本数据集包含中国上市公司企业债券信用利差数据,时间覆盖2003-2024年。信用利差(Credit Spread)定义为上市公司企业债券到期收益率与同期限国债收益率之差。测算方法参考《企业社会责任与债券信用利差关系及其影响机制——基于沪深上市公司的实证研究》:信用利差 = 企业债券到期收益率 - 同期限国债到期收益率;以每年最后一个交易日为观测时点,按债券剩余期限匹配国债收益率,对国债收益率曲线进行双向线性插值以获取非标准期限的收益率。 第1步 合并债券交易数据、债券基本信息、发行机构信息,构建宽表
第2步 匹配每年最后一个交易日,获取年度收盘收益率
第3步 计算债券剩余期限 = 到期日 - 基准日(年)
第4步 三次样条插值国债收益率曲线,匹配至债券剩余期限
第5步 计算信用利差 CS = Clsyield - Treasury
第6步 合并上市公司基本信息(行业、省份等)
第7步 生成三个版本:全样本 → 剔除金融 → 缩尾1%
完整计算代码随数据提供(Stata .do + Python .py 双版本),可完全复现。
数据质量评估报告_20260323.zip
(2.19 MB)
二、数据文件清单
时间范围:2003-2024年(年度频率)
债券数量:1,903 只企业债券
上市公司:674 家
省份覆盖:31 个省(自治区、直辖市)
信用评级:AAA、AA+、AA、AA-、A+ 等
行业覆盖:7 个证监会行业门类
1. 原始数据文件
├─ 国债收益率.dta 国债收益率原始数据(含年份、交易日、收益率、期限)
├─ 单只债券年交易信息表.dta 上市公司单只债券年度交易信息
├─ 债券基本情况表_公司年.dta 上市公司债券基本信息(代码、利率类型、到期日等)
└─ 发行机构信息.dta 上市公司发行机构信息(发行人性质、省份)
2. 中间数据文件
├─ 每年最后一个交易日.dta 每年最后一个交易日提取结果
├─ 总表.dta 清洗后的上市公司债券主样本表
├─ 期限.dta 日期-期限匹配网格中间表
└─ 国债收益率插值结果.dta 双向插值后的国债收益率
3. 最终结果文件
├─ 企业债券信用利差.dta 上市公司企业债券信用利差最终结果(Stata格式)
├─ 最终结果.dta 最终汇总结果数据
└─ 最终结果.xlsx 最终汇总结果数据(Excel格式)
4. 代码文件
├─ 上市公司企业债券信用利差数据计算代码.do Stata计算代码
├─ 上市公司企业债券信用利差数据计算代码.py Python计算代码
├─ 上市公司企业债券信用利差数据评估代码.do Stata评估代码
└─ 上市公司企业债券信用利差数据评估代码.py Python评估代码
5. 参考文献
└─ 企业社会责任与债券信用利差关系及其影响机制——基于沪深上市公司的实证研究.pdf
6. 辅助文件
└─ 企业债券信用利差指标解释及相关测算数据.dta 指标解释与测算辅助数据
三、核心变量说明
变量名 类型 说明
──────────────────────────────────────────────────────────────────
CS 数值型 上市公司企业债券信用利差(经1%缩尾处理)
CS = YTM - Treasury
CS最终结果 数值型 最终汇总表中的信用利差变量
YTM 数值型 上市公司债券到期收益率(经1%缩尾处理)
Treasury 数值型 同期限国债收益率(双向插值得到)
Clsyield 数值型 上市公司债券收盘到期收益率(原始值)
tag 数值型 年化剩余期限(= term / 365)
term 数值型 上市公司债券剩余期限(天数)
Liscd 数值型 上市公司债券上市代码
Sctcd 数值型 上市公司债券证券代码
Stkcd 数值型 上市公司股票代码
Orgid 数值型 上市公司发行机构编号
Conme 字符型 上市公司债券简称
Intrtyp 字符型 上市公司债券利率类型(固定利率/浮动利率)
Ipodt 字符型 上市公司债券发行日期
Matdt 字符型 上市公司债券到期日期
Crdrate 字符型 上市公司债券信用评级
Term 数值型 上市公司债券原始期限
Bndtype 数值型 上市公司债券类型
Acisuquty 数值型 上市公司债券应计利息
IssuerNature 字符型 上市公司发行人性质(一般企业等)
Province 字符型 上市公司所在省份
year / trdyer 数值型 年份变量
date 数值型 日期变量(Stata日期格式)
四、信用利差计算流程(参考《企业社会责任与债券信用利差关系及其影响机制》)
┌─ 步骤1:数据预处理
│ · 从国债收益率表提取每年最后一个交易日(作为观测时点)
│ · 合并上市公司债券交易信息、基本情况表、发行机构信息
│
├─ 步骤2:样本筛选
│ · 剔除浮动利率上市公司债券(仅保留固定利率)
│ · 仅保留一般企业发行的上市公司债券
│ · 剔除非上市公司债券(要求有股票代码)
│ · 剔除一年内到期的上市公司短期债券(term < 365天)
│ · 剔除信用评级缺失的上市公司样本
│
├─ 步骤3:国债收益率插值(按剩余期限匹配同期限国债收益率)
│ · 从上市公司样本中提取"年末日期+年化剩余期限"匹配网格
│ · 第一轮:按期限分组,沿时间方向线性插值(含外推)
│ · 第二轮:按日期分组,沿期限方向二次插值(含外推)
│ · 负值处理:国债收益率理论上不应为负,负值置为缺失后填充
│
└─ 步骤4:信用利差计算
· 到期收益率缩尾:对 Clsyield 做 1% 双侧缩尾得到 YTM
· 信用利差:CS = YTM - Treasury
· 剔除负信用利差样本
· 信用利差缩尾:对 CS 做 1% 双侧缩尾
五、信用利差经济含义
1. 概念(参考前述文献)
信用利差是"信用风险补偿 + 流动性补偿 + 其他风险溢价"的综合体现,
在实证研究中常用"企业债券到期收益率 - 同期限国债收益率"刻画。
2. 经济解读
- 信用利差上升:市场对上市公司违约风险预期上升、融资环境趋紧
- 信用利差下降:上市公司信用环境改善、风险偏好回升、融资宽松
3. 常见影响因素
- 宏观层面:货币政策、利率水平、信用周期
- 上市公司层面:信用评级、财务杠杆、现金流与盈利能力
- 市场层面:流动性、期限结构、风险偏好与情绪冲击
六、评估报告输出结构
运行评估代码后自动生成:
数据质量评估报告_YYYYMMDD/
├─ 评估日志_YYYYMMDD.log
└─ 上市公司-企业债券信用利差数据2003-2024/
├─ 评估摘要_XXX.csv
├─ 数据分布分析文件夹/
│ ├─ 描述性统计_XXX.csv
│ ├─ 字符频率Top20_变量名_XXX.csv
│ ├─ 数值分箱频率_变量名_XXX.csv
│ └─ 相关系数矩阵_XXX.csv
├─ 分布图文件夹/
│ ├─ 直方图_变量名_XXX.jpg
│ ├─ 箱线图_变量名_XXX.jpg
│ ├─ 核密度图_变量名_XXX.jpg
│ ├─ 散点图矩阵_XXX.jpg
│ ├─ 时间趋势_变量名_XXX.jpg
│ ├─ 累积分布_变量名_XXX.jpg
│ ├─ 相关性热力图_XXX.jpg
│ └─ 分年度箱线图_变量名_XXX.jpg
├─ 异常值检验文件夹/
│ ├─ IQR异常值检验_XXX.csv
│ ├─ Zscore异常值检验_XXX.csv
│ ├─ 缺失值统计_XXX.csv
│ └─ 重复观测检查_XXX.csv
├─ 逻辑合理性验证文件夹/
│ └─ 逻辑合理性验证_XXX.csv
└─ 稳健性测试文件夹/
├─ 稳健性测试_XXX.csv
└─ 稳健性对比核密度图_XXX.jpg
七、容错机制
1. Stata代码:全流程使用 capture + noisily,单个环节报错不影响整体
2. Python代码:全流程使用 try/except,单点错误不中断任务
3. 文件名自动清洗非法字符,降低路径报错风险
4. 自动识别数值型和字符型变量,无需手动指定
八、文件对应关系
计算代码:
- Stata版:上市公司企业债券信用利差数据计算代码.do
- Python版:上市公司企业债券信用利差数据计算代码.py
评估代码:
- Stata版:上市公司企业债券信用利差数据评估代码.do
- Python版:上市公司企业债券信用利差数据评估代码.py
【数据】上市公司企业债券信用利差数据(2003-2024)
(76 Bytes, 需要: RMB 38 元)


雷达卡



京公网安备 11010802022788号







