搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  数据质量评估报告_20260323.zip
资料下载链接地址: https://bbs.pinggu.org/a-8820129.html
附件大小:
一、数据简介
本数据集包含中国上市公司企业债券信用利差数据,时间覆盖2003-2024年。信用利差(Credit Spread)定义为上市公司企业债券到期收益率与同期限国债收益率之差。测算方法参考《企业社会责任与债券信用利差关系及其影响机制——基于沪深上市公司的实证研究》:信用利差 = 企业债券到期收益率 - 同期限国债到期收益率;以每年最后一个交易日为观测时点,按债券剩余期限匹配国债收益率,对国债收益率曲线进行双向线性插值以获取非标准期限的收益率。 第1步合并债券交易数据、债券基本信息、发行机构信息,构建宽表
第2步匹配每年最后一个交易日,获取年度收盘收益率
第3步计算债券剩余期限 = 到期日 - 基准日(年)
第4步三次样条插值国债收益率曲线,匹配至债券剩余期限
第5步计算信用利差 CS = Clsyield - Treasury
第6步合并上市公司基本信息(行业、省份等)
第7步生成三个版本:全样本 → 剔除金融 → 缩尾1%

完整计算代码随数据提供(Stata .do + Python .py 双版本),可完全复现。



二、数据文件清单

时间范围:2003-2024年(年度频率)
债券数量:1,903 只企业债券
上市公司:674 家
省份覆盖:31 个省(自治区、直辖市)
信用评级:AAA、AA+、AA、AA-、A+ 等
行业覆盖:7 个证监会行业门类

1. 原始数据文件
├─ 国债收益率.dta 国债收益率原始数据(含年份、交易日、收益率、期限)
├─ 单只债券年交易信息表.dta 上市公司单只债券年度交易信息
├─ 债券基本情况表_公司年.dta 上市公司债券基本信息(代码、利率类型、到期日等)
└─ 发行机构信息.dta 上市公司发行机构信息(发行人性质、省份)


2. 中间数据文件
├─ 每年最后一个交易日.dta 每年最后一个交易日提取结果
├─ 总表.dta 清洗后的上市公司债券主样本表
├─ 期限.dta 日期-期限匹配网格中间表
└─ 国债收益率插值结果.dta 双向插值后的国债收益率


3. 最终结果文件
├─ 企业债券信用利差.dta 上市公司企业债券信用利差最终结果(Stata格式)
├─ 最终结果.dta 最终汇总结果数据
└─ 最终结果.xlsx 最终汇总结果数据(Excel格式)


4. 代码文件
├─ 上市公司企业债券信用利差数据计算代码.do Stata计算代码
├─ 上市公司企业债券信用利差数据计算代码.py Python计算代码
├─ 上市公司企业债券信用利差数据评估代码.do Stata评估代码
└─ 上市公司企业债券信用利差数据评估代码.py Python评估代码


5. 参考文献
└─ 企业社会责任与债券信用利差关系及其影响机制——基于沪深上市公司的实证研究.pdf


6. 辅助文件
└─ 企业债券信用利差指标解释及相关测算数据.dta指标解释与测算辅助数据





三、核心变量说明


变量名 类型 说明
──────────────────────────────────────────────────────────────────
CS 数值型 上市公司企业债券信用利差(经1%缩尾处理)
CS = YTM - Treasury
CS最终结果 数值型 最终汇总表中的信用利差变量
YTM 数值型 上市公司债券到期收益率(经1%缩尾处理)
Treasury 数值型 同期限国债收益率(双向插值得到)
Clsyield 数值型 上市公司债券收盘到期收益率(原始值)
tag 数值型 年化剩余期限(= term / 365)
term 数值型 上市公司债券剩余期限(天数)
Liscd 数值型 上市公司债券上市代码
Sctcd 数值型 上市公司债券证券代码
Stkcd 数值型 上市公司股票代码
Orgid 数值型 上市公司发行机构编号
Conme 字符型 上市公司债券简称
Intrtyp 字符型 上市公司债券利率类型(固定利率/浮动利率)
Ipodt 字符型 上市公司债券发行日期
Matdt 字符型 上市公司债券到期日期
Crdrate 字符型 上市公司债券信用评级
Term 数值型 上市公司债券原始期限
Bndtype 数值型 上市公司债券类型
Acisuquty 数值型 上市公司债券应计利息
IssuerNature 字符型 上市公司发行人性质(一般企业等)
Province 字符型 上市公司所在省份
year / trdyer 数值型 年份变量
date 数值型 日期变量(Stata日期格式)





四、信用利差计算流程(参考《企业社会责任与债券信用利差关系及其影响机制》)


┌─ 步骤1:数据预处理
│ · 从国债收益率表提取每年最后一个交易日(作为观测时点)
│ · 合并上市公司债券交易信息、基本情况表、发行机构信息

├─ 步骤2:样本筛选
│ · 剔除浮动利率上市公司债券(仅保留固定利率)
│ · 仅保留一般企业发行的上市公司债券
│ · 剔除非上市公司债券(要求有股票代码)
│ · 剔除一年内到期的上市公司短期债券(term < 365天)
│ · 剔除信用评级缺失的上市公司样本

├─ 步骤3:国债收益率插值(按剩余期限匹配同期限国债收益率)
│ · 从上市公司样本中提取"年末日期+年化剩余期限"匹配网格
│ · 第一轮:按期限分组,沿时间方向线性插值(含外推)
│ · 第二轮:按日期分组,沿期限方向二次插值(含外推)
│ · 负值处理:国债收益率理论上不应为负,负值置为缺失后填充

└─ 步骤4:信用利差计算
· 到期收益率缩尾:对 Clsyield 做 1% 双侧缩尾得到 YTM
· 信用利差:CS = YTM - Treasury
· 剔除负信用利差样本
· 信用利差缩尾:对 CS 做 1% 双侧缩尾






五、信用利差经济含义


1. 概念(参考前述文献)
信用利差是"信用风险补偿 + 流动性补偿 + 其他风险溢价"的综合体现,
在实证研究中常用"企业债券到期收益率 - 同期限国债收益率"刻画。


2. 经济解读
- 信用利差上升:市场对上市公司违约风险预期上升、融资环境趋紧
- 信用利差下降:上市公司信用环境改善、风险偏好回升、融资宽松


3. 常见影响因素
- 宏观层面:货币政策、利率水平、信用周期
- 上市公司层面:信用评级、财务杠杆、现金流与盈利能力
- 市场层面:流动性、期限结构、风险偏好与情绪冲击





六、评估报告输出结构


运行评估代码后自动生成:


数据质量评估报告_YYYYMMDD/
├─ 评估日志_YYYYMMDD.log
└─ 上市公司-企业债券信用利差数据2003-2024/
├─ 评估摘要_XXX.csv
├─ 数据分布分析文件夹/
│├─ 描述性统计_XXX.csv
│├─ 字符频率Top20_变量名_XXX.csv
│├─ 数值分箱频率_变量名_XXX.csv
│└─ 相关系数矩阵_XXX.csv
├─ 分布图文件夹/
│├─ 直方图_变量名_XXX.jpg
│├─ 箱线图_变量名_XXX.jpg
│├─ 核密度图_变量名_XXX.jpg
│├─ 散点图矩阵_XXX.jpg
│├─ 时间趋势_变量名_XXX.jpg
│├─ 累积分布_变量名_XXX.jpg
│├─ 相关性热力图_XXX.jpg
│└─ 分年度箱线图_变量名_XXX.jpg
├─ 异常值检验文件夹/
│├─ IQR异常值检验_XXX.csv
│├─ Zscore异常值检验_XXX.csv
│├─ 缺失值统计_XXX.csv
│└─ 重复观测检查_XXX.csv
├─ 逻辑合理性验证文件夹/
│└─ 逻辑合理性验证_XXX.csv
└─ 稳健性测试文件夹/
├─ 稳健性测试_XXX.csv
└─ 稳健性对比核密度图_XXX.jpg


七、容错机制


1. Stata代码:全流程使用 capture + noisily,单个环节报错不影响整体
2. Python代码:全流程使用 try/except,单点错误不中断任务
3. 文件名自动清洗非法字符,降低路径报错风险
4. 自动识别数值型和字符型变量,无需手动指定


八、文件对应关系


计算代码:
- Stata版:上市公司企业债券信用利差数据计算代码.do
- Python版:上市公司企业债券信用利差数据计算代码.py


评估代码:
- Stata版:上市公司企业债券信用利差数据评估代码.do
- Python版:上市公司企业债券信用利差数据评估代码.py







    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2026-3-29 16:20