| 所在主题: | |
| 文件名: 数据质量评估报告_20260323.zip | |
| 资料下载链接地址: https://bbs.pinggu.org/a-8820129.html | |
| 附件大小: | |
|
一、数据简介
本数据集包含中国上市公司企业债券信用利差数据,时间覆盖2003-2024年。信用利差(Credit Spread)定义为上市公司企业债券到期收益率与同期限国债收益率之差。测算方法参考《企业社会责任与债券信用利差关系及其影响机制——基于沪深上市公司的实证研究》:信用利差 = 企业债券到期收益率 - 同期限国债到期收益率;以每年最后一个交易日为观测时点,按债券剩余期限匹配国债收益率,对国债收益率曲线进行双向线性插值以获取非标准期限的收益率。 第1步合并债券交易数据、债券基本信息、发行机构信息,构建宽表 第2步匹配每年最后一个交易日,获取年度收盘收益率 第3步计算债券剩余期限 = 到期日 - 基准日(年) 第4步三次样条插值国债收益率曲线,匹配至债券剩余期限 第5步计算信用利差 CS = Clsyield - Treasury 第6步合并上市公司基本信息(行业、省份等) 第7步生成三个版本:全样本 → 剔除金融 → 缩尾1% 完整计算代码随数据提供(Stata .do + Python .py 双版本),可完全复现。 二、数据文件清单 时间范围:2003-2024年(年度频率) 债券数量:1,903 只企业债券 上市公司:674 家 省份覆盖:31 个省(自治区、直辖市) 信用评级:AAA、AA+、AA、AA-、A+ 等 行业覆盖:7 个证监会行业门类 1. 原始数据文件 ├─ 国债收益率.dta 国债收益率原始数据(含年份、交易日、收益率、期限) ├─ 单只债券年交易信息表.dta 上市公司单只债券年度交易信息 ├─ 债券基本情况表_公司年.dta 上市公司债券基本信息(代码、利率类型、到期日等) └─ 发行机构信息.dta 上市公司发行机构信息(发行人性质、省份) 2. 中间数据文件 ├─ 每年最后一个交易日.dta 每年最后一个交易日提取结果 ├─ 总表.dta 清洗后的上市公司债券主样本表 ├─ 期限.dta 日期-期限匹配网格中间表 └─ 国债收益率插值结果.dta 双向插值后的国债收益率 3. 最终结果文件 ├─ 企业债券信用利差.dta 上市公司企业债券信用利差最终结果(Stata格式) ├─ 最终结果.dta 最终汇总结果数据 └─ 最终结果.xlsx 最终汇总结果数据(Excel格式) 4. 代码文件 ├─ 上市公司企业债券信用利差数据计算代码.do Stata计算代码 ├─ 上市公司企业债券信用利差数据计算代码.py Python计算代码 ├─ 上市公司企业债券信用利差数据评估代码.do Stata评估代码 └─ 上市公司企业债券信用利差数据评估代码.py Python评估代码 5. 参考文献 └─ 企业社会责任与债券信用利差关系及其影响机制——基于沪深上市公司的实证研究.pdf 6. 辅助文件 └─ 企业债券信用利差指标解释及相关测算数据.dta指标解释与测算辅助数据 三、核心变量说明 变量名 类型 说明 ────────────────────────────────────────────────────────────────── CS 数值型 上市公司企业债券信用利差(经1%缩尾处理) CS = YTM - Treasury CS最终结果 数值型 最终汇总表中的信用利差变量 YTM 数值型 上市公司债券到期收益率(经1%缩尾处理) Treasury 数值型 同期限国债收益率(双向插值得到) Clsyield 数值型 上市公司债券收盘到期收益率(原始值) tag 数值型 年化剩余期限(= term / 365) term 数值型 上市公司债券剩余期限(天数) Liscd 数值型 上市公司债券上市代码 Sctcd 数值型 上市公司债券证券代码 Stkcd 数值型 上市公司股票代码 Orgid 数值型 上市公司发行机构编号 Conme 字符型 上市公司债券简称 Intrtyp 字符型 上市公司债券利率类型(固定利率/浮动利率) Ipodt 字符型 上市公司债券发行日期 Matdt 字符型 上市公司债券到期日期 Crdrate 字符型 上市公司债券信用评级 Term 数值型 上市公司债券原始期限 Bndtype 数值型 上市公司债券类型 Acisuquty 数值型 上市公司债券应计利息 IssuerNature 字符型 上市公司发行人性质(一般企业等) Province 字符型 上市公司所在省份 year / trdyer 数值型 年份变量 date 数值型 日期变量(Stata日期格式) 四、信用利差计算流程(参考《企业社会责任与债券信用利差关系及其影响机制》) ┌─ 步骤1:数据预处理 │ · 从国债收益率表提取每年最后一个交易日(作为观测时点) │ · 合并上市公司债券交易信息、基本情况表、发行机构信息 │ ├─ 步骤2:样本筛选 │ · 剔除浮动利率上市公司债券(仅保留固定利率) │ · 仅保留一般企业发行的上市公司债券 │ · 剔除非上市公司债券(要求有股票代码) │ · 剔除一年内到期的上市公司短期债券(term < 365天) │ · 剔除信用评级缺失的上市公司样本 │ ├─ 步骤3:国债收益率插值(按剩余期限匹配同期限国债收益率) │ · 从上市公司样本中提取"年末日期+年化剩余期限"匹配网格 │ · 第一轮:按期限分组,沿时间方向线性插值(含外推) │ · 第二轮:按日期分组,沿期限方向二次插值(含外推) │ · 负值处理:国债收益率理论上不应为负,负值置为缺失后填充 │ └─ 步骤4:信用利差计算 · 到期收益率缩尾:对 Clsyield 做 1% 双侧缩尾得到 YTM · 信用利差:CS = YTM - Treasury · 剔除负信用利差样本 · 信用利差缩尾:对 CS 做 1% 双侧缩尾 五、信用利差经济含义 1. 概念(参考前述文献) 信用利差是"信用风险补偿 + 流动性补偿 + 其他风险溢价"的综合体现, 在实证研究中常用"企业债券到期收益率 - 同期限国债收益率"刻画。 2. 经济解读 - 信用利差上升:市场对上市公司违约风险预期上升、融资环境趋紧 - 信用利差下降:上市公司信用环境改善、风险偏好回升、融资宽松 3. 常见影响因素 - 宏观层面:货币政策、利率水平、信用周期 - 上市公司层面:信用评级、财务杠杆、现金流与盈利能力 - 市场层面:流动性、期限结构、风险偏好与情绪冲击 六、评估报告输出结构 运行评估代码后自动生成: 数据质量评估报告_YYYYMMDD/ ├─ 评估日志_YYYYMMDD.log └─ 上市公司-企业债券信用利差数据2003-2024/ ├─ 评估摘要_XXX.csv ├─ 数据分布分析文件夹/ │├─ 描述性统计_XXX.csv │├─ 字符频率Top20_变量名_XXX.csv │├─ 数值分箱频率_变量名_XXX.csv │└─ 相关系数矩阵_XXX.csv ├─ 分布图文件夹/ │├─ 直方图_变量名_XXX.jpg │├─ 箱线图_变量名_XXX.jpg │├─ 核密度图_变量名_XXX.jpg │├─ 散点图矩阵_XXX.jpg │├─ 时间趋势_变量名_XXX.jpg │├─ 累积分布_变量名_XXX.jpg │├─ 相关性热力图_XXX.jpg │└─ 分年度箱线图_变量名_XXX.jpg ├─ 异常值检验文件夹/ │├─ IQR异常值检验_XXX.csv │├─ Zscore异常值检验_XXX.csv │├─ 缺失值统计_XXX.csv │└─ 重复观测检查_XXX.csv ├─ 逻辑合理性验证文件夹/ │└─ 逻辑合理性验证_XXX.csv └─ 稳健性测试文件夹/ ├─ 稳健性测试_XXX.csv └─ 稳健性对比核密度图_XXX.jpg 七、容错机制 1. Stata代码:全流程使用 capture + noisily,单个环节报错不影响整体 2. Python代码:全流程使用 try/except,单点错误不中断任务 3. 文件名自动清洗非法字符,降低路径报错风险 4. 自动识别数值型和字符型变量,无需手动指定 八、文件对应关系 计算代码: - Stata版:上市公司企业债券信用利差数据计算代码.do - Python版:上市公司企业债券信用利差数据计算代码.py 评估代码: - Stata版:上市公司企业债券信用利差数据评估代码.do - Python版:上市公司企业债券信用利差数据评估代码.py |
|
熟悉论坛请点击新手指南
|
|
| 下载说明 | |
|
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。 2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。 3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。 (如有侵权,欢迎举报) |
|
京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明