数据区间:包含1999-2024中国上市公司年报文本
数据格式:本数据集为已整理好的txt格式与pdf格式数据,文件大小超140G+,累计涵盖7w+观测值数量(pdf+txt年报总数超14w份),5600+样本企业,包含PDF和TXT格式,适用于文本分析
数据指标:证券代码、统计截止日期、上市公司ID、证券简称、ABH股交叉码、行业名称、行业代码、中文全称、公司成立日期、首次上市日期、法人代表、注册资本、公司网址、经营范围、主营业务、上市状态、注册具体地址、注册地址所属省份、注册地址所属城市、注册地经度(E)、注册地纬度(N)、公司办公地址、办公地址经度、办公地址纬度、办公地址邮政编码等。
参考文献:
[1]任宏达,王琨.产品市场竞争与信息披露质量——基于上市公司年报文本分析的新证据[J].会计研究,2019,(03):32-39.
[2]伊志宏,杨圣之,陈钦源.分析师能降低股价同步性吗——基于研究报告文本分析的实证研究[J].中国工业经济,2019,(01):156-173.
[3]黄大禹,谢获宝,孟祥瑜,等.数字化转型与企业价值——基于文本分析方法的经验证据[J].经济学家,2021,(12):41-51.
[4]姜付秀,王运通,田园,等.多个大股东与企业融资约束——基于文本分析的经验证据[J].管理世界,2017,(12):61-74.


雷达卡


京公网安备 11010802022788号







