搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  缺少的股票和年份.xlsx
资料下载链接地址: https://bbs.pinggu.org/a-4035823.html
附件大小:
42.25 KB   举报本内容
上市公司年报文本

持续更新,后续关注我后免费获取更新版本
不管什么时候毕业或者发期刊用到,都能用到最新的数据

【原创整理,严禁转载,转载必究】


参考文献
[1]王克敏,王华杰,李栋栋等.年报文本信息复杂性与管理者自利——来自中国上市公司的证据[J].管理世界,2018,34(12):120-132+194.
[2]周波,张程,曾庆生.年报语调与股价崩盘风险——来自中国A股上市公司的经验证据[J].会计研究,2019(11):41-48.
[3]任宏达,王琨.社会关系与企业信息披露质量——基于中国上市公司年报的文本分析[J].南开管理评论,2018,21(05):128-138.

计算说明

使用Python爬虫上市公司所有的年报,但由于年报更新的情况,所以仅保留当前最新的年报。
原始年报命名统一为:证券代码_年份_年报发布日期_xxxx年年度报告”,便于后续方便处理。最终得到53595份文本数据。
Python爬虫有详细注释,易于直观理解。

数据说明

样本选择:全部A股2001-2022年数据,年报文本格式为txt格式 ,便于后续处理


赠送超值上市基本信息:证券代码、统计截止日期、上市公司ID、证券简称、ABH股交叉码、行业名称、行业代码、中文全称、公司成立日期、首次上市日期、法人代表、注册资本、公司网址、经营范围、主营业务、上市状态、注册具体地址、注册地址所属省份、注册地址所属城市、注册地经度(E)、注册地纬度(N)、公司办公地址、办公地址经度、办公地址纬度、办公地址邮政编码等。

再额外赠送超值上市常用分组指标:是否 ST或PT、是否金融业、资产负债率是否大于1、是否沪深A股、
是否北京A股、行业名称、行业代码、所属省份代码、所属省份、所属城市代码、所属城市、分东部地区、中部地区、西部地区、是否高科技行业、是否重污染行业

数据截图



分年份数据量统计

年份

样本量

2001

1010

2002

1078

2003

1141

2004

1235

2005

1238

2006

1325

2007

1450

2008

1507

2009

1659

2010

2007

2011

2240

2012

2364

2013

2411

2014

2525

2015

2723

2016

3019

2017

3399

2018

3505

2019

3721

2020

4193

2021

4743

2022

5102

总计

53595





数据较大,论坛上传有大小限制,所以只能放在百度下载,以下为百度网盘地址








    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2026-1-10 13:19