管理层讨论与分析数据库是针对上市公司财务报告中管理层讨论与分析模块而建立的专业数据库,数据库涵盖了从1999年至今所有上市公司的年报、半年报和季报中与经营讨论与分析相关的数据资料,并采用人工智能算法对文本内容涉及的正面、负面词汇进行判断识别。其中,正面词汇和负面词汇的判断基础主要是根据Tim Loughran and Bill McDonald(2011)的英文正负面词典翻译为中文词典,再结合中文语境进行扩充和完善得到。可以有效帮助使用者分析上市公司所披露和预期的经营文本数据。
MD&A文本极具研究价值,研究内容广泛,比如公司治理、审计、风险识别、证券投资、股价预测、公司金融等等。研究人员可通过自然语言处理技术提取和分析MD&A的情感分析、自利性归因、竞争和风险分析、关键词提取和蹭热点分析、可读性分析等等。欢迎会计学、金融学、产业经济学等研究方向的学者购买使用。
1、数据量情况
经营分析日期 | 数据量 |
| 2001-06-30 | 447 |
| 2001-12-31 | 764 |
| 2002-06-30 | 665 |
| 2002-12-31 | 1054 |
| 2003-06-30 | 925 |
| 2003-12-31 | 1200 |
| 2004-06-30 | 1085 |
| 2004-12-31 | 1317 |
| 2005-06-30 | 1161 |
| 2005-12-31 | 1328 |
| 2006-06-30 | 1022 |
| 2006-12-31 | 1419 |
| 2007-06-30 | 1230 |
| 2007-12-31 | 1544 |
| 2008-06-30 | 1362 |
| 2008-12-31 | 1600 |
| 2009-06-30 | 1378 |
| 2009-12-31 | 1749 |
| 2010-06-30 | 1521 |
| 2010-12-31 | 2102 |
| 2011-06-30 | 1885 |
| 2011-12-31 | 2340 |
| 2012-06-30 | 2151 |
| 2012-12-31 | 2466 |
| 2013-06-30 | 1933 |
| 2013-12-31 | 2512 |
| 2014-06-30 | 2320 |
| 2014-12-31 | 2628 |
| 2015-06-30 | 2681 |
| 2015-12-31 | 2821 |
| 2016-06-30 | 2786 |
| 2016-12-31 | 3114 |
| 2017-06-30 | 3171 |
| 2017-12-31 | 3490 |
| 2018-06-30 | 3430 |
| 2018-12-31 | 3585 |
| 2019-06-30 | 3444 |
| 2019-12-31 | 3794 |
| 2020-06-30 | 3835 |
| 2020-12-31 | 4239 |
| 2021-06-30 | 4063 |
| 2021-12-31 | 4588 |
| 2022-06-30 | 4416 |
| 2022-12-31 | 5117 |
2、指标说明
股票代码 | 公司股票代码 |
公司简称 | 公司简称 |
会计年度 | 所属会计年度 |
经营分析时间 | 层讨论与分析的发布时间 |
正面词汇数量 | 层讨论与分析内容中识别出的正面词汇数量 |
负面词汇数量 | 层讨论与分析内容中识别出的负面词汇数量 |
句子数量 | 层讨论与分析内容的句子数量 |
文字数量 | 层讨论与分析内容的文字数量 |
语调 =(正面词汇数-负面词汇数)/(正面词汇数+负面词汇数),
取值介于[-1,+1]该数值越高,表明管理层整体用词越积极正面,对公司目前经营现状、未来业绩和行业发展前景持积极乐观的态度。
3、数据截图
4、相关文献
[1] 孟庆斌;杨俊华;鲁冰. 管理层讨论与分析披露的信息含量与股价崩盘风险——基于文本向量化方法的研究. 《中国工业经济》, 2017年12期
[2] 周楷唐;姜舒舒;麻志明. 政治不确定性与管理层自愿业绩预测.《会计研究》, 2017年10期
[3] Xiaobei Huang, Xi Li, Senyo Tse, Jennifer Wu Tucker. The effects of a mixed approach toward management earnings forecasts: Evidence from China. Journal of Business Finance & Accounting, Accepted manuscript online:20 December 2017
5、数据购买
附件包含两份文件
管理层讨论与分析.xlsx
管理层讨论与分析文本数据比较大1G,放在百度网盘地址上,附件里面提供网盘地址和提取码
包含MD&A文本内容,可通过Python的jieba分词语言对数据进行分词或者进行其他处理,构造更多结构化数据。
管理层讨论与分析(MD&A)数据大全2001-2022年 语料、文本分析Excel格式.zip
(6.77 MB, 需要: RMB 29 元)
本附件包括:- 管理层讨论与分析数据.xlsx
- 管理层讨论与分析数据文本网盘.txt


雷达卡





京公网安备 11010802022788号







