楼主: baby01
2206 11

[经管数据集] 管理层讨论与分析(MD&A)数据大全2001-2023年 语料、文本分析Excel格式 [推广有奖]

  • 8关注
  • 37粉丝

已卖:452份资源

博士生

81%

还不是VIP/贵宾

-

威望
0
论坛币
373 个
通用积分
182.2041
学术水平
153 点
热心指数
152 点
信用等级
152 点
经验
11708 点
帖子
245
精华
0
在线时间
409 小时
注册时间
2017-6-15
最后登录
2025-12-8

楼主
baby01 企业认证  发表于 2024-7-5 21:47:02 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
管理层讨论与分析(MD&A)数据大全



管理层讨论与分析数据库是针对上市公司财务报告中管理层讨论与分析模块而建立的专业数据库,数据库涵盖了从1999年至今所有上市公司的年报、半年报和季报中与经营讨论与分析相关的数据资料,并采用人工智能算法对文本内容涉及的正面、负面词汇进行判断识别。其中,正面词汇和负面词汇的判断基础主要是根据Tim Loughran and Bill McDonald(2011)的英文正负面词典翻译为中文词典,再结合中文语境进行扩充和完善得到。可以有效帮助使用者分析上市公司所披露和预期的经营文本数据。


MD&A文本极具研究价值,研究内容广泛,比如公司治理、审计、风险识别、证券投资、股价预测、公司金融等等。研究人员可通过自然语言处理技术提取和分析MD&A的情感分析、自利性归因、竞争和风险分析、关键词提取和蹭热点分析、可读性分析等等。欢迎会计学、金融学、产业经济学等研究方向的学者购买使用。




1、数据量情况

截止日期

数据量

2001-06-30

447

2001-12-31

764

2002-06-30

665

2002-12-31

1054

2003-06-30

925

2003-12-31

1200

2004-06-30

1085

2004-12-31

1317

2005-06-30

1161

2005-12-31

1328

2006-06-30

1022

2006-12-31

1419

2007-06-30

1230

2007-12-31

1547

2008-06-30

1362

2008-12-31

1600

2009-06-30

1378

2009-12-31

1750

2010-06-30

1521

2010-12-31

2105

2011-06-30

1885

2011-12-31

2340

2012-06-30

2151

2012-12-31

2469

2013-06-30

1933

2013-12-31

2514

2014-06-30

2320

2014-12-31

2630

2015-06-30

2681

2015-12-31

2821

2016-06-30

2786

2016-12-31

3114

2017-06-30

3171

2017-12-31

3493

2018-06-30

3430

2018-12-31

3590

2019-06-30

3444

2019-12-31

3797

2020-06-30

3835

2020-12-31

4246

2021-06-30

4063

2021-12-31

4750

2022-06-30

4416

2022-12-31

5120

2023-06-30

4847

2023-12-31

5337

合计

112063


2、指标说明


股票代码

公司股票代码

公司简称

公司简称

会计年度

所属会计年度

经营分析时间

层讨论与分析的发布时间

正面词汇数量

层讨论与分析内容中识别出的正面词汇数量

负面词汇数量

层讨论与分析内容中识别出的负面词汇数量

句子数量

层讨论与分析内容的句子数量

文字数量

层讨论与分析内容的文字数量



语调 =(正面词汇数-负面词汇数)/(正面词汇数+负面词汇数),
取值介于[-1,+1]该数值越高,表明管理层整体用词越积极正面,对公司目前经营现状、未来业绩和行业发展前景持积极乐观的态度。





3、数据截图

QQ截图20240705214407.jpg




4、相关文献

[1] 孟庆斌;杨俊华;鲁冰. 管理层讨论与分析披露的信息含量与股价崩盘风险——基于文本向量化方法的研究. 《中国工业经济》, 2017年12期

[2] 周楷唐;姜舒舒;麻志明. 政治不确定性与管理层自愿业绩预测.《会计研究》, 2017年10期

[3] Xiaobei Huang, Xi Li, Senyo Tse, Jennifer Wu Tucker. The effects of a mixed approach toward management earnings forecasts: Evidence from China. Journal of Business Finance & Accounting, Accepted manuscript online:20 December 2017




5、数据购买


附件包含两份文件
管理层讨论与分析.xlsx
管理层讨论与分析文本数据比较大1.3G,放在百度网盘地址上,附件里面提供网盘地址和提取码

包含MD&A文本内容,可通过Python的jieba分词语言对数据进行分词或者进行其他处理,构造更多结构化数据。




管理层讨论与分析(MD&A)数据大全2001-2023年 语料、文本分析Excel格式.zip (5.82 MB, 需要: RMB 29 元) 本附件包括:
  • 管理层讨论与分析数据.xlsx
  • 管理层讨论与分析数据文本网盘.txt






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Excel格式 EXCEL xcel exce 管理层

沙发
baby01(未真实交易用户) 企业认证  发表于 2024-7-5 21:47:09
【稀缺数据】上市公司信用利差指标2005-2023年月度数据 重磅权威赠送计算代码
https://bbs.pinggu.org/thread-11815761-1-1.html

藤椅
baby01(未真实交易用户) 企业认证  发表于 2024-7-5 21:47:16
1990-2023年上市公司常用变量合集研发创新绿色并购全要素生产率融资约束近1500个变量  
https://bbs.pinggu.org/thread-11821497-1-1.html

板凳
baby01(未真实交易用户) 企业认证  发表于 2024-7-5 21:47:22
【稀缺数据】上市公司审计师关系网络密度、中心度和规模数据大合集2008-2022年
https://bbs.pinggu.org/thread-11800795-1-1.html

报纸
baby01(未真实交易用户) 企业认证  发表于 2024-7-5 21:47:28
(更新优化) Stata调整回归显著性常用代码(适用于OLS、固定效应、2SLS、GMM)
https://bbs.pinggu.org/thread-11786544-1-1.html

地板
kilinebush(未真实交易用户) 在职认证  发表于 2024-7-6 09:01:02 来自手机
baby01 发表于 2024-7-5 21:47
管理层讨论与分析(MD&A)数据大全
谢谢分享

7
赵安豆(未真实交易用户) 发表于 2024-7-6 11:08:14
管理层讨论与分析(Management's Discussion and Analysis,简称MD&A)是上市公司财务报告中一个重要的部分,它包含了公司高级管理层对过去一年经营状况的评估、对未来趋势的预测以及对公司财务表现和风险因素的深入解析。建立MD&A数据库对于研究者、投资者和分析师来说具有极高的价值,因为它提供了定量数据之外的定性信息,有助于更全面地理解公司的运营情况。

该数据库自1999年起收集并整理了所有上市公司的年报、半年报和季报中与经营讨论相关的文本内容。通过人工智能算法对这些文本进行情感分析,识别其中的正面词汇和负面词汇,这一过程是基于Tim Loughran and Bill McDonald(2011)提出的英文正负面词典,该词典被翻译成中文,并针对中文语境进行了扩充和调整。

MD&A数据库的数据量逐年增加,例如在2001年6月30日之前收集了447份报告,在同年12月31日前则有764份。随着时间推移,数据覆盖的范围和深度都在持续扩大,这不仅反映了上市公司数量的增长,也体现了对MD&A分析需求的增加。

该数据库的应用领域广泛,包括但不限于公司治理、审计实践、风险管理、证券市场分析、股价预测以及企业金融策略研究等。通过自然语言处理技术(NLP),研究人员可以从MD&A文本中提取情感倾向、自利性归因、竞争态势和风险评估等方面的信息,为学术研究提供丰富的数据支持。

对于会计学、金融学和产业经济学领域的学者而言,MD&A数据库是一个宝贵的资源,它不仅能够深化对上市公司财务表现的理解,还能够揭示隐藏在数字背后的经营策略和市场预期。购买并使用该数据库将极大地促进相关领域内高质量研究的产出。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



8
Eva同学(未真实交易用户) 发表于 2024-7-13 16:48:25
博主,已购买你的数据,但是你的数据好像有问题,比如,我查看了2023年万科的MD&A文本内容,实际上文字数只有43462,而你统计的数量是273938,你的数据统计错误,273938是包含了空格的字符数量,而不是文字的字数。

万科2022-2023截图.PNG (5.3 KB)

万科2022-2023截图.PNG

9
Eva同学(未真实交易用户) 发表于 2024-7-13 17:01:39
/数据字数统计有误,比如万科2023年,实际字数为43462,而你的数据是273938

10
baby01(未真实交易用户) 企业认证  发表于 2024-7-13 21:12:51
Eva同学 发表于 2024-7-13 16:48
博主,已购买你的数据,但是你的数据好像有问题,比如,我查看了2023年万科的MD&A文本内容,实际上文字数只 ...
您好,您这个是从数据库下载的,还是手动统计的

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 22:03