楼主: baby01
15413 40

[实证分析] 管理层讨论与分析(MD&A)数据大全1999-2020年 语料、文本分析Excel格式 [推广有奖]

  • 8关注
  • 37粉丝

已卖:452份资源

博士生

81%

还不是VIP/贵宾

-

威望
0
论坛币
373 个
通用积分
182.2041
学术水平
153 点
热心指数
152 点
信用等级
152 点
经验
11708 点
帖子
245
精华
0
在线时间
410 小时
注册时间
2017-6-15
最后登录
2025-12-25

楼主
baby01 企业认证  发表于 2021-8-6 17:51:59 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
管理层讨论与分析(MD&A)数据大全




管理层讨论与分析数据库是针对上市公司财务报告中管理层讨论与分析模块而建立的专业数据库,数据库涵盖了从1999年至今所有上市公司的年报、半年报和季报中与经营讨论与分析相关的数据资料,并采用人工智能算法对文本内容涉及的正面、负面词汇进行判断识别。其中,正面词汇和负面词汇的判断基础主要是根据Tim Loughran and Bill McDonald(2011)的英文正负面词典翻译为中文词典,再结合中文语境进行扩充和完善得到。可以有效帮助使用者分析上市公司所披露和预期的经营文本数据。


MD&A文本极具研究价值,研究内容广泛,比如公司治理、审计、风险识别、证券投资、股价预测、公司金融等等。研究人员可通过自然语言处理技术提取和分析MD&A的情感分析、自利性归因、竞争和风险分析、关键词提取和蹭热点分析、可读性分析等等。欢迎会计学、金融学、产业经济学等研究方向的学者购买使用。




1、数据量情况

会计年度

经营分析时间

样本量

1999

1999-12-31

3

2000

2000-06-30

665

2000

2000-12-31

480

2001

2001-06-30

1007

2001

2001-12-31

1142

2002

2002-06-30

1160

2002

2002-12-31

1187

2003

2003-06-30

1225

2003

2003-12-31

1255

2004

2004-06-30

1328

2004

2004-12-31

1342

2005

2005-06-30

1353

2005

2005-12-31

1337

2006

2006-06-30

1339

2006

2006-12-31

1423

2007

2007-06-30

1446

2007

2007-12-31

1520

2008

2008-06-30

1569

2008

2008-12-31

1591

2009

2009-06-30

1586

2009

2009-12-31

1751

2010

2010-06-30

1884

2010

2010-12-31

2104

2011

2011-06-30

2196

2011

2011-12-31

2332

2012

2012-06-30

2019

2012

2012-12-31

2475

2013

2013-06-30

1854

2013

2013-12-31

2535

2014

2014-06-30

2227

2014

2014-12-31

2650

2015

2015-06-30

2614

2015

2015-12-31

2843

2016

2016-06-30

2796

2016

2016-12-31

3136

2017

2017-06-30

3305

2017

2017-12-31

3509

2018

2018-06-30

3509

2018

2018-12-31

3601

2019

2019-06-30

3624

2019

2019-12-31

3712

2020

2020-06-30

3902

2020

2020-12-31

4210





2、指标说明




股票代码

公司股票代码

公司简称

公司简称

会计年度

所属会计年度

经营分析时间

层讨论与分析的发布时间

经营讨论与分析内容

层讨论与分析的详细内容

正面词汇数量

层讨论与分析内容中识别出的正面词汇数量

负面词汇数量

层讨论与分析内容中识别出的负面词汇数量

句子数量

层讨论与分析内容的句子数量

文字数量

层讨论与分析内容的文字数量



语调 =(正面词汇数-负面词汇数)/(正面词汇数+负面词汇数),
取值介于[-1,+1]该数值越高,表明管理层整体用词越积极正面,对公司目前经营现状、未来业绩和行业发展前景持积极乐观的态度。





3、数据截图
QQ截图20210806173810.jpg




4、相关文献

[1] 孟庆斌;杨俊华;鲁冰. 管理层讨论与分析披露的信息含量与股价崩盘风险——基于文本向量化方法的研究. 《中国工业经济》, 2017年12期

[2] 周楷唐;姜舒舒;麻志明. 政治不确定性与管理层自愿业绩预测.《会计研究》, 2017年10期

[3] Xiaobei Huang, Xi Li, Senyo Tse, Jennifer Wu Tucker. The effects of a mixed approach toward management earnings forecasts: Evidence from China. Journal of Business Finance & Accounting, Accepted manuscript online:20 December 2017




5、数据购买



附件包含两份文件

管理层讨论与分析(不包含经营讨论与分析内容).xlsx
管理层讨论与分析.xlsx  包含经营讨论与分析内容的数据比较大562M,放在百度网盘地址上,附件里面提供网盘地址和提取码

包含MD&A文本内容,可通过Python的jieba分词语言对数据进行分词或者进行其他处理,构造更多结构化数据。


管理层讨论与分析(MD&A)数据大全1999-2020年.zip (5.68 MB, 需要: RMB 30 元) 本附件包括:
  • 管理层讨论与分析百度网盘地址.txt
  • 管理层讨论与分析(不包含经营讨论与分析内容).xlsx




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Excel格式 EXCEL xcel exce 管理层

沙发
baby01(未真实交易用户) 企业认证  发表于 2021-8-6 18:35:25
jieba示例

  1. #coding=utf-8
  2. import jieba,math
  3. import jieba.analyse
  4. '''
  5. jieba.cut主要有三种模式
  6. #随便对一个动物园的评论进行分析
  7. str_text="真是好久好久没来哈皮娜拉野生动物园了,记忆里还是小时候三四年级学校组织春游去的银河系"
  8. #全模式cut_all=True
  9. str_quan1=jieba.cut(str_text,cut_all=True)
  10. print('全模式分词:{ %d}' % len(list(str_quan1)))
  11. str_quan2=jieba.cut(str_text,cut_all=True)
  12. print("/".join(str_quan2))
  13. # print(str(str_1))   #为一个generator 用for循环可以得到分词的结果
  14. # str_1_len=len(list(str_1))  #为什么?这里执行后后面.join 就不执行,求告知

  15. #精准模式cut_all=False,默认即是
  16. str_jing1=jieba.cut(str_text,cut_all=False)
  17. print('精准模式分词:{ %d}' % len(list(str_jing1)))
  18. str_jing2=jieba.cut(str_text,cut_all=False)
  19. print("/".join(str_jing2))

  20. #搜索引擎模式  cut_for_search
  21. str_soso1=jieba.cut_for_search(str_text)
  22. print('搜索引擎分词:{ %d}' % len(list(str_soso1)))
  23. str_soso2=jieba.cut_for_search(str_text)
  24. print("/".join(str_soso))
复制代码


藤椅
baby01(未真实交易用户) 企业认证  发表于 2021-8-8 18:29:38
好的 谢谢您

板凳
baby01(未真实交易用户) 企业认证  发表于 2021-8-8 18:30:10
最新更新!

报纸
baby01(未真实交易用户) 企业认证  发表于 2021-8-11 09:40:56
[handshake][handshake][handshake][handshake][handshake]

地板
baby01(未真实交易用户) 企业认证  发表于 2021-8-11 09:41:01
[handshake]

7
baby01(未真实交易用户) 企业认证  发表于 2021-8-11 09:41:09
管理层讨论与分析(MD&A)数据大全

8
baby01(未真实交易用户) 企业认证  发表于 2021-8-11 09:41:24
持续更新   

9
dddfff(未真实交易用户) 发表于 2021-8-29 14:44:28
问一下txt是中国研究数据服务平台(CNRDS)提取的管理层分析和讨论txt吗?中国研究数据服务平台(CNRDS)提取的文本是不完整的,都只提取了原报告pdf管理层分析和讨论的1\3

10
baby01(未真实交易用户) 企业认证  发表于 2021-8-29 16:40:14
dddfff 发表于 2021-8-29 14:44
问一下txt是中国研究数据服务平台(CNRDS)提取的管理层分析和讨论txt吗?中国研究数据服务平台(CNRDS)提取的 ...
是的      

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 05:04