楼主: nothing`more
2169 14

[经管数据集] 上市公司年报可读性2001-2021 (年报/社会责任报告/财务附注等) [推广有奖]

  • 2关注
  • 45粉丝

副教授

8%

还不是VIP/贵宾

-

威望
0
论坛币
10319 个
通用积分
59.2933
学术水平
5 点
热心指数
5 点
信用等级
5 点
经验
8039 点
帖子
221
精华
0
在线时间
1140 小时
注册时间
2016-2-15
最后登录
2024-4-28

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
可读性是文本分析的重要维度。上市公司的年报文本可读性,既可以直接作为解释变量,来分析一系列企业行为,如李春涛老师发表在《金融研究》上的论文《年报可读性与企业创新》,以此来分析企业的创新行为。还有如:
  • 刘会芹,施先旺.年报文本信息可读性与股价崩盘风险[J].投资研究,2022,41(07):129-148.
  • 朱丹,李静柔,李世新.年度报告的可读性水平、过往业绩与分析师预测[J].审计与经济研究,2021,36(05):77-85.
  • 逯东,宋昕倍,龚祎.控股股东股权质押与年报文本信息可读性[J].财贸研究,2020,31(05):77-96.



另一方面,可读性也可以用来作为企业信息披露质量的代理指标,这方面的经典文献包括:

  • 王海芳,姜道平,许莹.数字化转型能否提高信息披露质量?——基于年报可读性的研究[J].管理现代化,2022,42(02):58-65.
  • 丁亚楠,王建新.“浑水摸鱼”还是“自证清白”:经济政策不确定性与信息披露——基于年报可读性的探究[J].外国经济与管理,2021,43(11):70-85.
  • 阮睿,孙宇辰,唐悦,聂辉华.资本市场开放能否提高企业信息披露质量?——基于“沪港通”和年报文本挖掘的分析[J].金融研究,2021(02):188-206.



但是,当前研究更多的使用单一维度来度量年报可读性。诚如李春涛老师所言:
现有衡量中文年报可读性的指标忽视了年报自身特有的文本属性,即信息披露本身会包含大量的会计财务术语,而且忽视了企业规模和复杂度导致的年报信息披露量的差异性。
据此,Shin, Donghyuk, et al. (2020) 使用基于word2vec神经网络语言模型,构建了一个文本可读性指数。其原理是假设文本中句子相互独立,并考虑句中词汇的前后搭配顺序,将文本中各个句子生成概率乘积的对数似然的均值,作为此文本的可读性度量。


其计算公式为:


\[readability = \frac{1}{N} \sum_{s=1}^{N} \log P_s\]

其中,Ps表示句子s生成的概率,N表示构成文本的句子数。其值越高,表示文本中词对搭配顺序在语料中出现的频率越高,文本越容易被理解,文本可读性越高;反之,则表示词对在语料中出现的频率越低,文本越不容易被理解,文本可读性越差。

现将文本可读性数据分享给大家。考虑到研究需求,共有两份数据:
1. 上市公司财务报告可读性 (年报可读性),2001-2021年数据,因为上市公司会公布季报和年报,所以是季度数据。一个上市公司一年有四个值,分别是3、6、9、12月。

财务报告可读性 (85 Bytes, 需要: RMB 29 元)
2. 上市公司管理层讨论可读性 (MD&A) ,2001-2021年数据,管理层讨论通常是一年一次,所以是年度数据
管理层讨论与分析可读性 (85 Bytes, 需要: RMB 29 元)

3. 社会责任报告可读性 (CSR) ,2006-2020年数据,年度数据。

社会责任报告可读性 (85 Bytes, 需要: RMB 29 元)

4. 财务报告附注可读性,2001-2021年数据,年度数据。

财务报告附注可读性 (85 Bytes, 需要: RMB 29 元)

5. 审计报告可读性,2016-2021年,年度数据。审计报告 2016 年才开始公布,共有两份数据,一份是审计报告全文可读性,一份是关键审计事项段可读性。

审计报告可读性 (85 Bytes, 需要: RMB 29 元)

6. 内部评价报告可读性,2001-2021年,年度数据。

内部评价报告可读性 (85 Bytes, 需要: RMB 29 元)

7. 业绩说明会可读性,2007-2021年,年度数据。

业绩说明会可读性 (85 Bytes, 需要: RMB 29 元)


参考文献:Shin, Donghyuk, et al. "Enhancing social media analysis with visual data analytics: A deep learning approach." MIS Quarterly 44.4 (2020): 1459-1492.

皮皮侠你个数据贩子也够无耻啊,文案都直接照抄,是因为NMSL所以没受过一点家教么!








二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:上市公司年报 上市公司 公司年报 可读性 上市公 文本可读性

沙发
fanggodie 在职认证  学生认证  发表于 2022-12-6 10:40:07 |只看作者 |坛友微信交流群
您好,我想要社会责任报告可读性的数据,请问怎么联系?

使用道具

藤椅
nothing`more 学生认证  发表于 2022-12-6 17:33:35 |只看作者 |坛友微信交流群
fanggodie 发表于 2022-12-6 10:40
您好,我想要社会责任报告可读性的数据,请问怎么联系?
您随便买一份财务报告可读性数据吧,我再私发给您社会责任报告可读性的数据

使用道具

板凳
nothing`more 学生认证  发表于 2022-12-20 15:17:54 |只看作者 |坛友微信交流群
fanggodie 发表于 2022-12-6 10:40
您好,我想要社会责任报告可读性的数据,请问怎么联系?
您好,已经更新社会责任报告可读性数据了,有2006-2020年的年度数据

使用道具

报纸
sherryooxx 发表于 2023-3-14 19:22:21 |只看作者 |坛友微信交流群
你好,科研小白想问一下,这个计算用到什么软件?这些数据的来源又是哪里呢?

使用道具

地板
nothing`more 学生认证  发表于 2023-3-14 22:08:05 |只看作者 |坛友微信交流群
sherryooxx 发表于 2023-3-14 19:22
你好,科研小白想问一下,这个计算用到什么软件?这些数据的来源又是哪里呢?
数据就来自于网络公开抓取呀,像公司的年报,直接就可以从巨潮网上获取,然后再此基础上进行文本分析就好了,都有很成熟的方法,只是做起来很麻烦而已

使用道具

7
顾qin 发表于 2023-4-20 10:29:52 |只看作者 |坛友微信交流群
你好,请问有没有年报总字数这样子的数据,谢谢!

使用道具

8
nothing`more 学生认证  发表于 2023-4-20 19:01:09 |只看作者 |坛友微信交流群
顾qin 发表于 2023-5-21 10:50
你好,请问有没有年报总字数这样子的数据,谢谢!
没有哦,只有可读性这一个变量,不过文本长度这类通用变量的话,CNRDS之类的应该就有

使用道具

9
学术小菜狗 发表于 2023-10-21 21:15:37 |只看作者 |坛友微信交流群
你好,有计算该指标的python代码吗

使用道具

10
nothing`more 学生认证  发表于 2023-10-24 09:28:13 |只看作者 |坛友微信交流群
学术小菜狗 发表于 2023-10-21 21:15
你好,有计算该指标的python代码吗
附加代码就不止这个价格了哦

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 18:52