楼主: yusb
1698 7

[经管数据集] 上市公司年报可读性2001-2022年3月份:财务报告可读性MDA管理层讨论与分析可读性 [推广有奖]

已卖:21107份资源
好评率:99%
商家信誉:一般

巨擘

0%

还不是VIP/贵宾

-

威望
1
论坛币
40750 个
通用积分
2588.9809
学术水平
20 点
热心指数
31 点
信用等级
7 点
经验
5832 点
帖子
20230
精华
0
在线时间
11781 小时
注册时间
2020-12-8
最后登录
2026-1-17

楼主
yusb 在职认证  发表于 2022-12-19 15:43:24 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

上市公司年报可读性2001-2022年3月份:财务报告可读性MDA管理层讨论与分析可读性


1、数据来源:基于上述公司年报、公告数据整理计算

2、时间跨度:2001-2022年03月份第一季度

3、区域范围:沪深A股,主板、中小企业板、科创板、创业板

4、指标说明:


上市公司年财务报告及MDA管理层讨论与分析可读性2001-202203.zip (7.68 MB, 需要: RMB 59 元) 本附件包括:

  • 数据说明-上市公司年报可读性2001-2021年:财务报告可读性&管理层讨论与分析可读性.docx
  • 管理层讨论与分析可读性.zip
  • 财务报告可读性.zip


其中:

上市公司财务报告可读性2001-202203.zip (6.04 MB, 需要: RMB 39 元) 本附件包括:

  • 字段说明.txt
  • 数据库解释.pdf
  • 2001-2021年财务报告_可读性.xlsx
1af9e5f1dee8fcbe6fd185b35ec61bc.png

(季度数据,数据到2022年3月份)

security_code[证券代码]:以上海证券交易所和深圳证券交易所公布的证券代码为准。

security_name[证券简称]:以上海证券交易所和深圳证券交易所公布的公司最新证券简称为准。

rep_period[报告期间]:报告对应会计期间截止日期,格式为“YYYY-MM-DD”。

rep_type[报告类型]:文本数据源类型。

readability[可读性]:报告文本中句子的条件生成概率的对数均值。其值越高,表示文本中词对搭配顺序在语料中出现的频率越高,文本可读性越高;反之,则表示词对在语料中出现的频率越低,文本可读性越差。



上市公司管理层讨论与分析可读性2001-2021.zip (1.87 MB, 需要: RMB 29 元) 本附件包括:

  • 字段说明.txt
  • 数据库解释.pdf
  • 2001-2021年管理层讨论与分析_可读性.xlsx
1af9e5f1dee8fcbe6fd185b35ec61bc.png

security_code[证券代码]:以上海证券交易所和深圳证券交易所公布的证券代码为准。

security_name[证券简称]:以上海证券交易所和深圳证券交易所公布的公司最新证券简称为准。

rep_period[报告期间]:报告对应会计期间截止日期,格式为“YYYY-MM-DD”。

rep_type[报告类型]:文本数据源类型。


readability[可读性]:报告文本中句子的条件生成概率的对数均值。其值越高,表示文本中词对搭配顺序在语料中出现的频率越高,文本可读性越高;反之,则表示词对在语料中出现的频率越低,文本可读性越差。



可读性是文本分析的重要维度。上市公司的年报文本可读性,既可以直接作为解释变量,来分析一系列企业行为,如李春涛老师发表在《金融研究》上的论文《年报可读性与企业创新》,以此来分析企业的创新行为。另一方面,可读性也可以用来作为企业信息披露质量的代理指标

但是,当前研究更多的使用单一维度来度量年报可读性。诚如李春涛老师所言:

现有衡量中文年报可读性的指标忽视了年报自身特有的文本属性,即信息披露本身会包含大量的会计财务术语,而且忽视了企业规模和复杂度导致的年报信息披露量的差异性。

据此,Shin, Donghyuk, et al. (2020) 使用基于word2vec神经网络语言模型,构建了一个文本可读性指数。其原理是假设文本中句子相互独立,并考虑句中词汇的前后搭配顺序,将文本中各个句子生成概率乘积的对数似然的均值,作为此文本的可读性度量。

其计算公式为:


其中,Ps表示句子s生成的概率,N表示构成文本的句子数。其值越高,表示文本中词对搭配顺序在语料中出现的频率越高,文本越容易被理解,文本可读性越高;反之,则表示词对在语料中出现的频率越低,文本越不容易被理解,文本可读性越差.


现将文本可读性数据分享给大家。考虑到研究需求,共有两份数据:

上市公司财务报告可读性 (年报可读性),2001-2021年数据,因为上市公司会公布季报和年报,所以是季度数据。一个上市公司一年有四个值,分别是3、6、9、12月。

上市公司管理层讨论可读性 (MD&A) ,2001-2021年数据,管理层讨论通常是一年一次,所以是年度数据



[1]会芹,施先旺.年报文本信息可读性与股价崩盘风险[J].投资研究,2022,41(07):129-148.

[2]朱丹,李静柔,李世新.年度报告的可读性水平、过往业绩与分析师预测[J].审计与经济研究,2021,36(05):77-85.

[3]逯东,宋昕倍,龚祎.控股股东股权质押与年报文本信息可读性[J].财贸研究,2020,31(05):77-96.

[4]王海芳,姜道平,许莹.数字化转型能否提高信息披露质量?——基于年报可读性的研究[J].管理现代化,2022,42(02):58-65.

[5]丁亚楠,王建新.“浑水摸鱼”还是“自证清白”:经济政策不确定性与信息披露——基于年报可读性的探究[J].外国经济与管理,2021,43(11):70-85.

[6]阮睿,孙宇辰,唐悦,聂辉华.资本市场开放能否提高企业信息披露质量?——基于“沪港通”和年报文本挖掘的分析[J].金融研究,2021(02):188-206.





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:上市公司年报 财务报告 上市公司 公司年报 可读性

沙发
学术小菜狗(未真实交易用户) 发表于 2023-10-21 21:14:10
你好,请问有计算该指标的python代码吗?

藤椅
zvt067621(未真实交易用户) 发表于 2023-12-16 15:56:57
您好,请问有到23年的数据吗

板凳
yusb(未真实交易用户) 在职认证  发表于 2023-12-16 17:43:50
zvt067621 发表于 2023-12-16 15:56
您好,请问有到23年的数据吗
有到2022的

报纸
2021310470(真实交易用户) 发表于 2024-1-24 12:57:37
具体构建是参考哪一篇文献呢?

地板
冻冻冻着呢(真实交易用户) 发表于 2024-2-9 15:32:13
yusb 发表于 2023-12-16 17:43
有到2022的
请问22年的怎样获取

7
俏俏熊(未真实交易用户) 在职认证  发表于 2024-6-30 00:02:00
请问有2022年的完整数据吗?

8
yusb(未真实交易用户) 在职认证  发表于 2024-6-30 09:27:28
俏俏熊 发表于 2024-6-30 00:02
请问有2022年的完整数据吗?
有的,您可以拍这个链接,然后提供邮箱我发您

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-18 01:56