上市公司年报可读性2007-2022年:财务报告可读性MDA管理层讨论与分析可读性
1、数据来源:基于上述公司年报、公告数据整理计算
2、时间跨度:2007-2022年的年报
3、区域范围:沪深A股,主板、中小企业板、科创板、创业板
4、指标说明:
常用字占比------------常用字/总字数,指标越大,可读性越好
专业词占比-----------专业词/总字数,指标越大,可读性越差
连接词占比-----------连接词/总字数,指标越大,可读性越差
平均句长--------------总字数/总句数,指标越大,可读性越差
mmx_常用字占比-------将常用字占比进行归一化,由于常用字占比为正向指标,故先用1-常用字占比,将其转化为负向指标之后在进行归一化,具体操作为:(指标值-最小值)/(最大值-最小值)
mmx_专业词占比、mmx_连接词占比、mmx_平均句长------同上
Redability=mmx_常用字占比 + mmx_专业词占比 + mmx_连接词占比+ mmx_平均句长-----------将四个指标归一化之后加总,加总后仍是负向指标,指标越大,可读性越差
Stkcd year 常用字 常用字占比 专业词 专业词占比 连接词 连接词占比 总字数 总句数 平均句长 mmx_常用字占比 mmx_专业词占比 mmx_连接词占比 mmx_平均句长 Readability
- 07-22可读性.xlsx
- 数据说明.txt
可读性是文本分析的重要维度。上市公司的年报文本可读性,既可以直接作为解释变量,来分析一系列企业行为,如李春涛老师发表在《金融研究》上的论文《年报可读性与企业创新》,以此来分析企业的创新行为。另一方面,可读性也可以用来作为企业信息披露质量的代理指标
但是,当前研究更多的使用单一维度来度量年报可读性。诚如李春涛老师所言:
现有衡量中文年报可读性的指标忽视了年报自身特有的文本属性,即信息披露本身会包含大量的会计财务术语,而且忽视了企业规模和复杂度导致的年报信息披露量的差异性。
[1]会芹,施先旺.年报文本信息可读性与股价崩盘风险[J].投资研究,2022,41(07):129-148.
[2]朱丹,李静柔,李世新.年度报告的可读性水平、过往业绩与分析师预测[J].审计与经济研究,2021,36(05):77-85.
[3]逯东,宋昕倍,龚祎.控股股东股权质押与年报文本信息可读性[J].财贸研究,2020,31(05):77-96.
[4]王海芳,姜道平,许莹.数字化转型能否提高信息披露质量?——基于年报可读性的研究[J].管理现代化,2022,42(02):58-65.
[5]丁亚楠,王建新.“浑水摸鱼”还是“自证清白”:经济政策不确定性与信息披露——基于年报可读性的探究[J].外国经济与管理,2021,43(11):70-85.
[6]阮睿,孙宇辰,唐悦,聂辉华.资本市场开放能否提高企业信息披露质量?——基于“沪港通”和年报文本挖掘的分析[J].金融研究,2021(02):188-206.