- 刘会芹,施先旺.年报文本信息可读性与股价崩盘风险[J].投资研究,2022,41(07):129-148.
- 朱丹,李静柔,李世新.年度报告的可读性水平、过往业绩与分析师预测[J].审计与经济研究,2021,36(05):77-85.
- 逯东,宋昕倍,龚祎.控股股东股权质押与年报文本信息可读性[J].财贸研究,2020,31(05):77-96.
另一方面,可读性也可以用来作为企业信息披露质量的代理指标,这方面的经典文献包括:
- 王海芳,姜道平,许莹.数字化转型能否提高信息披露质量?——基于年报可读性的研究[J].管理现代化,2022,42(02):58-65.
- 丁亚楠,王建新.“浑水摸鱼”还是“自证清白”:经济政策不确定性与信息披露——基于年报可读性的探究[J].外国经济与管理,2021,43(11):70-85.
- 阮睿,孙宇辰,唐悦,聂辉华.资本市场开放能否提高企业信息披露质量?——基于“沪港通”和年报文本挖掘的分析[J].金融研究,2021(02):188-206.
但是,当前研究更多的使用单一维度来度量年报可读性。诚如李春涛老师所言:
现有衡量中文年报可读性的指标忽视了年报自身特有的文本属性,即信息披露本身会包含大量的会计财务术语,而且忽视了企业规模和复杂度导致的年报信息披露量的差异性。
其计算公式为:
\[readability = \frac{1}{N} \sum_{s=1}^{N} \log P_s\]
其中,Ps表示句子s生成的概率,N表示构成文本的句子数。其值越高,表示文本中词对搭配顺序在语料中出现的频率越高,文本越容易被理解,文本可读性越高;反之,则表示词对在语料中出现的频率越低,文本越不容易被理解,文本可读性越差。
现将文本可读性数据分享给大家。考虑到研究需求,共有两份数据:
1. 上市公司财务报告可读性 (年报可读性),2001-2021年数据,因为上市公司会公布季报和年报,所以是季度数据。一个上市公司一年有四个值,分别是3、6、9、12月。
2. 上市公司管理层讨论可读性 (MD&A) ,2001-2021年数据,管理层讨论通常是一年一次,所以是年度数据。
3. 社会责任报告可读性 (CSR) ,2006-2020年数据,年度数据。
4. 财务报告附注可读性,2001-2021年数据,年度数据。
5. 审计报告可读性,2016-2021年,年度数据。审计报告 2016 年才开始公布,共有两份数据,一份是审计报告全文可读性,一份是关键审计事项段可读性。
6. 内部评价报告可读性,2001-2021年,年度数据。
7. 业绩说明会可读性,2007-2021年,年度数据。
参考文献:Shin, Donghyuk, et al. "Enhancing social media analysis with visual data analytics: A deep learning approach." MIS Quarterly 44.4 (2020): 1459-1492.
皮皮侠你个数据贩子也够无耻啊,文案都直接照抄,是因为NMSL所以没受过一点家教么!