- 年份:2001-2024
- 范围:A股上市公司
- 三个版本:未来注意力时间配置(未缩尾未剔除金融STPT版本)、未来注意力时间配置(未缩尾已剔除金融STPT版本)、未来注意力时间配置(已缩尾已剔除金融STPT版本)
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开
- 注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可行业参照证监会2012年行业分类标准,制造业用二级行业分类,其他用一级分类来计算并对连续型变量进行了1%和99%分位数的缩尾处理
- 代码格式:do/pythpn文件,含生成代码和分析评估代码
- 分析结果及论文图表均在帖子末尾的压缩包,可直接下载查看情况
计算公式:
企业家未来注意力测量方法说明
本文采用对企业年报中MD&A一章进行文本分析的方法来测量企业家未来注意力。使用文本分析测度人们的时间配置有着较强的语言学理论基础(Chen, 2013)。由于企业MD&A一节的总词数大多在2000词以上,标准化后的数值过小,因此本文将所有文本分析得到的指标都乘以100。
词集构建分三个步骤:第一步参照陈守明和胡媛媛(2016)的做法,采用"未来""即将""将来""将要""接下来""今后"作为表征将来的基础词;第二步基于Word2vec中的CBOW模型构造词向量空间,并在其中寻找近义词,筛选出词频数在1000词以上、和基础词相似度在30%以上的词;第三步邀请3名业界和学术界专家对CBOW模型得到的相似词进行人工核查,最终得到表征未来的词集(包括"将来""将要""接下来""今后""未来""下一步""后续""新阶段""以后""预见""或将")。
本文基于表征未来的词集进行文本分析,并利用词典法对每家企业的年报中MD&A部分进行词频分析,分别计算以下3个指标:词集词频数占MD&A总词数的比例、词集词频数占不含数字MD&A总词数的比例、词集词频数占不含数字和英文MD&A总词数的比例。
参考引用:
- 外部关税冲击、企业家注意力配置与创新发展

计算代码和评估代码:
结果数据
上市公司企业家未来注意力数据2001-2024年含do-python代码和excel-dta格式数据.zip
(31.48 MB, 需要: RMB 29 元)
评估结果.zip
(558.37 KB)


雷达卡



京公网安备 11010802022788号







