1.指标介绍
近年来越来越多的文献关注宏观层面的经济政策不确定性对企业行为的影响。但Baker等(2016)的经济政策不确定性指标(EPU)存在两个问题:
第一,EPU指数是国家层面的,在同一个时间点上对所有企业有且仅有一个观测值,无法区分企业个体面临经济政策不确定性的差异。
第二,当使用EPU指数时,往往假设所有企业对不确定性的感知是同质的。
因此,构造企业个体层面的对经济政策不确定性的感知指标(FEPU)具有重要的理论价值。
2.构建过程
参照聂辉华等(2020,世界经济)的做法:
首先,通过格式转换工具把每份上市公司年报的PDF文件转换成文本文件,使用正则表达式取出“管理层讨论与分析”的内容,剔除所有数字、英文字母和除句号以外的所有标点符号和特殊符号。
然后,以中文句号为分隔符把MD&A文本分割为句子,考虑到中文的语言习惯,以句子作为分析的基本单位。假定上市公司i在年份t的年报中MD&A句子数量为S_{it},使用编程语言Python调用jieba分词模块对每个句子进行分词,并在分词的同时剔除停用词。为尽量降低分词带来的歧义,我们在分词时定义了用户词表,词表包括所有A股上市公司的全称和简称、会计科目名称、后续文本处理用到的表示不确定性的词语以及与政府(政策)相关的词语。
分词以后每个句子都变成一系列词语的组合,再对每个句子(s)逐一进行以下操作:搜索每个句子中出现的词,如果出现表示不确定性的词,就认为是表示不确定性的句子;如果一个句子中同时出现政府、政策等内容相关的词和表示不确定性的词,就认为是一个表示政策不确定性的句子(P)。用经济政策不确定性句子中不确定性词语数量(n_{s})占MD&A总词语数量(N)的比例衡量企业面临的经济政策不确定性(FEPU)。FEPU的计算如(1)式所示,其中I_{P}(s)是示性函数,当s∈P时,I=1;当s不∈P时,I=0。
![](https://pic.jg.com.cn/img/pinggu/ff78e9c88368747470733a2f2f64616e64616e2d7069632e6f73732d636e2d68616e677a686f752e616c6979756e63732e636f6d2f755069632f4a435246714c2e706e6754c9108783.jpg)
此外,我们额外构建了句频层面的指标FEPU_S。
参考文献[1] 聂辉华、阮睿和沈吉. 企业不确定性感知、投资决策和金融资产配置[J]. 世界经济, 2020, (6): 77-98.
样本期间:2001-2022年
数据来源:公司信息(巨潮资讯网、CSMAR)、词表(原文附录)
处理软件:Python 3.11
指标包括:Scode(公司代码)、Year(会计年度)、WordNum_key(关键词数量)、Sentnum_key(关键句数量)、FEPU_W(FEPU_词频%) FEPU_S(FEPU_句频%)
数据包括:dta文件+csv文件
数据展示:
【2001-2022】企业经济政策不确定性感知数据
(85 Bytes, 需要: RMB 59 元)
补充内容 (2024-7-10 20:14):
已经更新至2023年:https://bbs.pinggu.org/forum.php ... ;extra=#pid89906666
补充内容 (2024-7-13 14:22):
已经更新至2023年:https://bbs.pinggu.org/thread-11827176-1-1.html