近几年,学术界和实业界高度关注经济政策不确定性。确实,这个时代最大的确定性就是充满不确定性。目前度量经济政策不确定性的主要指标,是BBD(2016)开发的EPU指数。然而,每个地区或国家在每个时点只有一个EPU指数,从而在计量上它无法与时间固定效应区分,而且它也无法区分不同企业的政策不确定性感受差异。
2020年,作者(聂辉华、阮睿和沈吉)在《世界经济》杂志发表了一篇论文,提供了一种计算企业层面的经济政策不确定性指数的方法,并利用该数据分析了不确定性感受对企业投资和融资的影响。论文发表后,受到了很多研究者的关注。
借鉴此方法
使用文本分析法构造FEPU的具体过程如下:
衡量经济政策不确定性的指标从上市公司年报文本中使用文本挖掘方法提取得到。随着计算机技术的发展,把文本等非结构化数据引入公司金融研究的做法越来越普遍(Tetlock,2007;Li,2008;Tetlock等,2008;Loughran和McDonald,2014、2016)。本文参考Baker等(2016)和Hassan等(2019)的做法,使用“词表法”筛选特定的内容文本 ,在一段文本中如果出现特定词语,就把这段文本识别为表达某些特定含义的文本。本文认为如果一句话中同时出现“政策词语”和“不确定性词语”,就认为这句话是年报撰写人表述公司面临经济政策不确定性的内容。
具体方法如下:首先通过格式转换工具把每份上市公司年报的PDF文件转换成文本文件,使用正则表达式取出“管理层讨论与分析”(简称MD&A,有些年报中是“董事会报告”)的内容,剔除所有数字、英文字母和除句号以外的所有标点符号和特殊符号。然后,以中文句号为分隔符把MD&A文本分割为句子,考虑到中文的语言习惯,本文以句子作为分析的基本单位。假定上市公司 在年份 的年报中MD&A句子数量为 ,使用编程语言Python调用jieba分词模块对每个句子进行分词,并在分词的同时剔除停用词(stopwords)。为尽量降低分词带来的歧义,本文在分词时定义了用户词表,词表包括所有A股上市公司的全称和简称、会计科目名称、后续文本处理用到的表示不确定性的词语以及与政府(政策)含义相关的词语。分词以后每个句子都变成一系列词语的组合,再对每个句子(s)逐一进行以下操作:搜索每个句子中出现的词,如果出现表示不确定性的词,就认为是表示不确定性的句子;如果一个句子中同时出现政府、政策等内容相关的词和表示不确定性的词,就认为是一个表示政策不确定性的句子(P)。用经济政策不确定性句子中不确定性词语数量(n)占MD&A总词语数量(N)的比例衡量企业面临的经济政策不确定性(FEPU)。
引用来源:聂辉华、阮睿、沈吉,2020,《企业不确定性感知、投资决策和金融资产配置》,《世界经济》,第6期,77-98页。