企业气候政策不确定性感知数据,基于对企业年报中MD&A章节的文本分析得到。分如下五步构造:
1. 构造 气候、政策、不确定性 三类词表(种子词 + Word embedding 模型扩展近义词);
2. 利用换行符和标点符号(句号),将每一份MD&A文本拆分为一组语句;
3. 利用python中的jieba工具将每一个语句切分成一组词,过程中调用 气候、政策、不确定性 三类词表为自定义词典,同时调用百度、川大、哈工大、人大中文停用词表。
4. 若一个语句中同时含有气候、政策、不确定性 三类词表中的词汇,则标记其为 企业气候政策不确定性感知 语句,统计这类语句在每一份MD&A文本中的占比(ClimatePUP_Sentences, 比值较小,使用时可以乘100%),得到指标。
5. 替代指标:统计气候政策不确定性感知语句中的“不确定性”词典词汇在每一份MD&A文本中的词频占比(ClimatePUP_Words, 比值较小,使用时可以乘100%),有助于突出“不确定性”感知这一主体的影响,从而强化结论。
适用于可持续发展、绿色创新、绿色转型等目前热门主题的研究


雷达卡





京公网安备 11010802022788号







