首先,基于31 个省 2002—2025年政府工作报告的文本数据,对政府工作报告文本进行分词处理,参考哈工大停用词表,过滤掉年报文本中的停用词。随后基于论文中提到的部分与环境有关的词汇如下:“环境保护”、“环保”、“污染”、“能耗”、“减排”、“排污”、“生态”、“绿色”、“低碳”、“空气”、“化学需氧量”、“二氧化硫”、“二氧化碳”、“PM10” 以及“ PM2. 5”以所有政府工作报告为语料库进行word2vec拓展得到与环境有关的词汇词典共152个词。最后统计与环境相关词汇出现的频次,并计算其占政府报告全文词频总数的比例, 从而得到刻画政府环境治理的整体指标,包含省份,年份,环境词频,总词频及占比的结构化数据集。
数据来源:原始数据来源于31 个省 2002—2025 年政府工作报告的文本数据。
数据范围:31个省政府工作报告
包含指标:
| 省份 | 年份 | 环境词频 | 总词频 | 占比 |
样例数据:
参考文献:[1]陈诗一,陈登科.雾霾污染、政府治理与经济高质量发展[J].经济研究,2018,53(02):20-34.
下载链接:
【工具变量】省级地方政府环境治理数据集(2002-2025年)
(76 Bytes, 需要: RMB 15 元)


雷达卡





京公网安备 11010802022788号







