数据来源 原始数据来源于31 个省 2002—2025 年政府工作报告的文本数据
时间跨度 2002年-2025年
区域跨度 31个省政府工作报告
数据格式 数据格式为Excel形式
数据简介
为缓解环境污染的负面影响,中央和地方政府推出了诸多环境治理政策。由于政府环境治理力度难以直接度量,政府环境治理变量的构建可以探索政府治理是否降低了污染水平。从研究价值看,该指标可用于揭示政府环境治理能否显著降低雾霾污染以及判断政府环境治理对经济产生的长期可持续的影响,因此本数据参考陈诗一、陈登科(2018)的做法,构建政府环境治理变量。本数据基于地方政府工作报告通过文本分析构建的政府环境治理变量,而地方政府工作报告一般发生在年初,经济活动则贯穿于一年的始终,从而可以有效规避“反向因果”所引起的内生性问题。本数据政府环境治理变量是省级层面变量,有助于缓解研究中相关变量是地级市层面变量因反向因果而产生的内生性问题。
首先,我们基于31 个省 2002—2025年政府工作报告的文本数据,对政府工作报告文本进行分词处理,参考哈工大停用词表,过滤掉年报文本中的停用词。随后基于论文中提到的部分与环境有关的词汇如下:“环境保护”、“环保”、“污染”、“能耗”、“减排”、“排污”、“生态”、“绿色”、“低碳”、“空气”、“化学需氧量”、“二氧化硫”、“二氧化碳”、“PM10” 以及“ PM2. 5”以所有政府工作报告为语料库进行word2vec拓展得到与环境有关的词汇词典共152个词。最后统计与环境相关词汇出现的频次,并计算其占政府报告全文词频总数的比例, 从而得到刻画政府环境治理的整体指标,包含省份,年份,环境词频,总词频及占比的结构化数据集。
数据指标
省份
年份
环境词频
报告总词数
环境词频占比
参考文献
[1]陈诗一,陈登科.雾霾污染、政府治理与经济高质量发展[J].经济研究,2018,53(02):20-34.


雷达卡




京公网安备 11010802022788号







