地级市-环境规制力度 | 15个文本词频(2002-2024年)
参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021)的做法,利用Python对政府工作报告进行分词处理,统计地级市政府工作报告中与环境规制相关的15个关键词
一、数据介绍
数据名称:政府工作报告-环境规制力度
数据范围:286个地级市(包括直辖市)
数据年份:2002-2024年
样本数量:5722条
数据来源:地方政府网
数据说明:内含环境规制相关的15个词频明细、文本长度、文本词频总数
二、整理说明
从地方政府网爬取工作报告原始文件
将报告文本整理为面板数据
去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频等。
三、指标说明
一共24个指标,如下
行政区划代码
年份
城市
所属省份
文本总长度
仅中英文-文本总长度
文本总词频-全模式
文本总词频-精确模式
环保词频和
环境保护
环保
污染
能耗
减排
排污
生态
绿色
低碳
空气 化学需氧量
二氧化硫
二氧化碳
PM10
PM2.5


雷达卡




京公网安备 11010802022788号







