数据名称:最新更新地级市环境规制力度文本词频法数据02-24年
最新更新地级市环境规制力度文本词频法数据02-24年
(85 Bytes, 需要: RMB 35 元)
参考《经济研究》陈诗一(2018)、《中国工业经济》邓慧慧(2019)、《中国软科学》尹礼汇(2021)的做法,利用Python对政府工作报告进行分词处理,统计地级市政府工作报告中与环境规制相关的15个关键词
数据范围:
286个地级市(包括直辖市)
数据年份:
2002-2024年
样本数量:
5722条
数据来源:
地方政府网
数据说明:内含环境规制相关的15个词频明细、文本长度、文本词频总数;从地方政府网爬取工作报告原始文件,将报告文本整理为面板数据,去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和(精确:'推荐', '经管之家')(全:'推荐', '经管', '', '之家', '经管之家'),保留中英文、数字、标点符号,利用正则表达式统计15个词频,保留中英文、数字,统计全文文本总长度,保存文本词频总数、15个词频明细、文本长度
指标说明:
一共24个指标,如下
行政区划代码 年份 城市 所属省份 文本总长度 仅中英文-文本总长度 文本总词频-全模式 文本总词频-精确模式 环保词频和 环境保护 环保 污染 能耗 减排 排污 生态 绿色 低碳 空气 化学需氧量 二氧化硫 二氧化碳 PM10 PM2.5


雷达卡




京公网安备 11010802022788号







