楼主: 数据博导
221 0

[经管数据集] 环境相关词频统计-地级市、省级、中央(1954-2024年) [推广有奖]

  • 0关注
  • 1粉丝

已卖:51份资源

硕士生

47%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0.0150
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1246 点
帖子
75
精华
0
在线时间
57 小时
注册时间
2025-7-16
最后登录
2025-10-30

楼主
数据博导 在职认证  发表于 2025-7-24 15:09:09 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

本次数据为政府工作报告-原始全文

“环境规制”历年相关词频和-中央


一、数据介绍

数据名称:环境规制-15个相关词频统计

数据范围:地级市、省级、中央

数据年份:中央(1954-2024)、省级(2002-2024)、地级市(2002-2024)

数据来源:地方政府网站


数据说明:内含[url=]环境规制[/url]相关的15个词频明细、扩展词频

更新时间:2024年6月


二、整理说明

➤从地方政府网爬取工作报告原始文件

➤将报告文本整理为面板数据

➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和

(精确:'推荐', '马克', '数据网')

(全:'推荐', '马克', '克数', '数据', '数据网')

➤保留中英文、数字、标点符号,利用正则表达式统计60个精确词频

➤利用正则表达式统计15个扩展词频

➤保留中英文、数字,统计全文文本总长度

➤保存文本词频总数、15个词频明细、文本长度


三、指标说明

一共24个指标,并额外统计扩展词频



年份

地区

文本总长度

仅中英文-文本总长度

文本总词频-全模式

文本总词频-精确模式

环境规制词频和

环境保护

环保

污染

能耗

减排

排污

生态

绿色

低碳

空气

化学需氧量

二氧化硫

二氧化碳

PM10

PM2.5

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:地级市 python 政府工作报告 正则表达式 地方政府

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 20:25