- 阅读权限
- 255
- 威望
- 0 级
- 论坛币
- 281 个
- 通用积分
- 7.3444
- 学术水平
- 155 点
- 热心指数
- 155 点
- 信用等级
- 154 点
- 经验
- 33156 点
- 帖子
- 166
- 精华
- 0
- 在线时间
- 1874 小时
- 注册时间
- 2007-3-6
- 最后登录
- 2024-5-22
教授
还不是VIP/贵宾
- 威望
- 0 级
- 论坛币
- 281 个
- 通用积分
- 7.3444
- 学术水平
- 155 点
- 热心指数
- 155 点
- 信用等级
- 154 点
- 经验
- 33156 点
- 帖子
- 166
- 精华
- 0
- 在线时间
- 1874 小时
- 注册时间
- 2007-3-6
- 最后登录
- 2024-5-22
| 开心 11 小时前 |
---|
签到天数: 390 天 连续签到: 5 天 [LV.9]以坛为家II
|
相似文件
换一批
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
政府工作报告数据(中央、省、市级)-含原始全文/文本长度/总词频,1954-2023,整理好的面板数据,excel版
政府工作报告是理解国家政策、经济社会发展趋势、科技创新方向以及民生关注点的重要文件,明确了国家的宏观政策方向,对于政府决策者、学者、企业和公众都具有重要的研究价值。
一、数据范围:中央、省级、市级
二、数据年份:中央(1954-2023)、省级(2002-2023)、市级(2003-2023)
三、数据来源:地方政府网
四、数据格式:面板数据,包括原始文本
五、数据整理
从地方政府网爬取工作报告原始文件,将报告文本整理为面板数据,去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和(包含精确模式和全模式),保留中英文、数字,统计全文文本总长度,保存原始文本、文本长度、词频总数
六、数据指标
- 年份
- 地区等级
- 地区
- 报告全文
- 文本总长度(字)
- 仅中英文-文本总长度(字)
- 文本总词频-全模式(个)
- 文本总词频-精确模式(个)
七、附件说明
附件1为中央级、附件2为省级、附件3为市级
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|
|
|