政府工作报告文本数据覆盖国务院、省级政府、市级政府在内的三级政府部门,代表了政府在各个阶段的工作情况和成果,是极有价值的文本分析数据;
本次将报告原始文本整理成了Excel面板数据,时间跨度为中央(1954-2024)、省级(2002-2024)、市级(2002-2024)。
一、数据介绍
数据名称:中国全国中央政府工作报告各省级地级市政府工作报告原文Txt原始文本(附赠Excel长度词频总数)
数据年份:中央(1954-2024)、省级(2002-2024)、市级(2002-2024)
样本范围:中央、全国各省、城市地级市
数据来源:地方政府网
数据格式:Txt格式(附赠csv/excel格式)
提供打包购买合集链接及分别购买链接:
中央政府工作报告Txt原始文本附Excel词频版(1954-2024年)网盘链接.docx
(61.42 KB, 需要: RMB 29 元)
全国31省份政府工作报告Txt文本附Excel词频版(2002-2024年)网盘链接.docx
(60.73 KB, 需要: RMB 39 元)
全国285地级市政府工作报告Txt原始文本(2002-2024年)附Excel词频版网盘链接.docx
(60.87 KB, 需要: RMB 49 元)
中央+31省级+285地级市工作报告合集Txt原始文本附Excel词频版(2002-2024年)网盘链接.docx
(60.54 KB, 需要: RMB 99 元)
二、整理说明
➤从地方政府网爬取工作报告原始文件
➤将报告文本整理为面板数据
➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
➤保留中英文、数字,统计全文文本总长度
➤保存原始文本、txt文件、文本长度、词频总数
三、部分文件展示
1、中央级:1954-2024年txt文档无缺失
2、省级:2002-2024年无缺失(含4个直辖市)
3、全国285个地级市城市政府工作报告2002-2023年:(含4个直辖市)
含全国285地级市城市,注意:地级市城市政府工作报告存在客观披露缺失(全网都是),并非所有地级市都有2002-2024年齐全报告!!
为避免交易双方理解歧义,现将每年含有的数据量列明如下,介意勿买,谢谢!(如:2002年,仅有4个地级市有政府工作报告,2015-2024年有280~286个地级市有政府工作报告。)
附赠Csv/Excel格式:


雷达卡







打开是这样的,还是打不开。算了,我不需要了,你们还是把钱推给我吧。
京公网安备 11010802022788号







