搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  数据质量评估报告_20260207.zip
资料下载链接地址: https://bbs.pinggu.org/a-8777059.html
附件大小:
一、数据简介
本数据集基于中国各省级政府工作报告,利用Python的Jieba分词库
对数字生态相关关键词进行词频统计,构建省级数字生态发展水平的
文本量化指标。数据覆盖2002-2024年,可用于研究数字经济、数字
生态发展的区域差异与时间演变趋势。


数字生态关键词词典包括:数据、数字、网络、智慧、互联网、智能、
信息、信息化、信息安全、信息技术、系统信息、信息系统、电子信息、
信息平台、信息服务、信息产业、信息咨询、信息通讯、信息处理、
信息工程、信息资源、信息中心、信息传输、信息基储科技信息、
信息共享、新兴产业、共享经济、宽带、5G、物联网、云计算、云生态、
云平台、云服务、云、区块链、电商、电子商务、金融、通信、IT、
B2B、C2C、B2C、C2B、O2O、自动化、自动控制、自动监测、自动监控、
自动检测等。

参考文献:
付成林, 王德新. 数字经济与统一大市场的因果效应与作用机制
——基于有效市场和有为政府视角[J]. 2023年第12期.
DOI: 10.19592/j.cnki.scje.410515



二、数据来源
原始数据来源于各省级政府工作报告(2002-2024年)的文本内容,
通过Python Jieba分词库进行关键词词频统计。省份编码为标准的
省级行政区划编码。




三、数据范围
时间范围:2002-2024年
空间范围:中国省级行政区(不含港澳台)
数据频率:年度面板数据




四、文件清单
1. 原始数据文件
省级政府工作报告关键词词频数据.dta 各省各年各关键词词频(Stata格式)
省级政府工作报告关键词词频数据.xlsx 各省各年各关键词词频(Excel格式)
省份编码数据.dta 省份名称与省级行政区划编码对照表


2. 计算结果文件(运行计算代码后生成)
计算结果.dta 汇总后的省级词频面板数据(Stata格式)
计算结果.xlsx 汇总后的省级词频面板数据(Excel格式)


3. 代码文件
省级数字生态词频数据计算代码.do 数据计算代码(Stata版本)
省级数字生态词频数据计算代码.py 数据计算代码(Python版本)
省级数字生态词频数据评估代码.do 数据质量评估代码(Stata版本)
省级数字生态词频数据评估代码.py 数据质量评估代码(Python版本)


4. 参考文献
数字经济与统一大市场的因果效应与作用机制——基于有效市场和有为政府视角.pdf


五、计算结果变量说明
变量名 类型 说明
省份 字符型 省级行政区名称
省份编码 数值型 省级行政区划编码
年份 数值型 数据年份(2002-2024)
数字生态关键词总词频 数值型 该省份当年政府工作报告中数字生态
相关关键词出现的总次数(行加总)

六、计算方法
1. 利用Python Jieba分词库对各省历年政府工作报告进行关键词
词频统计,提取数字生态相关关键词的出现次数
2. 对所有关键词词频进行行加总(rowtotal),得到数字生态关键词
总词频,以直接加总方式计算总披露次数
3. 匹配省份编码,形成省级年度面板数据
4. 按省份编码和年份排序输出









    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2026-2-22 04:10