数据名称:省级数字治理词频数据
时间跨度:2002-2024年
数据层级:省级层面
数据来源:各省(自治区、直辖市)政府工作报告文本分析
二、指标说明
1. 数字治理
定义:地方政府对数字治理工作的重视程度指标
计算方法:(数字治理关键词总词频 / 工作报告总词数) × 100
单位:百分比(%)
理论依据:通过词频占比消除报告长度差异的影响,
更准确反映数字治理在政府工作中的相对重要性
2. 数字治理关键词总词频
定义:政府工作报告中数字治理相关关键词出现的总次数
关键词范围:城市大脑、智慧城市、数字政府、智能政府、
电子政务、数据治理、数字化转型等
统计方法:多关键词词频累加
3. 工作报告总词数
定义:政府工作报告的总字数/词数
用途:作为标准化的分母,消除报告长度差异
三、数据文件说明
1. 省级数字治理词频原始数据.dta
内容:各省政府工作报告词频统计原始数据
格式:Stata数据格式
2. 省级数字治理词频原始数据.xlsx
内容:与dta文件相同,Excel格式
格式:Excel数据格式
3. 数字治理词频(省级).dta
内容:计算后的数字治理指标
格式:Stata数据格式
4. 数字治理词频(省级).xlsx
内容:与dta文件相同,Excel格式
格式:Excel数据格式
5. 省份编码.dta
内容:省份名称与编码对照表
格式:Stata数据格式
四、变量列表
变量名 变量说明 单位/类型
省份 省份名称 字符型
省份编码 省份行政区划代码 数值型
年份 年份 数值型
数字治理 数字治理指标 百分比
数字治理关键词总词频 关键词出现总次数 整数
工作报告总词数 报告总词数 整数
五、数据处理说明
1. 文本来源
各省(自治区、直辖市)人民政府工作报告
报告来源:政府官网、政府公报、省级年鉴等
2. 关键词列表
城市大脑、智慧城市、数字政府、智能政府
电子政务、政务服务、一网通办
数据治理、数字化转型、数字经济等
3. 标准化处理
采用词频占比方式标准化
消除不同年份、不同省份报告长度差异的影响
六、参考文献
数字治理与城市经济韧性(详见文件夹内PDF文献)
七、代码文件说明
1. 上市公司数字治理词频省级数据计算代码.do - Stata计算代码
2. 上市公司数字治理词频省级数据计算代码.py - Python计算代码
3. 上市公司数字治理词频数据评估代码.do - Stata数据质量评估代码
4. 上市公司数字治理词频数据评估代码.py - Python数据质量评估代码
省级数字治理词频数据2002-2024年.zip
(1.78 MB, 需要: RMB 29 元)


雷达卡



京公网安备 11010802022788号







