本数据集基于地级市政府工作报告文本数据,计算各城市数字生态相关关键词的
词频指标。数字生态词频反映了地方政府对数字经济生态系统建设、数字化产业
发展等议题的关注程度,可用于研究数字生态发展水平的地区差异与时间演变趋势。
二、核心指标及计算方法
【指标名称】数字生态关键词总词频
【计算方法】
将政府工作报告中所有数字生态相关关键词的出现次数进行加总。
关键词范围:从"数据"到"自动检测"的所有数字生态相关词汇。
【数据来源】
地级市政府工作报告文本数据
三、数据范围
【时间跨度】2003年 - 2024年(共22年)
【地域范围】中国地级市层面
【样本说明】2003年之前数据样本较少,不纳入分析
四、变量说明
序号 变量名称 变量类型 说明
1 城市 字符型 地级市名称
2 城市编码 数值型 城市唯一标识码
3 年份 数值型 数据年份(2003-2024)
4 数字生态关键词总词频 数值型 核心指标,关键词词频加总
五、数据来源
【文本数据来源】
- 各地级市政府工作报告
【城市编码来源】
- 国家统计局行政区划代码
六、参考文献
《数字经济与统一大市场的因果效应与作用机制——基于有效市场和有为政府视角》
七、文件清单
文件名称 说明
原始数据.xlsx 原始数据(Excel格式)
原始数据.dta 原始数据(Stata格式)
城市编码.dta 城市编码匹配表
数字生态词频(市级).xlsx 计算结果(Excel格式)
数字生态词频(市级).dta 计算结果(Stata格式)
市级数字生态词频数据计算代码.py Python计算代码
市级数字生态词频数据计算代码.do Stata计算代码
市级数字生态词频数据评估代码.py Python评估代码
市级数字生态词频数据评估代码.do Stata评估代码
市级数字生态词频数据2003-2024年.zip
(1.76 MB, 需要: RMB 32 元)


雷达卡



京公网安备 11010802022788号







