- 年份:2003-2024
- 范围:284市
- 代码格式:do文件(Stata 14/15/16/17/18)
计算说明:
对指标体系中缺乏数据支撑的“数字经济相关政策”指标,通过收集整理地方政府工作报告确定数字经济相关词频,借助Python软件对政府工作报告进行分词处理,并统计数字经济相关词频数量以量化政府政策支持力度。关键词:数字经济、智能经济、信息经济、知识经济、智慧经济、数字化信息、现代信息网络、信息和通信技术、ICT、通信基础设施、互联网、云计算、区块链、物联网、数字化、数字乡村、数字产业电子商务、5G、数字基础设施、人工智能、电商、大数据、数据化产业数字化、数字产业化、数据资产化、智慧城市、云服务、云技术云端、电子政务、移动支付、线上、信息产业、软件、信息基础设施:信息技术、数字生活
缺失情况说明:部分市早年工作报告已缺失无法搜集,缺失部分已剔除不在样本中,2003-2024年284个地级市应合计6248份原始文件,其中488份为缺失无法搜集的部分,这部分无法进行文本分析,其余5760份均按流程进行文本分析,分析结果文件为“原始数据.xlsx”、“原始数据.dta”
处理说明:原始数据为使用Python对地方ZF工作报告进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式
参考文献
- 金灿阳,徐蔼婷,邱可阳.中国省域数字经济发展水平测度及其空间关联研究[J].统计与信息论坛,2022,37(06):11-21.
代码:
原始数据
结果数据
【更新至2024】数字经济政策词频统计2024-2003市级文本分析数据Stata整理含说明
(76 Bytes, 需要: RMB 35 元)


雷达卡




京公网安备 11010802022788号







