- 年份:2003-2025
- 范围:284市
- 代码格式:do文件(Stata 14/15/16/17/18)
计算说明:
参考用数字技术关键词词频占报告总词频的比重代表各省份数字技术水平。在数字技术关键词的确定上,借鉴相关研究,确定数字技术主要包括大数据、云计算、区块链、人工智能、通信技术和物联网6个方面,并最终筛选出关键词58个。
关键词:所有数字技术关键词如下所示;大数据相关关键词:大数据、数据挖掘、数据仓库)异构数据、增强现实、混合现实、虚拟现实、数字孪生;云计算相关关键词:云计算、流计算人图计算、内存计算、多方安全计算、类脑计算、绿色计算、认知计算、融合架构、亿级并发、艾字节级存储、物联网、信息物理系统、云平台、量子计算;物联网相关关键词:物联网、射频识别、红外感应器、定位系统、激光扫描器、智能感应、导航系统、移动物联网;通信技术相关关键词:网络安全、4G、5G、6G、通信、5G网络、卫星;人工智能相关关键词 人工智能、机器学习、挖掘算法、智能算法、机器人、专家系统、虚拟现实、智能技术、计算机视觉、商务智能、决策支持系统、决策辅助系统、智能机器人、智能数据分析;区块链相关关键词:区块链、数字货币、分布式计算、差分隐私技术、智能合约
缺失情况说明:部分市早年工作报告已缺失无法搜集,缺失部分已剔除不在样本中,2003-2024年284个地级市应合计6248份原始文件,其中488份为缺失无法搜集的部分,这部分无法进行文本分析,其余5760份均按流程进行文本分析,分析结果文件为“原始数据.xlsx”、“原始数据.dta”
处理说明:原始数据为使用Python对地方ZF工作报告进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式
参考文献
- 董康,孙可可,李平.数字技术会缩小居民收入差距吗?——来自ZF工作报告文本分析的证据[J].技术经济,2023,42(01):90-103.
代码:
原始数据
结果数据
市级数字技术水平词频2003-2025.zip
(2.34 MB, 需要: RMB 34 元)


雷达卡




京公网安备 11010802022788号







