一、时间跨度:2000-2025年,3.2万多条数据,共计涵盖2700多个县域,内含数字基础设施相关的51个词频明细、扩展词频
二、数据来源:ZF工作报告
三、测算方法
参考钞小静等(2021)、李小明等(2025)的做法,根据中国县域政府工作报告,整理和统计区县级数字基础设施政策词频总和数据,内含数字基础设施相关51个词频明细数据。具体来说,从地方政府网爬取工作报告原始文件,将报告文本整理为面板数据,去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计文本总词频,保留中英文、数字、标点符号,统计文本总长度,利用正则表达式统计51个精确词频以及扩展词频。
四、数据指标
- 年份
- 区县代码
- 区县名称
- 所属城市
- 所属省份
- 文本总长度
- 文本总长度(仅中英文)
- 文本总词频-全模式
- 文本总词频-精确模式
- 数字基础设施水平词频和(两种版本结果)
- 51个原始词频明细
五、参考文献
[1]钞小静,廉园梅,罗鎏锴.新型数字基础设施对制造业高质量发展的影响[J].财贸研究,2021,32(10):1-13.
[2]钞小静,薛志欣,孙艺鸣.新型数字基础设施如何影响对外贸易升级——来自中国地级及以上城市的经验证据[J].经济科学,2020,(03):46-59.
[3]李小明,刘雅迪,汪婵,等.破解环境规制的“增长困局”:数字经济的对冲效应[J].经济学动态,2025,(09):19-38.


雷达卡




京公网安备 11010802022788号







