数据来源:工作报告
时间范围:2002-2025年
数据范围:地级市、省级行政单位
数据格式:excel
包含指标:
本数据集展示了2011-2024年各地级市政府工作报告中的新质生产力词频统计数据。
注:本数据收集的具体过程如下
第一,定义种子词汇。基于国家发展和改革委员会网站公布的资料,确定了包括“新质生产力”、“数字经济”等在内的16个种子词汇。这些词汇涵盖了新质生产力的核心特征,如数字化、智能化、高效能等。
(https://www.ndrc.gov.cn/wsdwhfz/202402/t20240206_1363980.html)
第二,根据确定的16个种子词汇,借助Word2Vec神经网络模型,运用深度学习的技术手段,从2023年9月至2024年4月间国家发展和改革委员会网站发布的有关“新质生产力”新闻文章中提取与种子词汇语义相近的词汇。为确保测量的精确性,本研究仅保留了那些与种子词汇相似度超过0.85的词汇,同时排除了与主题无关的词汇,如人名。
第三,挖掘各地级市政府年度报告中种子词汇与相似词词汇在其中出现的频数,为了便于比较,将词频加一后取自然对数。最终,识别出61个与新质生产力相关的高频词汇,包括但不限于“量子”、“数据”“高效能”、“科技创新”、“低损耗”等。词库包含的61个词汇详见数据皮皮侠。
16个种子词展示如下:
新质生产力 | 数字经济 | 数字化 |
智能化 | 网络化 | 先进生产力 |
信息技术 | 高科技 | 高效能 |
高质量 | 生物技术 | 能源技术 |
材料科学 | 数据 | 科技创新 |
高新技术 |
指标:
省份 | 地级市 | 年份 | 词频总和 |
注:在地级市政府新质生产力词频分析中,指标为省份-地级市-年份-词频总和(含所有关键词词频);
在省级政府新质生产力词频分析中,指标为省份-年份-词频总和(含所有关键词词频)。
样例数据:
下载链接:
【工具变量】最新省地级市新质生产力指数数据集(2002-2025年)
(76 Bytes, 需要: RMB 15 元)


雷达卡



京公网安备 11010802022788号







