数据来源 省、地级市政府工作报告
时间跨度 2002-2025年
区域跨度 地级市、省级行政单位
数据格式 数据格式为excel形式
数据简介
本研究整理了2002至2025年间地级市政府与省级政府工作报告中关于新质生产力的文本内容,旨在为研究新质生产力的发展特征和趋势提供数据支持。通过分析相关关键词的词频,揭示地方政府在推动新质生产力方面的关注重点和政策导向,助力相关领域的研究与实践。
数据指标
本数据集展示了2011-2024年各地级市政府工作报告中的新质生产力词频统计数据。
注:本数据收集的具体过程如下
第一,定义种子词汇。基于国家发展和改革委员会网站公布的资料,确定了包括“新质生产力”、“数字经济”等在内的16个种子词汇。这些词汇涵盖了新质生产力的核心特征,如数字化、智能化、高效能等。
第二,根据确定的16个种子词汇,借助Word2Vec神经网络模型,运用深度学习的技术手段,从2023年9月至2024年4月间国家发展和改革委员会网站发布的有关“新质生产力”新闻文章中提取与种子词汇语义相近的词汇。为确保测量的精确性,本研究仅保留了那些与种子词汇相似度超过0.85的词汇,同时排除了与主题无关的词汇,如人名。
第三,挖掘各地级市政府年度报告中种子词汇与相似词词汇在其中出现的频数,为了便于比较,将词频加一后取自然对数。最终,识别出61个与新质生产力相关的高频词汇,包括但不限于“量子”、“数据”“高效能”、“科技创新”、“低损耗”等。
16个种子词展示如下:
新质生产力 数字经济 数字化
智能化 网络化 先进生产力
信息技术 高科技 高效能
高质量 生物技术 能源技术
材料科学 数据 科技创新
高新技术
指标:
省份 地级市 年份 词频总和
注:在地级市政府新质生产力词频分析中,指标为省份-地级市-年份-词频总和(含所有关键词词频);
在省级政府新质生产力词频分析中,指标为省份-年份-词频总和(含所有关键词词频)。


雷达卡




京公网安备 11010802022788号







