本数据集基于中国31个省级行政区(不含港澳台)2002-2024年的政府工作报告文本,通过词频分析方法构建了省级科技人才关注度指标。该指标衡量各省份政府工作报告中对科技人才议题的关注程度,反映地方政府在科技人才培养和引进方面的政策导向。
二、数据来源
省级政府工作报告文本词频统计数据。政府工作报告是各省份每年向人民代表大会提交的年度施政纲领,是衡量地方政府政策关注度的重要文本资料。通过对报告全文进行关键词检索和词频统计,量化政府对特定议题的关注程度。
三、时间范围
2002-2024年(共23年)
四、空间范围
中国大陆31个省级行政区(省、自治区、直辖市),共713条省份-年份观测值。
五、核心指标
科技人才关注度 = ln(科技人才关键词总词频 + 1)
其中,科技人才关键词总词频 = "科技"词频 + "人才"词频。
对总词频进行对数化处理(加1取自然对数),以降低极端值影响并使数据分布更接近正态分布。数值越大表示政府工作报告中科技人才相关内容越多。
六、数据文件清单
1. 省级政府工作报告词频数据.dta/.xlsx
原始词频数据,包含4个变量(省份、年份、科技词频、人才词频),713条记录。
2. 省份编码数据.dta
省份编码对照表,包含31个省份的6位行政区划代码。
3. 计算结果省级科技人才关注度.dta/.xlsx
最终计算结果,包含5个变量:省份、省份编码、年份、科技人才关注度、科技人才关键词总词频。
七、参考文献
[1] 陈曦, 吴英巨, 朱建华. 新质生产力视角下地方人才引进与全要素生产率[J]. 经济管理, 2024, 46(12): 104-120.
[2] 李晓萍, 赵浩云, 江飞涛, 刘悦. 中国区域人才政策与区域创新绩效[J]. 财经研究.
省级科技人才关注度数据2002-2024年.zip
(4.11 MB, 需要: RMB 32 元)
数据质量评估报告_20260214.zip
(3 MB)


雷达卡



京公网安备 11010802022788号







