数据名称:各省人才重视程度数据
数据范围:中国31个省(自治区、直辖市)
时间范围:2002-2024年
数据来源:各省级政府工作报告全文文本挖掘
数据格式:Stata格式(.dta)和Excel格式(.xlsx),附Stata/Python计算代码
二、研究背景
人才是经济高质量发展的动力源泉。习近平总书记指出"国家发展靠人才,民族振兴靠人才"。党的二十大报告强调"人才是第一资源",要"深入实施科教兴国战略、人才强国战略、创新驱动发展战略"。改革开放以来,人力资源和人才向东南沿海经济发达地区聚集的"孔雀东南飞"现象广受关注,各省份对人才的重视程度存在显著差异。本数据通过对省级政府工作报告进行文本挖掘,量化衡量各省份对人才创新议题的关注程度,为研究地方政府人才政策导向、区域人才竞争格局等议题提供数据支撑。
三、指标定义与测算方法
1. 数据基础:收集2002-2024年各省级政府工作报告全文,统计报告总词数及人才创新相关关键词出现频次。
2. 关键词范围:人才资源、人才队伍、高层次人才、人才强国战略、创新创业、创新驱动、创新团队、知识产权等8个人才创新领域核心词汇。
3. 核心指标:
人才重视程度 = 人才创新关键词总词频 / 政府工作报告总词数
该指标反映省级政府在年度施政纲领中对人才创新议题的相对关注程度,数值越高表示该省份在政府工作中越重视人才创新。
四、数据结构
计算结果数据包含以下字段:
省份 —— 省级行政区名称(如:北京市、广东省、新疆维吾尔自治区等)
省份编码 —— 省级行政区数字编码
年份 —— 观测年份(2002-2024)
人才重视程度 —— 核心指标,人才创新关键词总词频占报告总词数的比率
人才创新关键词总词频 —— 当年政府工作报告中8个关键词出现次数之和
工作报告总词数 —— 当年政府工作报告的总词数
五、文件结构
本数据包含以下文件:
省级政府工作报告词频数据.dta / .xlsx —— 原始数据,各省份各年度政府工作报告的关键词词频统计
省份编码对照表.dta —— 省份名称与数字编码对照表
计算结果省级人才重视程度.dta / .xlsx —— 最终计算结果数据
省级人才重视程度数据计算代码.do —— Stata计算代码(含详细注释)
省级人才重视程度数据计算代码.py —— Python计算代码
省级人才重视程度数据评估代码.do —— Stata数据质量评估代码
省级人才重视程度数据评估代码.py —— Python数据质量评估代码
"孔雀东南飞"-经济高质量发展与人才流动.pdf —— 参考文献
六、参考文献
[1] 李磊,王天宇."孔雀东南飞":经济高质量发展与人才流动[J].数量经济技术经济研究,2023,40(02):5-24.
省级人才重视程度数据2002-2024年.zip
(6.68 MB, 需要: RMB 32 元)
数据质量评估报告_20260213.zip
(5.78 MB)


雷达卡



京公网安备 11010802022788号







