数据名称:地级市科技人才关注度数据
时间跨度:2003-2024年
数据层级:地级市层面
数据来源:各地级市政府工作报告文本分析
二、指标说明
1. 科技人才关注度
定义:地方政府对科技人才工作的重视程度
计算方法:基于政府工作报告中科技人才相关关键词词频
公式:科技人才关注度 = ln(科技人才关键词总词频 + 1)
理论依据:政府工作报告是地方政府年度工作的纲领性文件,
其中科技人才相关词汇出现频率反映政府重视程度
2. 科技人才关键词总词频
定义:政府工作报告中"科技"和"人才"等关键词出现的总次数
关键词列表:科技、人才等
统计方法:文本词频统计
三、数据文件说明
1. 市级科技人才词频原始数据.dta
内容:各地级市政府工作报告词频统计原始数据
格式:Stata数据格式
2. 市级科技人才词频原始数据.xlsx
内容:与dta文件相同,Excel格式
格式:Excel数据格式
3. 科技人才关注度(市级).dta
内容:计算后的科技人才关注度指标
格式:Stata数据格式
4. 科技人才关注度(市级).xlsx
内容:与dta文件相同,Excel格式
格式:Excel数据格式
5. 城市编码.dta
内容:城市名称与编码对照表
格式:Stata数据格式
四、变量列表
变量名 变量说明 单位/类型
城市 城市名称 字符型
城市编码 城市行政区划代码 数值型
年份 年份 数值型
科技人才关注度 科技人才关注度指标 数值型
科技人才关键词总词频 关键词出现总次数 整数
五、数据处理说明
1. 文本来源
各地级市人民政府工作报告
报告来源:政府官网、政府公报、地方年鉴等
2. 词频统计方法
采用Python/Stata进行文本分词和词频统计
关键词匹配采用精确匹配方式
3. 数据覆盖范围
覆盖全国大部分地级市
部分年份部分城市可能存在缺失
六、参考文献
科技金融政策与新质生产力发展
七、代码文件说明
1. 上市公司科技人才关注度市级数据计算代码.do - Stata计算代码
2. 上市公司科技人才关注度市级数据计算代码.py - Python计算代码
3. 上市公司科技人才关注度数据评估代码.do - Stata数据质量评估代码
4. 上市公司科技人才关注度数据评估代码.py - Python数据质量评估代码
市级科技人才关注度数据2003-2024年.zip
(1.88 MB, 需要: RMB 32 元)
数据质量评估报告_20260206.zip
(481.28 KB)


雷达卡



京公网安备 11010802022788号







