- 年份:2002-2025
- 范围:31省
- 文件格式:Dta格式(使用Stata打开)、Xlsx格式(使用Excel打开)
- 代码格式:do文件(Stata 14/15/16/17/18)
计算说明:
指标说明:参考文献的做法,运用文本分析法对各地区工作报告中出现的“创新”“科技”“科学”“技术”“研发”“产学研”“科研”“高新”“科教”9个关键词进行词频统计,采用其占去除停用词后的工作报告总分词数量比重表示政府对科技的关注度,即科技注意力指标。
相关关键词:“创新”“科技”“科学”“技术”“研发”“产学研“科研”“高新”“科教”。
缺失情况说明:2002年度之前的部分市早年工作报告已缺失无法搜集,缺失部分已剔除不在样本中。2002-2025年度期间数据不存在缺失值,词频文件为“原始数据xlsx”“原始数据.dta”。
处理说明:本资料所使用的词频数据为使用Python对地方政府工作报告进行文本分析后获得(jieba分词,停用词表使用哈工大停用词表),后续使用Stata进行整理,最终形成面板数据形式。
参考文献
- 戴万亮,林小燕.什么样的环境要素组合有利于实现高区域创新效率——基于WSR方法论[J].科技进步与对策,2024,41(23):52-62.
代码:
原始数据:
结果数据
【更新至2025】科技注意力指标2025-2002年省级数据含Stata Excel表文本分析结果
(76 Bytes, 需要: RMB 32 元)


雷达卡




京公网安备 11010802022788号







