本数据集基于中国各省(自治区、直辖市)政府工作报告的文本分析,运用词频统计方法构建了省级层面的"生态环境注意力"和"经济注意力"两个维度的注意力分配指标。数据覆盖2002-2024年,形成省级面板数据结构。
该数据集可用于研究地方政府在生态环境治理与经济发展之间的注意力分配格局、演变趋势及其影响因素,适用于公共管理、环境经济学、政治学等领域的实证研究。
二、理论背景
本数据集的构建基于"注意力基础观"(Attention-Based View, ABV)理论框架。该理论由Ocasio(1997)提出,核心观点认为决策者的注意力是稀缺资源,组织行为取决于决策者将注意力分配到哪些议题上。
将注意力理论应用于政府治理领域,政府工作报告作为地方政府年度施政纲领性文件,其文本内容能够反映地方政府对不同政策领域的关注程度。通过对报告中特定领域关键词的词频统计,可以量化地方政府对生态环境治理和经济发展的注意力分配水平。
参考文献:
- Ocasio W. Towards an attention-based view of the firm[J]. Strategic Management Journal, 1997, 18(S1): 187-206.
- 文件夹内附参考论文PDF:《地方政府生态环境治理注意力研究——基于30个省市政府工作报告(2006—2015)文本分析》
三、数据来源与构建方法
1. 原始数据来源:各省(自治区、直辖市)历年政府工作报告全文文本。
2. 构建方法:
(1) 对政府工作报告进行文本预处理(分词、去停用词等);
(2) 统计生态环境相关关键词(如"生态""环境""污染""排放"等)的词频,行加总后得到"生态环境注意力"指标;
(3) 统计经济发展相关关键词(如"经济""投资""产业""进出口"等)的词频,行加总后得到"经济注意力"指标;
(4) 匹配省份编码,形成标准化的省级面板数据。
3. 时间范围:2002-2024年
四、文件清单
本文件夹包含以下文件:
1. 原始数据文件:
- 政府工作报告文本词频数据.dta 各省政府工作报告分词词频统计原始数据
- 政府工作报告文本词频数据.xlsx 同上(Excel格式)
- 省份编码信息数据.dta 省份名称与数值编码对照表
2. 计算结果文件:
- 计算结果省级版本.dta 最终计算结果(Stata格式)
- 计算结果省级版本.xlsx 最终计算结果(Excel格式)
3. 代码文件:
- 省级生态环境治理注意力分配数据计算代码.do Stata计算代码
- 省级生态环境治理注意力分配数据计算代码.py Python计算代码
- 省级生态环境治理注意力分配数据评估代码.do Stata数据质量评估代码
- 省级生态环境治理注意力分配数据评估代码.py Python数据质量评估代码
4. 参考文献:
- 地方政府生态环境治理注意力研究——基于30个省市政府工作报告(2006—2015)文本分析.pdf
五、变量说明(计算结果数据)
变量名 类型 说明
省份 字符型 省(自治区、直辖市)名称
省份编码 数值型 省份数值编码(用于面板数据设定)
年份 数值型 数据年份(2002-2024)
生态环境注意力 数值型 生态环境治理注意力指标,由生态环境相关关键词(生态、环境、污染、排放等)词频加总得到,数值越大表示该省当年对生态环境治理的关注程度越高
经济注意力 数值型 经济发展注意力指标,由经济发展相关关键词(经济、投资、产业、进出口等)词频加总得到,数值越大表示该省当年对经济发展的关注程度越高
六、数据特征
- 数据结构:省级面板数据(省份×年份)
- 时间跨度:2002-2024年(共23年)
- 截面单位:中国各省(自治区、直辖市)
- 指标类型:词频加总型连续变量,取值为非负整数
- 数据格式:提供Stata(.dta)和Excel(.xlsx)两种格式
省级生态环境治理注意力分配数据2002-2024年.zip
(1.33 MB, 需要: RMB 32 元)
数据质量评估报告_20260210.zip
(1.04 MB)


雷达卡



京公网安备 11010802022788号







