个人写论文所整理的数据,主题是研究“高铁开通的经济环境效应”。删除存在样本严重缺失的城市后,共保留227个地级市,时间周期为2004-2018。由于高铁开通的时间点不一致,需要采用多时点双重差分模型,因此文件中保留已经处理好的Policyyear变量,可以直接用于多时点DID回归。本数据可以直接用于高铁效应分析。同时,还包括地理坡度这一自然工具变量,可以直接作为城市化或高铁开通的工具变量。
具体包括的指标包括:
1. 经济集聚水平(单位行政面积的非农业产出水平)
2. 创新创业水平(研究中心公布的双创指数)
3. 公路航空占比(公路客运量和航空客运量占比)
4. 铁路客运总量
5. 要素错配(劳动力要素错配和资本错配均以省级数据表征市级)
6. 市场分割指数(同上,以省级数据表征市级)
7. 雾霾浓度
8. 碳强度(tqd)
9. 碳排放总量(tpf)
10. 环境规制水平(熵值法估计得到)(er)
11. 城市化水平(ur)
12. 城市GDP(gdp)
13. 人口规模(pop)
14. 外商投资(fdi)
15. 劳动生产率(labor)
16. 能源消费总量(energy)
17. 产业结构(第二产业占比)(is)
18. 固定资产投资(ifa)
19. 专利申请数量(tech)
20. time/treat/did是高铁开通的虚拟变量
21. 地理坡度(slope)