更新时间:2022年10月23日
处理软件:Stata16
样本区间:2000-2020(可根据需要自行调整)
观测值:55135
数据说明:本数据为2000-2020中国县域面板数据,本数据特点如下:(1)提供原始数据和Stata处理代码:方便大家学习掌握数据处理过程,并佐证数据的可靠性;(2)面板数据:区县为空间维度,时间为年度的面板数据,可以直接使用;(3)包含区县:每年包含的区县个数不等,一般在2500+至2800+左右,详见后文各年度观测值;(4)两种格式:为方便大家使用分别提供了dta和xlsx两种格式的最终处理数据;(5)更新时间为2022年10月23日,已经是截止目前最新的,也是本数据的第一版,后续会持续更新。注意事项:(1)缺失值:有些数据原始数据中就存在缺失,所以大家在选择前可以在本帖评论或者私信询问一下关注变量的缺失值情况,笔者也正在处理多个数据库和年鉴本身的数据,以求最大限度填补缺失值;(2)变量说明:本数据包含176个变量,详见附件(可免费下载),建议大家购买前先行查阅;(3)样本数据:dta格式,详见附件(可免费下载)。
包含文件说明:
(1)子文件夹:xlsx out data等文件夹,主要存储原始数据、过程dta数据(可忽略)
(2)数据处理过程文件:Stata数据处理代码do文件(推荐查阅!)
(3)两套最终处理数据:包含dta和excel两种格式(重要!)
(4)变量说明
各年度观测值:
年度 | Freq. | Percent | Cum. |
2000 | 2,520 | 4.57 | 4.57 |
2001 | 2,512 | 4.56 | 9.13 |
2002 | 2,500 | 4.53 | 13.66 |
2003 | 2,499 | 4.53 | 18.19 |
2004 | 2,539 | 4.61 | 22.8 |
2005 | 2,529 | 4.59 | 27.39 |
2006 | 2,549 | 4.62 | 32.01 |
2007 | 2,559 | 4.64 | 36.65 |
2008 | 2,563 | 4.65 | 41.3 |
2009 | 2,565 | 4.65 | 45.95 |
2010 | 2,560 | 4.64 | 50.59 |
2011 | 2,591 | 4.7 | 55.29 |
2012 | 2,607 | 4.73 | 60.02 |
2013 | 2,612 | 4.74 | 64.76 |
2014 | 2,631 | 4.77 | 69.53 |
2015 | 2,702 | 4.9 | 74.43 |
2016 | 2,704 | 4.9 | 79.34 |
2017 | 2,852 | 5.17 | 84.51 |
2018 | 2,851 | 5.17 | 89.68 |
2019 | 2,847 | 5.16 | 94.84 |
2020 | 2,843 | 5.16 | 100 |
Total | 55,135 | 100 |
数据代码展示: