本次分享的数据的特点:
1. 来源可靠。分享的数据来自中国县域统计年鉴,直接下载与中国经济社会发展统计数据库http://tongji.cnki.net/kns55/index.aspx ,而非其他二手渠道。
2. 干净,可直接使用。我已经将2009年到2012年的数据merge到同一张表中。包含每一个县每年的每个指标。数据结构如下图
3. 提供多种选择。如你们可见,帖子一共有三个附件。分别是只包括县域数据的excel表,包含县域数据和省级、市级和县级行政代码的excel表(行政区划代码下载自国家统计局,时间为2011年的标准。),以及一个压缩包。压缩包包括我处理过的原始文件及相关code,以方便想要学习交流的人使用,所以定价也最高。STATA版本为14.
数据的不足之处在于:
1. 中国县域统计年鉴统计的区县不包括地级市的中心城区,因此每年中包括近2000个区县的数据,而非全国所有区县的数据。
2. 即使在2009年到2012年间,部分区县的归属和名称也存在变动。但这部分样本非常小,四年间只有不到20个,我未做处理,可以留给使用数据的人自行处置。
我个人希望大家能下载包含原始数据和code的压缩包。以前对于年鉴类的数据,我个人都是通过excel来处理,但这次主要是通过观测数据结构来用stata进行处理(当然不可避免地需要用到excel进行某些处理工作)。在这个过程中感觉又学到了很多,包括对数据结构的掌握程度,以及stata命令的深入程度(比如正则表达式函数和正则表达式用法)。我在code中对处理方法和思路进行了比较详细的说明,希望能对想要学习的人有一定帮助。也欢迎大家一起交流,共同进步。