tag 标签: 调查数据经管大学堂:名校名师名课

相关日志

分享 经济学微观数据简介
epsilonzhang 2013-8-7 19:09
给一个我了解的微观数据的列表(排序在一定程度上反应个人偏好),简单提一下数据的特点: 1. Census:1982,1990,2000,2005 学界流行的版本中82,90,00数据为1%子样本;2005年数据为20%子样本; 普查数据主要优势是样本量大,这意味着你更容易发现变量之间的显著性关系,这在使用IV估计的时候尤其重要;普查数据通常可以和统计局发布的省、市、县层面的统计数据进行匹配使用; 这些数据都是confidential的,不过2000年的数据流传甚广,一度出现在人大经济论坛。 2. CHNS (China Health and Nutrition Survey): 1989,1991,1993,1997,2000,2004,2006,2009 优势在于这是一个跟踪调查,是针对中国的调查中唯一有这么长时间跨度的跟踪调查; 这套数据有营养摄入信息,这是其他调查没有的; 这套数据是对公众开放使用的,社区调查数据需要另外申请,签订保密协议。 3.CHIPS(Chinese Household Income Project Survey):1988,1995,2002,2007 这个是具有全国代表性的家户收入调查,有很详细的资产和收入信息,样本量也比较大,城镇和农村观测值都在2万以上; 由于有跨度长达二十年的四次调查,可以做一些时间趋势的分析; 这套数据基本上是对公众开放使用的。 4. UHS (Urban Household Survey) NBS城调队的调查,1986年往后每年一次,最新的不知道已经到哪一年了,优势是时期跨度很长,可以做趋势性的分析,类似CHIPS,但是变量没有CHIPS那么多; 这套数据不是对公众开放的,不过有一个从香港那边流传过来的版本(六个省那个),被广泛使用了。 5. CFPS(Chinese Family Panel Studies) 这个是美国PSID调查的中国版本,会是一个两年一次的跟踪调查,具有全国代表性; 这套数据是对公众开放使用的,2010年的基线调查应该是今年年底发布。 6. CHARLS(China Health and Retirement Longitudinal Study) 这个时美国HRS调查的中国版本,2008做了pilot survey,2011年基线调查,具有全国代表性; 这个调查的对象不是全年龄段人口,只是45岁及以上人口; 优势之一是非常详细的健康信息; 优势之二是调查集中在45岁以上人口,这个年龄区间的样本量就很大; 这套数据也是对公众开放使用的,基线数据会在明年二月份之前发布。 7. CLHLS (Chinese Longitudinal Healthy Longevity Survey):1998,2000,2002,2005,2008,2011 这是一个针对高龄老人的跟踪调查,具有全国代表性; 这是唯一一个以高龄老人为调查对象的家户调查,因此是最适合做死亡分析的; 这套数据是对公众开放使用的。 8. CGSS: 2003,2005,2006 这是一个偏社会学的调查,是个repeated cross-sectional的调查; 有许多比较独有的问题,例如社会观念,政治倾向等; 这套数据是对公众开放使用的。 9. 第三次和第四次全国卫生调查(卫调):2003,2008 主要调查内容涉及健康和医疗保险,问题比较粗略; 优势是样本量很大; 这套数据不对公众开放使用。 10. 中国儿童情况抽样调查:1992 这套数据重点调查了儿童、妇女,优点是样本量很大,50多万?懒得去check了; 这套数据不对公众开放使用,清华的李宏彬老师多次使用这套数据。 11. 全国人口与生殖健康调查:1997,2001 顾名思义,重点是生育问题,比较unique,样本量在两三万左右吧,记不清了; 这套数据不对公众开放使用。 12. CULS(China Urban Labor Survey):2001 社科院人口所做的调查,五个大城市; 详细的劳动力就业信息; 应该是有后续调查,但是我没有见过数据; 这个数据应该是可以公开使用的,去问蔡昉老师吧。 13. 2009年农村金融调查 这个是花旗银行的项目,平新乔老师负责的调查,9个县吧; 比较详细的农村金融信息; 我估计是可以公开使用的。 14. CHFLS(Chinese Health and Family Life Survey):2003 调查内容是健康和生活,具体的生殖系统疾病,同居,婚姻及性生活等,所以算是比较unique的; 估计是不可以公开使用的。 15.CHFS( China Household Finance Survey) 这个是家户金融调查,西南财大甘犁老师负责的,也是刚刚完成基线调查,放在家户调查的后面,是因为这个数据我没见过,不了解,不是不重要。 16. 清华李宏彬老师他们做一个有关教育的调查,也是才完成不久,我也没见过数据。 17. RCRE,农业部农户调查数据,我没见过数据,是个一年一次的农户调查。 到目前为止都是家户调查数据,下面几个是企业调查: 18. 中国工业企业调查数据:1998-2007 这个调查所有SOE和规模以上的非SOE; 样本量大,时间跨度长; 个人感觉数据质量不大行,企业调查还是不如家户调查准确; 不是对外公开的,不过花钱可以买。 19. 世界银行企业调查数据:2003,2005 好像是工业企业10%抽样调查; 不是对外公开的。 总结: 这几年家户调查越来越多,是做应用研究学者的福利; 更难能可贵的是,CHNS,CLHLS,CHARLS,CFPS,CGSS等数据都毫无保留的对公众免费开放使用; 非免费公开可用的数据,部分可以花钱买到; 我没有对数据内容做详细描述,凡是感兴趣的人可以百度之,很容易搜索到相关信息,对数据有疑问的也可以直接在评论中提问,对于其中大部分我接触过的数据我会尽量回复(对于对公众免费公开的数据,如有必要我可以直接提供); 还有一些小的家户和企业调查因为太小众了,没有列出; 关于调查数据有未尽的欢迎大家在评论中指出和补充; 我本人的研究方向是健康经济学、劳动经济学、社会保障,欢迎相关方向的学术交流讨论。Email:ccz.zhang@gmail.com
个人分类: 数据交流|209 次阅读|0 个评论
GMT+8, 2025-12-29 03:56