一些计量经济学的初学者在掌握了计量模型后往往迫不及待地希望将模型应用于实际数据,但他们在尝试获取数据时却常常感到困惑,不知道从哪里能得到想要的数据……
为了解决这一问题,本文简要介绍一些国内外实证研究中比较常用的数据集。当然,随着现代社会信息技术的发展和大量数据收集工作的开展,我们在实证研究中可以应用的数据远远不止于此,但由于这些数据大多可以免费申请获得,并且其权威性已经得到很多研究的论证,因此对于初学者而言,它们不失为上佳之选。
国内常用数据集
1.中国家庭动态追踪调查(CFPS)
由北京大学中国社会科学调查中心(ISSS)实施的一项旨在通过跟踪搜集个体、家庭、社区三个层次的信息,反映中国社会经济、人口、教育和健康的变迁情况的数据。其调查目的主要是为社会科学学术研究和政策决策提供参考。其中2008年和2009年两年在北京、上海、广东三地进行了试调查,2010年进行了第一次全国调查。经2010年基线调查界定出来的所有基线家庭成员及其今后的血缘/领养子女将作为CFPS的基因成员,成为永久追踪对象。CFPS调查问卷共有社区问卷、家庭问卷、成人问卷和少儿问卷四种主体问卷类型,并在此基础上不断发展出针对不同性质家庭成员的长问卷、短问卷、代答问卷、电话访谈问卷等多种问卷类型。
2. 中国健康与养老追踪调查(CHARLS)
由北京大学国家发展研究院中国经济研究中心主持的数据收集项目,在我国每两年追踪调查一次,目的是采集能够代表年龄在45岁以上(包括45岁)的中国居民的情况。2008年秋季已经在我国甘肃、浙江两省进行了预调查,2011年进行了第一次全国调查。CHARLS 抽样以保证样本的无偏性和代表性为宗旨,通过四个阶段,分别在县(区)-村(居)-家户-个人层面上进行抽样。具体而言,在县(区)-村(居)两级抽样中,CHARLS均采用按人口规模比例的概率抽样(简称为PPS抽样)。在县级抽样阶段,按照PPS方法,以每个区县2009年人口数量为基础,使用地区、城乡和GDP为分层指标,直接从全国30个省级行政单位(不包括西藏自治区、台湾省以及香港和澳门特别行政区)范围内随机抽取150个区县;在村级抽样阶段,按照PPS方法,以每个村或社区2009年常住人口为基础,从上述150个区县中各随机抽取3个村或社区,最后得到450个村/社区。CHARLS问卷内容包括:个人基本信息、家庭结构、经济收支状况、健康状况(含实际体格测量)、医疗服务利用和医疗保险以及社区基本情况等。
3. 中国健康与营养调查(CHNS)
由中国疾病预防与控制中心、美国北卡罗来纳大学以及中国预防科学研究院合作主持的数据收集项目。该调查始于1989年,以后又分别在1991年、1993年、1997年、2002年、2006年、2009年及2011年进行。该调查在全国随机抽取辽宁、黑龙江、山东、江苏、河南、湖北、湖南、广西、贵州等9个省份中的城乡社区及家庭,调查内容包括家庭和个人的基本特征、收入和支出状况、健康情况、营养摄入、医疗保险及使用等情况,以及社区基础设施、公共服务等环境特征。
4.中国家庭收入调查(CHIP)
由中国社会科学院与国家统计局合作主持的数据收集项目。该调查始于1988年,目前共有1988年、1995年、2002年和2007年等四个截面数据。调查内容包括城市住户问卷、农村住户问卷和城市农民工问卷。调查信息由三个部分组成:城镇住户调查、农村住户调查和流动人口调查,详细记录了家庭收入与消费信息。
5. 中经网数据库
由国家信息中心中经网凭借与国家发改委、国家统计局、海关总署及各行业主管部门的合作,提供的一个综合、有序的经济统计数据库群。其内容涵盖宏观经济、行业经济、区域经济以及世界经济等各领域,包括六个子库,分别是宏观月度库、行业月度库、海关月度库、综合年度库、城市年度库以及世界经济统计数据库。
国外常用数据集
1.当前人口调查(CPS)
由美国人口普查局主持的反映美国家庭基本信息的月度调查数据。它提供了美国劳动力市场就业、失业情况;工作时间;收入支出以及相应的人口统计信息。
2.长期追踪调查(NLS)
旨在收集美国劳动人口长期劳动力市场表现及其他重要生活决策信息的一系列调查,到目前为止已经进行了超过40年。对于经济学家、社会学家以及其他研究人员,长期追踪调查具有非常重要的意义。
3.医疗支出面板调查(MEPS)
针对美国家庭、个人、医疗服务提供者以及企业雇主的一系列大规模调查。它提供了关于医疗保健支出、医疗服务利用以及医疗保险覆盖等与医疗和健康有关的全面信息。
4.资产价格研究数据库(CRSP)
由美国芝加哥大学商学院资产价格研究中心收集维护的、旨在提供与美国证券交易相关的基础与衍生金融产品数据。它主要包括美国股票数据库、美国资产组合配置数据库、美国财政数据库以及美国共同基金数据库,等等。
5.宾夕法尼亚大学世界表(The Penn World Table, PWT)
由其前身联合国国际比较项目(International Comparison Programme, ICP)发展而来。数据库早期由Irving Kravis、Robert Summers与Alan Heston等知名学者创建与维护。1991年首次用于Summer和Heston的论文“宾大世界表:一个扩展的国际比较,1950—1988年”。其公开版本于1993年问世,此后不断更新与修正。当前最新的是PWT 8.0版本,由宾夕法尼亚大学出版,由收入与物价国际比较中心发布。PWT 8.0数据库涵盖了1950—2011年167个国家或地区的30个涉及国民经济核算与贸易活动的统计数据。
本文节选自秦雪征《应用计量经济学:EViews 与SAS实例》,2016年北京大学出版社出版


雷达卡




京公网安备 11010802022788号







