最近几年,我们对农户借贷需求进行了较为广泛的调查,采集了青海、新疆、甘肃、河北、黑龙江、吉林、山西、湖南、湖北、河南、安徽、江西、陕西、山东、辽宁、内蒙古等16省区的72个县、440多个村庄的5100家农户的数据。其中,在一年中发生借贷行为的农户占55.3%(包括向亲友借贷),为2820户,其余2280户没有发生借贷。对于这一宝贵的数据资源,当然要充分利用。于是,为了对农户借贷行为进行因素分析,不同的研究者建立了不同的计量经济学模型。有人利用2820户发生借贷的农户的借贷额为被解释变量,建立经典的回归模型;有人认为应该将没有发生借贷的农户信息加以利用,其借贷额为0,于是利用5100农户为样本,建立经典的回归模型;有人认为不应该将没有发生借贷的农户的借贷额统统视为0,而应该视为小于等于0(≤0),于是利用5100农户为样本,建立了归并(censoring)数据模型(Tobit模型)。有人认为不应该将没有发生借贷的农户的借贷额统统视为小于等于0,因为其中一部分农户有借贷需求,只是因为各种原因(例如提出借贷被拒绝,担心借不到而不敢提出借贷要求等)而没有发生实际借贷。所以,应该按照Heckman两步法建立模型,即首先利用全部样本信息建立借贷是否发生的二元选择模型,然后再利用2820户发生借贷的农户为样本,建立借贷额的因素分析回归模型。显然,最后一种模型是正确的,其他都是不正确的。那么,为什么会发生这些现象?
上述例子从不同的角度反映了计量经济学模型与数据之间的关系。前者反映了计量经济学模型估计结果对数据质量的依赖性;后者反映了计量经济学模型类型对数据类型的依赖性。正如李子奈(2007)指出的,在我国计量经济学应用研究广泛开展的今天,问题和错误也普遍存在。重要的原因之一是对计量经济学模型方法论基础缺乏正确的理解,其中包括计量经济学模型的数据基础问题
本文来源于CSSCI学术论文网:
http://www.csscipaper.com/ 全文阅读链接:
http://www.csscipaper.com/eco/lilunjingji/54307.html