antoni09 发表于 2010-11-29 14:24 
IV不能说成是自变量,计量经济学中,IV专门指工具变量,参数可不能写成indicator,这个专门指0或1的虚拟变量,参数应该称为parameter,这些专业名词都应该正确使用。
做理论和做经验研究的不一样,做理论的可以偏重某一点,其他的都可以简化,做经验研究的必须同时考虑很多理论可能性。比如楼主列出来的生产函数形式,其实这只是生产函数的一种假定形式,还有其他的生产函数形式,只不过都不如柯布道格拉斯生产函数方便处理而已。因此在做生产函数的计量分析时,单是检验柯布道格拉斯生产函数的那两个系数还是不行的,还必须尽可能的把其他能够影响产值的因素包括进来,这就是为什么那些作者要罗列一大堆理论文献,因为可以根据这些理论来确定什么因素对产值可能起作用。
其实楼主如果多读点国外文献会发现,学界对经验研究的困难应该探讨得非常深入细致了,使用线性回归有什么好处?在理论假定前提不明确的情况下,回归的系数代表了什么意义?以为这些问题很浅的人真的了解线性回归?
受教,您说的有道理。不过indicator是在一些社会科学英文文献中从研究方法论问题时的泛指,不是小弟的独创。但回想计量经济学中确实没有看到,用parameter的确更准确。
您提的问题有些我很赞成,但并没有回答我的问题
您的问题
——“在理论假定前提不明确的情况下,回归的系数代表了什么意义?”——如果是最最简单OLS检验,说明了在两列数据所代表的变量在一定的显著性水平基于线性关系所呈现出的相关性,系数更多代表了相关性,而并非是确切的数值,并非是完全的线性对应。这是计量经济学书本上的大意,也是几乎每个老师都会教授的结论,因为H0是假定参数为0,如果以大概率拒绝,能说明的只是相关性。结论是对的,可少有人质疑为什么那个参数无用。或许因为经典计量经济学的初级教材都是这么举例的,结果做到相关性就可以了。。。(此理由小弟也不确定,但请指正)
但即使这得到检验的相关性,也是基于线性这一前提,回归是在此基础上一定概率的拟合。我们不可以说,因为从结论而言,人们需要的信息是变量之间的相关性,所以就剔除了检验的线性模型这一前提。
回到我的问题。
1。传导机制部分的理论。比如您说的柯布道格拉斯生产函数的例子,小弟的问题不是不肯定您说的“还必须尽可能的把其他能够影响产值的因素包括进来”,而在于如果把这些影响的因素考虑进来,但没有基于原始的柯布道格拉斯生产函数进行再论证(换言之,没有在一个统一的前提和假定下建立包括所涉及因素在内的模型),这也就意味相关传导机制的论述尽管有理论,但是
该理论体系合起来看并不是基于一个统一的假定和前提(题外话:这也是为什么西方宏观经济学相比于西方微观经济学至今看上去始终没那么完美的原因,每个流派都在建立自己的假定,且很少兼顾前人理论,未能涵盖其他流派),有的前提与假定甚至会出现自我矛盾。
2。第二个关于检验部分。基于回归检验的原始模型(比如OLS的线性)即使论证了数据的相关性,其实也只是基于回归检验线性这个前提而得到的结论,并非是文章前面传导机制的理论。也就是你
检验的再正确还是检验的变量间基于线性关系这一前提的相关性(这里暂且不谈论斜率),
检验的过程实际
没有用到传导机制部分所叙述的理论。
举个例子:因变量DV是30年来全球的气温逐年的增长率,自变量IV是30年来A国的GDP增长率。
假设文章开始运用了这样的传导机制:经济增长——工业化加速——二氧化碳排放增加——全球变暖。但在这一过程没有建立了自己的模型,而是论述A理论“某古典理论提及经济增长——工业化加速”,B理论“某新古典理论工业化加速——二氧化碳排放增加”,C理论“某宏观理论认为二氧化碳排放增加——全球变暖”。然后定性的建立了一个上文提到的传导机制。接着,进行回归检验,假设DV和IV都是平稳的,使用OLS,也确实p值很小,DW,R等从回归方法上都很符合要求。然后文章结束,表明了最初的结论。
我的意思是该文章:
第1,该文传导机制实际没有建立严谨的理论(无论多少中间变量,严谨的方法是基于一个前提推出,最好是数学模型);第2,计量检验从检验方法上DV和IV具有相关性(是显著的,这里不谈斜率或者截距的问题),但所证明的相关性也是建立在
线性模型(OLS)基础上的相关;再者,这里的相关性结果与文章前文所论述的传导机制并没有一一对应。换言之,这里的
数据并没有证明文中所论述的变量间的传导机制,而是
基于检验方法(OLS)的
线性模型证明了两变量的相关性。
那么从方法上而言,
文中那个传导机制有何意义?
如果这个方法
是可行的,作者
完全可以在传导机制中再随意加入或者减掉一个中间变量,同样可以得到相同的结论。
也许有朋友会说那把传导机制
都用前人的已有理论。当然这样的话传导机制是没问题(如果不是抄袭),但是
文章的数据不还是没有证明这个传导机制?而经济学论文的核心并不是最后的检验方法,而恰恰是前面的传导机制,
没有证明传导机制,光靠数据的相关性是请问说明了什么? 除非传导机制的模型可以转化为后面计量检验的模型形式(如同经典的柯布道格拉斯生产函数)
这里论述的前提都是基于实证主义(再次说明下,实证主义不等同于经验主义,有些朋友有兴趣还是阅读一些社会科学方法论的原著,比如Karl Popper, Kuhn Thomas, Imre Lakatos的文章,国内有些误解多半源自于翻译者)
文中若有不对之处,请继续批评指正!