|
一切罪恶源于我们研究的是观测数据,是数据的被动接受者,而不是数据的实际控制者。在生物学实验中不存在这个问题,他们可以将样本随机分为实验组和对照组,从而实现两组均质(微弱的随机性差异不影响统计显著性),或者说“其他条件一样”,然后通过实验组和对照组的均值差异来判断“处理”是否有统计意义上的显著效果。从逻辑上来讲,既然通过随机化实现了实验组和对照组的“其他情况相同”,那么两组均值的差异,只能归结为“处理”影响的效果。
内生性的问题,是观测数据的特点所导致的必然结果。
因此,如果数据这个根本性的问题不解决,其他所有的所谓解决内生性问题的方法,都只是亡羊补牢、隔靴搔痒。
那么,我们就应该悲观了吗?我认为大可不必。我的看法是:一是内生性问题导致系数估计偏误。有时候我们更关心的是系数显著为正还是显著为负,至于其大小是次要的。所以能够通过稳健性检验表明系数符号的正确性,就达到了我们的目的。至于其真实系数为0.2还是0.4,只有天知道,我们还是不要为此伤脑筋了吧。二是管用原则。探究内生性问题,有时候也就是在寻找真正的原因机制。在纷繁芜杂的现实世界中,各种变量的影响交织在一起,我们观察到的变量之间的相关,是不是具有真正的影响关系?说实话,这个很难,如果寻根问底,答案遥不可寻。但是如果在现有条件下,我们改变了X的值,Y的值确实发生了变动(管他是如何发生的),对于政策设计来说就是有意义的。当然,换成其他情况,可能X与Y的关系又会大不一样,但是人毕竟不是上帝,我们只能通过学习不断逼近真理,在错误的代价上衍生出新的智慧。
|