取对数通常有两个目的:
其一,有些模型假设其中的变量或干扰项服从正态分布,取对数比较容易满足这一假设条件;
其二,有些变量包含了严重的离群值,取对数有助于减小离群值对估计结果的影响,尤其是当你采用 OLS 进行估计的时候。原理很简单,ln(10) = 2.3,ln(10000) = 9.2,可以看出,原本差异很大的两个数字,取完对数后差异变小了。
当然,取对数也是有代价的,最为明显的就是导致估计系数的含义发生变化。例如 y = xb + e,估计完成后,b 的系数可以解释为边际效果;而当采用 lny = lnx*b + e 的形式后,b 的系数则解释为弹性。如果采用 lny = xb + e 的形式,b 的含义就不那么容易解释清楚了。
不过,多数计量模型的目的并不是为了得到 b 的具体估计值(CD 函数除外,它希望得到资本和劳力的弹性),而只是为了推断其系数是否显著异于零,即进行定性判断。换言之,也就是我们平时所言的,x 是否影响 y?至于 x 在多大程度上影响 y,则不是我们重点关注的问题。在这种情况下,进行对数转换并不会影响我们的分析目的,因为对数转换是单调转换,不会影响数值的相对大小。
上述是我的粗陋见解,不妥之处,还请各位指正和讨论。
|