看文献时,作者对回归系数进行解读时,经常会说这样一句话,当解释变量增加一单位标准差时,会导致被解释变量增加多少单位的标准差。
首先需要厘清两个概念:
标准差(standarddeviation):这个很好理解,我们从小就学了均值、标准差。对于正太分布而言,4个标准差可以解释95%左右的样本。标准差反应了样本的离散程度。
标准误(standarderror):这个一般是回归时汇报的,其计算方式
数据越接近拟合线,标准误的值会变得越小,标准误表示的是观测值距离回归线的平均距离。
现在举一个例子说明一下,DaronAcemoglu and Simon Johnson(2005)Unbundling Institutions中的一段。
In column 1 of panel A of table 4, thecoefficient on constrainton executive is 0.99 (with a standard error of 0.29). Thisimplies that a one-standard- deviation improvement in property rightsinstitutions will lead to a 1.9- standard-deviation increase in GDP per capita.
下图红色圈起来的部分就是这段英语说的表4第一列,这里被解释变量是GDPper capita,解释变量是constrainton executive。这里回归的系数(0.99)及标准误(0.29)是下图黄色线框起来的部分。这段话还说如果解释变量改善一个标准差,被解释变量将增加1.9个标准差。那这个1.9到底是怎么计算出来的呢,
还得参考解释变量和被解释变量的描述性统计部分。如下右图黄色标记的部分,分别是这两个变量的均值和标准差。
1.9 =2.09 x 0.99 / 1.10
即1.9是用解释变量的标准差乘以系数再除以被解释变量的标准差。