空间计量经济学是计量经济学的一个分支,其中空间自回归模型(也称空间滞后模型,SAM)、空间误差模型(SEM)和空间杜宾模型(SDM)是广泛使用的三个空间计量模型。如果说一般计量模型是研究“我”的自变量对“我”的因变量的影响,那么空间杜宾模型就是研究“我的邻居”的因变量对“我”的因变量是否存在影响以及“我的邻居”的自变量对“我”的因变量的影响。结合空间杜宾模型的表达式\[y = \lambda wy + \pmb{x}\pmb{\beta} + w\pmb{x}\pmb{\delta} + \varepsilon\]来看,lambda 就是反映“我的邻居”的因变量对“我”的因变量的影响的参数,称作空间自回归系数;delta 就是反映“我的邻居”的自变量对“我”的因变量的影响的参数,称作解释变量的空间滞后项的系数。式中加粗的 x beta 和 delta 均为矩阵形式。
一、空间权重矩阵
我们知道虚拟变量可以作为地区层面的控制变量(在这个地区,为1;不在这个地区,为0),类似的思路,空间计量模型中使用空间权重矩阵(即上式中的 w )来确定“谁是谁的邻居(为1),谁不是谁的邻居(为0)”。也就是说一般情况下空间权重矩阵就是一个元素或是1或是0的对称矩阵,注意,空间权重矩阵的主对角线元素为0(因为自己不能和自己相邻)。在这里我们暂时不考虑构造起来比较复杂的距离权重矩阵和经济权重矩阵(因为我也不会),只考虑ROOK(“点相邻就算相邻”)和QUEEN(“边相邻就算相邻”)空间权重矩阵。贴一下我的空间权重矩阵:
在这里简单提一下stata导入数据的方法,小白可以手动选择 文件-导入-Excel电子表格,在弹出来的窗口中,一般要勾选“将第一行作为变量名”,并注意“单元格范围”(如果导入的单元格范围含有空白行或列,后面的操作会报错——空间权重矩阵不对称),再手动选择 文件-另存为,保存为stata可以直接读取的dta格式的数据文件即可;如果dta格式的数据文件位于stata的安装文件夹路径下,也可直接输入代码 use name.dta, clear,name是dta格式的数据文件的名字,可附加选项clear表示导入该数据的同时,清除stata内存中的已有数据(stata内存只能同时读取一份数据)。
对于面板数据(截面数据:“一时间点上各个截面变量的值组合起来的数据”;时间序列数据:“一截面变量各个时间点上的值组合起来的数据”;面板数据:“同时包含截面层面和时间层面的数据”)而言,基本上,后面的空间自相关检验、选择空间计量模型的LM检验以及空间杜宾模型分析中出现报错,都和空间权重矩阵密切相关:原因或是空间权重矩阵不对称,或是空间权重矩阵没有标准化,或是空间权重矩阵“格式”不对。空间权重矩阵不对称和没有标准化的问题其实很好解决,麻烦的是空间权重矩阵的“格式”。简单来说,生成空间权重矩阵有“两种不同的方法”,空间自相关检验、选择空间计量模型的LM检验和空间杜宾模型分析,有的只支持读取第一种方法生成的空间权重矩阵,有的只支持读取第二种方法生成的空间权重矩阵。
生成空间权重矩阵的第一种方法如下:
spatwmat命令行表示你使用W13.dta这个数据文件,生成了一个名为W0的的空间权重矩阵。这里,你有13个截面变量(地区),因此生成的是一个13×13的矩阵。
二、空间自相关检验
想要使用空间计量模型方法,首先要看前面我们提到的“我的邻居”的因变量对“我”的因变量是否存在显著的影响(如果基本没啥影响的话,当然就没理由拿什么空间计量模型了)。这就是考察数据是否存在空间依赖性的空间自相关检验。目前学界使用的空间自相关检验方法有三种:莫兰指数I、吉尔里指数C和Getis-Ord指数。当然这里我们还是暂且忽略这些检验方法建立起来的思路,而把关注点先放在检验的度量标准上。
相关操作如下:
首先,把第二种方法生成的空间权重矩阵标准化:
接下来自然是处理面板数据——声明截面变量和时间变量:xtset 截面变量 时间变量
生成莫兰指数和吉尔里指数(Getis-Ord指数要求空间权重矩阵必须是非行标准化的):spatgsa 因变量,weights(空间权重矩阵) moran geary twotail



雷达卡











京公网安备 11010802022788号







