空间面板计量分析步骤
(由于网上的资料操作性不高,作者自行整理空间面板计量分析步骤,集中于操作方面,涉及ArcGIS10.2、Stata13、Geoda1.6.7、Matlab2010a,不讨论理论,由于作者对计量的认识不一定充分,步骤可能有误或者未尽完善,希望能够对此问题有一个正确的系统认识,现展示操作步骤,请各位大神指导。如有错误或简化的步骤,望留言和联系,谢谢。其他同行如转载请注明出处)详细附图板在附件,
一、总思路
(一)确定有否必要使用空间计量,即使用一般面板计量模型还是空空间面板计量模型(空间自相关分析)
(二)确定空间滞后模型还是空间误差模型,还是其他模型,还是不需要用到空间模型(LM)
(三)确定随机效应还是固定效应(Haueman)
(四)确定个体固定、时间固定还是混合固定(LR)
一、ArcGIS 10.2部分
1、收集数据,形成excel总表
t为年份,BSM为分析地区的唯一ID;
2、打开ArcMap,加载“XZQ”图层
3、新建字段BSM(字段类型为long),按照excel的BSM标注每个地区的唯一ID
4、运用图层导出,分别导出n个“XZQ”图层,n为年份数,如果分析的时间跨度为10年,则n=10,分别命名为XZQ2007、XZQ2008、XZQ2009……
5、逐个右键“XZQ”图层,按照年份运用join连接上述excel表,连接字段为BSM
6、连接后,分别右键导出图层,重新命名为“XZQLJ2007”、 “XZQLJ2008”、“XZQLJ2009”……
二、GEODA1.6.7部分
1、安装GEODA1.6.7
2、导入每一年的XZQLJ,以XZQLJ2007为例
3、Tools-Weights-Create,创建空间权重矩阵
(1)Weights File ID Variable选择唯一ID的BSM;
(2)连接方式采取“Queen”,表示分析单元的图斑相互邻接(通常为面状),如果分析的图斑不相互邻接(点状),则用“Rook”;
(3)生成的权重为对应SHP文件的GAL文件,例如XZQLJ2007.gal
4、进行自相关检验
(1)全域自相关检验
点击面板上对应图标展开菜单,点击UniVariate Moran’s I,弹出面板,选择需要进行检验的因变量,本例为LnZons,得到该年份的散点图和Moran’s I值。查看了相关论文,一般为对全局Moran’s I值进行逐年的趋势分析,得到其趋势,此处不详细说明。
(2)局部自相关检验
点击面板上对应图标展开菜单,点击UniVariate Local Moran’s I,同样选择待分析的变量,结果有三种结果图式,可根据相关理论选择。
(3)回归分析。考虑GeoDA主要为对空间截面数据的处理,如果是空间面板,Geoda无法实现,将结合Stata和Matlab进行。
三、STATA部分
1、安装一系列的分析插件
(1)ssc installspmap/shp2dta/mif2dta/spweight/spwmatrix
(2)search speightxt,点击安装speightxt的插件
(3)安装空间回归插件
1)findit spatreg
2)search spregdhp
3)search xsmle(空间面板模型)
2、使用spwmatrix命令导入gal文件,语法:
spwmatrix import usingC:\Users\Administrator\Desktop\test\Z2J2007.gal, wname(Z2J2007)
此阶段生成的矩阵主要供Matlab使用,不进行标准化
3、使用stata的命令putexcel将矩阵导出到excel,语法:
putexcelA1=matrix(Z2J2007) using JUZHEN
|
四、Matlab2010a部分
(一)LM检验
1、下载空间计量工具箱jplv7
新建一个工作文件夹,例如在桌面建立一个TEST2,把jplv7所有的内容解压到TEST中
2、导入权重变量和分析变量
(1)新建变量,命名为A
把所有变量(首列为因变量,其余为自变量)
****注意数据的顺序
****不把变量名称导入
3、保存工作空间
File-Save Workspace As,命名为TEST2.mat,路径指向TEST2文件夹下
4、设置工作路径
(1)点击左下角的软件开始菜单,点击路径path
(2)点击Add with Subsfolders,把路径指向于文件夹TEST2(如果后面因为matlab搜索不到工具而报错,则可尝试一下把所有工具的文件夹分别指向路径一次,便于matlab能够搜索)
把TEST2下所有解压出来的jplv7文件夹都设置一次路径,注意是所有文件夹都要加入Matlab search path中,不然后面的分析会找不到对应的分析工具而报错。
5、Hausman检验
把数据先视作一般面板数据进行Hausman检验,决定是使用随机效应模型还是固定效应模型,后面看到LR检验的工具箱也有空间面板的Hausman检验,但只有对SLM模型和SAC模型的随机效应和固定效应的区分,其他模型方法不是太清楚,希望有大神补全。检验的结果一般为固定效应,所以下面LM检验时也是围绕固定效应,对于随机效应这方面也是并不清晰。
6、空间LM检验
(1)用matlab把TEST2\spatial\panel\demoLMsarsem_panel.m文件复制到TEST2的目录下,即与TEST2.mat相同的目录(主要是为了不影响源文件,以便改错后可以修复)。打开demoLMsarsem_panel.m
(2)加载文件
自己新增变量和权重矩阵后,这两行是没有用的,不过可以在对应的的这两个文件分别输入变量和权重,但我觉得比较不方便,就把他们删掉了,改增加load TEST.mat
(3)修改时间变量、指向因变量和自变量
****T为总的年数,N为总的个体数(区域数),对应载入的面板数据
****修改y和x所在的列号,例如,如果因变量在第一列,则y后面的数字输入为1;自变量在2-8列,则数字对应输入列号,用逗号分隔。
(4)LM检验
*******分别修改下面几种方法的变量,第一项为因变量,第二项后面均为自变量,与对应的表格的列相对应
(第一种是最小二乘法估计,含LM检验)
(第二种是对于空间固定滞后模型和空间固定误差模型的空间LM检验和空间robust检验,将会根据生成相关值的情况决定是使用空间滞后模型和空间误差模型,具体可参考相关论文。默认情况是个体的固定效应,如果要进行时间的固定效应,则把第一行model=1改为model=2,也是修改变量名称即可)
(第三种是对于空间混合固定滞后模型和空间混合固定误差模型的空间LM检验和空间robust检验,修改变量名称即可)
*******分别比较各种方法的统计量和显著性,决定使用空间滞后模型还是空间误差模型
7、LR检验
(1)用matlab把TEST2\spatial\panel\demopanelscompare.m文件复制到TEST2的目录下。打开demopanelscompare.m
(2)加载文件,加载变量,指向自变量和因变量,此处不再叙述
(3)LR检验
以空间固定效应如LM检验,需先修改因变量和自变量的名称,此处要注意info.model=1的语句,值为1时,代表个体固定效应,值为2时,代表时间固定效应,值为3时,代表双固定效应,比较统计量和显著性可以决定使用个体固定、时间固定还是混合固定。
8、对应LM检验中的分析结果,例如分析数据确定了使用空间+固定+混合+滞后模型,则在LM检验中针对对应的分析结果进行解释即可。