楼主: 齐轩邈
39214 20

[学习心得] 空间计量stata实现:面板数据空间杜宾模型(SDM)   [推广有奖]

  • 0关注
  • 5粉丝

初中生

76%

还不是VIP/贵宾

-

威望
0
论坛币
61 个
通用积分
7.8569
学术水平
4 点
热心指数
9 点
信用等级
4 点
经验
80 点
帖子
3
精华
0
在线时间
28 小时
注册时间
2019-6-7
最后登录
2022-6-6

楼主
齐轩邈 学生认证  发表于 2020-1-19 13:57:30 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
之前参加学校比赛,抽到的是一篇基于空间杜宾模型做空间计量分析的论文,我在组里主要负责搞模型部分以及代码实现。本小白当时也是各种百度搜索,现学现用,程序报错再百度搜索,再现学现用…最后终于勉强弄懂了大概。现整理一下自己的资料发帖分享出来。思路主要是,结合stata代码,尽量简单直白地解释空间计量经济学的逻辑及stata软件的逻辑,最后给出自己的代码。


空间计量经济学是计量经济学的一个分支,其中空间自回归模型(也称空间滞后模型,SAM)、空间误差模型(SEM)和空间杜宾模型(SDM)是广泛使用的三个空间计量模型。如果说一般计量模型是研究“我”的自变量对“我”的因变量的影响,那么空间杜宾模型就是研究“我的邻居”的因变量对“我”的因变量是否存在影响以及“我的邻居”的自变量对“我”的因变量的影响。结合空间杜宾模型的表达式\[y = \lambda wy + \pmb{x}\pmb{\beta} + w\pmb{x}\pmb{\delta} + \varepsilon\]来看,lambda 就是反映“我的邻居”的因变量对“我”的因变量的影响的参数,称作空间自回归系数;delta 就是反映“我的邻居”的自变量对“我”的因变量的影响的参数,称作解释变量的空间滞后项的系数。式中加粗的 x betadelta 均为矩阵形式。


一、空间权重矩阵


我们知道虚拟变量可以作为地区层面的控制变量(在这个地区,为1;不在这个地区,为0),类似的思路,空间计量模型中使用空间权重矩阵(即上式中的 w )来确定“谁是谁的邻居(为1),谁不是谁的邻居(为0)”。也就是说一般情况下空间权重矩阵就是一个元素或是1或是0的对称矩阵,注意,空间权重矩阵的主对角线元素为0(因为自己不能和自己相邻)。在这里我们暂时不考虑构造起来比较复杂的距离权重矩阵和经济权重矩阵(因为我也不会),只考虑ROOK(“点相邻就算相邻”)和QUEEN(“边相邻就算相邻”)空间权重矩阵。贴一下我的空间权重矩阵:

01.png 02.png 其实就是自己对照地图在Excel中手动填写0或1,把Excel文件导入到stata时不包含首列的结果。


在这里简单提一下stata导入数据的方法,小白可以手动选择 文件-导入-Excel电子表格,在弹出来的窗口中,一般要勾选“将第一行作为变量名”,并注意“单元格范围”(如果导入的单元格范围含有空白行或列,后面的操作会报错——空间权重矩阵不对称),再手动选择 文件-另存为,保存为stata可以直接读取的dta格式的数据文件即可;如果dta格式的数据文件位于stata的安装文件夹路径下,也可直接输入代码 use name.dta, clearnamedta格式的数据文件的名字,可附加选项clear表示导入该数据的同时,清除stata内存中的已有数据(stata内存只能同时读取一份数据)。


对于面板数据(截面数据:“一时间点上各个截面变量的值组合起来的数据”;时间序列数据:“一截面变量各个时间点上的值组合起来的数据”;面板数据:“同时包含截面层面和时间层面的数据”)而言,基本上,后面的空间自相关检验、选择空间计量模型的LM检验以及空间杜宾模型分析中出现报错,都和空间权重矩阵密切相关:原因或是空间权重矩阵不对称,或是空间权重矩阵没有标准化,或是空间权重矩阵“格式”不对。空间权重矩阵不对称和没有标准化的问题其实很好解决,麻烦的是空间权重矩阵的“格式”。简单来说,生成空间权重矩阵有“两种不同的方法”,空间自相关检验、选择空间计量模型的LM检验和空间杜宾模型分析,有的只支持读取第一种方法生成的空间权重矩阵,有的只支持读取第二种方法生成的空间权重矩阵。


生成空间权重矩阵的第一种方法如下:

03.png


spatwmat命令行表示你使用W13.dta这个数据文件,生成了一个名为W0的的空间权重矩阵。这里,你有13个截面变量(地区),因此生成的是一个13×13的矩阵。


生成空间权重矩阵的第二种方法如下:
04.png 这里,在第一种方法生成的空间权重矩阵的基础上,通过spcs2xt命令“声明”你的面板数据的截面变量(13个地区)和时间变量(共10年),生成了一个名为W0xtdta文件。再通过spatwmat命令生成了一个名为W的的空间权重矩阵,由于截面层面的信息和时间层面的信息已经“叠加”,这个矩阵是130×130的。


二、空间自相关检验


想要使用空间计量模型方法,首先要看前面我们提到的“我的邻居”的因变量对“我”的因变量是否存在显著的影响(如果基本没啥影响的话,当然就没理由拿什么空间计量模型了)。这就是考察数据是否存在空间依赖性的空间自相关检验。目前学界使用的空间自相关检验方法有三种:莫兰指数I、吉尔里指数CGetis-Ord指数。当然这里我们还是暂且忽略这些检验方法建立起来的思路,而把关注点先放在检验的度量标准上。


相关操作如下:


首先,把第二种方法生成的空间权重矩阵标准化:
05.png
接下来自然是处理面板数据——声明截面变量和时间变量:xtset 截面变量 时间变量
06.png
成莫兰指数和吉尔里指数(Getis-Ord指数要求空间权重矩阵必须是非行标准化的):spatgsa 因变量,weights(空间权重矩阵) moran geary twotail
07.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


03.png (8.15 KB)

03.png

04.png (34.88 KB)

04.png

QQ图片20200119123105.png (37.65 KB)

QQ图片20200119123105.png

02.png (43.41 KB)

02.png

01.png (68.7 KB)

01.png

W13.png (43.41 KB)

W13.png

已有 3 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
Sunknownay + 3 + 3 + 3 鼓励积极发帖讨论
ying1125 + 1 + 1 + 1 精彩帖子
柳新~ + 100 + 5 精彩帖子

总评分: 论坛币 + 100  学术水平 + 4  热心指数 + 9  信用等级 + 4   查看全部评分

沙发
苦鬼2014 学生认证  发表于 2020-1-19 14:31:45 来自手机
齐轩邈 发表于 2020-1-19 13:57
之前参加学校比赛,抽到的是一篇基于空间杜宾模型做空间计量分析的论文,我在组里主要负责搞模型部分以及代 ...
赞。能不能再多讲讲,可以的话提供一些参考文献吧

藤椅
小瓶九阳丹 发表于 2020-1-21 15:42:44
谢谢分享

板凳
三重虫 发表于 2020-1-21 20:26:36

报纸
ecnugm 发表于 2020-2-4 23:21:11
请问空间权重矩阵不对称怎么解决?

地板
jwonderchild 发表于 2020-2-5 19:14:58
要是早点看到这贴子,我也不至于为了生成权重矩阵花100论坛币买shp文件用geoda做了

7
chentaoxin 发表于 2020-8-5 20:35:39
jwonderchild 发表于 2020-2-5 19:14
要是早点看到这贴子,我也不至于为了生成权重矩阵花100论坛币买shp文件用geoda做了
老板,我10块给你做

8
chentaoxin 发表于 2020-8-5 20:36:36
ecnugm 发表于 2020-2-4 23:21
请问空间权重矩阵不对称怎么解决?
要是行标准化是不对称的,没有行标准化的话应该是算法错误

9
zzq15 发表于 2020-8-11 23:29:50
spcs2xt命令中的matrix和time的位置好像反了

10
ugu7118297 发表于 2020-8-16 16:12:26
chentaoxin 发表于 2020-8-5 20:35
老板,我10块给你做
老板,能不能帮忙做空间权重矩阵啊,可以有偿

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-8 07:43