日前,Stata公司发布了最新的Stata 15,包含了许多令人激动的重大升级,包括非参数回归、空间计量、门槛回归、DSGE模型等。本公众号将陆续为你介绍,与计量经济学最为相关的几个全新模块。
空间计量分析
地理学第一定律告诉我们,“所有事物都与其他事物相关联,但较近的事物比较远的事物关系更密切” (Everything is related to everything else, but near things are more related than distant things)。基于此,在全球化的背景下,区域之间的互动与溢出效应(spillover effects),越来越成为学界与政界的关注焦点。
因此,始于1970年代的空间计量经济学(spatial econometrics),近年来发展迅速且日益流行,成为处理空间数据的利器。所谓 “空间数据”(spatial data),就是在原来的横截面或面板数据上,加上横截面单位的位置信息(或相互距离)。空间计量经济学的最大特色就在于充分考虑横截面单位之间的空间依赖性(spatial dependence)。
在Stata 15中宣布空间数据
正当你还在四处寻找空间计量的非官方命令时,Stata 15十分贴心而及时地推出了整套空间计量的官方命令(均以 sp 开头,表示 spatial data),可以处理横截面与面板形式的空间数据。
在 Stata 中处理某些特别形式的数据时,常需要首先设置数据格式,比如时间序列(tsset)、面板数据(xtset)、久期数据(stset,其中 st 表示 survival time)、调查数据(svyset,其中 svy 表示 survey data)。现在,Stata 15 中又新增了宣布数据为空间数据的命令,即
. spset id
其中,id 为地理单元的标识变量(geographic unit identifier)。
导入空间数据
当然,在 spset 之前,你先要将空间数据输入 Stata。根据空间数据的不同来源,Stata 15 提供了三种导入空间数据的方法,即通过地图文件(data with shapefiles)、通过包含位置信息的文件(data containing locations,比如经纬度),以及其他方法(data without shapefiles or locations,比如手工输入)。
一般建议使用第一种方法,可通过网络搜索下载相应的地图文件(shapefiles)。Stata 15 提供了将地图文件 shapefiles 转换为 Stata 格式的方便命令:
. spshape2dta
此命令将 shapefiles 翻译为 Stata 的 dta 数据文件。使用 shapefiles 的好处之一是,可以很容易地画可视化的等值区域图(choropleth),即根据某个变量的取值大小,在地图上以该区域的颜色深浅来直观地表示。比如,Stata 手册提供的案例:
. grmap hrate
此命令表示,使用变量 hrate(homicide rate,凶杀率)来画等值区域图,结果如下图。从此图可知,凶杀率呈现出区域集聚(深色区域)的特征。
定义空间权重矩阵
空间计量分析的出发点是空间权重矩阵(spatial weighting matrix)。比如,对于
其中,此矩阵的
另一常用方法为通过距离的倒数来定义空间权重矩阵,即
其中,
在Stata 15 中,可通过命令 spmatrix 来方便地定义、导入、导出空间权重矩阵,以及进行相应的操作。比如,
. spmatrix create contiguity W
此命令将根据相邻关系(contiguity)来创建空间权重矩阵
. spmatrix create idistance W
其中,idistance 表示 inverse distance,即距离的倒数。在定义空间权重矩阵之后,即可进行空间计量的回归分析(包括横截面与面板数据),将在下期推文继续介绍。
上次推文发布后,不少朋友询问如何获得 Stata 15。如需购买正版 Stata 15,可联系 Stata 公司的中国代理商友万科技(www.uone-tech.cn),也是第一届 Stata 用户大会的主办方,邮箱 crystal@uone-tech.cn。祝 Stata 在中国开花结果,让更多实证研究者受益。
参考文献
陈强,《高级计量经济学及Stata应用》,第2版,高等教育出版社,2014年。
陈强,《计量经济学及Stata应用》,高等教育出版社,2015年。
微信公众号链接:https://mp.weixin.qq.com/s/gaj7dbfdR8fHu1cGwX1UdQ