|
实在是好贴,精彩回复也是比比皆是。
我先总结一下楼上的精彩内容吧,然后再提出我的疑惑大家接着讨论,谢谢!
#总结
首先,五楼的@jose.liupei提出了3种主要的稳健性检验途径
1. 从数据出发,根据不同的标准调整分类,检验结果是否依然显著;
2. 从变量出发,从其他的变量替换,如:公司size可以用total assets衡量,也可以用total sales衡量;
3. 从计量方法出发,可以用OLS, FIX EFFECT, GMM等来回归,看结果是否依然robust;
然后,接下来大家的讨论大多可以归结为以上三类。
1、关于限制样本数据的
①有人问:如果是将全国的数据划分为东中西部的进行回归,算稳健性检验吗?
有回复:这样不见得会得到同样的结果。因为东中西部存在差异。你可以用抽样的方式,随机抽取部分样本,这样可能会比较适合。
②还有人问:剔除数据中的极端值再回归,这算不算是稳健性检验呢?(或许这是另外帖子里的讨论)
有回答:可以
2、讨论最多的是关于怎样从变量出发,进行稳健性检验的。
之一:替换
①有问:可不可以换y做稳健性检验
回复1:从我看到的文献及了解的而言,一般是不换Y的,你可以将你关注的变量进行替换,或者将样本进行细分。我个人的理解是,做计量的最终目的,是我们要看的是自变量(你关注的那个)与因变量之间的因果关系(最终的目的。那么做稳健性检验,其实就是你想看看你现在选择的这个变量是不是能证实或证伪你的假设,如果通过多个方法,你在一定程度上能证明你关注的因素对因变量有显著因果关系(或其他关系)。那就实现了你的想法。
回复2:我看过一篇换Y的,一个是狭义金融风险资产、一个是广义金融风险资产。发在统计研究上的。
②有问:如何替换控制变量?能不能通过换控制变量进行稳健性检验呢?
@jose.liupei回复:首先想想稳健性检验的目的是什么?简单说就是要检测你的主要最重要的那个变量是否在不同情况下结果依然稳定,那么所有的稳健性检验就是以这个为出发点。
我提到的通过换变量的方式来进行稳健性检测主要是通过对主要变量的替换,举个最简单的例子,如果想测试公司规模对公司盈利是否有显著影响,那么我们在文中是以total assets来衡量公司规模,所以在稳健性检验的时候可以用total sales或者total number of employee来衡量公司规模看结果是否依然稳定。当然,有些时候找一个替换变量不是那么容易。
关于能不能通过换控制变量进行稳健性检验,我个人持保留意见。但有种情况下,是有必要的:如果你的主要变量和控制变量有很强的相关性,那么通过对控制变量的替换,看能不能降低相关性,而相关性的降低是否会影响主要变量的结果,在这种情形下是有必要的。
其实,增加/减少控制变量也是一种稳健性检验,也就是说能不能capture additional effects。
另有层主回复:我个人的理解是因变量应该是唯一的,否则,研究的目标就不能是确定的。代理变量更多的应该是针对无法度量的自变量,如果连因变量都无法很好的度量出来,我感觉论文的品质就要大打折扣。
3、换计量方法检验(略)
#下面是我的疑问,大多比较初级,欢迎指正
①关于限制样本,采用东中西部分组回归,我同意上面回复者的前半段意思。做我国面板的话确实很多问题存在东中西部差异,有人专门做这种差异分析,所以分地区来检验效果可能不理想,但可以一试。但我不同意他后半段建议。随机抽取?第一,会不会刚好遗漏对显著性有影响的样本;第二,确实见过文献随机缩小样本的情况,但这是否会是作者试了很多种,取一种能保证稳健性的情况来展示呢?
而关于剔除数据中的极端值,比如剔除人口密度极端的地区?比如剔除第三产业比重极端小的地区?对于剔除之后,稳健性良好的情况,这得看剔除的因素是否是关键自变量。个人感觉,如果剔除的是关键自变量的极端样本,那会改变模型吧?相比而言,剔除非关键自变量的极端样本,感觉更好。欢迎大家讨论指正!
②关于变量角度。楼上大家都认可了用相近变量替换核心变量的方法。我疑问的是增减变量的途径。也有从其他帖子引发的思考https://bbs.pinggu.org/thread-1548998-1-1.html(连老师做了回复)
情形A:增加一个变量,增加的变量不显著。这能是稳健性检验么?不管增加的是与核心变量关系紧密还是关系不大的。如果是可行途径,那么可能太过容易找到这样的变量。
情形B:增加一个变量,增加的变量显著。那这个增加的变量是否会是原模型的遗漏变量?
情形C:减少一个原来不显著的变量,剩下的变量显著性不变。是否说明原模型没必要纳入这个变量?(个人认为,这种情形不是没必要纳入,因为这个变量可能是理论上确实有影响的变量,而过往研究也证实了其重要性,但在特定的模型和研究对象下,可能变得次要而不显著,这并不代表没必要纳入)
情形D:减少一个原来显著的变量,剩下的显著性不变。说明什么呢?
情形E:减少一个原来显著的变量,剩下的显著性发生了变化。又说明什么?除了模型设定有误,不稳健外,有不有更多的解读,比如是否能解读去掉的这个变量和发生变化的这个变化,有某种影响力上的关联?
|