各位前辈好,小弟最近在看断点回归的论文,其中有一篇在分析时是把最接近断点的一些样本挖掉,再进行估计,比如研究高考500分附近的学生后来薪资水平差异,500+可以重点大学,500-则不能。作者把498 499 500 501 502的样本去掉了。其后作者也有进行全样本的估计,但是只是用来说明估计结果稳健。
我的理解是:应该反过来,全样本作为主要分析,挖掉中间数据的样本分析作为稳健检验的对照。
这篇论文发在AEJ,他这样做的理由没有具体说,我比较好奇为什么是这样。
还请各位不吝赐教。


雷达卡



京公网安备 11010802022788号







