暗香疏影_ 发表于 2022-5-9 16:58 
好滴,谢谢友友指点,其实断点回归这一块儿,总觉得没学到精髓,B站视频、论文看了挺多的,但是到自己上手 ...
陈强老师书上说的那个分组变量确实就是驱动变量的意思哈,不同叫法而已。在精确断点回归中,当驱动变量>=一个常数(断点)时,处理变量全为1;当驱动变量<一个常数时,处理变量全为0。举个常见的例子就是假设500分以上的人全都上大学,500分以下全不能上大学,那么分数就是驱动变量,断点就是500,处理变量就是“是否上大学,上大学取1,没上大学取0”。如果画个图形,横轴是分数,纵轴是“是否上大学”,那么纵轴的取值就会在分数=500时出现间断,从0跳升到1.
从上面这个例子你也能看出来,一般断点回归是要有一个明确的现实或制度基础的,比如60分就是及格,60岁以上退休…… 但如果拿PSM得分做驱动变量的话,首先处理变量的取值不一定真的有间断(图形上看出间断来了也完全有可能是因为画图方式不对)。就算真有间断,别人要是问你为啥会在PSM得分取一个特定值的时候处理变量出现跳升,你能解释么,更何况PSM得分还是一个估计出来的值。目前我在比较知名的期刊上是没有看到有这么做的,国内3流的C刊上面很多处理不一定合适,容易误导人,所以我之前建议你多看些顶刊的。
写论文要看你的研究主题适合用什么方法,而不是某个方法能拿来研究什么。要知道《经济研究》、《金融研究》上不少论文所用的方法也仅是面板回归而已,因为那些听起来“高大上”的方法可能并不适用于他们的研究主题,往上生搬硬套反而显得没水平。
off support占一半的话确实有点多了,但拿来作为稳健性检验的一部分也并无不可,作为文章主体部分的补充嘛,现在期刊论文中通常也很少将PSM作为文章的主体部分,都只是在稳健性检验部分用一下。