在看了一些RD回归相关的视频和基础知识之后,还是有很多不明白的,希望各位老师各位大神帮忙解答。
一、首先,rd回归中的bin是什么,这个bin与带宽(bandwidth)之间有什么关系吗?
二、1.这个RD回归的因变量是二分变量,那么这个RD回归的表怎么读呢?
在做RD回归之前,这篇文章先做了一个probit模型,那RD回归是基于probit的基础之上吗,跟probit一样对因变量做了处理吗,系数也是要看他们的normal结果吗?我看视频里很多stata操作就是直接用rd命令,那rd命令背后用的是什么函数呢?
三、为了检验在断点之后的一段时间里是否还仍然有影响,文章分开比较了不同月份的系数。发现在4个月以后,付费意愿仍显著高于纪录片放映前的水平,这表明纪录片确实起到了作用。那么这个图中的y轴是什么呢,这个图中那个0的线又代表什么呢?是在这个断点之前的影响为0吗
四、在第四页右边的最后一句,原文说到“一些不连续的变量可能会混淆因果关系的探索,我们还添加了星期几和月的一周的变量(三个虚拟变量表示第二、第三和第四周,第一周作为省略类别)作为附加控制变量。)”
就是这个文章的数据是每两周的周末收集一次,一共进行了27周。是一个伪面板数据。我想知道的是,加入这个虚拟变量具体的原因是为什么?是因为是面板数据的原因吗?在文中,本来空气污染指数对人们的支付意愿是有显著的影响的,但是加入了这个虚拟变量之后就不显著了,没想明白为什么。
————————
非常感谢大家的解答~附件是论文原文