楼主: zzl19910906
18137 10

[Panel Data专题] 请教连老师,PSM+DID [推广有奖]

  • 4关注
  • 24粉丝

讲师

83%

还不是VIP/贵宾

-

威望
0
论坛币
9588 个
通用积分
8.3300
学术水平
12 点
热心指数
12 点
信用等级
13 点
经验
128 点
帖子
337
精华
0
在线时间
623 小时
注册时间
2011-7-14
最后登录
2024-3-12

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
连老师:
       我在想要做PSM+DID,遇到以下问题向老师请教:
      1.common support假设的结果应该怎么看?这部分在视频中,基本思想理解了。但是具体结果在什么条件下满足假设、在什么条件下不满足假设不太清楚,图中为三种匹配方法现实的common support假设结果。
      2.我做出的结果,现在只有半径匹配,在半径为0.0001时,满足平行假设;最近邻匹配、核匹配的平行假设都无法被满足,这样的结果是否不够稳健?还需要继续调整?(最近补充:调整了一些变量后,半径匹配平行假设不出结果,核匹配平行假设基本都满足,最近邻匹配的平行假设不满足)
     3.我看到老师的其他回复都是用PSM的核匹配后做DID,那么半径匹配后,能做DID吗?(补充:老师,核匹配后后又该怎么做DID?)     
    4.我发现很多匹配后没有倾向得分值,也就没有参与匹配,这是不是因为数据存在缺漏的缘故?要继续下一步的DID,是否应该补齐缺漏数据?(比如用选取替代变量、继续查找数据、多重补漏分析等)
    5.用于PSM的数据需要做无量纲处理(除以均值或者标准差)吗?



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:DID PSM 连老师 Support Common 演唱会 老师 罗嘉良 林子祥 谢安琪

附件: 你需要登录才可以下载或查看附件。没有帐号?我要注册

回帖推荐

arlionn 发表于7楼  查看完整内容

如果进行了很好的匹配,相当于你研究的 outcome 变量的影响因素中,只有 Treat 为 1 还是为 0 差异,两个组中的其他特征都非常相似(这是匹配的目的)。你所谓的控制变量其实都已经反映在了匹配变量中。 PSM 匹配过程中,加入的变量是“上北大学生的特征”,列举这些特征是为了找到与北大学生特征相似的学生。就好像是找到了“北大男”的孪生兄弟,此时二者的差别只有是否上北大,因此,他们的收入差异也就只能来源于此了。还有什 ...

本帖被以下文库推荐

沙发
arlionn 在职认证  发表于 2013-4-18 10:40:22 |只看作者 |坛友微信交流群
1. 三幅图中,只有核匹配比较满足 Common Support 假设,半径匹配基本上不满足;

2. 那就选用核匹配吧;

3. 理论上是可以的,但由于涉及到权重的问题,写程序还有些障碍,你还是用 diff 命令提供的 核匹配+DID 进行分析吧。

4. 你要看一下匹配变量的详情,应该是匹配变量,即参与 probit 回归的那些变量中存在缺漏值,导致相应行的观察值并未参与回归,也就无法计算出 pscore 了。

5. 无需量纲处理。不知你的变量都是什么?

使用道具

藤椅
zzl19910906 发表于 2013-4-18 12:54:43 |只看作者 |坛友微信交流群
arlionn 发表于 2013-4-18 10:40
1. 三幅图中,只有核匹配比较满足 Common Support 假设,半径匹配基本上不满足;

2. 那就选用核匹配吧; ...
1.老师,我查看了数据结果,确实由于数据缺漏造成的倾向得分值无法计算
2.进行无量纲处理的数据是:各地区的(省级)的发电量、原煤产量、布产量等。除去他们的均值做无量纲处理后,结果并无显著变化。

使用道具

板凳
zzl19910906 发表于 2013-4-18 13:08:07 |只看作者 |坛友微信交流群
arlionn 发表于 2013-4-18 10:40
1. 三幅图中,只有核匹配比较满足 Common Support 假设,半径匹配基本上不满足;

2. 那就选用核匹配吧; ...
老师,还有一个问题向老师请教。
   我现在的一个时间发生的是一个时间段,那么匹配应该拿什么时段的数据来做匹配呢? (我选用的是面板数据)
   比如,一个政策在1990-2000年持续发生了10年,10年之后就结束了。这个政策是有指向性的,所以存在样本选择偏误。那么我应该拿什么时段的时间来做匹配呢?是1990年-2000年,还是这之前和之后的时间段都用于匹配呢?
   匹配之后DID的两个时期应该怎样选择才比较合适呢?能不能新生成一个虚拟变量来反映时期,把1980-1990年这10年看做是基期,定义为0; 把2000-2010年这10年看做是处理后的时期,定义为1,用来做DID?
  

使用道具

报纸
arlionn 在职认证  发表于 2013-4-19 08:47:33 |只看作者 |坛友微信交流群
“能不能新生成一个虚拟变量来反映时期,把1980-1990年这10年看做是基期,定义为0; 把2000-2010年这10年看做是处理后的时期,定义为1,用来做DID?”
这个方案可行。

使用道具

地板
zzl19910906 发表于 2013-4-19 23:07:05 |只看作者 |坛友微信交流群
arlionn 发表于 2013-4-19 08:47
“能不能新生成一个虚拟变量来反映时期,把1980-1990年这10年看做是基期,定义为0; 把2000-2010年这10年看 ...
还是继续在这个帖子里面请教连老师吧,方便其他人查看。

Question1:老师看下PSM+DID的基本步骤是不是正确:
Step1:PSM核匹配
Step2:生成时期虚拟变量 t (事件发生前的时期==0;事件发生后的时期==1)
Step3:DID
基本命令:diff outcome_var, t(_treated) p(t) cov(用于产生propensity score的变量) kernel id(id) report             (Note:此处_treated的是第1步PSM的匹配结果)


Question2:无法加入控制变量,因为:
cov(varlist) 选项的解释是 Specifies the pre-treatment covariates of the model. When option kernel is selected these variables are used to generate the propensity score.

这时,即使加了report选项,最后报告的也只是PSM中probit回归的结果。
那么岂不是无法加入控制变量了?我思考了一下,问题是不是这样:
我看到老师在另一个帖子中回复说道:“OLS控制变量只是摆了个pose,没有真正地控制住;但是,PSM做到了”;这主要是由老师在视频中提到的PSM的common support和balance两个假设做到的。
那么,这里PSM的控制变量是不是和我们通常意义上理解的控制变量是有差异的?
OLS的控制变量找到的是被解释变量的影响因素;而PSM的控制变量是事件发生的影响因素。以老师视频中讲到的“上北大与收入的关系”来说。
如果是OLS,我们加入的控制变量是“ 影响这个人收入的因素
如果是PSM,我们加入的控制变量时“影响这个人上北大的因素
两者并不一致。
老师还在另一帖子说:“DID本质上就是OLS”,那么如果我们进行了匹配,是不是基于核匹配的DID就已经和传统的DID有很大差异了,因为传统的DID在存在样本选择偏误的情况下,并没有满足DID所要求的“共同趋势假设”?




使用道具

7
arlionn 在职认证  发表于 2013-4-22 21:30:49 |只看作者 |坛友微信交流群
如果进行了很好的匹配,相当于你研究的 outcome 变量的影响因素中,只有 Treat 为 1 还是为 0 差异,两个组中的其他特征都非常相似(这是匹配的目的)。你所谓的控制变量其实都已经反映在了匹配变量中。
PSM 匹配过程中,加入的变量是“上北大学生的特征”,列举这些特征是为了找到与北大学生特征相似的学生。就好像是找到了“北大男”的孪生兄弟,此时二者的差别只有是否上北大,因此,他们的收入差异也就只能来源于此了。还有什么需要控制的吗?呵呵,我想你的思路一直被传统的 OLS 限制着。

使用道具

8
zzl19910906 发表于 2013-4-22 22:58:08 |只看作者 |坛友微信交流群
arlionn 发表于 2013-4-22 21:30
如果进行了很好的匹配,相当于你研究的 outcome 变量的影响因素中,只有 Treat 为 1 还是为 0 差异,两个组 ...
了解了,谢谢老师!老师讲的很清楚了。
不过觉得真的很不好意思,还是有问题要麻烦老师。

因为我想要考察匹配效果,想要用老师提到的下面的方法:
“比较ROC曲线  面积接近于0.8表明达到了不错的匹配,参见Yang(2007,p.7) ”这种方法。
但是我发现,这种方法只适合“最近邻匹配”,因为只有“最近邻匹配”_weight的结果有缺漏。
PSM+DID,目前只能用“核匹配”,而“核匹配”只要on support,那么weight都不为缺漏,所以“核匹配”完成以后,我绘制的下面两幅图是完全一致的,就无法用来判断匹配效果了
那么除了用密度函数图、ROC曲线以外,还有其他方法来判断“核匹配”的优劣吗?
      附:讲义中绘图的主要差异处:
      *-1-模型拟合效果:AUC 越大越好
           roctab jili _pscore if _support==1,  
                ...   ...
             caption("ROC 曲线下的面积: AUC = 0.844")

       *-2-共同支撑假设检验:AUC 越接近于0.5越好
           roctab jili _pscore if _weight!=.,  
                 ...   ...
            caption("ROC 曲线下的面积: AUC = 0.536")


另外,ROC曲线下的面积是如何计算出来的呢?
Note:我只知道筛选变量时,老师曾经用过这个指标。但匹配后又怎么用呢?
      logit jili size lev      prof tobin gpay  hhi5 $xv
      cap drop pr
      qui predict pr if e(sample)
      roctab jili pr
      estadd scalar auc = r(area)      
      est store m5  




使用道具

9
kk22boy 发表于 2013-6-8 15:49:13 |只看作者 |坛友微信交流群
zzl19910906 发表于 2013-4-19 23:07
还是继续在这个帖子里面请教连老师吧,方便其他人查看。

Question1:老师看下PSM+DID的基 ...
连老师,楼上的Question1不知道是否正确呢?
如果该贴对您有些许帮助,希望你能回复一下或者评一下热心指数!谢谢!

使用道具

10
zzl19910906 发表于 2013-6-9 00:22:30 |只看作者 |坛友微信交流群
kk22boy 发表于 2013-6-8 15:49
连老师,楼上的Question1不知道是否正确呢?
您没有@到连老师。第一步有点没说清,使用PSM找到匹配变量,这样直接附加到后面的DID的cov选项用于匹配

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-8 07:39