我觉得这个问题很难,主要是背景的问题。
您的rct,正确应该是Radomized Control Trail,中文应当是随机控制实验。
换句话说,探讨这方面的研究,大多是公共卫生,或医疗或流行病学研究的。
一般学经济的,学计量经济的,Missing value的处理或者Treatment effect的探讨,是比较后期的,
许多书,往往是列在书本的后半,如Wooldridge或Colin Cameron
但即便探讨了,问题是,却也很少提到随机控制实验的问题。
主要的理由是,就经济来说,弄随机实验太耗成本。
但也不是所有的计量经济书不细说。像 美国 詹姆斯·H.斯托克 马克·W.沃特林著的 经济计量学就有提到。
【旧版于第11章,新版应当在更后面章节】
我只能就我自己浅薄的知势去片面回答。
主要应当是,follow-up比baseline缺失了约400观测值
这个应当当要问您自己,您会对这实验比较了解,究竟是怎么样的缺失法。
如果是attrition,那是属于一种非随机选择样本。
如果不去掉的话怎么比较?比较什么?
在follow-up中用均值来代替?
请回到最原本的思考,如果一切缺失的机制都是随机,那么,去掉可能更可取。
mean imputation的方法,是在非随机机制下处理的方法之一,最简单,
但如果真的非随机机制,您敢用这样简单的方法吗?
用difference in difference的话有影响么?
相信您对DID模型应该很熟,问题是,DID模型,您个人认为能消除非随机机制的缺失值吗?
我个人认为,如果是非随机肯定有影响。
如果是随机机制,那么,这跟模型无关吧,反到是怎么处理missing value比较重要。
最后,坦白说,以您的缺失值比率上来说,10%实在是算不了什么。
其实您可以尽量思索,您的缺失机制是随机的,那么砍掉或乎略这些缺失值是有道理的。
再则,如果人家挑您毛病,认为缺失机制是非随机的,好吧!
那您就用mean取代,或者用种种imputation的方法去处理,再估一次,
如果说,处理缺失值后的结果,和直接砍掉的结果,一样或差不多,两者结果经检定也无差异,
那么,我想人家也不会说您什么了!
尽量提供我个人的浅见,不要再问我太深入的问题,总觉得这问题很有水平,不是我能解决的!


雷达卡




京公网安备 11010802022788号







