其中,被解释变量Y是二元虚拟变量,解释变量Relateness是连续变量,Control为控制变量,u表示固定效应,Mid表示中介变量,i表示产业,r表示地区,t表示时间,研究期间为2003-2013年。
问题1:因为并非每个地区每年都有全部的30个制造业产业,所以这是个高维非平衡面板,并且2010由于相关指标未公布,所以2010的中介变量和控制变量全部都是缺失的(被解释变量和解释变量有数据)。我是否需要将该面板数据变为平衡面板,即将各个地区都设置为30个制造业产业,而缺乏对应产业的地区,其相关的解释变量、被解释变量、控制变量都设为0或者缺失值?
问题2:对于高维面板数据,stata里面的reghdfe命令仅适用于线性回归,而我的被解释变量为01变量,并且是非平衡面板,因此是否直接可以用logit模型来实现前述模型的运行?若可以直接运用logit模型,则第一个模型对应的命令logit yirt RELDENS_lag3 Control c.r_num##c.i c.r_num##c.t c.t##c.i 是否正确?或者是否有其他命令或方法能够实现第一个模型的结果?
问题3:研究期间为2003-2013年,但由于2010年相关数据没有公布,2010的中介变量和控制变量全部都是缺失的。控制变量里面,一共八个控制变量,其中有两个控制变量2008、2009年的数据也缺失,则此数据是否可以直接跑模型,或者需要将缺失2008和2009数据的两个控制变量直接进行删除?
个人毕业论文当中遇到的问题,学术小白,查阅了一些书籍也无法解决上述问题,希望大家能帮忙解答疑惑,不胜感激!!!


雷达卡








京公网安备 11010802022788号







