我利用CFPS数据库构建了一个面板数据,想要研究数字普惠金融DFII对不同来源收入(经营收入、工资收入、转移收入、财产收入)的影响。样本家庭为观测个体,一共四期2014、2016、2018、2020的数据;xtset family_id year。
实验中将家庭经营性收入(foperate)作为因变量,对数字普惠金融DFII、其他控制变量进行固定效应回归时,发现核心解释变量前系数并不显著;我检查了很多原因,感觉主要是因为我的面板把家庭作为观测的主体,样本里一些家庭就是只通过打工获取收入(比如现实中就是有很多农民工家庭只存在工资性收入来源),这种家庭的收入来源长期是工资性收入,而其家庭经营收入foperate长期为0(四期数据一直都是零),这样的样本不加以区分全放进以foperate为因变量的回归中,对显著性产生很大的影响。相当于这种家庭本来就不是依靠产业经营过活儿的,还把这些样本家庭放进以foperate为因变量的回归中就不太恰当。
因此打算剔除每一年经营性收入(foperate)总是=0的那些样本重新回归,这样的处理合不合理呢?请各位大佬给点建议!
我暂时没有找到有其他期刊文章这样处理问题,如果大家有看过类似问题处理的可不可以给一下文章呀!


雷达卡





京公网安备 11010802022788号







