由于毕业论文的需要,现正做一份有关中国FDI影响因素的数据回归。但之前只是零星学过一些截面与时间序列的模型及其检验,面板数据完全得靠自学,老师还必须要求自己整明白,但小厮真心求大神帮帮忙求理解。
问题:选择的截面属于时间长截面短。
1.首先我在stata里将数据设为panel,然后做了一下数据的summarize,表格里出现了overall/between/within 三列,我知道overall的意思,但假设就standard deviation这一列数据,between 和between 分别指的是什么呢?有什么差别吗?因为我看到好像还有一种叫做“between estimator”的模型,不知是否它会关系到有些模型的选择问题。
2.我做了Pooled的模型回归,但是F-statistic很大,有90多,而且模型的R-2也很好,84%多。这样说来是要用这个模型吗?但是按常理想也不可能,数据肯定是会受到截面(即不同城市)的影响的。请问如何解决?
3.我知道Pooled的模型相当于直接把截面与时间混合,不变截距与斜率模型,是OLS的估计。固定效应&随机效应都是属于GLS的估计,请问OLS与GLS的差别在哪里?是经典假设不同吗?看了很多文章,还是模模糊糊的,请问所谓的固定效应指的就是因截面而带来的影响吗(除X外)?
4.请问单位根检验要在hausman test前还是后?具体在哪一步要进行单位根的测试?看到有很多单位根的test,具体要用哪一个好呢?
问题比较多{:3_58:},希望各位大神能帮帮忙,小厮不胜感激啊。论文deadline在即,非常感谢大家能及时回复。