楼主: haohaodushu
3718 11

[学术与投稿] 悬赏50个币,求解:截面数据需要做什么检验。非常感谢 [推广有奖]

11
cttn 发表于 2011-4-4 18:01:33
cttn 发表于 2011-4-4 17:50
自变量间是否有相关,也要考虑
也就是测验是否共线

12
张洋862 发表于 2018-6-26 23:15:44
横截面遇到的问题及需要的检验大概有:异方差,多重共线性,对数形式,不同组结构改变,函数形式误设,内生问题等。
一、OLS基础(chapter1-chapter5)

1、方法:最小化残差平方和,再取导数(u是误差,u尖尖是残差)

2、结果:β=(X’X)-1X’Y

3、六个经典假设:

MLR.1: 线性; MLR.2:随机抽样; MLR.3:条件均值为0;

MLR.4:无完全共线性; MLR.5:同方差; MLR.6:误差正态分布

满足MLR1~MLR4:β无偏

满足MLR1~MLR5:高斯马尔科夫成立,OLS is BLUE,var(βj)=σ2/SSTj(1-Rj2)

满足MLR1~MLR6:β正态分布,t、F统计量有效

4、推断(inference):t=(估计值-假设值)/标准误

p-value=0.0718, then at 7% level, fail to reject H0; at 8% level, reject H0.

F= [(SSRr-SSRur)/q]/[SSRur/(n-k-1)], SSRur为不受约束模型(长模型)的残差平方和

5、渐进性质(大样本性质,asymptotic property): 大样本可放松MLR.6

大样本下,即使MLR.6不满足,t、F也成立,LM test(与F作用一样)

判断估计值好坏的标准:

(i) 无偏性Unbiased(expectation):E[θ^]=θ;(ii) 有效性efficient(variance): minimum variance;

(iii) 一致性consistent(distribution): limProb(/θ^_θ/<ε)=1,for anyε, ε>0

如果满足不了(i),至少要满足(iii),(iii)是最起码的要求。

大样本下(n→∞):

满足MLR1~MLR4:β无偏且一致的

满足MLR1~MLR5:β具有最小的渐进方差且渐进正态分布,t、F可用,可以不要MLR.6

二、异方差

1.异方差的后果:与方差有关的都不成立了,MLR1-MLR4依然成立,不影响无偏和一致性

(1)OLS不再是BLUE,有效性不成立

(2)t、F、LM 不再成立,不能做显著性检验

2.检验方法

(i) robust standard error

reg y x

reg y x, robust

如果某变量的t值变化很大,且由显著变为不显著,则很可能有异方差

(ii)Breusch-Pagan:

H0:无异方差

reg u^2 x1,…xk

method a) test x1,…xk, See F statistic

p-value=0.002, reject H0,there is strong evidence of heteroskedasticity

method b) compute LM

di n*R^2

14.088

Scalar pval=chi2tail(n,14.088)

Di pval

0.002 ( reject Ho)

(iii)White:

reg u^2 yhat uhatsq

如果两个系数都显著,则表明很强的异方差

将模型全部换成log形式,再做上面三种检验,异方差可能减少,或消失

(iv)Goldfeld-Quandt:

3.纠正方法

(i) robust standard error:仅限大样本条件

reg y x, robust

do t,F,LM test, 此时的robust t,F(robust wald),LM都比OLS可靠,但是仅对大样本来讲

(ii) WLS(已知异方差形式):V(u/x)=inc2σ2 对线性、非线性都适用

OLS:reg sav inc size educ age black

WLS:reg sav inc size educ age black [aw=1/inc]

(iii) FGLS(不知道异方差形式): 可以用于大小样本,但是不一定准

reg y x

predict ub, resid

gen lubar=log(ub*ub)

qui reg lubar y x

predict newyhat,xb

gen newyhatse=exp(newyhat)

reg y x [aw=1/newyhatse]

三、多重共线性(multicollinearity)

1.症状:R^2很大;一些被认为重要的变量不显著;F显著而t却不显著

2.检验方法:vif

reg y x1 x2 x3 x4

vif

if vif >10, there is evidence of multicollinearity

3.解决办法: drop one

Corr x1 x2 x3 x4,看出哪个和其他的相关性强,将其去掉

Collin x1 x2 x3 x4

去掉vif最大的一个,如x4

reg y x1 x2 x3

vif 此时vif 很可能〈10

四、log形式与函数形式误设(FUNCTIONAL FORM)

1.log的解释:

logy=9.23-0.718logx1+0.306x2

0.718:when x1 increase 1%, y will decrease by 0.718%,with x2 fixed;

0.306:when x2 increase 1, y will increase by 30.6% with x1 fixed

2.使用log的原因

解决非线性模型估计;解释弹性;去掉异方差;

3.检验应不应该用log(RESET):

(1)看看哪个好 reg y x 与 reg logy logx

reg y x

reg y x yhat^2 yhat^3

test yhat^2 yhat^3俩的系数为0,do F test

if fail to reject ho, there is no functional form misspecification, 非log好

Do the same steps for logy on logx

(2)看看哪个好 i:reg y x

ii: reg y logx

方法1:reg y x logx

test x的所有系数是否都为0,do f test

if fail to reject h0, use ii; if reject ho, use I;

方法2:reg ii first, get yhat

reg y x yhat

t test if yhat 的系数为0,if fail to reject, use i; reject, use ii

五、不同组的结构改变(CHOW TEST)

1.检验哑变量是否影响解释变量系数(斜率)

假设v1,v2是哑变量

reg y, x1, x2, v1, v2, v1*x1, v2*x1, v1*x2, v2*x2

F检验最后两个变量的系数都是0

If fail to reject h0, dummy variables have no effect on independent variable

2.结构改变检验(chow test)

看看两个样本(两组data)是否适合用于同一个模型,通常以某时间分开样本,看前后有没有结构改变,即模型系数有没有改变。

F= [(SSR-SSR1- SSR2)/(k+1)]/[( SSR1+SSR2)/(n-2k-2)]

H0:there is no structural change

六、内生问题(ENDOGENEITY)see Instrument Variable

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-9 08:08