目前我要分析的是股票对老年人退休有没有影响,但是为了剔除其他对老年人退休的影响,所以要把有股票的老年人分为一组(treatment group),没股票的老年人分为一组(control group)。
现在我懂我模型的意思,但是还是不懂具体怎么操作,各位麻烦帮我看一下我的理解对不对!
我的模型结构基本上是
Y=B0+B1*T+B2*A+B3*T*A+B4*X
Y=1代表老人想退休,Y=0不想退休;
T=1代表老人有股票,T=0没有股票;
A=1代表股票变动之后,A=0代表股票还没有变动
若A=0,Y=B0+B1*T+B4*X
实验组Y=B0+B1+B4*X
对照组Y=B0+B4*X
他们的差是B1
若A=1:Y=B0+B1*T+B2+B3*T+B4*X
实验组Y=B0+B1+B2+B3+B4*X
对照组Y=B0+B2+B4*X 他们的差是B1+B3
净影响为变动之后,2组的差B3
所以我现在要求的就是这个B3.
这里B3代表的是T*A和Y的相关性,那我再拿T*A为自变量,Y为因变量在stata里做线性回归xtreg,得出的系数,或者P值,就可以观测有没有影响了,是这样吗?
模型是这个意思吗?
但是我现在不知道应该怎么样提取数据,做一个面板数据。
目前我找到了股票1998-2012每个月的价格变动。但是应该怎么生成股票变动前,变动后这个变量呢?此外,老师让我在数据库下载了一个关于老年人的dataset,2006-2010年调查的,关于老年人几乎所有的信息,包括年龄,性别,学历,有无房产,婚姻状况等~这些失业率,有没有房产都可以当做模型中的X变量,可以暂时不管。
但是这个数据库里只有老人想何时退休的年龄,我是不是应该把它和年龄做对比,譬如:老年人现在58岁,想60岁退休,就说明他现在还不想退休,这个样本的Y值就是0?老师要求把退休年龄做成这种0,1的数据。
此外,一般,面板数据是指在不同时间(譬如2001-2010年10个年头),不同截面(譬如广州、北京、上海三个截面),一个相当于横轴,一个相当于纵轴,3个地方10年之内,每年进出口的额度,这样构建成一个面板数据。
但是,我现在的面板数据的时间变量2006-2010有了,但是每一年的样本都不一样,可能因为生老病死之类的。样本不一样,那我应该怎么做截面变量呢?
而且就算样本一样,也只是同一个截面呀,这个应该怎么处理?
周一就要见老师了,现在慌张的不知道的怎么做,求高手帮助呀!~~~~(>_<)~~~~


雷达卡






你使用的是中国数据吧,中国人是想退休就可以退休的么。
京公网安备 11010802022788号







