楼主: clu43
1686 1

[Stata初级班] 请教连老师两个命令 [推广有奖]

  • 0关注
  • 0粉丝

VIP

本科生

2%

还不是VIP/贵宾

-

威望
0
论坛币
541 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
364 点
帖子
36
精华
0
在线时间
88 小时
注册时间
2009-8-28
最后登录
2018-11-15

楼主
clu43 发表于 2010-4-28 15:00:57 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教连老师两个命令


householdnumber line(household下的个人)  year    income     father mother
211                       1                                      1991       200         .        .
211                       1                                      1993       300         .        .
211                       2                                      1993       320         1        1
212                       1                                      1993       200         .         .
212                       1                                      1995       230         .         .
212                       2                                      1993       210         .         .

如上panel data 请问如何写code得到下面两个结果

(1) drop 掉 father 和mother 同时等于缺失值的同一household的所有个人的观测值。 如上表的212应删除 , 如果在同一个household下只要出现father和mother的非缺失值 则保留该household的信息 即上表中211household中的所有个人信息
        我用的语句是
         gen n=1;  bys householdnumber: egen size=sum(n) if father==1 | mother==1; drop if n~=.    可是如果这样211  1中的两个个人观测值也都被删了 不知code该如何写才正确呢?

(2) 在同一个household的同一个年份下  如 obs house  line year  inc   fa  mo              (问题1数据的部分截取)
                                                                     1。  211      1    1993  300   .    .
                                                                      2。   211    2    1993  200  1   1
           只对fa mo为缺失值的observation进行回归 但是回归时inc需用同一household下 相同年份的父母收入替代  如observation1中的300 需用 2中的200代替 也就是说用父母的收入做小孩收入的工具变量  fa或mo为1时表示此观测值为父母的   若父母的收入均存在 则用父亲的收入替代

怕没讲明白 再具体一些的意思如下:
      首先 我并不是对所有的观测值回归 而只是对fa 和 mo存在缺失值的观测值当做cross-section单独回归 如上述观测值1才满足条件 2因为fa mo 不为缺失值 所以在reg时希望将它排除在reg的命令之外
     其次 在对所选的的fa mo为缺失值的回归中 income数据并不是用个体自己的 而是用同一个household下相对应的父母收入做工具变量替代 比如1中的income300 需用2中的200替代 而且他们必须是同一年份下(如上述1993)的情况才可替代 问题在于我的数据是panel 会有很多不同的年份 不知道用什么语句才能让其选出在同一个household下的相同年份的个体及其父母数据 并只对个体进行回归 且回归的自变量收入需用相对应的父母收入代替?
挺多限制条件的 希望老师明白我意思了 非常非常感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:连老师 observation panel data household observat 请教 老师 命令

沙发
arlionn 在职认证  发表于 2010-4-29 09:38:05
clu43 发表于 2010-4-28 15:00
请教连老师两个命令


householdnumber line(household下的个人)  year    income     father mother
211                       1                                      1991       200         .        .
211                       1                                      1993       300         .        .
211                       2                                      1993       320         1        1
212                       1                                      1993       200         .         .
212                       1                                      1995       230         .         .
212                       2                                      1993       210         .         .

如上panel data 请问如何写code得到下面两个结果

(1) drop 掉 father 和mother 同时等于缺失值的同一household的所有个人的观测值。 如上表的212应删除 , 如果在同一个household下只要出现father和mother的非缺失值 则保留该household的信息 即上表中211household中的所有个人信息
        我用的语句是
         gen n=1;  bys householdnumber: egen size=sum(n) if father==1 | mother==1; drop if n~=.    可是如果这样211  1中的两个个人观测值也都被删了 不知code该如何写才正确呢?

A: 命令如下:
clear
input  ///
householdnumber line       year    income     father   mother
211              1         1991       200         .        .
211              1         1993       300         .        .
211              2         1993       320         1        1
212              1         1993       200         .         .
212              1         1995       230         .         .
212              2         1993       210         .         .
end

replace father=0 if father==.
replace mother=0 if mother==.
gen parent = father + mother

bysort house: egen sum_p = sum(parent)
list
drop if sum_p == 0

(2) 在同一个household的同一个年份下  如 obs house  line year  inc   fa  mo              (问题1数据的部分截取)
                                                                     1。  211      1    1993  300   .    .
                                                                      2。   211    2    1993  200  1   1
           只对fa mo为缺失值的observation进行回归 但是回归时inc需用同一household下 相同年份的父母收入替代  如observation1中的300 需用 2中的200代替 也就是说用父母的收入做小孩收入的工具变量  fa或mo为1时表示此观测值为父母的   若父母的收入均存在 则用父亲的收入替代

怕没讲明白 再具体一些的意思如下:
      首先 我并不是对所有的观测值回归 而只是对fa 和 mo存在缺失值的观测值当做cross-section单独回归 如上述观测值1才满足条件 2因为fa mo 不为缺失值 所以在reg时希望将它排除在reg的命令之外
     其次 在对所选的的fa mo为缺失值的回归中 income数据并不是用个体自己的 而是用同一个household下相对应的父母收入做工具变量替代 比如1中的income300 需用2中的200替代 而且他们必须是同一年份下(如上述1993)的情况才可替代 问题在于我的数据是panel 会有很多不同的年份 不知道用什么语句才能让其选出在同一个household下的相同年份的个体及其父母数据 并只对个体进行回归 且回归的自变量收入需用相对应的父母收入代替?
挺多限制条件的 希望老师明白我意思了 非常非常感谢!
A: 这个问题,我认为你需要在仔细思考一番,把最核心的问题提出来,否则我无法抽出大块的时间从头到尾帮你解答。这已经超出了我在视频中介绍的内容。希望你能谅解。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-29 01:13