楼主: zxer996
4285 8

[数据管理求助] [stata数据清理]-父亲、子女数据匹配-CHNS [推广有奖]

  • 2关注
  • 0粉丝

大专生

75%

还不是VIP/贵宾

-

威望
0
论坛币
657 个
通用积分
1.8100
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
234 点
帖子
11
精华
0
在线时间
111 小时
注册时间
2017-1-17
最后登录
2024-7-18

楼主
zxer996 发表于 2020-12-15 17:13:50 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
目的:修正变量relation(与户主关系)的部分样本值。

请问如何code:同一户(hhid)中,按age排序,年龄小的为个体A,年龄大的为个体B。
如果个体A的line_f(父亲行号)= 个体B的line(本人行号),则个体A的relation == 3(子女);否则,不作处理。

数据如下:
  1. clear
  2. input hhid  wave  relation idind           line    line_f   line_m   line_s  age  gender
  3. 211102067   2000       1   211102067003      3        2        1        .     0    1
  4. 211102067   2000       1   211102067002      2        .        .        1    34    1
  5. 211204072   2000       1   211204072002      2        .        .        1    47    1
  6. 211204072   2000       1   211204072003      3        2        1        6    14    1
  7. 211208015   2000       1   211208015003      3        1        2        4    26    1
  8. 211208015   2000       0   211208015001      1        .        .        2    53    1
  9. end
  10. label var hhid "户号"
  11. label var relation "与户主关系,0户主 1配偶 2父母 3子女"
  12. label var idind "本人ID"
  13. label var line "本人行号"
  14. label var line_f "父亲行号"
  15. label var line_m "母亲行号"
  16. label var line_s "配偶行号"
  17. label var gender "性别,1男 0女"
复制代码

PS:手动清理了一部分,奈何数据量大、效率低,前来求教!非常感谢!






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:STATA数据 Stata 数据匹配 tata CHNS

沙发
zxer996 发表于 2020-12-15 17:38:39
数据补充如下
  1. clear
  2. input hhid wave relation idind line line_f line_m line_s age gender
  3. 211102067   2000  1   211102067003  3  2   1   .   0  1
  4. 211102067   2000  1   211102067002  2  .   .   1  34  1
  5. 211204072   2000  1   211204072002  2  .   .   1  47  1
  6. 211204072   2000  1   211204072003  3  2   1   6  14  1
  7. 211208015   2000  1   211208015003  3  1   2   4  26  1
  8. 211208015   2000  0   211208015001  1  .   .   2  53  1
  9. end
  10. label var relation "与户主关系,0户主 1配偶 3子女"
  11. label var line_f "父亲行号"
  12. label var line "本人行号"
  13. label var gender "性别,1男 0女"
复制代码

藤椅
黃河泉 在职认证  发表于 2020-12-16 10:52:46
zxer996 发表于 2020-12-15 17:38
数据补充如下
你的叙述与说明要与资料一致,否则别人会搞不清楚。谁是个体A,个体B又是谁?若个体A的line_f 不等于 个体B的line,则个体A的relation == ?

板凳
zxer996 发表于 2020-12-17 17:16:52
黃河泉 发表于 2020-12-16 10:52
你的叙述与说明要与资料一致,否则别人会搞不清楚。谁是个体A,个体B又是谁?若个体A的line_f 不等于 个体 ...
谢谢老师!原帖已修改。
我的问题如下:同一户(hhid)中,按age排序,年龄小的为个体A,年龄大的为个体B。
如果个体A的line_f(父亲行号)= 个体B的line(本人行号),则个体A的relation == 3(子女);否则,不作处理。请问这如何code?
目的是为了修正变量relation(与户主关系)的部分样本值。

报纸
黃河泉 在职认证  发表于 2020-12-18 09:09:23
zxer996 发表于 2020-12-17 17:16
谢谢老师!原帖已修改。
我的问题如下:同一户(hhid)中,按age排序,年龄小的为个体A,年龄大的为个体B。 ...
这样清楚多了,但为什么第 6 笔之 relation 为 0?

地板
zxer996 发表于 2020-12-18 19:11:52 来自手机
黃河泉 发表于 2020-12-18 09:09
这样清楚多了,但为什么第 6 笔之 relation 为 0?
因为附的数据是relation== 0或1【户主或 户主的配偶】的部分原样本,第六个relation=0则是户主。
在检查重复值时,存在同一户(hhid)中有两个户主或两个户主的配偶,因而采用line、line_f、line_m(本人、父亲、母亲行号)之间的关系对relation进行纠正。

7
黃河泉 在职认证  发表于 2020-12-19 07:47:23
zxer996 发表于 2020-12-18 19:11
因为附的数据是relation== 0或1【户主或 户主的配偶】的部分原样本,第六个relation=0则是户主。
在检查重 ...
无法理解你的问题!

8
xiangjian154 发表于 2021-5-9 22:18:08
你好,请问你父代与子代匹配成功了吗

9
Haruru98 发表于 2022-3-11 18:25:35
xiangjian154 发表于 2021-5-9 22:18
你好,请问你父代与子代匹配成功了吗
你好,请问你父代与子代匹配成功了吗?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-8 15:46