1676 8

[数据管理求助] 新手求助数据清洗问题 [推广有奖]

  • 0关注
  • 0粉丝

高中生

5%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
169 点
帖子
4
精华
0
在线时间
41 小时
注册时间
2020-10-12
最后登录
2023-8-27

楼主
小鱼的七秒梦想 发表于 2020-12-3 12:16:21 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
以下是有关夫妻的数据,id1是某一被调查者的id号,id2是其配偶的id号。现在是想把id号同时出现在id1和id2中的数据保留下来,请问命令该怎么用。
clear
input id1 id2 male
110006101 110006102 1
110006102 110006101 0
110009102 110009104 1
110015104 110015101 1
110020103 110020105 1
110020105 110020103 0
110020106 110020104 0
110026101 110026102 0
110026102 110026101 1
110033101 110033104 1
110033104 110033101 0
110041101 110041102 0
110041102 110041101 1
110043101 110043102 1
end







二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:新手求助 Input Male 被调查者 Lea

沙发
黃河泉 在职认证  发表于 2020-12-3 16:08:36
你确定这是正确资料吗?以第一笔资料来看,自己是自己的配偶?还是怎样?
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input float(id1 id2 male)
  4. 110006104 110006104 1
  5. 110006104 110006104 0
  6. 110009104 110009104 1
  7. 110015104 110015104 1
  8. 110020104 110020104 1
  9. 110020104 110020104 0
  10. 110020104 110020104 0
  11. 110026104 110026104 0
  12. 110026104 110026104 1
  13. 110033104 110033104 1
  14. 110033104 110033104 0
  15. 110041104 110041104 0
  16. 110041104 110041104 1
  17. 110043104 110043104 1
  18. end
复制代码
以此资料,到底要保留哪些?请具体说明之!

藤椅
黃河泉 在职认证  发表于 2020-12-3 16:14:36
不好意思,输入资料有些错误。但还是请"根据资料"说明到底哪些需要保留!

板凳
小鱼的七秒梦想 发表于 2020-12-3 16:40:00
黃河泉 发表于 2020-12-3 16:08
你确定这是正确资料吗?以第一笔资料来看,自己是自己的配偶?还是怎样?以此资料,到底要保留哪些?请具体 ...
黄老师,您好!我输的数据是正确的。我数据里id1是被调查者的ID号 ,而id2是被调查者的配偶的id号,一对夫妻具有不同的id号,现在是想把数据里的夫妻样本都挑选出来(也就是夫妻双方id在id1和id2各自都出现过一次),而那些只在id1和id2里出现过一次的剔除掉。或者说将id1里是夫妻的数据保留下来,不是夫妻(只出现男方或女方)的删除掉。不知道我这样表达您能理解嘛?

报纸
黃河泉 在职认证  发表于 2020-12-3 17:08:23
小鱼的七秒梦想 发表于 2020-12-3 16:40
黄老师,您好!我输的数据是正确的。我数据里id1是被调查者的ID号 ,而id2是被调查者的配偶的id号,一对夫 ...
上面资料哪几笔要留下?哪几笔要删除?

地板
小鱼的七秒梦想 发表于 2020-12-3 17:14:17
黃河泉 发表于 2020-12-3 17:08
上面资料哪几笔要留下?哪几笔要删除?
按照我给的数据是第3、4、7、14行数据删除,其余保留。

7
黃河泉 在职认证  发表于 2020-12-3 17:17:52
小鱼的七秒梦想 发表于 2020-12-3 16:40
黄老师,您好!我输的数据是正确的。我数据里id1是被调查者的ID号 ,而id2是被调查者的配偶的id号,一对夫 ...
你要的是这个吗?
  1. gen double id3 = cond(id1 < id2, id1, id2)
  2. gen double id4 = cond(id1 < id2, id2, id1)
  3. *format id3 id4 %14.0f
  4. bys id3 id4: gen t = _N
  5. keep if t == 2
复制代码

8
小鱼的七秒梦想 发表于 2020-12-3 17:50:31
黃河泉 发表于 2020-12-3 17:17
你要的是这个吗?
是的,非常感谢

9
DΘstinyじò 发表于 2020-12-3 19:49:45
小鱼的七秒梦想 发表于 2020-12-3 17:50
是的,非常感谢
照目前的数据排列,试一试这样:(虐单呗
  1. // sort id*
  2. drop if id1[_n]!=id2[_n-1] & id1[_n]!=id2[_n+1]
复制代码

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-9 15:24