楼主: 水十早月
5150 11

[数据管理求助] stata数据处理求助,如何将某些编号的数据筛选并保存 [推广有奖]

  • 0关注
  • 1粉丝

大专生

90%

还不是VIP/贵宾

-

威望
0
论坛币
2947 个
通用积分
1.6320
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
948 点
帖子
18
精华
0
在线时间
115 小时
注册时间
2019-4-12
最后登录
2024-6-11

10论坛币
hhid数据编号从201100001——201108438,共8438个编号,29324条数据;familyid数据编号不连续,共5753个编号。
需要将hhid内所有的对应5753个familyid的数据筛选出来,保留这些数据的hhid,province,gender,age。
如果方便,麻烦最好附上代码,让本小白自己研究学习,感谢各位大神
捕获.JPG

最佳答案

蓝色 查看完整内容

就用merge命令 假设包含hhid,province,age,gender这四项的数据假设已经保存为data1.dta 假设包含familyid变量的保存为data2数据集
关键词:求教stata stata数据处理 stata编程
沙发
蓝色 发表于 2019-8-13 09:17:08 |只看作者 |坛友微信交流群
水十早月 发表于 2019-8-30 08:48
数据一共包括hhid,province,age,gender这四项,familyid是我另加的。目的就是要把hhid中匹配familyid的 ...
就用merge命令
假设包含hhid,province,age,gender这四项的数据假设已经保存为data1.dta
假设包含familyid变量的保存为data2数据集

  1. use d:\data1.dta,clear
  2. gen familyid=hhid

  3. merge m:1  familyid   using d:\data2.dta
  4. keep if _merge==3    /*保留两个数据都有的数据*/
复制代码

使用道具

藤椅
zpp1995 学生认证  发表于 2019-8-21 09:12:16 来自手机 |只看作者 |坛友微信交流群
水十早月 发表于 2019-8-13 09:17
hhid数据编号从201100001——201108438,共8438个编号,29324条数据;familyid数据编号不连续,共5753个编号 ...
family数据是否有缺失?

使用道具

板凳
水十早月 发表于 2019-8-29 16:07:39 |只看作者 |坛友微信交流群
zpp1995 发表于 2019-8-21 09:12
family数据是否有缺失?
familyid是hhid中提取出的五千多个,不连续。这个问题我用Excel的高级筛选功能解决了,但是stata还是不会操作

使用道具

报纸
蓝色 发表于 2019-8-29 19:02:44 |只看作者 |坛友微信交流群
没有看明白到底要做什么

使用道具

地板
水十早月 发表于 2019-8-29 20:35:33 |只看作者 |坛友微信交流群
蓝色 发表于 2019-8-29 19:02
没有看明白到底要做什么
familyid是我需要的对象的编号,hhid是所有的对象,从里面把我需要的筛选出来,保留对应的一系列信息,无关的剔除出去。怪我自己描述的不清楚,这么说您能理解了啵?

使用道具

7
蓝色 发表于 2019-8-29 20:52:39 来自手机 |只看作者 |坛友微信交流群
你贴的图两个编码都有,直接保留不就是了

你介绍了那么多,还是不清楚你的数据集有哪些,都是什么关系

使用道具

8
水十早月 发表于 2019-8-30 08:48:38 来自手机 |只看作者 |坛友微信交流群
蓝色 发表于 2019-8-29 20:52
你贴的图两个编码都有,直接保留不就是了

你介绍了那么多,还是不清楚你的数据集有哪些,都是什么关系
数据一共包括hhid,province,age,gender这四项,familyid是我另加的。目的就是要把hhid中匹配familyid的数据保留下来,这么说您能明白了吗

使用道具

9
水十早月 发表于 2019-8-30 14:40:37 |只看作者 |坛友微信交流群
蓝色 发表于 2019-8-30 09:14
就用merge命令
假设包含hhid,province,age,gender这四项的数据假设已经保存为data1.dta
假设包含fam ...
familyid是不重复的,每个编号只出现一次,但是hhid是重复的,每个编号会重复出现几次,这样的话,直接merge可以吗?

使用道具

10
蓝色 发表于 2019-8-30 15:05:29 |只看作者 |坛友微信交流群
水十早月 发表于 2019-8-30 14:40
familyid是不重复的,每个编号只出现一次,但是hhid是重复的,每个编号会重复出现几次,这样的话,直接me ...
可以

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-8 04:20