楼主: lihoujian
124458 43

[数据管理求助] stata中数据如何合并 [推广有奖]

VIP

历史过客

院士

34%

还不是VIP/贵宾

-

威望
3
论坛币
37632 个
通用积分
199.1110
学术水平
218 点
热心指数
228 点
信用等级
178 点
经验
55904 点
帖子
1574
精华
3
在线时间
3196 小时
注册时间
2007-10-3
最后登录
2024-1-6

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如表
id pid x y
1011 1 5 3
1011 2 4 2
1012 1 5 3
1012 2 6 4
1012 3 7 8
1013 1 6 5


idpid z
1011 1 5
1011 2 6
1012 2 7
1012 3 4
1013 1 3
1014 1 5


如何将这两张表合理地合并起来呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata pid IDP DPI 如何

懂得放弃才会拥有
沙发
逍遥梦蝶 发表于 2013-3-13 10:46:39 |只看作者 |坛友微信交流群
键入help merge
我觉得merge的help说得还是很清楚的

使用道具

藤椅
lihoujian 发表于 2013-3-13 10:49:15 |只看作者 |坛友微信交流群
等于没有回答,不过谢谢,merge 1:1  id using ,merge 1:m id using,这个合并是不合理的,这个有两个id,分别为id和pid
懂得放弃才会拥有

使用道具

板凳
wxylzh 发表于 2013-3-13 11:08:29 |只看作者 |坛友微信交流群
如何合并要根据你自己的需要来定的,stata中数据合并有纵向合并、横向合并和交叉合并,纵向合并是把两个数据的样本加总在一起,使总样本增加;横向合并是把两个数据文件的变量加总在一起,合并后样本不变,变量的数目增加;交叉合并是把一个数据的个案和另外一个数据的个案交叉搭配生产新的数据。
我觉得楼主是不是要实现组内交叉合并?组内交叉合并命令是joinby 分组变量 using 文件2,你得先把文件1打开,你的分组变量是id,还是pid根据你自己的需要。

使用道具

报纸
lihoujian 发表于 2013-3-13 11:13:11 |只看作者 |坛友微信交流群
如何合并要根据你自己的需要来定的,stata中数据合并有纵向合并、横向合并和交叉合并,纵向合并是把两个数据的样本加总在一起,使总样本增加;横向合并是把两个数据文件的变量加总在一起,合并后样本不变,变量的数目增加;交叉合并是把一个数据的个案和另外一个数据的个案交叉搭配生产新的数据。
我觉得楼主是不是要实现组内交叉合并?组内交叉合并命令是joinby 分组变量 using 文件2,你得先把文件1打开,你的分组变量是id,还是pid根据你自己的需要。
id是户代码,pid是家庭成员排序,我想要第二张表里面的id与第一张表的id匹配,且第二章表的pid与第一张表的pid匹配,不匹配的自动占位
懂得放弃才会拥有

使用道具

地板
蓝色 发表于 2013-3-13 11:48:58 |只看作者 |坛友微信交流群
merge 1:1 id pid using

使用道具

7
lihoujian 发表于 2013-3-13 15:44:10 |只看作者 |坛友微信交流群
merge 1:1 id pid using
谢谢蓝色版主的建议,我起初也是用这个命令,但是variables id pid do not uniquely identify observations in the master data

懂得放弃才会拥有

使用道具

8
lihoujian 发表于 2013-3-13 16:02:00 |只看作者 |坛友微信交流群
后来根据 merge m:1 ip pid using 是成功了,但是我觉得合并的不对头
懂得放弃才会拥有

使用道具

9
jzhyue 发表于 2013-4-29 21:21:16 来自手机 |只看作者 |坛友微信交流群
这样问问题,答者都不知怎么回复!你的具体问题要清楚,根据什么合并?不是没有办法,而是我们不知道你的要求!

使用道具

10
蓝色 发表于 2013-4-30 08:05:31 |只看作者 |坛友微信交流群
lihoujian 发表于 2013-3-13 15:44
谢谢蓝色版主的建议,我起初也是用这个命令,但是variables id pid do not uniquely identify observatio ...
那说明你的数据编码有问题 id pid 的组合不是唯一的
有可能同一个id下面对于几个相同的pid
需要检查数据后在合并

duplicates report  id   pid

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
lihoujian + 4 + 3 + 3 正解,蓝色版主不愧是大神啊

总评分: 学术水平 + 4  热心指数 + 3  信用等级 + 3   查看全部评分

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 19:48