人大经济论坛 › 论坛 › 计量经济学与统计论坛五区 › 计量经济学与统计软件 › Stata专版 › 求助一个 merge的问题。

CDA数据分析研究院

商业数据分析与大数据领航教育品牌



经管云课堂

经管/金融/财会/社科/名师公开课



学术培训

Stata 空间计量 SSCI Python

贵宾：通行论坛特权+数据库权限
+案例库+下载特权 VIP：论坛特权+更多下载次数
+ccerdata数据库+更高阅读权限+……

12 下一页

发帖

楼主: kuaijimxz

10114 18

[数据管理求助] 求助一个 merge的问题。 [推广有奖]

0关注
0粉丝

svip3

本科生

11%

（VIP/贵宾）六级

威望: 0 级
论坛币: 70299 个
通用积分: 0
学术水平: 0 点
热心指数: 1 点
信用等级: 3 点
经验: 593 点
帖子: 56
精华: 0
在线时间: 58 小时
注册时间: 2009-4-19
最后登录: 2024-5-7

楼主

kuaijimxz 发表于 2012-10-31 20:04:20 |只看作者 |坛友微信交流群|正序 |AI写论文

相似文件

换一批

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

大家好。我想把文件 abc和文件def合并成文件m，请问 merge 命令应该怎么写。谢谢
abc文件
stkcd  year  debt ratio
00001  1997 0.3  0.2
00001  1998  0.2 0.3
00002  1997 0.1  0.3
00002 1998  0.2  0.3
def文件
stkcd  year    size
00001  1997 3
00001  1998 4
00002 1997 5
00002 1997 3
文件m
stkcd  year  debt ratio  size
00001  1997 0.3  0.2 3
00001  1998  0.2 0.3 4
00002 1997 0.1  0.3  5
00002 1998  0.2  0.3  3

我用的是stata11的版本。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏4 回帖

关键词：Merge Stata11 stkcd ratio Stata

本帖被以下文库推荐

· Stata FAQ and Econometrics|主题: 560, 订阅: 189

使用道具举报

19楼

Evevalue 发表于 2016-5-15 11:03:25 |只看作者 |坛友微信交流群

蓝色发表于 2012-11-1 12:23
比如：A、b，C三个数据集；
A与B合并当然是1:1了，按照hhid pid 相同的合并，每个人对应自己的收入水平
A ...

受教了！

使用道具举报

18楼

儒雅谦和 发表于 2015-5-8 23:52:56 |只看作者 |坛友微信交流群

蓝色发表于 2012-11-1 12:23
比如：A、b，C三个数据集；
A与B合并当然是1:1了，按照hhid pid 相同的合并，每个人对应自己的收入水平
A ...

解决了疑惑我长久以来的问题，给10楼的点个赞！分享知识伟大！

使用道具举报

17楼

皖山一流

发表于 2014-10-4 01:28:48 来自手机 |只看作者 |坛友微信交流群

蓝色发表于 2012-11-1 12:23
比如：A、b，C三个数据集；
A与B合并当然是1:1了，按照hhid pid 相同的合并，每个人对应自己的收入水平
A ...

正解！

使用道具举报

16楼

kouexcellent 发表于 2014-10-2 22:02:35 |只看作者 |坛友微信交流群

学习了。

使用道具举报

15楼

a414490056 发表于 2014-10-2 12:18:58 |只看作者 |坛友微信交流群

joinby

使用道具举报

14楼

蓝色 发表于 2013-12-26 15:52:28 |只看作者 |坛友微信交流群

tomy70585 发表于 2013-12-26 12:18
版主你好
最近也在合併資料
透過舊版的merge指令後卻無法成功合併

到底是m：m还是1:1需要根据你的数据的要求

就像我上面的例子，个人的信息在不同的数据集中，merge是需要把个人的信息一一对应，则需要1:1.
但如果理论上应该是1:1的，但你merge的时候出现问题，则需要你检查数据了，估计是数据代码出错了
或者你少写写了一个匹配的变量
如你的例子
merge 1:1 ID year mon using B.dta
有问题，原因就是给定 id year mon 是不能定位到唯一的一个数据点的

. use "D:\temp\A.dta", clear

. bysort ID year mon: egen num=count(ID)

. tab num

      num |    Freq.    Percent       Cum.
------------+-----------------------------------
      1 |    55,185    100.00    100.00
------------+-----------------------------------
   Total |    55,185    100.00

. use "D:\temp\B.dta", clear

. bysort ID year mon: egen num=count(ID)

. tab num

      num |    Freq.    Percent       Cum.
------------+-----------------------------------
      1 |    16,602    20.78    20.78
   21092 |    42,184    52.81    73.59
   21093 |    21,093    26.41    100.00
------------+-----------------------------------
   Total |    79,879    100.00

很显然，你的b数据，给定 ID year mon 统计样本数据有许多重复的

Stata常见问题解答https://bbs.pinggu.org/thread-272681-1-1.html

使用道具举报

13楼

tomy70585 发表于 2013-12-26 12:18:22 |只看作者 |坛友微信交流群

蓝色发表于 2012-11-1 12:23
比如：A、b，C三个数据集；
A与B合并当然是1:1了，按照hhid pid 相同的合并，每个人对应自己的收入水平
A ...

版主你好
最近也在合併資料
透過舊版的merge指令後卻無法成功合併
在看過你的文章回覆後，想問一下
在m:m 的合併的情況下
關鍵合併變數中，若在主資料及從資料都非唯一的情況
是不是就要用m:m合併

之前使用了這個指令
use A, clear
merge ID year mon using B.dta, sort
出現了這樣的結果
variables ID year mon do not uniquely identify observations in the using data

但是透過了
merge m:m ID year mon using B.dta, force
卻是可以達到我想要的型態(保留_merge=3的部分)

所以想跟你請教一下
也感謝你在之前相關問題提問上的指引

資料 result檔為我要的資料型態