楼主: chiuuu
43144 14

[编程问题求助] stata merge 中 出现not uniquely identify observations in the using data [推广有奖]

11
糖萌萌 学生认证  发表于 2022-2-24 13:18:20 |只看作者 |坛友微信交流群
hya2000an 发表于 2020-7-31 13:11
试试
use "C:\Users\Chiu\Desktop\ROE.dta",clear
sort Stkcd Date
你好遇到了相同问题,想问下,他roe表和lev表里stkcd变量都是000001,也就是都是重复的,如果删除stkcd变量的重复值,那两个表最后不都只剩下一个stkcd,即000001了吗,那不就是1:1合并了,求解答。

使用道具

12
糖萌萌 学生认证  发表于 2022-2-24 13:19:48 |只看作者 |坛友微信交流群
黃河泉 发表于 2020-7-30 11:29
你这个显然是无法 merge (绝对不要用 merge m:m),你知道你要做什么吗 (你希望你最后资料是怎样?什么频率 ...
黄老师,请问他roe表和lev表里stkcd变量都是000001,也就是都是重复的,如果删除stkcd变量的重复值,那两个表最后不都只剩下一个stkcd,即000001了吗,那不就是1:1合并了,求老师解答。

使用道具

13
大富大贵张 发表于 2022-10-8 15:49:52 |只看作者 |坛友微信交流群
想问下楼主怎么解决的呀,我是把财务数据和行业类型数据合并,财务数据是按照代码-年份,行业数据是按照代码,使用merge m:1 stkcd  using  FIX.dta  出现了variable stkcd does not uniquely identify observations in the using data

使用道具

14
mengzijiang 发表于 2023-2-13 11:55:40 |只看作者 |坛友微信交流群
hya2000an 发表于 2020-7-31 13:18
无非是想按Stkcd合并ROE和LEV两个文件,
试试
谢谢你,已解决问题

使用道具

出现"not uniquely identify observations in the using data"的提示,意味着使用的数据中存在多个观测值(Observations)具有相同的键变量值(Key Variables),在这里可能是`Stkcd`和`Date`。Stata无法确定应该合并哪一个观测值,因为键变量不能唯一地标识每个观测。

为了解决这个问题,你可以按照以下步骤操作:

1. 检查你的使用数据(using data)中是否有重复的键变量组合,例如`Stkcd`和`Date`。可以使用如下命令:
```stata
list Stkcd Date in 1/50 if _n <= 50 // 显示前50个观测以检查重复
```

2. 如果确实存在重复,你需要决定如何处理这些重复的观测。通常有以下几种选择:
   - 保留一个:可以使用`bysort Stkcd Date: keep if _n == 1`来保留每个键变量组合的第一个观测。
   - 合并信息:如果有多个相同键变量的观测但其他变量值不同,可能需要将这些值合并成一个观测。
   - 删除重复:如果重复的观测没有额外价值,可以直接删除,使用`drop if _d == 1`。

3. 在清理完数据后,再次尝试执行`merge`命令。例如:
```stata
merge m:1 Stkcd Date using ROE, keep(match master) // 假设你想要保留主文件(Master)的数据
```

请确保在运行这些操作前备份你的原始数据,以免丢失重要信息。如果仍然遇到问题,请提供更多详细信息以便进一步帮助。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-21 11:01