楼主: 好想~~~
25961 15

[数据管理求助] stata merge 中 出现标志不唯一的问题 [推广有奖]

  • 1关注
  • 2粉丝

VIP1

硕士生

73%

还不是VIP/贵宾

-

威望
0
论坛币
2122 个
通用积分
0.1069
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2031 点
帖子
149
精华
0
在线时间
146 小时
注册时间
2009-10-1
最后登录
2016-6-28

楼主
好想~~~ 发表于 2015-6-16 16:17:32 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
多个数据库 横向合并,merge 1:1  districtcode count  street  group  hous housemembercode  using urban2
出现:variables districtcode count street group hous housemembercode do not uniquely
    identify observations in the master data
可是我目测检查了 districtcode count street group hous housemembercode  没错了 是唯一的啊  当然由于样本大 ,不知有否疏漏
问:如何检查是否唯一的问题?如何去掉重复的?
                                                                  谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Merge Stata tata observations observation identify master 数据库 count 如何

沙发
ywh19860616 发表于 2015-6-16 19:17:25
要检查变量值是否唯一,可以用函数isid

isid checks whether the specified variables uniquely identify the observations

已有 1 人评分经验 论坛币 学术水平 热心指数 收起 理由
SpencerMeng + 80 + 10 + 1 + 1 观点有启发

总评分: 经验 + 80  论坛币 + 10  学术水平 + 1  热心指数 + 1   查看全部评分

藤椅
夏目贵志 发表于 2015-6-16 23:50:32
help duplicates
可以列出重复值
已有 1 人评分经验 论坛币 收起 理由
葫芦娃大王 + 10 + 10 精彩帖子

总评分: 经验 + 10  论坛币 + 10   查看全部评分

板凳
蓝色 发表于 2015-6-17 07:43:47
目测是没有软件准确的。
还是用上面提到的命令检查数据
已有 1 人评分经验 论坛币 收起 理由
葫芦娃大王 + 10 + 10 精彩帖子

总评分: 经验 + 10  论坛币 + 10   查看全部评分

报纸
好想~~~ 发表于 2015-6-17 16:27:38
谢谢各位热情回答 答案为 duplicates drop 命令 也是从该论中其他贴看到 再次感谢大家的回答

已有 1 人评分经验 论坛币 收起 理由
葫芦娃大王 + 10 + 10 精彩帖子

总评分: 经验 + 10  论坛币 + 10   查看全部评分

地板
zixuechengcai 发表于 2020-7-18 11:06:34
碰到同样问题,按照上面各位的指示,用
duplicates list //列出重复值
duplicates drop   
搞定

谢谢各位~
已有 1 人评分经验 论坛币 收起 理由
葫芦娃大王 + 10 + 10 精彩帖子

总评分: 经验 + 10  论坛币 + 10   查看全部评分

7
chiuuu 发表于 2020-7-29 21:48:34
ROE的挡案

nobs    Stkcd    Date    Price    SOE    ROE
1001    000001    07jan2011    16.41    0    14.73
1002    000001    14jan2011    15.99    0    14.73
1003    000001    21jan2011    15.15    0    14.73
1004    000001    28jan2011    15.2    0    14.73
1005    000001    01feb2011    15.44    0    14.73
1006    000001    11feb2011    15.5    0    14.73
1007    000001    18feb2011    15.98    0    14.73
1008    000001    25feb2011    15.89    0    18.7505
1009    000001    04mar2011    16.68    0    18.7505
1010    000001    11mar2011    16.05    0    18.7505
1011    000001    18mar2011    15.83    0    18.7505
1012    000001    25mar2011    16.26    0    18.7505
1013    000001    01apr2011    16.57    0    18.7505
1014    000001    08apr2011    17.17    0    18.7505
1015    000001    15apr2011    18.73    0    18.7505
1016    000001    22apr2011    17.86    0    18.7505
1017    000001    29apr2011    18.2    0    6.68

lev的挡案
nobs    Stkcd    lev    MVA
55    000001    .9643    4.994e+10
56    000001    .9512    3.060e+10
57    000001    .9523    2.438e+10
58    000001    .9539    2.152e+10
59    000001    .9554    2.009e+10
60    000001    .9552    2.134e+10
61    000001    .9406    1.247e+10
62    000001    .94    6.562e+09
63    000001    .9422    3.673e+09
64    000001    .9464    -2.153e+09
65    000001    .9446    -1.446e+10
66    000001    .9472    -2.723e+09
67    000001    .9509    1.432e+10
68    000001    .9498    -9.814e+09
69    000001    .9488    2.472e+09

这是我的数据也出现的这样的问题 有人可以帮忙吗 谢谢

    clear all
    cd C:\Users\Chiu\Desktop

    use "C:\Users\Chiu\Desktop\ROE.dta"
    sort Stkcd Date
    save ROE.dta, replace

    use "C:\Users\Chiu\Desktop\lev.dta"
    drop nobs
    sort Stkcd
    duplicates report
    duplicates drop
    merge m:1 Stkcd using ROE.dta

8
fus0320269 发表于 2021-5-12 21:17:26
我看了重复的地方,,但是根本没重复啊 ,为啥他就显示重复了

9
美丽的烟火 学生认证  发表于 2022-4-10 19:33:44
fus0320269 发表于 2021-5-12 21:17
我看了重复的地方,,但是根本没重复啊 ,为啥他就显示重复了
我的也是,使用duplicates查看显示是唯一的,但是合并时有报错说那个数据库标识变量不唯一

10
snjtuljn 学生认证  发表于 2022-4-30 10:07:43
1:m     m:1   m:m 都试一试

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 03:19