楼主: qcasrl
4950 8

sql数据集合并(左连接),得到的观测对象为什么会比主数据集多? [推广有奖]

  • 6关注
  • 0粉丝

博士生

27%

还不是VIP/贵宾

-

威望
0
论坛币
99 个
通用积分
17.8700
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
503 点
帖子
106
精华
0
在线时间
397 小时
注册时间
2014-1-16
最后登录
2023-12-7

楼主
qcasrl 发表于 2015-8-12 23:49:26 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

proc sql;
create table aa  as select a.*, b.ner
        from total as a left join de08 as b
        on a.quan=b.quan and a.birthday=b.birth and a.sex=b.sex and a.prov=b.prov;
        quit;

用proc sql 程序合并两个数据集(左连接),为什么合并之后得到的数据集观测对象数量会比合并之前多?
合并之后的量不是应该等于主数据集的观测对象个数?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据集 sql left join proc sql Birthday

QQ图片20140212234408.png (2.74 KB)

用proc sql合并两个数据集,左连接

用proc sql合并两个数据集,左连接

沙发
Crsky7 发表于 2015-8-13 00:14:21
b中一定有许多主键(quan+birth+sex+prov)重复的观测!

藤椅
teqel 发表于 2015-8-13 00:18:18
Crsky7 发表于 2015-8-13 00:14
b中一定有许多主键(quan+birth+sex+prov)重复的观测!
Yes. Should make sure  (quan+birth+sex+prov) is Primary Key before the join

板凳
yangdelong1988 发表于 2015-8-13 00:26:02
被关联的表有重复观测

报纸
420948492 发表于 2015-8-13 12:43:16
楼上正解

地板
420948492 发表于 2015-8-13 13:33:34
楼上正解

7
qcasrl 发表于 2015-8-13 17:41:27
Crsky7 发表于 2015-8-13 00:14
b中一定有许多主键(quan+birth+sex+prov)重复的观测!
也就是说,B中有许多观测对象(quan+birth+sex+prov)这些信息均一致?
那怎样才能把这部分重复的观测筛选出来?

8
qcasrl 发表于 2015-8-13 17:42:12
teqel 发表于 2015-8-13 00:18
Yes. Should make sure  (quan+birth+sex+prov) is Primary Key before the join
那怎样能把这部分观测筛选出来?

9
Crsky7 发表于 2015-8-13 21:28:15
qcasrl 发表于 2015-8-13 17:41
也就是说,B中有许多观测对象(quan+birth+sex+prov)这些信息均一致?
那怎样才能把这部分重复的观测筛选 ...
u should dedup first.. use "nodupkey" option in "proc sort"
"dupout=" option will enable u to see those dups

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-3 06:17