签到
- 苹果/安卓/wp
- 苹果/安卓/wp
客户端
0.0

0.00

经管百科

人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › SAS专版 › SQL 自关联如何去重复？

楼主: daazx

2701 6

[问答] SQL 自关联如何去重复？ [推广有奖]

0关注
53粉丝

已卖：2份资源

教授

2%

还不是VIP/贵宾

-

TA的文库 其他...

Hadoop与大数据

0%

威望: 0 级
论坛币: 50036 个
通用积分: 7.1383
学术水平: 176 点
热心指数: 197 点
信用等级: 114 点
经验: 11000 点
帖子: 445
精华: 3
在线时间: 1069 小时
注册时间: 2007-10-19
最后登录: 2021-6-1
毕业学校: 深圳大学

楼主

在职认证

发表于 2017-8-15 14:46:41 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

有下图左边这个 t1 表，想生成右边 t2 表。只能写 SQL 的话，应该如何写？

自关联的话，会出现：a-b-1-7 和 b-a-7-1 这两条记录。而同一对只想出现一次，请问该如何写？

多谢大神~

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：sql 如何写

相关帖子

回复

沙发

学生认证

发表于 2017-8-15 15:13:15

data t1;
input v $ value;
datalines;
a 1
b 2
c 3
d 4
;
proc sql;
create table t2 as
select a.v as v1, b.v as v2, a.value as value1, b.value as value2
from t1 as a, t1 as b
where a.v < b.v;
quit;

复制代码

回复

藤椅

在职认证

发表于 2017-8-16 10:17:42

deem 发表于 2017-8-15 15:13

是可以的，多谢多谢~

实际上我的表中可能有几十万条数据，这样自关联，会不会耗时太久，有些优化的余地么？

回复

板凳

学生认证

发表于 2017-8-16 11:03:06

daazx 发表于 2017-8-16 10:17
是可以的，多谢多谢~

实际上我的表中可能有几十万条数据，这样自关联，会不会耗时太久，有些优化的余地 ...

会很影响的，你需要先建立一个辅助数据集，生成t2的前两列，接下来就是1:1匹配，不然的话SQL太慢了。

复制代码

回复

报纸

学生认证

发表于 2017-8-16 11:03:08

daazx 发表于 2017-8-16 10:17
是可以的，多谢多谢~

实际上我的表中可能有几十万条数据，这样自关联，会不会耗时太久，有些优化的余地 ...

会很影响的，你需要先建立一个辅助数据集，生成t2的前两列，接下来就是1:1匹配，不然的话SQL太慢了。

复制代码

回复

地板

学生认证

发表于 2017-8-16 11:03:11

daazx 发表于 2017-8-16 10:17
是可以的，多谢多谢~

实际上我的表中可能有几十万条数据，这样自关联，会不会耗时太久，有些优化的余地 ...

会很影响的，你需要先建立一个辅助数据集，生成t2的前两列，接下来就是1:1匹配，不然的话SQL太慢了。

复制代码

回复

7楼

superguy333 发表于 2017-8-17 00:08:01

这是个好问题，先留下足迹，解决后再回帖

回复

发帖

本版微信群

加好友,备注cda
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明