楼主: Greenlane
3350 8

如何用PROC SQL可以简单地得出不重复的行数? [推广有奖]

  • 0关注
  • 0粉丝

初中生

90%

还不是VIP/贵宾

-

威望
0
论坛币
145 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
122 点
帖子
17
精华
0
在线时间
17 小时
注册时间
2015-3-28
最后登录
2016-1-16

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
这个问题看起来很简单,

pro sql;
select count(*)... 可以得到行数,但是duplicate的行数也计算在内。

要去掉重复行数,如果写成
proc sql;
select count (distinct *)... 似乎顺利成章,但语法抱错.

而这种
proc sql;
select count(*) from (select distinct * from datatable)... 又显得有点矫情。

请教各位更好的方法。谢啦!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:proc sql sql ROC 如何用 duplicate 如何

沙发
马甲甲 发表于 2015-7-25 11:12:17 |只看作者 |坛友微信交流群
nodup
nodupkey

使用道具

藤椅
不是吧258123 发表于 2015-7-25 11:18:01 |只看作者 |坛友微信交流群
为什么非要用sql,用data步排序,nodup可以实现啊

使用道具

板凳
wsddzr 发表于 2015-7-25 11:55:28 |只看作者 |坛友微信交流群
不知道下面这种行不行 初学者~
  1. data have;
  2. input x y z;
  3. cards;
  4. 1 2 3
  5. 1 2 3
  6. 1 2 3
  7. 1 1 1
  8. 1 1 1
  9. 2 3 4
  10. 2 3 4
  11. run;

  12. proc sql;
  13. select count(*) from (select distinct x,y,z from have);
  14. quit;
复制代码

使用道具

报纸
haiimo 发表于 2015-7-25 12:00:17 来自手机 |只看作者 |坛友微信交流群
Greenlane 发表于 2015-7-25 11:01
这个问题看起来很简单,

pro sql;
proc sort data=... nodup/nodupkey;
by...;
得到非重复的

proc summary data=....;
by...
output out=... (where _freq_ >1)
得到重复的


是不是这样?

使用道具

地板
mingfeng07 学生认证  发表于 2015-7-25 13:17:59 |只看作者 |坛友微信交流群
重复也要看变量,你要取哪个variable不重复的观测,就select count(distinct variable) from datasets;
如果是针对多个变量的话,可以这么写:
proc sql;
select count(*) from (select count(*) from datasets group by variable1,variable2,....,variablen);
quit;

使用道具

7
Greenlane 发表于 2015-7-25 19:21:52 |只看作者 |坛友微信交流群
感谢各位的回复。
对于proc sort,  如果行数巨大,如千万行,会非常花时间。

使用道具

8
wsddzr 发表于 2015-7-26 23:23:51 |只看作者 |坛友微信交流群
Greenlane 发表于 2015-7-25 19:21
感谢各位的回复。
对于proc sort,  如果行数巨大,如千万行,会非常花时间。
那这里proc sql会少大概多少时间呢?

使用道具

9
Sasbuddy 发表于 2015-7-27 03:46:33 |只看作者 |坛友微信交流群
proc sql;
select distinct ID from ...
quit;
不重复的行数 = &sqlobs;


使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 08:28