楼主: appleqiuqiu
4326 8

[问答] 如何分类加总并去重 [推广有奖]

  • 0关注
  • 1粉丝

副教授

41%

还不是VIP/贵宾

-

威望
0
论坛币
3641 个
通用积分
2.6200
学术水平
2 点
热心指数
2 点
信用等级
2 点
经验
4191 点
帖子
133
精华
0
在线时间
1514 小时
注册时间
2010-4-27
最后登录
2022-6-22

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
现遇到这样一个问题:有两列数,第一列为id,第二列为count,如下:
idcount

1

27

2

13

3

45

4

23

4

2

5

15

6

32

7

12

7

6



可以看到4和7有重复,现在想把4和7对应的数分别加总,即4对应23+2=25, 7对应12+6=18,输出的数据集变成这样

idcount

1

27

2

13

3

45

4

25

5

15

6

32

7

18



不知道在sas里应如何实现?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Count 如何实现 IDC 数据集 不知道 如何

本帖被以下文库推荐

沙发
zhengbo8 发表于 2014-1-5 18:08:08 |只看作者 |坛友微信交流群
  1. data a;
  2.         input id count;
  3. datalines;
  4. 1 27
  5. 2 13
  6. 3 45
  7. 4 23
  8. 4 2
  9. 5 15
  10. 6 32
  11. 7 12
  12. 7 6
  13. ;

  14. proc sort data=a; by id; run;

  15. data b(keep = id count);

  16. if _N_=0 then set a(rename=(count=count1));

  17. declare hash h1 (hashexp: 3, ordered: 'a') ;

  18. h1.defineKey('id') ;
  19. h1.defineData('id', 'count1') ;
  20. h1.defineDone() ;

  21. do until (last.id) ;
  22.         do count = 0 by 0 until (last.id) ;
  23.                 set a(rename=(count=count1));
  24.                 by id;
  25.                 count + count1 ;
  26.         end ;
  27.         rc = h1.replace() ;
  28.         output;
  29. end ;

  30. run ;
复制代码
已有 1 人评分论坛币 收起 理由
admin_kefu + 100 热心帮助其他会员

总评分: 论坛币 + 100   查看全部评分

使用道具

藤椅
Imasasor 发表于 2014-1-5 18:39:53 |只看作者 |坛友微信交流群
  1. data a;
  2.         input id count;
  3. datalines;
  4. 1 27
  5. 2 13
  6. 3 45
  7. 4 23
  8. 4 2
  9. 5 15
  10. 6 32
  11. 7 12
  12. 7 6
  13. ;

  14. proc sql;
  15. create table b as
  16. select id, sum(count) as count from a
  17. group by id;
  18. quit;
复制代码
hash很强大,sql也很方便
欢迎加入亚太地区第一R&Python数据挖掘群: 251548215;

使用道具

板凳
appleqiuqiu 发表于 2014-1-5 22:09:43 |只看作者 |坛友微信交流群
zhengbo8 发表于 2014-1-5 18:08
老朋友真牛逼!!!你的这段程序我得消化消化。。。。求普及hash。。。

使用道具

报纸
appleqiuqiu 发表于 2014-1-5 22:10:41 |只看作者 |坛友微信交流群
Imasasor 发表于 2014-1-5 18:39
hash很强大,sql也很方便
多谢版主!版主提醒了我对观测进行操作时要用sql

使用道具

地板
yuerqieqie 发表于 2014-1-6 21:27:42 |只看作者 |坛友微信交流群
proc summary data = a nway;
        class id;
        var count;
        output out = b(drop = _freq_ _type_) sum = ;
run;
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
appleqiuqiu + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

7
playmore 发表于 2014-1-7 12:29:27 |只看作者 |坛友微信交流群
zhengbo8 发表于 2014-1-5 18:08
大侠能解释下
do count = 0 by 0 until (last.id) ;
其中的by 0是什么意思吗?
谢谢!
playmore邀请您访问ChinaTeX论坛!!!进入ChinaTeX论坛

使用道具

8
playmore 发表于 2014-1-7 13:20:49 |只看作者 |坛友微信交流群
playmore 发表于 2014-1-7 12:29
大侠能解释下
do count = 0 by 0 until (last.id) ;
其中的by 0是什么意思吗?
嗯,我刚研究了下,明白意思了

另外我发现最外面的那个大循环,就是
do until (last.id) ;
...
end;
好像删掉也没事,不知道是起什么作用,再问下,谢谢!
playmore邀请您访问ChinaTeX论坛!!!进入ChinaTeX论坛

使用道具

9
zhengbo8 发表于 2014-1-7 13:44:49 |只看作者 |坛友微信交流群
yuerqieqie 发表于 2014-1-6 21:27
proc summary data = a nway;
        class id;
        var count;

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 22:48