楼主: cynthialam
2481 16

如何计量重复度? [推广有奖]

  • 0关注
  • 4粉丝

博士生

44%

还不是VIP/贵宾

-

威望
0
论坛币
3021 个
通用积分
5.0600
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
145 点
帖子
261
精华
0
在线时间
98 小时
注册时间
2009-2-7
最后登录
2022-7-21

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
data aa;
input a b;
cards;
3 2
3 4
4 3
4 2
1 2
2 1
2 3
;
run;

这个数据中,有如下的关联关系:
1:2;
2:1,3,4;
3:2,4;
4:2,3

于是可以理解,1号和2号的重复度为0,2号和3号的重复度为1。。。。等等依此类推;

在SAS中可否实现上述的统计功能呢?

期待这样的结果形式:
a b cf
3 2 1
3 4 1
4 3 1
4 2 1
1 2 0
2 1 0
2 3 1

想过用SQL或HASH做,但总有点问题.....
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:cards Input HASH card Data 如何

回帖推荐

zhangzachary 发表于10楼  查看完整内容

本帖被以下文库推荐

沙发
cynthialam 发表于 2012-1-18 11:01:54 |只看作者 |坛友微信交流群
莫不是都回家过年了?

使用道具

藤椅
cynthialam 发表于 2012-1-18 11:15:37 |只看作者 |坛友微信交流群
急捏。。。。有人看,没人答。。。。。

使用道具

板凳
sushe1527 发表于 2012-1-18 11:27:26 |只看作者 |坛友微信交流群
4,2的重复度为什么是1呢 不明白

使用道具

报纸
456852 发表于 2012-1-18 11:39:42 |只看作者 |坛友微信交流群
没理解啊没理解

使用道具

地板
zhangzachary 发表于 2012-1-18 12:10:08 |只看作者 |坛友微信交流群
不理解重复度的定义,为什么1和2是0,其他的是1?能否再解释一下,或者举个例子,谢谢
寒冰凤凰 My blog: http://blog.sina.com.cn/u/1058955485

使用道具

7
cynthialam 发表于 2012-1-18 13:54:31 |只看作者 |坛友微信交流群
zhangzachary 发表于 2012-1-18 12:10
不理解重复度的定义,为什么1和2是0,其他的是1?能否再解释一下,或者举个例子,谢谢
重复度:对方编号的相同数量。
因为根据数据,2的对方编号为1、3、4,4号的对端编号为2、3;所以,2号和4号有一个对方编号相同(3号),所以重复度为1

使用道具

8
cynthialam 发表于 2012-1-18 13:55:03 |只看作者 |坛友微信交流群
sushe1527 发表于 2012-1-18 11:27
4,2的重复度为什么是1呢 不明白
因为根据数据,2的对方编号为1、3、4,4号的对端编号为2、3;所以,2号和4号有一个对方编号相同(3号),所以重复度为1

使用道具

9
cynthialam 发表于 2012-1-18 14:09:41 |只看作者 |坛友微信交流群
或者这么说吧,根据当前TX的编号,统计其所有对方编号。再比较两个TX对方编号的相同数量.....

使用道具

10
zhangzachary 发表于 2012-1-18 16:52:15 |只看作者 |坛友微信交流群
cynthialam 发表于 2012-1-18 13:54
重复度:对方编号的相同数量。
因为根据数据,2的对方编号为1、3、4,4号的对端编号为2、3;所以,2号和 ...
  1. data aa;
  2. input a b;
  3. datalines;
  4. 1 2
  5. 2 1
  6. 2 3
  7. 2 4
  8. 2 5
  9. 3 2
  10. 3 4
  11. 4 2
  12. 4 3
  13. 4 5
  14. 5 2
  15. 5 4
  16. ;
  17. run;

  18. /* proc sort */

  19. data ref;
  20.   set aa end=eof;
  21.   by a;
  22.   retain chain ;
  23.   if first.a then do;
  24.     chain=left(put(b,20.));
  25.   end;
  26.   else do;
  27.     chain=cats(chain,b);
  28.   end;
  29.   if last.a then output;
  30.   if eof then call symput("N",put(a,3.));
  31.   keep a chain;
  32. run;


  33. data refb;
  34.   set ref;
  35.   rename a=b chain=chain_b;
  36. run;


  37. %macro chongfu;
  38.   %do i=1 %to &N. ;
  39.     if  index(chain_b,substr(chain,&i.,1)) and substr(chain,&i.,1) ne " " then cf+1;
  40.   %end;
  41. %mend;



  42. data res;
  43.   if 0 then set ref refb;
  44.   if _n_=1 then do;
  45.     declare hash hrefa(dataset:"ref");
  46.       hrefa.definekey("a");
  47.       hrefa.definedata("a","chain");
  48.       hrefa.definedone();

  49.     declare hash hrefb(dataset:"refb");
  50.       hrefb.definekey("b");
  51.       hrefb.definedata("b","chain_b");
  52.       hrefb.definedone();
  53.   end;
  54.   set aa;
  55.   rca=hrefa.find();
  56.   rcb=hrefb.find();
  57.   cf=0;
  58.   if rca=0 and rcb=0 then do;
  59.     %chongfu;
  60.     output;
  61.   end;

  62.   keep a b cf;
  63. run;
复制代码
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

寒冰凤凰 My blog: http://blog.sina.com.cn/u/1058955485

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 02:22