现在有一份数据,格式如下:
会员id 购买产品
1 A
1 B
2 B
2 C
3 C
4 D
在做过关联分析后,我得到了一张关联分析的结果表,格式如下:
规则 左手规则 右手规则 LIFT
A→B A B 1.1
A→C A C 1.2
A,B→D A,B D 1.3
B→C B C 1.4
C→D C D 1.5
对关联分析的后续处理要求为,先去除某个会员购买过的产品在右手规则里出现的记录,再在结果里筛选出购买过的产品左手规则里出现的记录,最后按照LIFT由大到小排列,取前几条记录。例如,会员1买过A和B,那么就去掉A→B的规则,保留A→C,A,B→D,B→C,最后按照LIFT排列
这一部分某一个人单独的结果我已经在sas中用proc sql写好了,想问问大家,我要如何同时得到所有会员的结果呢?
也就是说,最后我想要得到的结果如下:
会员ID 规则 左手规则 右手规则 LIFT
1 B→C B C 1.4
1
2
2
3
3
我的思路是将全部的id拉出来,写一个循环,每一个id跑一遍,但也不是很清楚最后应该如何写在一张表里,希望各位大神能指点我一下