- 阅读权限
- 255
- 威望
- 0 级
- 论坛币
- 335 个
- 通用积分
- 0
- 学术水平
- 0 点
- 热心指数
- 0 点
- 信用等级
- 0 点
- 经验
- 52 点
- 帖子
- 3
- 精华
- 0
- 在线时间
- 40 小时
- 注册时间
- 2005-9-2
- 最后登录
- 2019-5-14
高中生
还不是VIP/贵宾
- 威望
- 0 级
- 论坛币
- 335 个
- 通用积分
- 0
- 学术水平
- 0 点
- 热心指数
- 0 点
- 信用等级
- 0 点
- 经验
- 52 点
- 帖子
- 3
- 精华
- 0
- 在线时间
- 40 小时
- 注册时间
- 2005-9-2
- 最后登录
- 2019-5-14
|
50论坛币
本来是要发一个悬赏的,结果不太会用一开始弄错了><
现在有一份数据,格式如下:
会员id 购买产品
1 A
1 B
2 B
2 C
3 C
4 D
在做过关联分析后,我得到了一张关联分析的结果表,格式如下:
规则 左手规则 右手规则 LIFT
A→B A B 1.1
A→C A C 1.2
A,B→D A,B D 1.3
B→C B C 1.4
C→D C D 1.5
对关联分析的后续处理要求为,先去除某个会员购买过的产品在右手规则里出现的记录,再在结果里筛选出购买过的产品左手规则里出现的记录,最后按照LIFT由大到小排列,取前几条记录。例如,会员1买过A和B,那么就去掉A→B的规则,保留A→C,A,B→D,B→C,最后按照LIFT排列
这一部分某一个人单独的结果我已经在sas中用proc sql写好了,想问问大家,我要如何同时得到所有会员的结果呢?
也就是说,最后我想要得到的结果如下:
会员ID 规则 左手规则 右手规则 LIFT
1 B→C B C 1.4
1
2
2
3
3
我的思路是将全部的id拉出来,写一个循环,每一个id跑一遍,但也不是很清楚最后应该如何写在一张表里,希望各位大神能指点我一下
|
|