楼主: seven.loo
6138 3

[问答] R语言关联分析数据预处理(交易数据) [推广有奖]

  • 0关注
  • 0粉丝

小学生

0%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
43 点
帖子
3
精华
0
在线时间
1 小时
注册时间
2014-1-17
最后登录
2014-1-23

楼主
seven.loo 发表于 2014-1-21 11:55:12 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
交易数据格式如下:
  1         2             3           4             5           6          7             8         9   。。。。。。。。。。。。100
面包      0             0         牛奶        益力多     0          0           鸡蛋       。。。   。。。    。。。  。。。
面包      豆浆       酸奶      0            益力多     可乐      0            0          。。。   。。。    。。。  。。。
0           豆浆        0          牛奶         0             0         橙汁       鸡蛋      。。。   。。。    。。。  。。。
面包       0            酸奶      牛奶        0            可乐    橙汁         0          。。。   。。。    。。。  。。。
。。。
。。。
。。。
。。。


请问在R中,在进行apriori之前,要如何预处理数据,转成怎样的一种格式比较合适??
由于字段有100个字段,行数有2BW左右,直接把这个数据放到apriori处理会处理的很慢,而且占内存。


是否可以转成如下格式或者其他的什么格式:
1  面包
1  牛奶
1  益力多
1  鸡蛋
2  面包
2  豆浆
2  酸奶
2  益力多
2  可乐
....
....

如果我要求的是 “面包”与其他食品的关联性,应该如何处理呢??求教
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据预处理 关联分析 交易数据 R语言 预处理 益力多 可乐 橙汁 豆浆 牛奶

沙发
yayabe 发表于 2014-1-21 12:23:28
用SQL多好

藤椅
seven.loo 发表于 2014-1-21 12:54:51
yayabe 发表于 2014-1-21 12:23
用SQL多好
怎么说?

板凳
李会超 发表于 2014-11-21 13:17:04
可以的。item是物品,tid是订单号之类
trans4 <- as(split(a_df3[,"item"], a_df3[,"TID"]), "transactions")

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-6 16:16