交易数据格式如下:
1 2 3 4 5 6 7 8 9 。。。。。。。。。。。。100
面包 0 0 牛奶 益力多 0 0 鸡蛋 。。。 。。。 。。。 。。。
面包 豆浆 酸奶 0 益力多 可乐 0 0 。。。 。。。 。。。 。。。
0 豆浆 0 牛奶 0 0 橙汁 鸡蛋 。。。 。。。 。。。 。。。
面包 0 酸奶 牛奶 0 可乐 橙汁 0 。。。 。。。 。。。 。。。
。。。
。。。
。。。
。。。
请问在R中,在进行apriori之前,要如何预处理数据,转成怎样的一种格式比较合适??
由于字段有100个字段,行数有2BW左右,直接把这个数据放到apriori处理会处理的很慢,而且占内存。
是否可以转成如下格式或者其他的什么格式:
1 面包
1 牛奶
1 益力多
1 鸡蛋
2 面包
2 豆浆
2 酸奶
2 益力多
2 可乐
....
....
如果我要求的是 “面包”与其他食品的关联性,应该如何处理呢??求教


雷达卡



京公网安备 11010802022788号







