非原创,转发哒
购物篮指的是超级市场内供顾客购物时使用的装商品的篮子,当顾客付款时这些购物篮内的商品被营业人员通过收款机一一登记结算并记录。
所谓的购物篮分析(Market Basket Analysis)就是通过这些购物篮子所显示的信息来研究顾客的购买行为。主要的目的在于找出什么样的东西应该放在一起。根据顾客的购买行为来了解是什么样的顾客以及这些顾客为什么买这些产品,找出相关规则,企业根据这些规则的挖掘获得利益与建立竞争优势。举例来说,零售店可藉由此分析改变置物架上的商品排列或是设计吸引客户的商业套餐等等。
通过一个简单的超市购物的数据来演示购物篮分析的方法和思想。工作流如下:
第一步,读取数据《购物篮.csv》
配置如下图
第二步 剔除只有一种物品的购物篮子
此处涉及到的算法节点包括:类型转换,汇总,行ID,选择等算法节点,具体的功能可以点击节点配置页面?获取节点使用说明。
首先,使用类型转换节点,将id字段从浮点型转换为整型。
其次,通过汇总节点依据id值进行汇总:
然后,通过选择节点选择id汇总值为1的样本,配置如下:
过滤后的表一共有174行,这些都是购物篮中只有一种物品的情况。右键单击查看过滤表,如下表所示:
第三步,生成购物篮。
首先,使用类型转换节点将id和卡号由浮点型转化为字符型。
其次,使用汇总节点派生购物篮。注意,这里应该以id为购物篮id,而不是卡号,因为同一卡可能有多次购买。但是并不是不能以卡号为研究对象,如果您想把一个人作为一个购物篮对象,也可以用卡号,但是此处经分析重复购买的人并不多,因此以人为研究对象没有意义。研究的对象的确定因研究重点不同而调整变化。
节点配置如下:
再次,使用参考行过滤节点,从汇总表中过滤掉过虑表中的数据。配置如下:
右键单击参考行过滤节点查看再次过滤后的数据如下表所示:
第四步,使用Apriori节点生成训练规则。配置如下:
生成的规则预览如下:
第五步,派生规则质量字段。
首先,使用选择节点过滤前项为空的规则。配置如下:
其次,使用过滤节点删除下面分析中不用的字段。配置如下:
然后,使用派生节点,派生规则质量字段。规则质量=支持度*规则置信度。配置如下:
最后,使用排序节点对数据按照规则质量和前项进行二重降序排列。排在前面的即为规则质量比较高的规则。节点配置如下:
第六步,提取规则质量较高的规则
通过表节点查看结果,表视图如下:
规则解释如下:
如果客户购买啤酒和蔬菜罐头的话,他还有87.4%的可能购买冻肉;
如果客户购买啤酒和冻肉的话,他还有85.9%的可能购买蔬菜罐头;
如果客户购买蔬菜罐头和冻肉的话,他还有84.4%的可能购买啤酒;
如果客户购买啤酒的话,他还有62.7%的可能购买啤酒·····
因此,对于这家超市而言,应该把水果和鱼类排放的近一些,这样可以提高销量。还有一点要注意的是,对这家超市有这样的规律,并不代表其他超市也是这样。但是方法论是通用的,不同的超市可以使用同样的方法论进行知识发现和验证。
数据获取:链接:http://pan.baidu.com/s/1o86jUvo 密码:ghch
(来源:莱信学院微信平台)