什么是频繁模式挖掘?
频繁模式挖掘(AKA 关联规则挖掘)是一种分析过程,它从各种数据库(如关系数据库、事务数据库和其他数据存储库)中的数据集中找到频繁模式、关联或因果结构。给定一组交易,这个过程旨在找到规则,使我们能够根据交易中其他项目的发生来预测特定项目的发生。
让我们看一个频繁模式挖掘的例子。首先,我们需要了解此类分析中使用的术语。尽管此技术中使用了许多指标和因素,但对于此示例,我们将仅考虑两个因素,即支持和信心。
支持:规则 x -> y(其中 x 和 y 分别是项目/事件等)的支持定义为数据集中包含项目集 x 和 y 的事务的比例。因此,支持 (x -> y)= 否。包含项目集 x 和 y / 总数的交易数量。的交易。
置信度:规则 x -> y 的置信度定义为:支持度 (x -> y) / 支持度 (x)。因此,它是包含结果中所有项目(本例中为 y)以及前项(本例中为 x)的交易数量与包含前件中所有项目的交易数量(x在这种情况下)。
在下表中,Support (milk->bread) = 0.4 表示牛奶和面包一起购买,占所有交易的 40%。置信度(牛奶->面包)= 0.5 意味着如果有 100 笔交易包含牛奶,那么将有 50 笔交易也包含面包。
频繁模式挖掘如何支持业务分析?
这种分析方法可用于评估各种业务功能和行业的数据。
购物篮数据分析:分析单个购物篮或单次购买中已购买商品的关联性。
交叉营销和销售:与补充您自己而非竞争对手的其他企业合作。例如,出于显而易见的原因,汽车经销商和制造商与石油和天然气公司开展了交叉营销活动。
目录设计:企业目录中的商品选择通常是为了相互补充而设计的,因此购买一件商品会导致购买另一件商品,因此这些商品通常是互补的或密切相关的。
医疗:每个患者都被表示为包含有序疾病集合的事务,并且可以预测哪些疾病可能同时/依次发生。
为了理解这种应用技术的价值,让我们考虑两个业务用例。
用例一
业务问题:零售店经理想要进行购物篮分析,以提出更好的产品放置和产品捆绑策略。
业务收益:根据生成的规则,商店经理可以战略性地将产品放在一起或按顺序排列,从而增加销售额,进而增加商店的收入。可以根据生成的规则设计诸如“购买此产品并免费获得此产品”或“购买此产品并获得 % 折扣”之类的优惠。
用例二
业务问题:一位银行营销经理希望分析哪些产品是经常并按顺序一起购买的。每个客户都表示为一个交易,包含订购的产品集,然后可以预测哪些产品可能同时/顺序购买。
业务收益:根据生成的规则,银行产品可以交叉销售给每个现有或潜在客户,以推动销售和银行收入。例如,如果经常/顺序购买储蓄、个人贷款和信用卡,那么新的储蓄账户客户可以与个人贷款和信用卡交叉销售。
频繁模式挖掘(AKA 关联规则挖掘)是一种分析过程,可从各种数据存储库中的数据集中找到频繁模式、关联或因果结构。这种分析方法可用于评估各种业务功能和行业的数据,可用于确定各种产品和服务的购买行为的频繁模式,以及分析各种数据点之间的关系以进行交叉销售和捆绑产品,和服务产品,并了解目标受众。
相关帖子DA内容精选 |