Clementine 中的apriori算法模型只提供了条件支持度选项,但是大家都知道apriori是基于频繁项集来进行规则计算的,那么没有规则支持度怎么来算频繁项集呢?还是Clementine中的apriori不产生频繁项集?查了很多资料 apriori算法都是先产出频繁项集的。。
求大牛们指点。。
昨晚问了一个大牛,他说是经典的关联规则算法是基于覆盖式的,搞不懂啊 网上也找不到源码。。。
支持度显示条件支持度 — 即其条件为真的 ID 在训练数据中的比例。例如,如果 50% 的训练数据包括 bread(面包)的购买,那么规则 bread > cheese 的条件支持度为 50%。注意:此处定义的支持度与实例数相同,但以百分比的形式表示。
• 置信度显示规则支持度与条件支持度的比。此比值表明了带有指定条件、并且其结果也为真的 ID 的比例。例如,如果 50% 的训练数据包含 bread(面包)(表明条件支持),但只有 20% 既包含 bread(面包)又包含 cheese(奶酪)(表明规则支持度),则规则 bread -> cheese 的置信度为规则支持度/条件支持度,在这里为 40%