关联规则Apriori算法是数据挖掘中常用的一种算法。这里会涉及诸如支持度、最小支持阈值、置信度、提升值等概念。
1.假如有a、b、c、d四个分类,Apriori算法首先计算四个分类的在每个观察记录上的个数,然后两两组合再计算个数,小于某个数的删除,并计算置信度。以此类推。
2.设定最小置信度,并与上述置信度比较,小于最小置信度的删除。
3.最后计算提升值,大于1为正关联;小于1为负关联。
楼主: 有福有德
|
4532
8
[数据挖掘理论与案例] 关联规则Apriori算法 |
院士 6%
-
|
| ||
所有模型都是错的
|
|||
| ||
京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明 免责及隐私声明