第章聚类分析孤立点分析
孤立点分析
什么是孤立点?对象的集合, 它们与数据的其它部分不一致孤立点可能是度量或执行错误所导致的 孤立点也可能是固有的数据变异性的结果 问题给定一个n个数据点或对象的集合, 及预期的孤立点的数目k, 发现与剩余的数据相比是相异的, 例外的, 或不一致的前k个对象 两个子问题:定义在给定的数据集合中什么样的数据可以被认为是不一致的找到一个有效的方法来挖掘这样的孤立点
孤立点分析
应用:信用卡欺诈检测电信欺诈检测顾客分割: 确定极低或极高收入的客户的消费行为 医疗分析: 发现对多种治疗方式的不寻常的反应孤立点的定义是非平凡的如果采用一个回归模型, 余量的分析可以给出对数据“极端”的很好的估计当在时间序列数据中寻找孤立点时, 它们可能隐藏在趋势的, 周期性的, 或者其他循环变化中, 这项任务非常棘手当分析多维数据时, 不是任何特别的一个, 而是维值的组合可能是极端的. 对于非数值型的数据(如分类数据), 孤立点的定义要求特殊的考虑


雷达卡




京公网安备 11010802022788号







