|
无论何时获得规则,都会从输入数据集中删除该规则所涵盖的示例。该过程将继续,直到覆盖所有示例,或者直到每个类示例中未覆盖的示例数量低于各自的最小已建立支持,或者直到达到获取规则的最大尝试次数。需要注意的是,由于示例一旦被规则覆盖,就会从输入数据集中删除,因此它们构成了一种分类。这就是说,为了对新示例进行分类,必须按照获得规则的顺序应用规则,并且将根据第一条规则的结果的相应类别对示例进行分类,第一条规则的前件验证了所检查的示例。在开始获取规则的迭代过程之前,该方法首先使用第2节中描述的全套示例和算法对LVQ神经网络进行监督训练。这一步骤的目标是确定最有希望的空间搜索领域。由于神经网络仅对数字数据进行操作,因此标称属性通过使用与标称属性的不同选项一样多的二进制数字的虚拟编码来表示。此外,在开始训练之前,每个数值属性在区间[0,1]中线性缩放。使用的相似性度量是欧几里德距离。一旦训练完成,每个质心将包含它所代表的示例的大致平均值。为了得到每一条规则,首先确定其对应的结果类。为了获得具有高支持度的规则,该方法分析具有更多未覆盖示例的类。
|