1 概念
2 决策树分类方法
3 朴素贝叶斯分类方法
4 k近邻分类方法
5 分类性能的度量
分类(classification):总结已有类别的对象的特点并进而进行未知类别对象的类别预测的过程
用给定的训练集用来建立一个分类模型(或称分类器),所建立的分类模型用来预测数据库中类标号未知的数据元组的类别。
训练数据集由一组数据库元组(称为训练样本、实例或对象)构成
样本形式为(v1,v2,…,vn;c),
其中vi表示属性值,c表示类标号。
分类器(classifier)
训练数据集(training dataset)
分类属性(class label attribute),每个取值称为一个类别(class label)
属性,用于描述一个对象的某个特性或性质
测试数据集(testing dataset)