最近一直受一个问题困扰,咨询一下论坛内的大家,请多多指教!问题是机器学习方面的。
如果用一组类别已知的样本,其类别可能是1,...,m,训练一个分类器,然后用其识别一组样本。待识别样本中如果出现了一个不在1,...,m类中的样本,分类器能发现吗?
直观的感觉是,不能发现,因为分类器一旦训练好了,对于一个新的、待识别的样本,一定分到自己已知的类别中的一个。但是,又觉得,如果对分类器的分类过程稍加修改,就有可能发现新类别。例如,对基于朴素贝叶斯的分类器,分类过程是计算后验概率,把待识别样分到后验概率最大的一类,这里可以加上一个阈值,如果后验概率低于它,那么,将判为新类别,而不是后验概率最大的一类。
盼高人指点,这种问题有什么已有的研究,给指个思路、提供点参考文献题目也行,不胜感激!