请教各位高手:
R语言中随机森林(randomForest)程序包里,怎么设置是分类,怎么设置就是回归呢?
在randomForest程序包的解释中,关于参数y的介绍如下:
y A response vector. If a factor, classification is assumed, otherwise regression is assumed. If omitted, randomForest will run in unsupervised mode
难道如果数据不是因子就无法进行分类处理吗,我分析的y为风险等级,分为五等,这个算是factor么?
进行这些操作主要是想对数据进行异常点删除,但是折腾了很久都弄不出来。
谢谢啦,本文是超级菜鸟,边学边做,望各位赐教!