10334 13

[问答] R做svm预测和随机森林分类好慢啊! [推广有奖]

11
雾锁山城 在职认证  发表于 2017-12-12 15:42:20
露露的家园2012 发表于 2017-12-12 09:55
我刚刚重新尝试一下,将df[,ncol]~.,换成了:
svmfit
svm不适合数据量大的情况,本身svm更适合数据量比较小。

12
露露的家园2012 发表于 2017-12-12 15:49:41
jameschin007 发表于 2017-12-12 15:36
服务器内存多少,CPU啥情况。

SVM吃CPU, RF吃内存。 换Python或java weka 快很多
微信图片_20171212154729.png

13
kantdisciple 发表于 2017-12-13 13:09:39
10万数据对NN来说不大,但是对svm来说已经非常大了。它不适合大样本情况。

14
jameschin007 发表于 2017-12-13 13:20:05
露露的家园2012 发表于 2017-12-12 15:49
不是打击你,这个配置差不多就是这样的。
所以建议比如把数据分成5份或10分,用RF或SVM 分别做5个模型。然后在做ensemble。

另外,这两个模型都是不支持多线程,所以就一个cpu在跑。 所以现在4核,8核也没用。 拿服务器跑也那样。
你可以看任务管理器里,只有一个cpu彪满,其他的都在休息。。。。
有人建议用并行包 parallel, 可以试试,但是很可能让你失望。SVM 上并行不稳定,很可能运行半天之后,会报错终止。 而且是随机的。有时运行挺好,有时就出问题。

建议你换xgboost吧。 支持并行。 效果很好。 R做原型验证还行,做实时分析肯定是满,所以还是换python或者java weka 比较有效。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 19:41