现在的数据集大约20000个样本,200个特征(20000x200的data_frame),R里面有哪些包是针对与大数据集机器学习进行改进的?望大神告知,非常感谢!
由于之后网格搜索优化以及交叉验证,所以计算量还是很大的。。。就我所知的有dplyr以及data.table,加上并行处理的方法,我想知道还有没有漏网之鱼?宗旨当然是越快越好。。。(前提是数据能够被机器学习相关包处理)
|
楼主: jmq19950824
|
3657
14
[问答] 如何提高R语言机器学习的计算效率? |
|
已卖:226份资源 讲师 48%
-
|
回帖推荐narcissism0923 发表于4楼 查看完整内容 推荐两个很好的机器学习平台:caret和mlr,其中几乎包含了当今所有主流的机器学习方法;
此外,就是以神经网络为主的包,主要是h2o和keras两大家,都是很好的平台。
cheetahfly 发表于2楼 查看完整内容 h2o, tensorflow, keras
| ||
|
from zero to hero
|
|||
|
|
| ||
| ||
| ||
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


