EM没用过,不过我觉着,其中算法的核心大多是proc的一些东西吧。
公司一直用的正版IBM SPSS Modeler(前身就是SPSS clementine),
不得不说其简洁性的操作,对SAS产生了极大的冲击;
里面的提供的算法也不少,但用了这么久,对其中一些算法的效率存在很大的质疑,
前阵子,对一个一百多万的数据,进行了logistic回归,苦等了8个多小时,却一直没结果;
无奈之下,停了模型,换成SAS操作,也就15分钟的事情;
再者SVM,帮助说明中称其十分适合大数据量,结果又一次华丽丽的让我失望了;
感觉效率高的,也就是决策树,判别分析,几个聚类算法也较快,
BP神经网络和bayesian网络算是一般吧,
其余的也就不敢恭维了;
最后不得不吐槽的是:help文档,没有任何算法的说明,与SAS,matlab的help文档相差甚远
|