作者:梁劲(Jim Liang),来自SAP
书籍特点:条理清晰,含图像化表示更加易懂,对公式有详细的注解等。
内容概要:主要分为基本概念、常用算法和其他三部分。
正是对机器学习的过程中的痛苦有切身体会,作者希望能做一份教程,以浅显易懂的方式去讲解它,降低大家的学习门槛。作者为此花费了数月时间,经常做到深夜,把自己的学习笔记整理成了这份教程。& B$ V5 w$ T+ u: D: N
全部教程包含三大部分:
Part1 介绍了基本概念,包括机器学习的流程、数据处理、建模、评估指标(如MSE、ROC曲线)、模型部署、过度拟合、正则化等。
Part2 是常用的算法,包括线性回归、逻辑回归、神经网络、SVM、Knn、K-Means、决策树、随机森林、AdaBoost、朴素贝叶斯、梯度下降、主成分分析等
Part3 介绍了大规模机器学习的方法等。
整个教程包含大量图片,辅助以文字。一图胜千言,能用图的地方,作者尽量不用文字。用diagram等方式来图解复杂的概念,降低学习曲线,整个教程虽然超过700页,但因为有图,所以比看一般的文字教程要轻松很多。如果学一般的教程,可能需要3个月到半年的话,希望这份教程能加速你的学习过程。