《机器学习导论》2nd Edition ---(土耳其)Ethem Alpaydin 著 范明 昝(zan)红英 牛常勇译 ----机械Press-2014.3
ML优化参数θ,使得逼近误差最小,也就是说,我们的估计要尽可能接近训练集中给定的正确值。
在线性模型限制过强的情况下,可以利用比如二次函数: y = ω2 * x **2 + ω1 *x + ω0
或更高阶的多项式,或其他非线性函数,为最佳拟合优化它们的参数。
回归的另一个例子:对移动机器人的导航。(或自动汽车导航)
其中,输出是每次转动车轮的角度,使得汽车前进而不会撞到障碍物或偏离车道。
输入由汽车上的传感器(如视频相机、GPS等)提供。
训练数据可以通过监视和记录驾驶员的动作收集。
另外还有响应面设计(response surface design)拟合新的模型。
1.2.4 非监督学习
监督学习中,目标是学习从输入到输出的映射关系,其中输出的正确值已经由指导者给出。
非监督学习中,没有这样的指导者,只有输入数据,其目标是发现输入数据中的规律。
输入空间存在着某种结构,使得特定的模式比其他模式更常出现。我们希望知道哪些警察发生,哪些不经常发生。在统计学中,这称为密度估计(density estimation)
密度估计的一种方法是聚类(clustering),其目标是发现输入数据的簇或分组。