楼主: 有福有德
1152 0

[原创博文] 如果理解误差 [推广有奖]

教师

院士

6%

还不是VIP/贵宾

-

威望
4
论坛币
56500 个
通用积分
8.4735
学术水平
344 点
热心指数
203 点
信用等级
274 点
经验
37400 点
帖子
1138
精华
10
在线时间
945 小时
注册时间
2010-10-14
最后登录
2024-3-21

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

误差

如何理解误差?


内容摘要监督算法调整参数和学习的基础,其优点有利于启发我们对算法有更深层次的理解。

  参考索引:引致Python机器学习技术:模型关系管理


误差的形式
监督模型的优劣,需要全盘考虑所有数据,而不能只看局部数据,所以误差需要汇总,但问题是汇总数据的计算方式或规则并不统一,不同的计算方式有不同特点甚至有不同的适用条件,如果你愿意可以就不同算法尝试不同的计算方式,而这种分析思路甚至一度成为机器学习工作者的必要思维准备。
图(a)所示,不管偏向哪个方向的测量其实都是误差,+2的误差和-2的误差是等效的,只是方向相反而已,所以如果是直接对误差求和得到的结果就是0,看起来好像是没有了误差,但其实是掩耳盗铃。现在的问题是如何消除负号?取绝对值还是取平方?如果你对数学有所了解的话,应该能推理出平方相比绝对值拥有更多的好处,比如平方后的数据方差更大,这就导致变量间的相关可能会更高,如图(b),相关区域就是由变量方差的重叠部分组成的,也就是放大了数据信息量,这无异于可以执行更多甚至更复杂的模型。
另外如图(c)所示,如果误差取平方,其误差函数就是U型函数,这样我们就能以最直接的方式到达U型底部,而无需担心局部最小问题的困扰。与此相应的,取完平方变换后的函数也是非线性的,如果取绝对值则是线性的,其实对于机器学习而言非线性模式是最常用的模型形式,因为非线性在复杂模式上有更好的分类性能和优势(如图d)。


误差.png






=========================================================================


书籍.png






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


误差:如何理解误差?.pdf

386.65 KB

所有模型都是错的
您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 07:19