人大经济论坛 › 论坛 › 提问悬赏求职新闻读书功能一区 › 学道会 › 充实笔记【机器学习导论 2ndEd】2019-03-26

发帖

楼主: albertwishedu

1063 8

[学习笔记] 充实笔记【机器学习导论 2ndEd】2019-03-26 [推广有奖]

66关注
14粉丝

已卖：251份资源

大师

56%

还不是VIP/贵宾

威望: 1 级
论坛币: 71389 个
通用积分: 14159.4013
学术水平: 749 点
热心指数: 907 点
信用等级: 676 点
经验: 365371 点
帖子: 22441
精华: 0
在线时间: 2570 小时
注册时间: 2014-7-8
最后登录: 2026-2-23

楼主

albertwishedu 发表于 2019-3-27 00:03:10 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

《机器学习导论》2nd Edition ---（土耳其）Ethem Alpaydin 著范明昝（zan）红英牛常勇译 ----机械Press-2014.3

2.4 噪声（noise）
噪声是数据中有害的异常。
噪声的存在，类的学习可能更加困难，且使用简单的假设可能做不到零误差。
噪声有以下几种解释：

记录输入属性可能不准确，这可能导致数据点在输入空间的移动。
标记数据点可能有错，可能将正例标记为负例，或相反。（称指导噪声：teacher noise）
可能存在我们没有考虑到的附加属性，会影响实例的标注。（附加属性可能是隐藏的（hidden)或潜在的(latent），因此是不可观测的。）这些被忽略的属性所造成的影响作为随机成分，是“噪声”的一部分。

当有噪声时，在正负实例之间不存在简单的边界，且为了将它们分开，需要对应于具有更大能力的假设类的复杂假设。
矩形可以用四个数定义，然，为了定义更复杂的形状，就需要具有大量参数的更复杂的模型。

利用复杂模型，可以更好地拟合数据，得到零误差。
另一个可行的方法是保持模型的简单性并允许一些误差的存在。

使用简单的矩形（除非其训练误差很大）更有意义，原因是：
1）矩形是一种容易使用的简单模型。（容易检查一个点是在矩形内还是在矩形外，对未来的数据实例，可以容易地检查它是正例还是负例）
2）矩形是一种容易训练的简单的模型，具有较少参数。简单模型具有更小的方差（variance），具有较大的偏倚（bias）。求解最优模型相当于最小化偏倚和方差。
3）矩形是容易解释的简单模型。
4）如果输入数据中确实存在错误标记的实例或噪声，且实际的类确实就是像矩形这样的简单模型，那么由于矩形具有较小的方差，且较少地被单个实例所影响，所以尽管可能导致训练集上较大误差，也是比曲线图像更好的分类器。
其泛化能力更好。
（Occam's razor）奥克姆剃刀规则：说较简单的解释看上去更可信，且任何不必要的复杂性都应该被摒弃。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：造成的影响简单模型复杂假设机器学习影响实例

回帖推荐

葛永浩发表于6楼查看完整内容

给你点赞！

artra2012 发表于5楼查看完整内容

为您点赞！！！

经管之家编辑部发表于4楼查看完整内容

给你点赞！

lonestone 发表于3楼查看完整内容

努力跟上

HappyAndy_Lo 发表于2楼查看完整内容

已赞！

已有 1 人评分	论坛币	学术水平	热心指数	信用等级	收起理由
经管之家编辑部	+ 100	+ 3	+ 3	+ 3	精彩帖子

总评分: 论坛币 + 100 学术水平 + 3 热心指数 + 3 信用等级 + 3 查看全部评分

本帖被以下文库推荐

· 学道会最美学习笔记|主题: 8116, 订阅: 89

沙发

HappyAndy_Lo 发表于 2019-3-27 00:04:54

已赞！

藤椅

lonestone

发表于 2019-3-27 06:55:08 来自手机

albertwishedu 发表于 2019-3-27 00:03
《机器学习导论》2nd Edition ---（土耳其）Ethem Alpaydin 著范明昝（zan）红英牛常勇译 ----机械Pre ...

努力跟上

板凳

经管之家编辑部

发表于 2019-3-27 07:07:03

给你点赞！

报纸

artra2012

发表于 2019-3-27 08:26:19

为您点赞！！！

地板

葛永浩 发表于 2019-3-27 08:54:57

给你点赞！

7楼

从1万到一亿

发表于 2019-3-27 15:19:14

谢谢分享，点赞！

8楼

充实每一天 发表于 2019-3-27 17:29:41 来自手机

点赞～

9楼

sulight

发表于 2019-3-27 20:31:58

谢谢分享，
学习心得：
1）矩形是一种容易使用的简单模型。（容易检查一个点是在矩形内还是在矩形外，对未来的数据实例，可以容易地检查它是正例还是负例）
2）矩形是一种容易训练的简单的模型，具有较少参数。简单模型具有更小的方差（variance），具有较大的偏倚（bias）。求解最优模型相当于最小化偏倚和方差。
3）矩形是容易解释的简单模型。
4）如果输入数据中确实存在错误标记的实例或噪声，且实际的类确实就是像矩形这样的简单模型，那么由于矩形具有较小的方差，且较少地被单个实例所影响，所以尽管可能导致训练集上较大误差，也是比曲线图像更好的分类器。
其泛化能力更好。

已有 1 人评分	论坛币	热心指数	收起理由
经管之家编辑部	+ 10	+ 1	鼓励积极发帖讨论

总评分: 论坛币 + 10 热心指数 + 1 查看全部评分

返回列表

发帖

本版微信群

扫码
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[学习笔记] 充实笔记【机器学习导论 2ndEd】2019-03-26 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

回帖推荐

本帖被以下文库推荐

浏览过的帖子

浏览过的版块

20周年荣誉勋章

一级伯乐勋章

初级学术勋章

中级学术勋章

初级热心勋章

中级热心勋章

初级信用勋章

中级信用勋章

本版微信群

[学习笔记] 充实笔记【机器学习导论 2ndEd】2019-03-26 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

回帖推荐

本帖被以下文库推荐

浏览过的帖子

浏览过的版块

20周年荣誉勋章

一级伯乐勋章

初级学术勋章

中级学术勋章

初级热心勋章

中级热心勋章

初级信用勋章

中级信用勋章

本版微信群

扫码加我拉你入群