楼主: albertwishedu
1194 4

[学习笔记] 充实笔记【机器学习导论 2ndEd】2019-03-23 [推广有奖]

已卖:251份资源

大师

55%

还不是VIP/贵宾

-

威望
1
论坛币
71385 个
通用积分
13994.2103
学术水平
749 点
热心指数
907 点
信用等级
676 点
经验
365028 点
帖子
22410
精华
0
在线时间
2564 小时
注册时间
2014-7-8
最后登录
2025-12-13

楼主
albertwishedu 发表于 2019-3-23 21:32:52 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

机器学习导论》2nd Edition ---(土耳其)Ethem Alpaydin 著 范明 昝(zan)红英 牛常勇译 ----机械Press-2014.3




学习算法应当找到一个特定的假设(hypothesis)h 属于 花H,尽可能逼近C
尽管专家定义了假设类,但他却不能说出参数值是什么,换句话说,尽管我们选定了H,但我们并不知道哪个特定的h 属于 H   等于或最接近于C。
一旦我们把注意力局限于这个假设类,学习类就归结为较简单的问题:找出定义h的四个参数(即前面所描述的那个矩形的四个坐标)

实际上,我们并不知道C(x),因此无法评估h(x)与C(x)的匹配程度。我们所拥有的是训练集 花X,它是所有可能的x的一个小子集。
经验误差(empirical error)是h的预测(prediction)与花X中给定的预期值(required value)不同的训练实例所占的比例。
【此处有公式】

在我们的例子中,假设类花H是所有可能的矩形的集合,每个四元组(p1,p2,e1,e2)都定义花H中的一个假设h  (h是四元组的上标)
我们需要选择其中最好的一个:即给定训练集,我们需要找到这四个参数的值,使得它涵盖所有的正例而不包括任何的负例。

如果x1和x2是实数,则存在无穷个h满足上述条件,即对于这些h误差E为零。但给定一个接近于正例和负例边界的某个未来实例,不同的候选假设可能做出不同的预测。这是泛化问题(generalization),即假设对不在训练集中的未来实例的分类的准确率如何。
一种可能的策略是:找出最特殊的假设(most specific hypothesis)S,涵盖所有正例而不包括任何负例的最紧凑的矩形。这样得到一个假设h=S,作为我们的诱导类(induced class)
实际的类C可能会比S更大,但绝对不会更小。

最一般的假设(most general hypothesis)G是涵盖所有正例而不包括任何负例的最大矩形。
对任何介于S和G之间的h 属于 花H,h为无误差的有效假设,称作与训练集相容(consistent),且这样的h形成解空间(version space)给定另一个训练集。S、G、解空间、参数,因此学习得到的假设 h 可能不同。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:泛化问题 匹配程度 学习算法 训练集 四元组

回帖推荐

artra2012 发表于4楼  查看完整内容

为您点赞!!!

tsangwm 发表于5楼  查看完整内容

thank you

经管之家编辑部 发表于3楼  查看完整内容

为您点赞!

hifinecon 发表于2楼  查看完整内容

已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
经管之家编辑部 + 100 + 3 + 3 + 3 精彩帖子

总评分: 论坛币 + 100  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

本帖被以下文库推荐

沙发
hifinecon 发表于 2019-3-23 22:21:46

藤椅
经管之家编辑部 在职认证  发表于 2019-3-24 06:37:46
为您点赞!

板凳
artra2012 在职认证  发表于 2019-3-24 08:56:26
为您点赞!!!

报纸
tsangwm 发表于 2019-3-24 15:00:04
thank you

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-21 18:14