楼主: albertwishedu
684 5

[学习笔记] 充实笔记【机器学习导论 2ndEd】2019-03-25 [推广有奖]

已卖:251份资源

大师

55%

还不是VIP/贵宾

-

威望
1
论坛币
71385 个
通用积分
13994.3339
学术水平
749 点
热心指数
907 点
信用等级
676 点
经验
365028 点
帖子
22410
精华
0
在线时间
2564 小时
注册时间
2014-7-8
最后登录
2025-12-13

楼主
albertwishedu 发表于 2019-3-25 13:43:29 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
机器学习导论》2nd Edition ---(土耳其)Ethem Alpaydin 著 范明 昝(zan)红英 牛常勇译 ----机械Press-2014.3

2.3 概率逼近正确学习(Probably Approximately Correct,PAC)

使用最紧凑的矩形S作为假设,希望找出我们需要多少实例。
(希望我们的假设是近似正确的,即误差概率不超过某个值)
在概率逼近正确(Praobably Approximately Correct, PAC)学习中,给定类C和从未知但具有确定概率分布P(x)中抽取样本,我们希望找出样本数N,使得对于任意的δ<=1/2 和 ε>0,假设h的误差至多为ε的概率至少为1-δ
               P{C△h ≤ ε} ≥ 1-δ
其中,C△h是C与h不同的区域。
在这种情况下,因为S是最紧凑的可能的矩形,C与h=S之间的误差区域是四个矩形条带之和。
我们希望确保正例落在该区域(导致错误)的概率最多为ε

对于任何这样的条带,如果我们能够确保其概率上届为ε/4,则误差最多为4(ε/4)=ε
注意,我们将矩形角部的重叠部分计算了两次,并且这种情况下总的实际误差小于4(ε/4)。随机抽取的样本不在此条带中的概率是1-ε/4。
所有N个独立抽取的样本不在此条带中的概率为(1- ε/4)ⁿ,我们希望其最大值为δ。有不等式
      ( 1 - x ) ≤ exp[ - x ]
如果选定 N 和 δ 满足   4 exp [ - εN/4] ≤ δ
则我们有 4(1 - ε/4 )ⁿ ≤ δ ,不等式两边同时除以4,再取自然对数,并重新排列各项,可以得到:
         N ≥ (4/ε)log(4/δ)             (式2-7)

因此,只要我们至少从C中取(4/ε)log(4/δ)个独立样本,并使用紧凑矩形作为我们的假设h,则在置信概率(confidence probability)至少为 1-δ的情况下,一个给定点被误分类的错误概率最多为 ε 。
减少δ我们可以有任意大的置信度,而减少ε我们可以有任意小的误差,且我们在不等式(2-7)中看到,样本的数量是分别随1/ε和1/δ呈线性和对数缓慢增长的函数。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:重叠部分 自然对数 实际误差 独立样本 概率分布

回帖推荐

sulight 发表于6楼  查看完整内容

谢谢分享, 只要我们至少从C中取(4/ε)log(4/δ)个独立样本,并使用紧凑矩形作为我们的假设h,则在置信概率(confidence probability)至少为 1-δ的情况下,一个给定点被误分类的错误概率最多为 ε 。 减少δ我们可以有任意大的置信度,而减少ε我们可以有任意小的误差,且我们在不等式(2-7)中看到,样本的数量是分别随1/ε和1/δ呈线性和对数缓慢增长的函数。

珍惜点滴 发表于5楼  查看完整内容

感谢分享,为您点赞!

充实每一天 发表于4楼  查看完整内容

点赞~

经管之家编辑部 发表于3楼  查看完整内容

为你点赞!
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
经管之家编辑部 + 100 + 3 + 3 + 3 精彩帖子

总评分: 论坛币 + 100  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

本帖被以下文库推荐

沙发
HappyAndy_Lo 发表于 2019-3-25 13:44:03

藤椅
经管之家编辑部 在职认证  发表于 2019-3-25 13:53:09
为你点赞!

板凳
充实每一天 发表于 2019-3-25 16:19:21 来自手机
点赞~

报纸
珍惜点滴 学生认证  发表于 2019-3-25 18:21:03
感谢分享,为您点赞!
爱投资,爱生活,等待有个他~

地板
sulight 学生认证  发表于 2019-3-25 23:16:57
谢谢分享,
只要我们至少从C中取(4/ε)log(4/δ)个独立样本,并使用紧凑矩形作为我们的假设h,则在置信概率(confidence probability)至少为 1-δ的情况下,一个给定点被误分类的错误概率最多为 ε 。
减少δ我们可以有任意大的置信度,而减少ε我们可以有任意小的误差,且我们在不等式(2-7)中看到,样本的数量是分别随1/ε和1/δ呈线性和对数缓慢增长的函数。
已有 1 人评分论坛币 热心指数 收起 理由
经管之家编辑部 + 10 + 1 鼓励积极发帖讨论

总评分: 论坛币 + 10  热心指数 + 1   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-29 13:17