楼主: albertwishedu
1080 2

[学习笔记] 【机器学习导论 2ndEd】充实笔记0317 [推广有奖]

已卖:251份资源

大师

56%

还不是VIP/贵宾

-

威望
1
论坛币
71389 个
通用积分
14138.7965
学术水平
749 点
热心指数
907 点
信用等级
676 点
经验
365352 点
帖子
22438
精华
0
在线时间
2569 小时
注册时间
2014-7-8
最后登录
2026-1-20

楼主
albertwishedu 发表于 2019-3-17 21:38:11 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
机器学习导论》2nd Edition ---(土耳其)Ethem Alpaydin 著 范明 昝(zan)红英 牛常勇译 ----机械Press-2014.3



1.2.5 增强学习
某些应用中,系统的输出是动作(Action)的序列。
这种情况下,单个的动作不重要,重要的是策略(policy),即达到目标的正确动作的序列。(不存在中间状态中最好动作这种概念),只要是好的策略的组成部分,该动作就是好的。
ML程序应该能够评估策略的好坏程度,并从以往好的动作序列中学习,以便能够产生策略。
这种学习方法称为增强学习(reinforcement learning)算法

游戏(game playing)是一个很好的例子。
(单个移动本身并不重要,正确的移动序列才是重要的)
游戏是AI和ML的重要研究领域,因为游戏容易描述,但又很难玩好。
一旦有了能够学习如何玩好游戏的好算法,我们要也可以将这些算法用在具有更显著经济效益的领域

用于某种环境下搜寻目标位置的机器人导航是增强学习的另一个应用领域。
致使增强学习难度增加的一个因素是系统具有不可靠和不完整的感知信息。
一个任务还可能需要多智能主体(multiple agents)的并行操作,这些智能主体将相互作用并协同操作,以便完成一个共同的目标,机器人足球即是例子。

1.3 注释
进化是形成我们身体形状、我们内在本能的主要力量。
我们还需要终身学习,以改变我们的行为。这有助于我们适应进化论还不能预测的环境变化。

心理学视角下的学习和认知可参看Leahey和Harris 1997。
与心理学、认知科学以及神经系统科学都不同,ML的目标并不是理解人类和动物学习的过程,而是像任何的工程领域一样,ML旨在构建一个有用的系统

几乎所有的科学领域都在用模型拟合数据。
科学家设计实验、进行观测并收集数据。通过找寻能解释所观测数据的简单模型,尝试抽取知识。
这个过程称为归纳(induction),它是从一组特别的示例中提取通用规则的过程。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


回帖推荐

hifinecon 发表于3楼  查看完整内容

ML is very important for most people. Way to go!

经管之家编辑部 发表于2楼  查看完整内容

为你点赞!
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
经管之家编辑部 + 100 + 3 + 3 + 3 精彩帖子

总评分: 论坛币 + 100  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

本帖被以下文库推荐

沙发
经管之家编辑部 在职认证  发表于 2019-3-18 06:08:34
为你点赞!

藤椅
hifinecon 发表于 2019-3-18 08:04:21
ML is very important for most people. Way to go!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-5 21:41