发帖

楼主: 时光永痕

1202 0

[数据挖掘新闻] 强化学习 [推广有奖]

0关注
14粉丝

svip3

学术权威

12%

（VIP/贵宾）八级

18%

0%

威望: 0 级
论坛币: 26 个
通用积分: 57.2238
学术水平: 4 点
热心指数: 4 点
信用等级: 4 点
经验: 34180 点
帖子: 2732
精华: 0
在线时间: 321 小时
注册时间: 2020-7-21
最后登录: 2024-8-1

楼主

时光永痕

发表于 2020-11-23 20:48:48 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

强化学习
强化学习（RL）–本系列“机器学习类型”子系列的第3个/最后一个帖子是在“解释机器学习”系列中。接下来的子系列“神秘的机器学习算法”即将出版。这篇文章仅讨论强化机器学习。
RL与诸如“某些新生婴儿如何学会在给定环境中站立，奔跑和生存”的场景进行了比较。
一些基础知识-强化学习
强化学习（RL）比监督学习或无监督学习更为笼统。它从与环境的互动中学习以实现目标，或者只是从奖惩中学习。换句话说，算法学会对环境做出反应。TD学习似乎最接近人类在这种情况下的学习方式，但是Q学习和其他学习方法也有自己的优势。
强化学习可以同时被称为学习问题和机器学习的子领域。作为学习问题，它是指学习控制系统以最大化代表长期目标的某些数值。
AILabPage的–机器学习系列
尽管RL已经成为机器学习的第三大支柱，并且现在对于数据科学家知道何时以及如何实现它变得越来越重要。RL在其他两种机器学习类型中扮演着同等重要的角色，因此越来越受到重视和关注，这反映出RL在AI中的重要性不断提高。
RL具有以下一些目标。
决策过程
奖励/罚金制度
推荐系统
什么是强化学习
在深入了解RL的内容和原因之前，让我们先了解一下RL的起源历史。从最好的研究中，我得到了1980年代的答案，同时对动物的行为进行了一些研究。特别是某些新生的小动物如何在给定的环境中学会站立，奔跑和生存。奖励是学习的一种生存，可以与被别人吃掉的惩罚相提并论。
题库

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：机器学习算法数据科学家机器学习 80年代基础知识

[数据挖掘新闻] 强化学习 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

[数据挖掘新闻] 强化学习 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群