楼主: 时光永痕
826 0

[数据挖掘新闻] 强化学习 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)三级

39%

威望
0
论坛币
26 个
通用积分
49.7576
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
316 小时
注册时间
2020-7-21
最后登录
2024-4-24

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
强化学习
强化学习(RL)–本系列“机器学习类型”子系列的第3个/最后一个帖子是在“解释机器学习”系列中。接下来的子系列“神秘的机器学习算法”即将出版。这篇文章仅讨论强化机器学习。
RL与诸如“某些新生婴儿如何学会在给定环境中站立,奔跑和生存”的场景进行了比较。
一些基础知识-强化学习
强化学习(RL)比监督学习或无监督学习更为笼统。它从与环境的互动中学习以实现目标,或者只是从奖惩中学习。换句话说,算法学会对环境做出反应。TD学习似乎最接近人类在这种情况下的学习方式,但是Q学习和其他学习方法也有自己的优势。
强化学习可以同时被称为学习问题和机器学习的子领域。作为学习问题,它是指学习控制系统以最大化代表长期目标的某些数值。
AILabPage的–机器学习系列
尽管RL已经成为 机器学习 的第三大支柱,并且现在对于数据科学家知道何时以及如何实现它变得越来越重要。RL在其他两种机器学习类型中扮演着同等重要的角色,因此越来越受到重视和关注,这反映出RL在AI中的重要性不断提高。
RL具有以下一些目标。
决策过程
奖励/罚金制度
推荐系统
什么是强化学习
在深入了解RL的内容和原因之前,让我们先了解一下RL的起源历史。从最好的研究中,我得到了1980年代的答案,同时对动物的行为进行了一些研究。特别是某些新生的小动物如何在给定的环境中学会站立,奔跑和生存。奖励是学习的一种生存,可以与被别人吃掉的惩罚相提并论。
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习算法 数据科学家 机器学习 80年代 基础知识

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 10:08