强化学习
强化学习(RL)–本系列“机器学习类型”子系列的第3个/最后一个帖子是在“解释机器学习”系列中。接下来的子系列“神秘的机器学习算法”即将出版。这篇文章仅讨论强化机器学习。
RL与诸如“某些新生婴儿如何学会在给定环境中站立,奔跑和生存”的场景进行了比较。
一些基础知识-强化学习
强化学习(RL)比监督学习或无监督学习更为笼统。它从与环境的互动中学习以实现目标,或者只是从奖惩中学习。换句话说,算法学会对环境做出反应。TD学习似乎最接近人类在这种情况下的学习方式,但是Q学习和其他学习方法也有自己的优势。
强化学习可以同时被称为学习问题和机器学习的子领域。作为学习问题,它是指学习控制系统以最大化代表长期目标的某些数值。
AILabPage的–机器学习系列
尽管RL已经成为 机器学习 的第三大支柱,并且现在对于数据科学家知道何时以及如何实现它变得越来越重要。RL在其他两种机器学习类型中扮演着同等重要的角色,因此越来越受到重视和关注,这反映出RL在AI中的重要性不断提高。
RL具有以下一些目标。
决策过程
奖励/罚金制度
推荐系统
什么是强化学习
在深入了解RL的内容和原因之前,让我们先了解一下RL的起源历史。从最好的研究中,我得到了1980年代的答案,同时对动物的行为进行了一些研究。特别是某些新生的小动物如何在给定的环境中学会站立,奔跑和生存。奖励是学习的一种生存,可以与被别人吃掉的惩罚相提并论。
题库