我刚刚在我的github原型书“ Bayesuvius”中上传了新的章节。本章介绍正确完成的强化学习(RL),即贝叶斯网络:)
本章主要基于谢尔盖·莱文教授在UC Berkeley教授的CS 285优秀课程笔记。我所做的只是将其中一些讲座翻译成B net lingo。
我最近在LinkedIn上与一些非常聪明的机器学习专家进行了交谈,这些专家认为RL和B网络的领域并没有太多重叠。实际上,其中之一甚至认为这两个领域“无可比拟”。用伯蒂·伍斯特(Bertie Wooster)的话说,我的反应是:“好吧,吉夫(Jeeves),我说这差不多要花点儿饼干了,我不认为我走得太远了!” 和“这不是我经常使用的表达方式,吉夫,而是……tu!”。我默默地确定在那里,然后将它们设置在狭窄的直线上,经过数天的挤压,它试图找到关于RL和B网之间的秘密恋情多汁的说法,这章是最后的结局。 。
我发现人类已知的所有RL算法都可以表示为B网。在我的RL章中,我将详细介绍几种著名的RL算法的bnet。这是最简单的RL算法(通常称为Q函数学习)的bnet。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


雷达卡



京公网安备 11010802022788号







