楼主: 时光永痕
1050 0

[数据挖掘新闻] 在贝叶斯网络上的我的书“ Bayesuvius”中增加了关于强化学习的章节 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)八级

3%

威望
0
论坛币
26 个
通用积分
57.2238
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34180 点
帖子
2732
精华
0
在线时间
321 小时
注册时间
2020-7-21
最后登录
2024-8-1

楼主
时光永痕 学生认证  发表于 2020-7-31 19:05:51 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在贝叶斯网络上的我的书“ Bayesuvius”中增加了关于强化学习的章节
我刚刚在我的github原型书“ Bayesuvius”中上传了新的章节。本章介绍正确完成的强化学习(RL),即贝叶斯网络:)
本章主要基于谢尔盖·莱文教授在UC Berkeley教授的CS 285优秀课程笔记。我所做的只是将其中一些讲座翻译成B net lingo。
我最近在LinkedIn上与一些非常聪明的机器学习专家进行了交谈,这些专家认为RL和B网络的领域并没有太多重叠。实际上,其中之一甚至认为这两个领域“无可比拟”。用伯蒂·伍斯特(Bertie Wooster)的话说,我的反应是:“好吧,吉夫(Jeeves),我说这差不多要花点儿饼干了,我不认为我走得太远了!” 和“这不是我经常使用的表达方式,吉夫,而是……tu!”。我默默地确定在那里,然后将它们设置在狭窄的直线上,经过数天的挤压,它试图找到关于RL和B网之间的秘密恋情多汁的说法,这章是最后的结局。 。
我发现人类已知的所有RL算法都可以表示为B网。在我的RL章中,我将详细介绍几种著名的RL算法的bnet。这是最简单的RL算法(通常称为Q函数学习)的bnet。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Bayes 贝叶斯网络 baye 贝叶斯网 Yes

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-22 05:02