发帖

楼主: 时光永痕

1081 0

[数据挖掘新闻] 在贝叶斯网络上的我的书“ Bayesuvius”中增加了关于强化学习的章节 [推广有奖]

0关注
14粉丝

svip3

学术权威

12%

（VIP/贵宾）八级

15%

0%

威望: 0 级
论坛币: 26 个
通用积分: 57.2238
学术水平: 4 点
热心指数: 4 点
信用等级: 4 点
经验: 34180 点
帖子: 2732
精华: 0
在线时间: 321 小时
注册时间: 2020-7-21
最后登录: 2024-8-1

楼主

时光永痕

发表于 2020-7-31 19:05:51 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

在贝叶斯网络上的我的书“ Bayesuvius”中增加了关于强化学习的章节
我刚刚在我的github原型书“ Bayesuvius”中上传了新的章节。本章介绍正确完成的强化学习（RL），即贝叶斯网络:)
本章主要基于谢尔盖·莱文教授在UC Berkeley教授的CS 285优秀课程笔记。我所做的只是将其中一些讲座翻译成B net lingo。
我最近在LinkedIn上与一些非常聪明的机器学习专家进行了交谈，这些专家认为RL和B网络的领域并没有太多重叠。实际上，其中之一甚至认为这两个领域“无可比拟”。用伯蒂·伍斯特（Bertie Wooster）的话说，我的反应是：“好吧，吉夫（Jeeves），我说这差不多要花点儿饼干了，我不认为我走得太远了！” 和“这不是我经常使用的表达方式，吉夫，而是……tu！”。我默默地确定在那里，然后将它们设置在狭窄的直线上，经过数天的挤压，它试图找到关于RL和B网之间的秘密恋情多汁的说法，这章是最后的结局。。
我发现人类已知的所有RL算法都可以表示为B网。在我的RL章中，我将详细介绍几种著名的RL算法的bnet。这是最简单的RL算法（通常称为Q函数学习）的bnet。

关注 CDA 人工智能学院，回复“录播”获取更多人工智能精选直播视频！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：Bayes 贝叶斯网络 baye 贝叶斯网 Yes

[数据挖掘新闻] 在贝叶斯网络上的我的书“ Bayesuvius”中增加了关于强化学习的章节 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

[数据挖掘新闻] 在贝叶斯网络上的我的书“ Bayesuvius”中增加了关于强化学习的章节 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群