楼主: yujun1214
6347 18

[其他] 【强化学习经典教材】Reinforcement learning state of the art.pdf [推广有奖]

  • 1关注
  • 2粉丝

已卖:947份资源

本科生

33%

还不是VIP/贵宾

-

威望
0
论坛币
6426 个
通用积分
7.8119
学术水平
3 点
热心指数
3 点
信用等级
3 点
经验
1847 点
帖子
79
精华
0
在线时间
69 小时
注册时间
2005-8-28
最后登录
2024-10-17

楼主
yujun1214 发表于 2018-6-22 12:22:43 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
Part I Introductory Part
1 Reinforcement Learning and Markov Decision Processes . . . . . . . . . . 3

Part II Efficient Solution Frameworks
2 Batch Reinforcement Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3 Least-Squares Methods for Policy Iteration . . . . . . . . . . . . . . . . . . . . . . 75

4 Learning and Using Models . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
5 Transfer in Reinforcement Learning: A Framework and a Survey . . . 143
6 Sample Complexity Bounds of Exploration . . . . . . . . . . . . . . . . . . . . . . 175
Part III Constructive-Representational Directions
7 Reinforcement Learning in Continuous State and Action Spaces . . . . 207

8 Solving Relational and First-Order Logical Markov Decision
Processes: A Survey . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253

9 Hierarchical Approaches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
10 Evolutionary Computation for Reinforcement Learning . . . . . . . . . . . 325
Part IV ProbabilisticModels of Self and Others
11 Bayesian Reinforcement Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359

12 Partially Observable Markov Decision Processes . . . . . . . . . . . . . . . . . 387
13 Predictively Defined Representations of State . . . . . . . . . . . . . . . . . . . . 415
14 Game Theory and Multi-agent Reinforcement Learning . . . . . . . . . . . 441
15 Decentralized POMDPs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471
Part V Domains and Background
16 Psychological and Neuroscientific Connections with Reinforcement
Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 507

17 Reinforcement Learning in Games . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 539
18 Reinforcement Learning in Robotics: A Survey . . . . . . . . . . . . . . . . . . 579
Part VI Closing
19 Conclusions, Future Directions and Outlook . . . . . . . . . . . . . . . . . . . . . 613

Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 631


Reinforcement learning state of the art.pdf (8.26 MB, 需要: 10 个论坛币)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Learning earning Cement Force Learn

已有 2 人评分经验 收起 理由
xujingtang + 100 精彩帖子
kongqingbao280 + 40 精彩帖子

总评分: 经验 + 140   查看全部评分

本帖被以下文库推荐

沙发
caifacai(未真实交易用户) 发表于 2018-6-22 18:52:13
支持分享好资源!夏日愉快!

藤椅
bearfighting(未真实交易用户) 发表于 2018-6-22 20:19:51
好东西啊,感谢分享

板凳
军旗飞扬(未真实交易用户) 在职认证  发表于 2018-6-23 06:17:02
谢谢分享

报纸
yujun1214(未真实交易用户) 发表于 2018-7-8 23:59:40

地板
jiaminZ(未真实交易用户) 发表于 2018-7-28 14:02:41
支持一下!

7
yujun1214(未真实交易用户) 发表于 2018-8-3 23:44:44

8
fin-qq(未真实交易用户) 发表于 2018-8-4 23:18:40
感谢分享

9
幸运符(未真实交易用户) 发表于 2018-8-11 00:21:45

10
何大鱼头(未真实交易用户) 发表于 2018-8-14 16:32:22
谢谢分享

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jr
拉您进交流群
GMT+8, 2026-1-5 00:53