楼主: 2023Hua
78 0

[其他] 计算视觉When to Trust Your Model Model-Based Policy Optimization [推广有奖]

  • 0关注
  • 22粉丝

已卖:1973份资源

大师

21%

还不是VIP/贵宾

-

威望
1
论坛币
546 个
通用积分
575.4231
学术水平
66 点
热心指数
130 点
信用等级
37 点
经验
114033 点
帖子
6755
精华
0
在线时间
2956 小时
注册时间
2022-8-18
最后登录
2026-1-19

楼主
2023Hua 在职认证  发表于 2025-8-11 11:46:44 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
When to Trust Your Model:
          Model-Based Policy Optimization

       Michael Janner Justin Fu    Marvin Zhang   Sergey Levine
              University of California, Berkeley
       {janner, justinjfu, marvin, svlevine}@eecs.berkeley.edu

                        Abstract
     Designing effective model-based reinforcement learning algorithms is difficult
     because the ease of data generation must be weighed against the bias of model-
     generated data. In this paper, we study the role ...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Optimization Model-Based Policy model ATION

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-3 11:36