签到
- 苹果/安卓/wp
- 苹果/安卓/wp
客户端
0.0

0.00

经管百科

人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › python论坛 › 为什么Double DQN能解决Nature DQN的过度估计问题

楼主: 赤芍君

985 0

[其他] 为什么Double DQN能解决Nature DQN的过度估计问题 [推广有奖]

0关注
0粉丝

初中生

47%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 8 个
通用积分: 1.0063
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 96 点
帖子: 8
精华: 0
在线时间: 8 小时
注册时间: 2016-5-16
最后登录: 2020-3-13

楼主

赤芍君 发表于 2020-1-16 20:25:48 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

看到的文章都说Double DQN将动作选择和价值估计分别放在当前网络和目标网络上计算，就能解决Nature DQN的过度估计问题，但是一直没想明白为什么，请问有没有哪位大神能解答一下，感谢~~~

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：深度强化学习强化学习 DQN Q learning

相关帖子

回复

发帖

本版微信群

加好友,备注cda
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明