经管之家 › 论坛 › 数据科学与人工智能 › 人工智能 › 人工智能论文版 › 基于递推最小二乘法的多步时序差分学习算法

发帖

楼主: 人工智能-AI

659 0

基于递推最小二乘法的多步时序差分学习算法 [推广有奖]

0关注
10粉丝

会员

学术权威

71%

还不是VIP/贵宾

威望: 0 级
论坛币: 25 个
通用积分: 0.0584
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 37770 点
帖子: 3776
精华: 0
在线时间: 853 小时
注册时间: 2017-9-5
最后登录: 2018-4-11

楼主

人工智能-AI

发表于 2018-1-16 11:20:01 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

摘要：强化学习是一种重要的机器学习方法。为了提高强化学习过程的收敛速度和减少学习过程值函数估计的误差，提出了基于递推最小二乘法的多步时序差分学习算法（RLS－加（λ））。证明了在满足一定条件下，该算法的权值将以概率1收敛到唯一解，并且得出和证明了值函数估计值的误差应满足的关系式。迷宫实验表明，与RLS-TD（0）算法相比，该算法能加快学习过程的收敛，与传统的TD（λ）算法相比，该算法减少了值函数估计误差，从而提高了精度。

原文链接:http://www.cqvip.com//QK/91690X/201008/33078307.html

送人玫瑰，手留余香~如您已下载到该资源，可在回帖当中上传与大家共享，欢迎来CDA社区交流学习。（仅供学术交流用。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：最小二乘法最小二乘学习算法 cqvip 学习方法强化学习时序差分最小二乘收敛

基于递推最小二乘法的多步时序差分学习算法 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

基于递推最小二乘法的多步时序差分学习算法 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群