人大经济论坛 › 论坛 › 数据科学与人工智能 › 人工智能 › 人工智能论文版 › 加强学习的实现及其在多主体系统中的应用

发帖

楼主: DL-er

676 0

加强学习的实现及其在多主体系统中的应用 [推广有奖]

0关注
6粉丝

会员

学术权威

74%

还不是VIP/贵宾

威望: 0 级
论坛币: 15 个
通用积分: 1.0435
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 38540 点
帖子: 3853
精华: 0
在线时间: 813 小时
注册时间: 2017-9-5
最后登录: 2018-6-30

楼主

DL-er

发表于 2018-1-25 17:40:04 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

摘要：简介加强学习的有关理论及实现的Q学习算法，并通过证明Q学习的收敛性，指出在下列条件下可得到最优解：1系统可以用马尔可夫过程模拟；2主体在任意的状态－动作下得到的奖励是有界的；3主体选择动作的策略可以保证随着学习的进行而每一对状态－动作都会无穷地出现。最后，讨论加强学习在多主体系统中的一些应用，并归纳出加强学习的若干特点。

原文链接:http://www.cqvip.com//QK/85729X/200001/7595955.html

送人玫瑰，手留余香~如您已下载到该资源，可在回帖当中上传与大家共享，欢迎来CDA社区交流学习。（仅供学术交流用。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：学习的 cqvip 学术交流马尔可夫学习算法智能主体机器学习 Q学习算法控制策略

加强学习的实现及其在多主体系统中的应用 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

加强学习的实现及其在多主体系统中的应用 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群