楼主: lg21c
1142 2

[数据挖掘理论与案例] 什么是Reinforcement Learning? [推广有奖]

  • 1关注
  • 11粉丝

已卖:1188份资源

教授

28%

还不是VIP/贵宾

-

威望
0
论坛币
205 个
通用积分
83.3162
学术水平
5 点
热心指数
9 点
信用等级
2 点
经验
25684 点
帖子
585
精华
0
在线时间
1343 小时
注册时间
2005-10-11
最后登录
2025-9-15

楼主
lg21c 发表于 2017-2-5 09:44:43 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
什么是Reinforcement Learning?请通俗地解释,我的理解是似乎要从“多步决策后才能见分晓”上去理解
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Learning earning Cement Learn Force

沙发
lg21c 发表于 2017-2-5 09:49:45
周志华把Reinforcement Learning称之为“延迟标记信息”的监督学习问题

藤椅
wwqqer 在职认证  发表于 2017-2-5 09:51:08
看这里:https://bbs.pinggu.org/thread-5025805-1-1.html
已有 1 人评分经验 热心指数 收起 理由
飞天玄舞6 + 30 + 1 热心帮助其他会员

总评分: 经验 + 30  热心指数 + 1   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-3 15:42