[其他] 计算视觉Towards Optimal Off-Policy Evaluation for Reinforcement Learning with M ... [推广有奖]

0关注
22粉丝

已卖：2005份资源

大师

21%

还不是VIP/贵宾

威望: 1 级
论坛币: 556 个
通用积分: 575.5673
学术水平: 66 点
热心指数: 130 点
信用等级: 37 点
经验: 114069 点
帖子: 6760
精华: 0
在线时间: 2972 小时
注册时间: 2022-8-18
最后登录: 2026-3-7

楼主

2023Hua

发表于 2025-8-11 14:24:06 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

Towards Optimal Off-Policy Evaluation for
   Reinforcement Learning with Marginalized
         Importance Sampling

   Tengyang Xie          Yifei Ma          Yu-Xiang Wang
  Dept. of Computer Science       AWS AI Labs       Dept. of Computer Science,
   UIUC       Amazon.com Services, Inc.    UC Santa Barbara
Urbana, IL 61801    East Palo Alto, CA 94303    Santa Barbara, CA 93106
tx10@illinois.edu       yifeim@amazon.com    yuxiangw@cs.ucsb.edu

         ...