|
在有许多玩家的游戏中,混沌动力学的盛行。工作文件,arXiv:1612.08111【q-fin.EC】,2016年。[6] 罗素。不确定环境下的学习代理。第十一届计算学习理论年会论文集,第101-103页。ACM,1998年。[7] A.Y.Ng和S.J.Russell。逆强化学习算法。在ICML中,第663–6702000页。[8] S.Levine、Z.Popovic和V.Koltun。高斯过程非线性逆强化学习。《神经信息处理系统的进展》,2011年第19-27页。[9] M.Wulfmeier、P.Ondruska和I.Posner。最大熵深度逆强化学习。工作文件,arXiv:1507.04888【cs.LG】,2016.5【10】B.D.Ziebart、A.L.Maas、J.A.Bagnell和A.K.Dey。最大熵逆强化学习。AAAI第8卷第1433–1438页。芝加哥,伊利诺伊州,美国,2008年。[11] M.阿尔杰。反向强化学习,2016年。[12] 亨德里克斯(D.Hendricks)、格比(T.Gebbie)和威尔科克斯(D.Wilcox)。使用时间聚类检测日内金融市场状态。量化金融,16(11):1657–16781016.6
|