|
然而,总体方案是为实时交易代理提交实际市场订单而设计的,因此实时交易代理将影响其收到的数据反馈(通过交易吸收限额订单,影响LOB功能),从而影响其感知的状态空间。我们希望该算法的有效性能够转化为实时交易。谨慎的进一步调查将包括使用LOB的替代流媒体功能(如市场深度),在更长和更不同的调查期内测试算法的稳定性,测试对状态判别阈值参数的敏感性,使用事件时间估计窗口/决策频率以及替代行动和奖励函数。致谢本研究部分基于南非国家研究基金会(授权号89250)支持的研究。本文的结论是由于作者和NRF在这方面不承担任何责任。作者感谢Diane Wilcox和Tim Gebbie的评论和建议,感谢Fields数学科学研究所和多伦多大学在本文大部分工作完成时接待了他。参考文献阿尔姆格伦,R.,克里斯,N.,2000年。投资组合交易的最佳执行。风险杂志3,5-39。纽约州班吉奥、A.考维尔、P.文森特、。表征学习:回顾与新视角。关于模式分析和机器智能的IEEETransactions。Bertsimas,D.,Lo,A.,1998年。执行成本的最优控制。金融市场杂志1,1-50。布拉特,M.,怀斯曼,S.,东卡罗来纳州多曼尼,1996年。数据的超顺磁性聚类。菲斯。牧师。莱特。76,3251–3254.布拉特,M.,怀斯曼,S.,东卡罗来纳州多曼尼,1997年。使用模型颗粒磁铁进行数据聚类。神经计算91805-1842。布朗格·勒万多夫斯基,纽约州班吉奥,文森特,P.,2012年。
|