|
请注意,除了在这种框架中假设的代理的有限理性之外,它类似于强化学习的经典极点平衡问题(参见[49]),其中现在是市场投资组合充当极点的角色,我们将问题倒置。我们的模型也非常类似于指数跟踪问题,只是我们将其设置为反向优化问题,以推断其自身动态的市场观点,而不是解决为指数找到良好跟踪投资组合的正向优化问题。请注意,此类模型公式的数据可作为一级限额订单(LOB)数据随时提供(二级LOB数据可通过一组外部预测值zt纳入模型中,见下文)。这与单个交易员的(数学上相同的)投资组合优化问题不同,后者需要交易员专有的执行数据来进行模型估计。然而,如果此类交易者的专有数据可用,我们的框架可以以同样的方式用于构建交易者的概率模型。监管机构尤其可以利用这一点来监测交易所或个人交易员的活动。请注意,在单期设置中,我们的问题公式将我们带回了BL模型,在该模型中,我们没有多期交易策略,而是只有单期最优投资组合配置。另一方面,在多期公式中,它以多种方式扩展了BL模型的设置,包括观察到的行动的概率模型,该模型考虑了单期设置中不存在的影响,如动态市场影响和动态变化预测。因为我们的模型是概率的,即。
|