|
对于每个试验,波动率项σ是均匀的,并且是从(a)中的区间[0.02,0.025]和(d)中的区间[0.03,0.035]随机生成的。λ = 0.9.从图2d-2f的间隔[0.03,0.035]中选择值。具体而言,图2d-2f演示了这种模拟,其中图2d显示了几何布朗运动路径,图2e显示了UCB1的次优性,图2f显示了200次试验结束时的累积财富。与ANRSO合作。royalsocietypublishing。组织R.Soc。打开sci。0000000. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .初始财富为1且λ=0.9,风险意识投资组合的累积财富为1.5412,组合投资组合为1.4409,UCB1为1.4294,等权投资组合为1.4132,最终为1.3298-贪婪的从上面的讨论可以看出,λ的值对我们的顺序投资组合选择算法的性能至关重要,应该根据市场条件来确定。特别是,Way等人[47]讨论了实现高回报的专业化和对冲风险的多样化之间的权衡,并同样表明这种选择取决于基本参数和初始条件。4、讨论与结论在本文中,我们研究了多武装土匪问题作为不确定条件下序列决策的数学模型。我们特别关注其在金融市场中的应用,并构建了一个顺序投资组合选择算法。我们首先应用图形理论,从市场中选择外围资产进行投资。然后在每次试验中,我们将最优多武装匪徒策略与一致风险度量的最小化相结合。通过调整参数,我们能够在最大化回报和最小化风险之间实现平衡。
|