|
Q=∑。对于每个模拟,我们使用估计的模型参数和各种ζ值,即:ζ,计算每个时间步最优投资组合的权重向量∈ {0.1,0.5,5}和ζ,ζ∈ {0.001, 0.05, 0.1, ..., 1}. 我们还计算了GOP和MQP;请注意,由于假设模型参数为常数,GOP和MQP的权重向量为常数。备注6。上述程序隐含地假设投资者知道数据生成过程背后的真实参数。显然,实际情况并非如此,该程序更类似于回溯测试的样本形式。此外,在我们的实验中,我们发现,模型误判可能会导致预期的不利结果,而且众所周知,参数估计,尤其是资产增长率的估计,很难稳健执行。然而,我们的兴趣点在于研究具有不同ζ值的最优投资组合的特征,而不是证明其在实际交易情况下的有效性。换言之,我们希望将参数估计问题(本文中我们并不关心)与随机控制问题分离开来。此外,可以试探性地调整ζ参数,以反映他们在增长率估计中的“信心”水平。在性能指标方面,我们将考虑每个投资组合的以下数量:1。(4.1)中给出的性能标准,其中黎曼积分给出的运行惩罚使用离散化近似:终端奖励=ζlogZπ(T)Zu(T)相对运行惩罚=ζt·NXt=1(π(t)- u(t)∑(t)(π(t)- u(t))绝对运行惩罚=ζt·NXt=1π(t)Q(t)π(t)2。
|