|
(与无约束Kelly优化情况一样,我们做出了b?n>ε>0的技术假设。)在附录中,我们证明了RCK问题(7)有一个最优的对偶变量κ?对于约束E(rTb)-λ≤ 1,这意味着解决问题(7)相当于找到(12)的鞍点。我们还假设我们知道最优对偶变量κ?值的上限M?。我们的方法计算迭代‘b(k+1)=∏b(k)+tk(r(k)T‘b(k))λ+λ′κ(k)(r(k)T‘b(k))λ+1r(k)!,κ(k+1)=κ(k)+tk1- (r(k)T\'b(k))λ(r(k)T\'b(k))λ![0,M],其中起始点“b(1)和”κ(1)分别位于ε和[0,M],r(k)是来自r分布的IID样本,∏是欧氏投影ε、 (a)[0,M]是[0,M]上的投影,即(a)[0,M]=max{0,min{M,a}。步长tk>0必须满足tk→ 0,∞Xk=1tk=∞.我们使用(加权)运行平均值sb(k)=Pki=1ti’b(i)Pki=1ti,κ(k)=Pki=1ti’κ(i)Pki=1作为我们对最佳赌注和κ的估计?,分别地同样,这种方法收敛速度很慢,但总是有效的;即E log(rTb(k))收敛到最优值,max{E(rTb(k)))-λ- 1, 0} → 0.与无约束Kelly情况一样,我们不知道ε应该有多小,或者M应该有多大。我们可以选择一个小的ε和一个大的M,然后验证(\'b(k))n>ε和\'κ(k)<M;如果这一点成立,我们对ε和M的猜测是正确的。与无约束情况一样,可以使用批处理来提高实际收敛性。在这种情况下,我们将这两个期望的梯度的无偏估计替换为其中一些期望的平均值。最后,我们提到最优性条件可以独立检查。
|