|
什么时候∑mi=1λi=1,λi>0。对于每个i,我们有λi(xi- x) 日志(x)≥ λi[对数(xi)- 对数(x)]Thusm∑i=1λi(xi- x) 日志(x)≥m级∑i=1λi[对数(xi)- log(x)]SinceE(log(φ(x))=Zlog(φ(x))dF(x)=limt→∞∞∑k=1log(φ(xk))(F(kn)- F(k- 1n))log(E(φ(x))=log(Zφ(x)dF(x))=log(limt→∞∞∑k=1φ(xk)(F(kn)- F(k- 1n),且对数函数是连续的,设λk=F(kn)- F(k-1n),m→ ∞, 然后我们有zlog(φ(x))dF(x)≤ log(Zφ(x)dF(x))So E(log(φ(x)))≤ 根据需要记录(E(φ(x)))。引理2如果b*是最佳投资组合和EbTXb*TXexists,我们有EbTXb*德克萨斯州≤ 1,对于任何其他投资组合,b.proof w(bλF)=Rlog(bTλx)dF(x)bλ=λb+(- λ) b类*bλ=我们有b=b*.根据定义,我们有最大值W(b,F)=W(b*, F) =最大值B∈AZlog(bTx)dF(x)我们说W(b,F)≥ W(黑色,F),k∈ [0,1]和dw(bλ,F)dλ≤ λ时为0→ 根据导数的定义为0。具有强化学习的鲁棒对数最优策略,即limλ→0+dW(bλ,F)dλ=limλ→0+λ[W(bλ,F)- W(b,F)]=limλ→0+λ[E(对数(λbTX)+(1- λ) b类*TX))- E(对数(b*TX))]=E(limλ→0+λlog(λbTXb*TX+1- λ)) (*)= E(limλ→0+λlog(1+λ(bTXb*德克萨斯州- 1) ))=E(bTXb*德克萨斯州- 1) (**)≤ 0等式(*)可参考[5],等式(**)是根据L\'Hospital规则得出的。然后我们将给出定理1的证明。定理1的证明:VY=rX | Y(b)*TX | Yx)- rX | Y(b*TXx)=Zlog(b*TX | Yx)dF(x | Y=Y)-Zlog(b*TXx)dF(x | Y=Y)=Zlogb*TX | Yxb*TXxdF(x | Y=Y)=Zlog(b*TX | Yxb*TXx·f(x)fx | Y=Y(x))dF(x | Y=Y)+Zlogf(x)fx | Y=Y(x)dF(x | Y=Y)=Zlog(b*TX | Yxb*TXx·f(x)fx | Y=Y(x))dF(x | Y=Y)+Zfx | Y=Y(x)logf(x)fx | Y=Y(x)dx≤ logZb公司*TX | Yxb*TXx·f(x)fx | Y=Y(x)dF(x | Y=Y)+Zfx | Y=Y(x)logf(x)fx | Y=Y(x)dx(le mma1)=logZb*TX | Yxb*TXxdF(x)+Zfx | Y=Y(x)logf(x)fx | Y=Y(x)dx≤ log1+Zfx | Y=Y(x)logf(x)fx | Y=Y(x)dx(le mma2)=Zfx | Y=Y(x)logf(x)fx | Y=Y(x)dxV=E(VY)VYY将证明Valso有一个上限。
|