|
具体来说,qj=pjaαj/a,其中a=Pjpjaαj,因此,Pjqjlnpjaαjqj=lna=r(α,λ)。接下来,我们将方程(28)中的最大值解释为α:r(α,λ)=maxv(αv)中某些函数的勒让德变换- s(v,λ)),(29)式中(v,λ)=minq∈Q(v)Xjqjlnqjpj, Q(v)=Q∈ :Xjqjlnaj=v. (30)(空集上的最小值定义为+∞.) 因此,r(α,λ)在α中是凸的,因此,κ(α)=maxλ∈[0,1]r(α,λ)也是凸的。提议3。方程(27)定义的函数h允许以下表示:h(v)=minλ∈v的[0,1]s(v,λ)≤ 五、≤ v、 (31)其中s(v,λ)是最小相对熵,见等式(30)。证据它源自函数q 7的凸性→Pjqjlnqjpj表示s(v,λ)在v中是凸的。对凸函数应用勒让德变换两次,得到相同的函数;因此,s(v,λ)=supα∈R(αv)- r(α,λ))。(32)让我们暂时将α限制在区间[0,1]内。如果α∈ [0,1],那么r(α,λ)在λ中是凹的,因此,我们可以应用冯·诺依曼的极小极大定理[7]:h(v)=maxα∈[0,1]最小λ∈[0,1](αv)- r(α,λ))=minλ∈[0,1]最大α∈[0,1](αv)- r(α,λ))。(33)我们声称约束α∈ [0,1]在最后一个最大值上,如果v≤ 五、≤ v、 为了看到这一点,让我们假设这两个不平等都是严格的;一般情况下是连续的。如果v<v<v,则在某个点(α(v),λ(v))达到最大值,0<α(v)<1。这一点是函数φ(α,λ)=αv的鞍- r(α,λ),表示最小λ∈[0,1]~n(α(v),λ)=~n(α(v),λ(v))=maxα∈[0,1]~n(α,λ(v))。(34)因为0<α(v)<1,而对于α,φ(α,λ(v))在α中是凹的∈ R、 最后一个最大值实际上是全局的。因此,(α(v),λ(v))满足λ的鞍条件∈ [0, 1], α ∈ R、 因此,也是这个域中的极小极大点。
|