楼主: 大多数88
1259 59

[量化金融] 错指定马氏决策过程的均衡 [推广有奖]

51
可人4 在职认证  发表于 2022-5-7 18:12:35
事实上limt→∞||T-1Ptτ=0gτ| |=0和三角形不等式impylimt→∞mt- Mσ,Q[M]≤ 极限→∞mt- T-1tXτ=1Mστ,Q(·,·| sτ)-1,xτ-1)+ 极限→∞T-1tXτ=1Mστ,Q(·,·| sτ)-1,xτ-1) - Mσ,Q[M]= 极限→∞T-1tXτ=1gτ+ 极限→∞T-1tXτ=1Mστ,Q(·,·| sτ)-1,xτ-1) - Mσ,Q[M]≤ 极限→∞T-1tXτ=1Mστ,Q(·,·| sτ)-1,xτ-1) - Mσ,QT-1tXτ=1(·,·)(sτ)-1,xτ-1)+ 极限→∞Mσ,QT-1tXτ=1(·,·)(sτ)-1,xτ-1)- Mσ,Q[M]. (18) 此外,通过定义Mσ,Q(见等式(4)),对于所有(s,x)∈ Gr(Γ),t-1tXτ=1Mστ,Q(s,x | sτ)-1,xτ-1) =Xs,~X∈Gr(Γ)Q(s |s,~x)t-1tXτ=1στ(x | s)1(~s,~x)(sτ)-1,xτ-1) (19)Mσ,QT-1tXτ=1(·,·)(sτ)-1,xτ-1)=X~s,~X∈Gr(Γ)Q(s |s,~x)t-1tXτ=1σ(x | s)1(~s,~x)(sτ)-1,xτ-1).(20) 方程(19)和(20)以及稳定性(σt→ σ) 意味着18岁时的第一项消失。由于算子Mσ[]的连续性,RHS中的第二项也在稳定性下消失事实上-1Ptτ=1(·,·)(sτ)-1,xτ-1) =t-1tmt-1(·, ·). 因此,km- Mσ,Q[M]k=0,所以M∈ IQ(σ)。因此,为了证明案例(i)和(ii),我们需要确定,对于每一个案例,都存在∈ (ΘQ(m))使得σ是MDP的最佳策略(\'Qu)。(i) 考虑任何δ∈ [0,δ]. 自从(Θ)在弱拓扑下是紧的,存在(ut)t的子序列,我们仍然将其表示为(ut)t,因此utw→ u∞和u∞∈ (ΘQ(m))。自σt∈对于所有t,∑(ut)和∑是uhc(见引理4),稳定性(σt→ σ) 意味着σ∈Σ(u∞). 我们的结论是,σ是MDP(\'Qu)的最佳策略∞). 如果δ=¨δ=0,则该断言无关紧要。如果δ≥ δ>0时,必须显示thatx(s,u∞) = arg maxx∈Γ(s)^s{π(s,x,s)+δW(s,B(s,x,s,u∞))}\'Qu∞(ds | s,x)=arg maxx∈Γ(s)^s{π(s,x,s)+δW(s,u)∞)}\'Qu∞(ds | s,x)。(21)我们通过建立(21)来结束。注意,由于δ>0,因此δ>0,这反过来意味着x(s,u∞) 她是单身汉。

52
能者818 在职认证  发表于 2022-5-7 18:12:38
(21)中的第一个等式成立,因为通过定义δ,E Qu∞(·| s,x(s,u)∞))[π(s,x(s,u∞), S) ]- equ∞(·| s,x)[π(s,x,s)]≥^δ ≥ 2δM1- δ> 0代表所有x∈ Γ(s)\\{x(s,u)∞)}, 通过定义M,δM1- δ≥ Δ^SnW(s,B(s,x,s,u∞))\'Qu∞(ds | s,x)-W(s,B(s,x(s,u∞), s、 u∞))\'Qu∞(ds | s,x(s,u)∞))o、 (21)中的第二个等式也有类似的论点。(ii)通过穷举学习的稳定性,存在一个子序列(ut(j))Jsuch,即ut(j)w→ u*. 这个事实和事实,对于所有开放的美国 ΘQ(m),limt→∞ut(j)(U)=1,表示u*∈ (ΘQ(m))。自σt(j)∈所有j的∑(ut(j))和∑是uhc(见引理4),稳定性(σt→ σ) 意味着σ∈Σ(u*). 此外,在稳定性条件下,通过穷举学习(即*= B(s,x,s,u)*) 所有人(s,x)∈ Gr(Γ)和s∈supp(\'Qu)*(·| s,x))、W(s,u)*) = 马克斯∈Γ(s)`s{π(s,x,s)+δW(s,u)*)}\'Qu*(ds | s,x)对于所有s∈ 然后,通过值函数的唯一性,σ是EMMDP(`Qu)的最佳策略*). 命题2的证明依赖于以下主张。索赔C.如果(σ,m)∈ Σ × (S×X)是σ∈ ∑ε与m∈ IQ(m)在定义18中满足完全沟通条件,然后m(s,x)>0表示所有(s,x)∈ Gr(Γ)。命题2的证明。(i) 我们证明,如果(σ,m)对于ε-扰动、弱识别且满足完全通信(且具有先验μ和策略函数f)的BayesianSMDP是稳定的,那么(σ,m)对于穷举学习是稳定的。也就是说,我们必须找到一个子序列(ut(j))j,使得ut(j)弱收敛到u*和u*= B(s,x,s,u)*) 对于任何(s,x)∈ Gr(Γ)和s∈ supp(\'Qu)*(·| s,x))。通过压缩(Θ),始终存在一个极限点为u的收敛子序列*∈ (Θ). 引理5,5*∈ (ΘQ(m))。根据假设,σ∈ ∑ε,根据定理2证明中给出的参数,m∈ 智商(σ)。由于SMDP满足了充分的沟通,根据权利要求C,supp(m)=Gr(Γ)。

53
nandehutu2022 在职认证  发表于 2022-5-7 18:12:42
这个结果,这个事实*∈ (ΘQ(m)),弱识别意味着强识别,即支持u的任何θ和θ*, Qθ(·| s,x)=所有(s,x)的Qθ(·| s,x)∈ Gr(Γ)。因此,这就意味着 ΘBorel and for all(s,x)∈ Gr(Γ)和s∈ 这是什么*(s|s,x)>0(即,\'Qθ(s|s,x)u*(dθ)>0),B(s,x,s,u*)(A) =\'AQθ(s | s,x)u*(dθ)\'ΘQθ(s|s,x)u*(dθ)=u*(A) 。因此*满足所需条件。(ii)证明了如果(σ,m)是一个Berk-Nash均衡,那么它也是一个具有穷举学习的Berk-Nash均衡。让我们来支持平衡信念。根据权利要求C和弱识别,可以得出,对于所有(s,x)的μ,Qθ(·s,x)=Qθ(·s,x)支持的任何θ和θ,都有强识别∈ Gr(Γ)。因此,尽管如此 ΘBorel and for all(s,x)∈ Gr(Γ)和s∈ S使得\'Qu(S|S,x)>0(即,\'Qθ(S|S,x)u(dθ)>0),B(S,x,S,u)(A)=\'AQθ(S|S,x)u(dθ)\'Qθ(S|S,x)u(dθ)=u(A)。因此,(σ,m)是一个具有穷举学习的Berk-Nash均衡。命题3的证明。假设(σ,m)是一个完美的Berk-Nash平衡,且(σε,mε,με)ε是与穷尽学习相关的平衡序列,使得limε→0(σε,mε)=(σ,m)。通过可能的子序列,让u=limε→0με(弱拓扑下)。通过平衡响应T(σ,m,u)=∑(\'Qu)×IQ(σ)×的上半连续性(ΘQ(m))(见定理1的证明),(σ,m)是一个具有支持信念u的Berk-Nash均衡。我们的结论是,(σ,m)是一个具有穷举学习的Berk-Nash均衡。所有人(s,x)∈ Gr(Γ)和s∈ 晚餐\'Qu(·s,x), 对于所有的f:Θ→ 资金充足且持续不断,\'f(θ)u(dθ)-\'f(θ)B(s,x,s,u)(dθ)≤\'f(θ)u(dθ)-\'f(θ)με(dθ)+\'f(θ)με(dθ)-\'f(θ)B(s,x,s,u)(dθ). RHSvanishes中的第一项为ε→ 弱收敛定义为0。

54
能者818 在职认证  发表于 2022-5-7 18:12:47
对于第二项,请注意,对于足够小的ε∈ 晚餐Q|ε(·s,x), 所以,由于με=B(s,x,s,με)对于任何(s,x)∈ Gr(Γ)和s∈ 晚餐Q|ε(·s,x), 我们可以用'f(θ)B(s,x,s,ε)(dθ)代替'f(θ)με(dθ)。因此,第二项因贝叶斯算子的连续性而消失。因此,根据标准参数,对于所有a,u(a)=B(s,x,s,u)(a) ΘBorel和all(s,x)∈ Gr(Γ)和s∈ 晚餐\'Qu(·s,x), 这意味着(σ,m)是具有穷举学习的aBerk-Nash均衡。定理3的证明。ε-扰动环境(σε,mε)的Berk-Nash平衡点的存在性适用于所有ε∈ (0,ε),其中ε=1/(|X |+1),来自用于证明ε=0情况存在的相同等式(见定理1)。弱识别、充分沟通和命题2(ii)意味着存在一个(σε,mε)ε>0的穷举学习伯克-纳什均衡序列。通过∑××的紧性(Gr(Γ)),存在一个收敛子序列,定义为一个完美的Berk-Nash均衡。假设μ,μin(Θ)是这样的\'f(θ)u(dθ)-\'f(θ)u(dθ)= 0表示任何f有界且连续。那么,对于任何F Θ闭合,u(F)-u(F)≤ Eu[fF(θ)]-u(F)=Eu[fF(θ)]-u(F),其中FFI是任何连续且有界的,且≥ 1{F};我们称这类函数为CF。因此,u(F)- u(F)≤ inff∈CFEu[f(θ)]- u(F)=0,其中等式源自单调收敛定理的应用。一个类似的技巧产生了反向不等式,因此,对于任何F,u(F)=u(F) Θ关闭。Θ上的Borel测度是内正则的(也称为astight;参见Aliprantis and Border(2006),第12章,定理12.7)。因此,对于任何Borel来说 Θ和任何 > 0,存在一个F 使μi(A\\F)小于 总的来说,i=1,2。因此u(A)- u(A)≤ u(A)- u(F)≤ u(F)- u(F)+. 根据我们之前的结果,可以得出u(A)- u(A)≤ .

55
kedemingshi 在职认证  发表于 2022-5-7 18:12:50
类似的伎俩产生了相反的不平等,而且 是任意的,这意味着对于所有A ΘBorel。引理1和4的在线附录证明。这些引理的证明是标准的。我们只证明引理1;引理4的证明是类似的。引理1的证明。(i) 让TQ:L∞(S)→ L∞(S) 做行李员接线员,TQ[W](S)=max^x∈Γ(s)`s{π(s,^x,s)+δW(s)}Q(ds|s,^x)。根据标准参数,TQ是模δ的收缩,因此存在唯一的固定点VQ∈ L∞(S) 。为了在Q中建立连续性,让VQnbe为给定Qnsuch的一系列固定点,并让VQn为给定Q的固定点。然后| | VQn- VQ | | L∞≤ ||TQn[VQn]- TQn[VQ]| | L∞+ ||TQn[VQ]- TQ[VQ]| | L∞≤ δ| | VQn- VQ | | L∞+ ||TQn[VQ]- TQ[VQ]| | L∞既然δ∈ [0,1],只剩下证明| | TQn[VQ]- TQ[VQ]| | L∞→ 0.注意,对于任何∈ S、 TQn[VQ](S)- TQ[VQ](s)≤^S(π(S,^xn,S)+δVQ(S)){Qn(ds | S,^xn)- Q(ds | s,^xn)}其中^xn∈ arg max\'S{π(S,^x,S)+δVQ(S)}Qn(ds | S,^x)。因为VQandπ是inL∞(S) 和| S |∞, 因此,TQn[VQ](s)- TQ[VQ](s)≤ C | | Qn- Q | |对于某些有限常数C。使用类似的参数,可以证明TQ[VQ](s)-TQn[VQ](s)≤C | | Qn- Q | |。因此,| | TQn[VQ]- TQ[VQ]| | L∞≤ C | | Qn- Q | | |预期结果如下,因为| | Qn- Q | |→ 0.(ii)对于每个s∈ S和Q∈ (S) Gr(Γ),让Xs(Q)≡ arg max^x∈Γ(s)Us(^x,Q),其中Us(^x,Q)=`s{π(s,^x,s)+δVQ(s)}Q(ds | s,^x)。注意,∑(Q)={σ∈ Σ : s∈ S、 σ(·S)∈ (Xs(Q))}与×s同构∈s(Xs(Q)),在σ∈ ∑(Q)i ffσ(·s)。。。。,σ(·| s | s |)∈ ×s∈s(Xs(Q))。在第(i)部分中,Usis是连续的,因此极大值定理意味着Xs(Q)在Q中是非空的、紧值的和上半连续的→ (Xs(Q))对于每个s也是非空、紧值和上半连续的∈ 根据泰科诺·弗夫定理,x也是∈s(Xs(Q)),因此∑(Q)。

56
kedemingshi 在职认证  发表于 2022-5-7 18:12:54
最后,为了建立∑(Q)的凸性,让∑,σ∈ ∑(Q),α∈(0,1)和σα=ασ+(1)- α)σ. 那么,不管怎样∈ S、 suppσα(·S)=suppσ(·S)∪ 供应σ(·s) Xs(Q),所以σα∈ ∑(Q)。索赔A、B和C的证明。对于权利要求A和B的证明,设Z=S×Gr(Γ)。对于每个z=(s,s,x)∈ Z和m∈ (Gr(Γ)),定义Pm(z)=Q(s|s,x)m(s,x)。我们有时滥用符号,写Q(z)≡ Q(s | s,x),对于Qθ也是如此。权利要求A的证明。(i)通过Z的正则性和完整性,存在θ*∈ Θ和α∈ (0,1)使得Qθ*(z)≥ α代表所有z∈ 使得Q(Z)>0。因此,对所有人来说∈ (Gr(Γ)),KQ(m,θ)*) ≤ -E’Pm[ln Qθ*(Z) ]≤ - lnα。(ii)KQ(mn,θ)- KQ(m,θ)=Pz:Q(z)>0(`Pmn(z)-下午(z)时(ln Q(z)- lnqθ(z))。假设所有z的Qθ(z)>0,使得Q(z)>0,(lnq(z)- lnqθ(z))对所有z有界,使得Q(z)>0。此外,Pmn(z)-对于所有z,Pm(z)收敛到零∈ Z是由于‘P·的线性和mnto m的收敛(iii)Ki(σn,θin)-K(σ,θi)=Pz:Q(z)>0(`Pmn(z)-\'Pm(z)ln Q(z)+Pz:Q(z)>0(\'Pm(z)ln Qθ(z)-\'Pmn(z)ln Qθn(z))。RHS中的第一项收敛到零(与Laim A(ii)中的参数相同)。证明的结论是,对于所有z,lim infn→∞-\'Pmn(z)ln Qθn(z)≥ -\'Pm(z)ln Qθ(z)。(22)假设lim infn→∞-\'Pmn(z)ln Qθn(z)≤ M<∞ (如果不是,(22)则无关紧要)。然后是(i)Pmn(z)→“\'Pm(z)>0,在这种情况下,(22)通过Qθ(z)在θ中的连续性保持相等,或(ii)\'Pmn(z)→\'Pm(z)=0,在这种情况下(22)保持不变,因为它的RHSI为零(按照惯例,0 ln 0=0),其LHS总是非负的。索赔证明B.(i)针对任何z∈ Z和任何h∞∈ H、 让我们来看看freqt(H)∞)(z)≡T-1吨-1τ=0{z}(zτ)。注意,t-1Ptτ=1logQ(sτ| sτ)-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1)= κ1t(h∞) + κ-κ3t(h∞, θ) ,其中κ1t(h∞) =Pz∈Z频率(h)∞)(z)-下午(z)ln Q(z),κ=Pz∈Z:Q(Z)>0μPm(Z)lnq(Z)和κ3t(h)∞, θ) =Pz∈Zfreqt(h)∞)(z) lnqθ(z)。我们首先展示了limt→∞κ1t(h∞) = 上午0点-下午5点。

57
nandehutu2022 在职认证  发表于 2022-5-7 18:12:57
为此,让gt(h∞, z)≡{z} (zτ)-下午(z)lnq(z),并观察到(gt(·,z))是一个鞅差序列。让Ht表示部分历史,直到时间t和Lt(h∞, z) =Ptτ=1τ-1gτ(h)∞, z) );请注意,EPf(·ht)Lt+1(h)∞, z)= Lt(h)∞, z) 所以(Lt(·,z))是关于Pf的鞅。此外,EPf(·ht)[gt(h∞, z) |]≤ (ln Q(z))Q(z),其边界为1;这个结果,迭代期望定律和(gt(·,z))不相关的事实,意味着suptEPf[|Lt(h∞, z) |]≤ M代表M<∞. 因此,根据马尔廷格尔收敛定理(见Durrett(2010)中的定理5.2.8)Lt(h∞, z) 将a.s.-PFL聚合为一个有限的∞(h)∞, z) 。Kronecker引理(Pollard(2001),第105页),limt→∞T-1Ptτ=1gτ(h∞, z) =0 a.s.-Pf,适用于所有(均匀)z∈ Z.因此,limt→∞κ1t(h∞) = 上午0点-下午5点。我们还注意到,类似的论点表明→∞频率(h)∞, z) =Pm(z)a.s.-Pf,适用于所有(一致)z∈ Z.自θ∈^Θ,z 7→ - log(Qθ(z))是有界的。因此,通过类似的论据,我们可以证明→∞κ1t(h∞) = 0 a.s.-Pf,因此,对于任何θ∈^Θ,limt→∞κ3t(h∞, θ) =Pz∈Z′Pm(Z)ln Qθ(Z)a.s.-Pf。这个结果和Limt→∞κ1t(h∞) = 0 a.s.-Pf,暗示limt→∞T-1Ptτ=1logQ(sτ| sτ)-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1)=Pz∈Z-Pm(Z)日志Q(z)Qθ(z)=P(s,x)∈Gr(Γ)EQ(·s,x)hlogQ(S | S,x)Qθ(S | S,x)任意θ的im(s,x)∈^Θa.s.-Pf,根据需要。(ii)对于任何ξ>0,定义Θm,ξ为θ∈ Θm,ξ当且仅当ifQθ(z)≥ ξ对于所有z,使得`Pm(z)>0。对于任何ζ>0,设ζξ=-α/(#Z4 lnξ)>0。因为limt→∞频率(h)∞, z) =Pm(z)a.s.-Pf,适用于所有(一致)z∈ Z^tζξ使得,T≥^tζξ,κ3t(h∞, θ) ≤X{z:\'Pm(z)>0}frekt(h)∞)(z) lnqθ(z)≤X{zi:\'Pm(z)>0}下午(z)- ζξlnqθ(z)≤X(s,X)∈Gr(Γ)EQ(·s,x)[lnqθ(s | s,x)]m(s,x)- #Zζξlnξ,a.s.-Pfandθ ∈ Θm,ξ(自Qθ(z)≥ ξ z,使得`Pm(z)>0)。

58
可人4 在职认证  发表于 2022-5-7 18:13:02
在上面的表达式中,α/4=-#Zζξlnξ,以及-1Ptτ=1logQ(sτ| sτ)-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1)=这个引理意味着对于一个序列(`t)tifPτ`τ<∞, 然后,τ=1bτbt′τ→ 0,其中(bt)是一个非减量正实值序列,它发散到∞. 我们可以用\'t\'应用引理≡ T-1tand bt=t.κ1t(h∞) + κ- κ3t(h∞, θ) 暗示T≥^tζξ,t-1tXτ=1logQ(sτ| sτ)-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1)≥X(s,X)∈Gr(Γ)EQ(·s,x)lnQ(S | S,x)Qθ(S | S,x)m(s,x)-α=KQ(m,θ)-α、 (23)a.s.-Pfandθ ∈ Θm,ξ。对于任何θ∈ {Θ:dm(θ)≥ }∩Θm,ξ,RHS在K以下有界*(m) +3α-α>K*(m) +α。此外,由于limt→∞频率(h)∞, z) =Pm(z)a.s.-Pf(均匀分布在z上)∈ Z) 对于任何θ,都存在一个T/∈ Θm,ξ,κ3t(h∞, θ) ≤ 频率(z)ln Qθ(z)≤(pL/2)对于所有t≥ T(ξ)和一些z∈ 其中pL=minZ{Pm(Z):\'Pm(Z)>0}。因此,对于任何θ/∈ Θm,ξ和a.s.-Pf:t-1tXτ=1logQ(sτ| sτ)-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1)≥Xz∈Z:Q(Z)>0μPm(Z)ln Q(Z)- (pL/2)lnξ(24)对于所有t≥ T(ξ)。注意这一点∈Z:Q(Z)>0μPm(Z)ln Q(Z)和K*(m) 是有界的,因此存在一个ξ(α),使得RHS可以大于K*(m) +α。因此,通过显示23和24,可以得出以下结论:对于任何t≥ T≡ max{tζξ(α),t(ξ(α))}和a.s.-Pft-1tXτ=1logQ(sτ| sτ)-1,xτ-1) Qθ(sτ| sτ)-1,xτ-1)≥ K*(m) +α表示所有θ∈ {Θ:dm(θ)≥ }, 如你所愿。索赔证明C.我们首先表明,对于任何(s,x)∈ Gr(Γ)和(s,x)∈Gr(Γ),存在一个n,使得Mnσ,Q(s,x | s,x)>0,其中Mnσ,Q=Mσ,Q··Mσ,Q。根据定义18中的条件,存在一个n和一条“路径”(s,x)。。。,(sn,xn))使得(si,xi)∈ Gr(Γ)对于所有i=1。。。,n和Q(s | sn,xn)Q(sn | sn)-1,xn-1) 。。。Q(s | s,x)>0。表达式Mσ,Q·Mσ,qi定义为S×X上的转移概率函数,其中Mσ,Q·Mσ,Q(S,X | S,X)≡P(a,b)M(s,x | a,b)M(a,b | s,x)。

59
能者818 在职认证  发表于 2022-5-7 18:13:05
表达式Mσ,Q··Mσ,由前一个表达式的连续迭代构造。这个不等式和σ(x | s)≥ ε表示所有(s,x)∈ Gr(Γ),意味着mnσ,Q(s,x | s,x)=x((s,x),。。。,(sn,xn)σ(x | s)Q(s | sn,xn)。。。σ(x | s)Q(s | s,x)≥ εn+1X((s,x),。。。,(sn,xn)Q(s | sn,xn)。。。Q(s | s,x)>0,根据需要。考虑任何不变分布m。至少存在一个点(s,x)∈Gr(Γ)使得m(s,x)>0。对于任何(s,x)∈ Gr(Γ),设n为确保Mnσ,Q(s,x | s,x)>0的整数。然后,m(s,x)=P(s,x)∈Gr(Γ)Mnσ,Q(s,x | s,x)m(s,x)≥ Mnσ,Q(s,x | s,x)m(s,x)>0。因此,supp(m)=Gr(Γ)。计算ΘQ(·)和searchexampleClaim D中的平稳分布。(i)设σ是一个以阈值w为特征的策略*. 然后在X,mX(·;w)上有一个唯一的平稳边际分布*), 它由mx(0;w)给出*) =E[γ]- (1 - F(w)*))E[λγ](1)- F(w)*)) {E[λ]- E[λγ]}+E[γ]。(ii)对于任何m∈ (Gr(Γ))与边际mX∈ (十) ,ΘQ(m)是一个单态givenbyθQ(m)=mX(0)mX(0)+mX(1)(E[γ])λ+1.-mX(0)mX(0)+mX(1)’γ\'λ+Cov(γ,λ)\'γ.索赔证明D.(i)针对任何m∈ (Gr(Γ)),z,x和A S Borel,letm(z,A,x)=^S^xσ(x|w)Q(z,A|w,x)m(w,x)dwdx,其中{z},A,xis只是集合{z}×A×{x}和\'Q(z,A|w,x)的符号≡Pr(A | z,w,x)G(z),带Pr(w)∈ A | z,w,0)=(\'AF(dw)w/prob。λ(z)1{0∈ A} w/prob。(1 - λ(z)),和pr(w∈ A | z,w,1)=\'AF(dw)w/pr.λ(z)1{0∈ A} w/pr.(1)- λ(z))w/pr.γ(z)1{w∈ A} w/pr.1- γ(z)。σ(1 | w)=1{w>w*}. 因此,对于x=1m(z,S,1;w*) = m(z,{w>w)*}, 1.W*)对于x=0,情况也类似。因此,mX(1;w*) =\'Zm(dz,{w>w*}, 1.W*) 和mX(0;w)*) =`Zm(dz,{w<w*}, 0; W*) (w=w)*发生概率为零,因此可以忽略)。

60
kedemingshi 在职认证  发表于 2022-5-7 18:13:08
因此,mx(1;w*) =^Z^S^Xσ(X|w)`Q(dz,{w>w*}|w、 x)m(w,x;w*)dwdx=^Z^S^XPr({w>w*}|z、 w,x)G(dz)m(w,x;w)*)dwdx=^Z^SPr({w>w*}|z、 0)G(dz)m(w,0;w*)dw+Z^SPr({w>w*}|z、 w,1)G(dz)m(w,1;w*)dw=^Zλ(Z)G(dz)(1)- F(w)*))mX(0;w)*) +^Zγ(Z)λ(Z)(1)- F(w)*))G(dz)mX(1;w)*)+^Z(1)- γ(z))G(dz)^S1{w>w*}m(dw,1;w)*).其中最后一行是从1{w>w*}1{w=0}=0始终。观察`W1{w>w*}m(dw,1;w)*) = m({w>w)*}, 1.W*) = mX(1;w)*) 根据我们之前的观察。ThusmX(1;w)*) = E[λ](1)-F(w)*))mX(0;w)*)+{E[λγ](1)- F(w)*)) + (1 - E[γ]}mX(1;w*).求解mX(1;w)*), 我们得到了mx(1;w)*) =E[λ](1)- F(w)*))(1 - F(w)*)) {E[λ]- E[λγ]}+E[γ]。结果表明,mX(0;w*) = 1.- mX(1;w)*).(ii)对于x=1,等式(·w,1)自然对数Q(W | W,1)Qθ(W | W,1)=Xz∈Zγ(Z)λ(z)^log(θ)F(dw)+(1)- λ(z))对数(1)- θ)G(z)+Xz∈Z(1)- γ(z){log(1)}G(z)=E[λγ]log(θ)+(E[γ]- E[λγ]对数(1)- θ) +常数。类似地,对于x=0,等式(·w,0)自然对数Q(W | s,0)Qθ(W | s,0)= E[λ]对数(θ)+(1)- E[λ])对数(1)- θ) +Const,其中Const和Const是不依赖于θ的常数。很容易看出,在[0,1]上,这些都是θ的严格凸函数,所以也有一个凸组合。因此,ΘQ(m)是任意m的单态,我们将其表示为θQ(m)。第一阶条件产生θ{E[λγ]mX(1)+E[λ]mX(0)}=1- θ{(E[γ]- E[λγ])mX(1)+(1)- E[λ])mX(0)}。因此θQ(m)=E[λγ]mX(1)+βλmX(0)\'-γmX(1)+mX(0)。期望的结果来自一些代数和协方差的标准表达式。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-7 07:41