楼主: nandehutu2022
2338 62

[量化金融] 顺序半匿名非原子博弈与它们的大博弈之间的联系 [推广有奖]

31
可人4 在职认证  发表于 2022-5-9 08:21:29
在此期间,玩家1的随机决策规则可以写成^χt(~ht,~oS(εst,-1) ,st1 |·),其中历史ht可表示为ht=(st′,xt′,oSX(εst′,-1xt′,-1) |t′=1,2。。。,T- 1) ,(39)~oS(εst,-1) 是他对其他玩家状态的观察,ST1代表玩家自己的状态。OSandoScan居住在一个完整的光谱中。当OS={0}和<<OS(·)=0时,玩家不知道其他人的状态;当OS=P(S)和@oSis出现在身份地图上时,每个人都完全意识到自己周围的环境。类似地,OSX、OSX和OSX也有不同的版本。然而,定理2和3消除了深入研究(OS、~OS、OSX、~OSX、~OSX、~OSX)有关有限遗传算法细节的需要。他们指出,NG对应物的平衡,必然既忽略了过去的历史,也忽略了当前的观察结果(εst,-1) ,对于有足够玩家的游戏来说是一个很好的近似均衡。~hth的缺失也有马尔科夫式的解释。另一方面,这种能力使,-1) 它的影响非常重要,因为这样可以节省玩家收集周围环境信息的时间。关于定理4,我们注意到以下几点。我们的每一个固定博弈都是随机博弈。对于后一种游戏的n人版本,玩家对其他人的状态有充分的了解,均衡很难计算,而且为了实现均衡,玩家之间需要高度的协调;见索兰[30]。这些平衡来自空间(2Rn)Sn×((Rn)Xn×Sn)Sn×Rn;然而,我们的NG均衡来自RS×X。同时,人们在现实生活中面临的贴现随机博弈通常是半匿名的;例如,参见Jovanoic和Rosenthal[16]中列出的示例。对于这样一个游戏,定理4表明,为了在一个大小的妥协下协调玩家的行为,可以采取一条更容易的路径。

32
可人4 在职认证  发表于 2022-5-9 08:21:32
如果所有玩家都同意执行相应的NG平衡,典型的玩家1只需对自己的状态ST1做出反应,而不必放弃太多。9.2 NG均衡的来源为了进一步支持这样一种说法,即研究理想化的NG有助于理解和执行现实生活中面临的混乱有限的游戏,我们证明,对于瞬态情况,满足标准(23)和(24),对于静态情况,满足标准(35)和(36),可以相对容易地获得NGE均衡。首先,我们集中讨论第3至6节中研究的重大案例。从(22),vt(st,(ξt,χ[t+1,\'t]),σt,χ[t\'t])=ZXξt(dy)·vt(st,(δy,χ[t+1,\'t]),σt,χ[t\'t])。(40)因此,supξt∈K(S,X)vt(st,(ξt,χ[t+1,\'t]),σt,χ[t\'t])=supy∈Xvt(st,(δy,χ[t+1,\'t]),σt,χ[t\'t])。(41)因此,我们f在“t周期”情况下方便使用的平衡标准(23)是等价的,对于每t=1,2。。。,\'t,χt(st|Xt(st,σt,χ[t\'t]))=1,圣∈ S、 (42)式中,Xt(st,σt,χ[t\'t])={x∈ X | vt(st,(δX,χ[t+1,\'t]),σt,χ[t\'t])=supy∈Xvt(st,(δy,χ[t+1,\'t]),σt,χ[t\'t]),(43)和σ通过(24)定义。由(42)和(43)组成的形式与NG文献中使用的分配平衡概念非常接近,如Mas Colell[24]和Jovanovic and Rosenthal[16]。分布平衡是一个作用中的环境序列τ[1\'t]=(τt|t=1,2,…,t)∈(P(S×X))t每t=1,2,…,满足τt(~Ut(τ[t]t])=1。。。,在这里,Ut(τ[t\'t])={(s,x)∈S×X | v′t(S,X,τ[t′t])=supy∈Xv′t(s,y,τ[t′t])和v′t(s,y,τ[t′t])是一个玩家在开始阶段t时的状态和动作y,但所有阶段的其他玩家和他自己在以后的阶段按照τ[t′t]行事;与(24)对应,分配平衡也满足τ| S=σ和τt | S=τt-1.⊙ ~gt-1(·,·,τt)-1) 对于t=2,3。。。,“t。

33
大多数88 在职认证  发表于 2022-5-9 08:21:35
根据Jovanovic和Rosenthal[16](定理1),当S和X是紧的,每个payoffffti在所有参数中是有界的和连续的,并且每个transitionkernelGT在所有参数中是连续的,这样的平衡τ[1-t]就会存在。当我们条件意义上的平衡χ[1\'t]存在时,我们可以通过迭代地求助于τt=σt来构造分布平衡τ[1\'t]χtandσt+1=Tt(χt)oσt对于t=1,2。。。,反过来,当后一个分配平衡τ[1\'t]可用时,我们几乎可以得到一个条件平衡χ[1\'t]。对于每个t=1,2。。。,根据Duffee、Geanakoplos、Mas Colell和McLennan[9](第7.51页),我们可以确定一个χt∈ K(S,X),它也是从S到P(X)的可测量映射,满足τt=τt|S χt。因此,我们将能够从χ到χt连续构造χ[1\'t]。但即使如此,χ[t\'t]和σt=τt|S也只能满足(42)f或τt|S-几乎每个st,但不一定每个st∈ 例如,我们可以假设S={S,\'S,…}。在每个t处,构造的χ[1\'t]可以保证(42)对于那些(τt|s)(\'si)>0的\'si,但对于那些(τt|s)(\'si)=0的\'si。另一方面,可以直接得到条件平衡χ[1\'t];详见附录F.1。当涉及到第8节中研究的固定案例时,我们进行了平行的发展。这里对应于(36)的性质是χ(s | | X)∞(s,σ,χ))=1,s∈ S、 (44)其中X∞(s,σ,χ)={x∈ X | v∞(s,(δx,χ)∞), σ, χ∞) = supy∈十五∞(s,(δy,χ)∞), σ, χ∞)}, (45)和σ满意度(35)。同样,存在一个相关的分配平衡τ∈ P(S×X)在相当一般的条件下是已知的;例如,见约万诺维奇和罗森塔尔[16](理论2)。然而,平衡τ并不完全导致条件平衡χ。

34
mingdashike22 在职认证  发表于 2022-5-9 08:21:39
所以,一旦我们关注静止情况的直接方法;参见附录F.2.10,其中包括共同行动计划下的重要标志。我们已经证明,在多时段大型有限期游戏中,玩家所面临的环境将与其NG对手的环境保持接近。对于过渡和静止环境,我们的结果表明,在大型有限博弈中,一个不确定的均衡,必然既忽略了过去的历史,也忽视了其他参与者的当前状态,可以作为一个很好的近似均衡。我们认为,在某些情况下,对状态空间和动作空间的离散性要求可能会令人沮丧。除了放宽上述限制,未来的研究还可以研究收敛速度问题。致谢本研究部分得到了国家科学基金Gr ant CMMI0854803以及国家自然科学基金11371273和71502015的支持。附录A的概念和基本引理回顾了分布空间P(A)的Prohorov度量的ρAstands。引理1设A是可分度量空间。那么,对于任何n∈ N和a,a′∈ An,ρA(εA,εA′)≤nmaxm=1dA(am,a′m)。证明:设=maxnm=1dA(am,a′m)。对于任何一个A\'∈ B(A),关键的观察结果是δA′m((A′))≥ δam(A′)。(A.1)那么,εA′((A′))=Pnm=1δA′m((A′))n≥Pnm=1δam(A′)n=εA(A′)。(A.2)因此,ρA(εA,εA′)≤ .根据Parthasarathy[2 6](定理II.7.1),强大数定律适用于弱拓扑下的经验分布,因此也适用于Prohorov度量下的经验分布。在下文中,我们陈述了它的弱版本。引理2 Let可分度量空间A与分布p∈ P(A)可以给出。然后,对于任意>0,只要n足够大,pn({a∈ An |ρA(εA,p)<}>1- .由于Dvoretzky、Kiefer和Wolfolwitz[10]的不等式,上述收敛对于某些A是一致的。

35
kedemingshi 在职认证  发表于 2022-5-9 08:21:42
不等式推断,当A是R或可数时,pn({A∈ An |ρA(εA,p)≤ }) > 1 - 2e-2n, > 0 .当n大于ln(3/)/(2)时,一个独立于p的数∈ P(A),上面将引出引理2中的不等式。因此,我们有以下几点。引理3当A是实线R或可数时,用引理2表示的收敛是一致的。也就是说,可以确定一个下界,使其上的每一个n都能实现引理中每一个p的不等式∈ P(A)。对于可分度量空间A,点A∈ A、 和(n)- 1) -点经验分布p∈ Pn-1(A),我们用(A,p)来表示Pn(A)的成员,它在点A上有额外的1/nW重量,但p中的概率质量被减少到(n)- 1) /n乘以其原始值。暂时∈ Anand m=1。。。,n、 我们有(am,εa)-m) n=εa。关于普罗霍洛夫度量,我们还有一个简单但有用的观察结果。引理4设A是一个可分的度量。那么,对于任何n∈ N\\{1},a∈ A、 安德普∈ Pn-1(A),ρA((A,p)n,p)≤n、 证据:让A\'∈ B(A)被选中。那么p(A′)=(m- 1) /(n)- 1) 对于一些m=1,2。。。,n、 Ifa/∈ A′,然后(A,p)n(A′)=(m- 1) /n因此(a,p)n(a′)≤ p(A′)≤ (a,p)n(a′)+n(a.3)如果a∈ A′,然后(A,p)n(A′)=m/n,因此(A,p)n(A′)-N≤ p(A′)≤ (a,p)n(a′)。(A.4)因此,|(A,p)n(A′)- p(A′)|≤n、 (A.5)由于Prohorov度量的性质,我们有ρA((A,p)n,p)≤n、 (A.6)我们就此完成了证明。对于定义1中引入的渐近相似性概念,我们认为它是在某些投影和展开下保留的。引理5设A是一个可分度量空间。还有,qn∈ P(An)每n∈ N和P∈ P(A)。假设序列qn与序列pn对称。

36
nandehutu2022 在职认证  发表于 2022-5-9 08:21:46
然后,序列qn | An-1将渐近类似于序列pn-1.证明:对于任意>0,由于序列qn与序列pn的渐近相似性,对于足够大的n,我们得到qn(A′n)>1- ,(A.7)where\'n={A∈ An |ρA(εA,p)<}。(A.8)通过引理4,我们得到ρA(εA,εA)-1) ≤NA.∈ 一(A.9)因此,对于足够大的n,A′n A×A′n-1,(A.10)where\'n\'-1={a-1.∈ 一-1 |ρA(εA)-1,p)<2。(A.11)但在(A.7)中,这意味着(qn | An-1) (A′n-1) =qn(A×A′n-1) ≥ qn(A′n)>1- . (A.12)也就是说,qn | An-1a在交感神经上与pn相似-1.引理6设A为可分度量空间。还有,qn∈ P(An)每n∈ N和p,p′∈ P(A)。假设序列qn在符号上类似于序列pn。然后,序列p′×qn-1也将渐近类似于序列pn。证明:对于任何>0,由于序列qn与序列pn的渐近相似性,对于足够大的n,我们有qn-1(A\'n-1) > 1 - ,(A.13)在哪里-1={a∈ 一-1 |ρA(εA,p)<}。(A.14)通过引理4,我们得到ρA(ε(A,A),εA)≤NA.∈ A、 A∈ 一-1.(A.15)因此,对于足够大的n,A×A′n-1. A′n,(A.16)其中n′n={A∈ An |ρA(εA,p)<2}。(A.17)但在(A.13)中,这意味着(p′×qn-1) (A′n)≥ (p′×qn)-1) (A×A′n-1) =p′(A)×qn-1(A\'n-1) > 1 - . (A.18)即p′×qn-1与pn有交感相似。引理7设A和B是可分度量空间。还有,qn∈ 每n的P(An×Bn)∈ Nand p∈ P(A×B)。假设序列qn在符号上类似于序列pn。然后,序列qn | an将渐近地类似于序列(p | A)n。证明:对于任何>0,由于序列qn与序列pn的渐近相似性,对于足够大的n,我们有qn(C′n)>1- (A.19),其中c′n={c=(A,b)∈ An×Bn |ρA×B(εc,p)<}。(A.20)但通过杨[33]的(87),ρA(εA,p | A)=ρA(εc | A,p | A)≤ ρA×B(εc,p),c=(a,b)∈ C′n.(A.21)因此,C′n A′n×Bn,(A.22)其中n={A∈ An |ρA(εA,p | A)<。

37
能者818 在职认证  发表于 2022-5-9 08:21:50
(A.23)结合(A.19)和(A.22),我们可以得到(qn | An)(A′n)=qn(A′n×Bn)≥ qn(C′n)>1- . (A.24)这表明,命题1:我们首先证明(i)第5节的qn |无符号相似(p | A)n.B证明。修好一些∈ (0, 1). 由于S的可数性,我们可以确定它的一些点。。。,所以每个σ({sI})>0和xi=1σ({sI})>1- . (B.1)为了方便起见,让\'S\'={S,\'S,…,\'sI}和\'S\'=S\\\'S\'。因为S是离散的,所以距离dS(\'S\',\'S\')=infs′∈\'S\',S\'∈\'S′\'dS(S′,S′)大于0。对于i,j=1,2。。。,一、 让我们用dijds(\'si,\'sj)和σifor({\'si})表示。现在定义δ=I∧ dS(\'S\',\'S\')∧ (mini6=jdij)∧ (miniσi),(B.2)仍然是严格正的。在本文中,我们使用∧ b代表min{a,b}和a∨ b代表max{a,b}。对任何人来说∈ N、 定义S\'N∈ 所以这是n={s∈ Sn |ρS(εS,σ)<δ}。(B.3)通过假设π在鼻症状上类似于σn,我们可以确保πn(S′n)>1-(B.4)使n足够大。考虑任何这样的n,以及任何s=(s,s,…,sn)∈ S′与i=1,2。。。,I.从δ开始≤ dS(\'S\',\'S\')∧ (mini6=jdij)即({si})δ,其含义来自(??),仍然是{si}本身。现在通过(B.3),εs({si})<σ({si})δ)+δ=σi+δ,(B.5)和εs({si})=1- εs({sj|j6=i}∪\'S′)>1- σ({sj|j6=i}∪\'S′)δ)- δ= 1 - σ({sj|j6=i}∪\'S\')- δ=σi- δ、 (B.6)仍然高于δ>0,因为δ≤ 迷你σi/2。为了方便起见,假设ni(s)=n·εs({si}),s中恰好为{si}的组分的数量。现在我们知道,对于每一个s,ni(s)都高于nδ∈ S′与i=1,2。。。,I.另一方面,通过引理2,每个I=1,2。。。,一、 所以当ni>ni时,(χ(\'si))ni(X′ini)>1-2I,(B.7)其中x′ini={x∈ Xni |ρX(εX,χ(\'si))<δ}。

38
能者818 在职认证  发表于 2022-5-9 08:21:54
(B.8)由于δ>0,我们可以确保每i=1,2,…,nδ和ni(s)高于nif。。。,我希望你足够大。修正一个既有利于(B.4)又有利于(B.7)的大n。对于任何(s,x)∈ Sn×Xn,设*xi(s,x)是xm的ni(s)长向量,其对应的sm恰好是*si:*xi(s,x)=(xm | m=1,2,…,n,但有sm=*si)∈ Xni(s)。(B.9)定义联合国∈ B(Sn×Xn),所以u′n={(s,x)∈ Sn×Xn | s∈ S′nandxi(S,x)∈ 每个i=1,2,…,的X′ini。。。,一} 。(B.10)通过(16),(B.4)和(B.7),我们得到了(πn) χn(U′n)=ZS′nπn(ds)·IYi=1(χ(\'si))ni(s)(X′ini(s))>(1-) · (1 -2I)I>1- . (B.11)对于U′n中的任何(s,x),让我们检查εsx=ε((s,x),。。。,(sn,xn))等于σ χ. 重新调用S={S,\'S,\'sI}∪“S”。所以对于任何U\'∈ B(S×X),U′=(I[I=1{si}×X′I)[U′,(B.12)其中X′I∈ B(X)对于i=1,2。。。,一、 而U′是这样的∈“S”表示任何(S′,x′)∈ U′\'。再次注意δ≤ dS(\'S\',\'S\')∧ mini6=jdij。当我们取dS×Xto平均值dS×X((s′,X′,(s′,X′))=dS(s′,s′)∨ dX(x′,x′,(B.12)将导致toI[i=1{si}×(x′i)δ (U′)δ。(B.13)现在从(B.5)和(B.8)开始,εsx({si}×X′i)=εs({si})·εxi(s,X)(X′i)<(σi+δ).[χ(\'si}(X′i)δ)+δ]≤ (σ  χ) ({si}×(X′i)δ)+2δ+δ<(σ) χ) ({si}×(X′i)δ)+3δ,(B.14),其中最后一个不等式是由于我们选择δ≤ /I<1。同时,εsx(U′)≤ εsx(\'S′×X)=εS(\'S′)=1-IXi=1εs({si})<1-IXi=1σi+iδ<+iδ,(B.15),其中倒数第二个不等式由(B.6)引起,最后一个不等式由(B.1)引起。结合(B.12)到(B.15),我们可以得到εsx(U′)<(σ) χ) ((U′)δ)++4Iδ。(B.16)因此,ρS×X(εsx,σ χ) <+4Iδ≤ 5,(B.17)最后一个不平等来自我们的选择,δ≤ /I.由于(B.11)和(B.17)将发生在任何足够大的n上,我们看到(I)是真的。然后我们证明(ii)。为了方便起见,我们用U,σ来表示S×X χ乘以τ,对于eachn∈ N、 πN χnbyνn。

39
大多数88 在职认证  发表于 2022-5-9 08:21:58
从(i)中,我们得到了与τn序列相似的序列∈ (0, 1). 由于S和X的可数性,以及U的可数性,我们可以确定一些J点\'U,\'U。。。,uJ,使每个τ({uJ})>0和jxj=1τ({uJ})>1- . (B.18)为了方便起见,让\'U\'={U,\'U,\'uJ}和\'U\'=U\\\'U\'。因为S和X都是离散的,所以U也是离散的。因此,距离dU(\'U\',\'U\')=infu\'∈“你,你”∈\'U′\'dU(U′,U′)大于0。对于j,k=1,2。。。,J、 让我们用d′jk表示dU(\'uj,\'uk),用τjj表示τ({\'uj})。现在定义δ=J∧ dU(\'U\',\'U\')∧ (minj6=kd′jk)∧ (minjτj),(B.19)仍然是严格正的。对任何人来说∈ N、 定义∈ 所以u\'n={u∈ Un|ρU(εU,τ)U2·supu′∈Unmaxm=1ρS(g(u′,εu-m) ,g(u′,τ))]<δ}。(B.20)通过(i)νn与τn在症状上相似,假设g(u,·)以au无关速率连续,以及引理4,我们可以确保νn(u′n)>1-,(B.21)通过使n足够大,考虑任何这样的n,以及任何u=(u,u,…,un)∈ U′和j=1,2。。。,J.它从δ开始≤ dU(\'U\',\'U\')∧ ({uj})δ仍然是{uj}本身。现在通过(B.20),εu({uj})<τ(({uj})δ)+δ=τj+δ,(B.22)和εu({uj})>1- τ({uk|k6=j}∪\'U′)δ)- δ=τj- δ、 (B.23)仍然高于δ>0,因为δ≤ minjτj/2。为了方便起见,设n′j(u)=n·εu({uj})。现在我们知道n′j(u)在上面nδ 对于每j=1,2。。。,J.由于U和引理3在均匀Glivenko-Cantelli性质上的可数性,存在一些与b和U无关的n′,因此当每个n′J(U)>n′(g(\'uj,εU\\\'uj))n′J(U)(S′\'jn′J(U)(U))>1-2J,j=1,2。。。,J、 (B.24)如果每个u\\\'ujis- 1) -长向量,几乎与u相同,但仅与j(u)相同- 1等于‘uj,and′jn′(u′)=s的分量∈ Sn′|ρS(εS,g(\'uj,εu′\\\'uj))<δ}。

40
大多数88 在职认证  发表于 2022-5-9 08:22:03
(B.25)但根据(B.20),我们可以保证(g(\'uj,εu\\\'uj))n′j(u)(S′jn′j(u))>1-2J,j=1,2。。。,J、 (B.26)其中\'jn\'={s∈ Sn′|ρS(εS,g(\'uj,τ))<δ}。(B.27)由于δ>0,我们可以确保nδ 因此每j=1,2,…,n′j(u)在n′之上。。。,J.足够大。修正一个既有利于(B.21)又有利于(B.26)的大n。任何(美国)∈ Un×Sn,设| sj(u,s)是sm的n′j(u)长向量,其对应的um恰好是|uj:| sj(u,s)=(sm | m=1,2,…,n,但带有um=|uj)∈ Sn′j(u)。(B.28)定义V′n∈ B(Un×Sn),所以v′n={(u,s)∈ Un×Sn | u∈ U\'nandsj(U,s)∈ S′jn′j(u)对于每个j=1,2。。。,J} 。(B.29)让我们遵循从(B.11)到(B.17)在(i)证明中使用的相同逻辑,用适当的替换,例如J f或i,U代表s,s代表X,νnπn,τ代表σ,g(·,·,τ)代表χ,GN代表χn,V′n代表U′n,(B.4),和(B.26)代表(B.7)。然后我们可以导出(νn gn)(V′n)>1- ,(B.30)然而,对于V′n中的任何(u,s),ρu×s(εus,τ) g(·,·,τ))<5。(B.31)由于(B.30)和(B.31)发生在任何足够大的n上,我们看到 Gna在交感神经上类似于(τ 引理7将导致序列νn的渐近相似性⊙ gn=(νn) gn)| sn到序列(τ)⊙ g(·,·,τ))n=((τ) g(·,·,τ))|S)n.因此(ii)是真的。对于(iii),用u表示给定的(s,x)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-25 07:23