顺序半匿名非原子博弈与它们的大博弈之间的联系 - 第4页 - 外文文献专区

31楼

发表于 2022-5-9 08:21:29

在此期间，玩家1的随机决策规则可以写成^χt（~ht，~oS（εst，-1），st1 |·），其中历史ht可表示为ht=（st′，xt′，oSX（εst′，-1xt′，-1） |t′=1,2。。。，T- 1），（39）~oS（εst，-1）是他对其他玩家状态的观察，ST1代表玩家自己的状态。OSandoScan居住在一个完整的光谱中。当OS={0}和<<OS（·）=0时，玩家不知道其他人的状态；当OS=P（S）和＠oSis出现在身份地图上时，每个人都完全意识到自己周围的环境。类似地，OSX、OSX和OSX也有不同的版本。然而，定理2和3消除了深入研究（OS、~OS、OSX、~OSX、~OSX、~OSX）有关有限遗传算法细节的需要。他们指出，NG对应物的平衡，必然既忽略了过去的历史，也忽略了当前的观察结果（εst，-1），对于有足够玩家的游戏来说是一个很好的近似均衡。~hth的缺失也有马尔科夫式的解释。另一方面，这种能力使，-1）它的影响非常重要，因为这样可以节省玩家收集周围环境信息的时间。关于定理4，我们注意到以下几点。我们的每一个固定博弈都是随机博弈。对于后一种游戏的n人版本，玩家对其他人的状态有充分的了解，均衡很难计算，而且为了实现均衡，玩家之间需要高度的协调；见索兰[30]。这些平衡来自空间（2Rn）Sn×（（Rn）Xn×Sn）Sn×Rn；然而，我们的NG均衡来自RS×X。同时，人们在现实生活中面临的贴现随机博弈通常是半匿名的；例如，参见Jovanoic和Rosenthal[16]中列出的示例。对于这样一个游戏，定理4表明，为了在一个大小的妥协下协调玩家的行为，可以采取一条更容易的路径。

32楼

可人4

发表于 2022-5-9 08:21:32

如果所有玩家都同意执行相应的NG平衡，典型的玩家1只需对自己的状态ST1做出反应，而不必放弃太多。9.2 NG均衡的来源为了进一步支持这样一种说法，即研究理想化的NG有助于理解和执行现实生活中面临的混乱有限的游戏，我们证明，对于瞬态情况，满足标准（23）和（24），对于静态情况，满足标准（35）和（36），可以相对容易地获得NGE均衡。首先，我们集中讨论第3至6节中研究的重大案例。从（22），vt（st，（ξt，χ[t+1，\'t]），σt，χ[t\'t]）=ZXξt（dy）·vt（st，（δy，χ[t+1，\'t]），σt，χ[t\'t]）。（40）因此，supξt∈K（S，X）vt（st，（ξt，χ[t+1，\'t]），σt，χ[t\'t]）=supy∈Xvt（st，（δy，χ[t+1，\'t]），σt，χ[t\'t]）。（41）因此，我们f在“t周期”情况下方便使用的平衡标准（23）是等价的，对于每t=1，2。。。，\'t，χt（st|Xt（st，σt，χ[t\'t]））=1，圣∈ S、（42）式中，Xt（st，σt，χ[t\'t]）={x∈ X | vt（st，（δX，χ[t+1，\'t]），σt，χ[t\'t]）=supy∈Xvt（st，（δy，χ[t+1，\'t]），σt，χ[t\'t]），（43）和σ通过（24）定义。由（42）和（43）组成的形式与NG文献中使用的分配平衡概念非常接近，如Mas Colell[24]和Jovanovic and Rosenthal[16]。分布平衡是一个作用中的环境序列τ[1\'t]=（τt|t=1,2，…，t）∈（P（S×X））t每t=1，2，…，满足τt（~Ut（τ[t]t]）=1。。。，在这里，Ut（τ[t\'t]）={（s，x）∈S×X | v′t（S，X，τ[t′t]）=supy∈Xv′t（s，y，τ[t′t]）和v′t（s，y，τ[t′t]）是一个玩家在开始阶段t时的状态和动作y，但所有阶段的其他玩家和他自己在以后的阶段按照τ[t′t]行事；与（24）对应，分配平衡也满足τ| S=σ和τt | S=τt-1.⊙ ~gt-1（·，·，τt）-1）对于t=2，3。。。，“t。

33楼

大多数88

发表于 2022-5-9 08:21:35

根据Jovanovic和Rosenthal[16]（定理1），当S和X是紧的，每个payoffffti在所有参数中是有界的和连续的，并且每个transitionkernelGT在所有参数中是连续的，这样的平衡τ[1-t]就会存在。当我们条件意义上的平衡χ[1\'t]存在时，我们可以通过迭代地求助于τt=σt来构造分布平衡τ[1\'t]χtandσt+1=Tt（χt）oσt对于t=1，2。。。，反过来，当后一个分配平衡τ[1\'t]可用时，我们几乎可以得到一个条件平衡χ[1\'t]。对于每个t=1，2。。。，根据Duffee、Geanakoplos、Mas Colell和McLennan[9]（第7.51页），我们可以确定一个χt∈ K（S，X），它也是从S到P（X）的可测量映射，满足τt=τt|S χt。因此，我们将能够从χ到χt连续构造χ[1\'t]。但即使如此，χ[t\'t]和σt=τt|S也只能满足（42）f或τt|S-几乎每个st，但不一定每个st∈ 例如，我们可以假设S={S，\'S，…}。在每个t处，构造的χ[1\'t]可以保证（42）对于那些（τt|s）（\'si）>0的\'si，但对于那些（τt|s）（\'si）=0的\'si。另一方面，可以直接得到条件平衡χ[1\'t]；详见附录F.1。当涉及到第8节中研究的固定案例时，我们进行了平行的发展。这里对应于（36）的性质是χ（s | | X）∞（s，σ，χ））=1，s∈ S、（44）其中X∞（s，σ，χ）={x∈ X | v∞（s，（δx，χ）∞), σ, χ∞) = supy∈十五∞（s，（δy，χ）∞), σ, χ∞)}, （45）和σ满意度（35）。同样，存在一个相关的分配平衡τ∈ P（S×X）在相当一般的条件下是已知的；例如，见约万诺维奇和罗森塔尔[16]（理论2）。然而，平衡τ并不完全导致条件平衡χ。

34楼

mingdashike22

发表于 2022-5-9 08:21:39

所以，一旦我们关注静止情况的直接方法；参见附录F.2.10，其中包括共同行动计划下的重要标志。我们已经证明，在多时段大型有限期游戏中，玩家所面临的环境将与其NG对手的环境保持接近。对于过渡和静止环境，我们的结果表明，在大型有限博弈中，一个不确定的均衡，必然既忽略了过去的历史，也忽视了其他参与者的当前状态，可以作为一个很好的近似均衡。我们认为，在某些情况下，对状态空间和动作空间的离散性要求可能会令人沮丧。除了放宽上述限制，未来的研究还可以研究收敛速度问题。致谢本研究部分得到了国家科学基金Gr ant CMMI0854803以及国家自然科学基金11371273和71502015的支持。附录A的概念和基本引理回顾了分布空间P（A）的Prohorov度量的ρAstands。引理1设A是可分度量空间。那么，对于任何n∈ N和a，a′∈ An，ρA（εA，εA′）≤nmaxm=1dA（am，a′m）。证明：设=maxnm=1dA（am，a′m）。对于任何一个A\'∈ B（A），关键的观察结果是δA′m（（A′））≥ δam（A′）。（A.1）那么，εA′（（A′））=Pnm=1δA′m（（A′））n≥Pnm=1δam（A′）n=εA（A′）。（A.2）因此，ρA（εA，εA′）≤ .根据Parthasarathy[2 6]（定理II.7.1），强大数定律适用于弱拓扑下的经验分布，因此也适用于Prohorov度量下的经验分布。在下文中，我们陈述了它的弱版本。引理2 Let可分度量空间A与分布p∈ P（A）可以给出。然后，对于任意>0，只要n足够大，pn（{a∈ An |ρA（εA，p）<}>1- .由于Dvoretzky、Kiefer和Wolfolwitz[10]的不等式，上述收敛对于某些A是一致的。

35楼

kedemingshi

发表于 2022-5-9 08:21:42

不等式推断，当A是R或可数时，pn（{A∈ An |ρA（εA，p）≤ }) > 1 - 2e-2n， > 0 .当n大于ln（3/）/（2）时，一个独立于p的数∈ P（A），上面将引出引理2中的不等式。因此，我们有以下几点。引理3当A是实线R或可数时，用引理2表示的收敛是一致的。也就是说，可以确定一个下界，使其上的每一个n都能实现引理中每一个p的不等式∈ P（A）。对于可分度量空间A，点A∈ A、和（n）- 1） -点经验分布p∈ Pn-1（A），我们用（A，p）来表示Pn（A）的成员，它在点A上有额外的1/nW重量，但p中的概率质量被减少到（n）- 1） /n乘以其原始值。暂时∈ Anand m=1。。。，n、我们有（am，εa）-m） n=εa。关于普罗霍洛夫度量，我们还有一个简单但有用的观察结果。引理4设A是一个可分的度量。那么，对于任何n∈ N\\{1}，a∈ A、安德普∈ Pn-1（A），ρA（（A，p）n，p）≤n、证据：让A\'∈ B（A）被选中。那么p（A′）=（m- 1） /（n）- 1）对于一些m=1，2。。。，n、 Ifa/∈ A′，然后（A，p）n（A′）=（m- 1） /n因此（a，p）n（a′）≤ p（A′）≤ （a，p）n（a′）+n（a.3）如果a∈ A′，然后（A，p）n（A′）=m/n，因此（A，p）n（A′）-N≤ p（A′）≤ （a，p）n（a′）。（A.4）因此，|（A，p）n（A′）- p（A′）|≤n、（A.5）由于Prohorov度量的性质，我们有ρA（（A，p）n，p）≤n、（A.6）我们就此完成了证明。对于定义1中引入的渐近相似性概念，我们认为它是在某些投影和展开下保留的。引理5设A是一个可分度量空间。还有，qn∈ P（An）每n∈ N和P∈ P（A）。假设序列qn与序列pn对称。

36楼

nandehutu2022

发表于 2022-5-9 08:21:46

然后，序列qn | An-1将渐近类似于序列pn-1.证明：对于任意>0，由于序列qn与序列pn的渐近相似性，对于足够大的n，我们得到qn（A′n）>1- ，（A.7）where\'n={A∈ An |ρA（εA，p）<}。（A.8）通过引理4，我们得到ρA（εA，εA）-1) ≤NA.∈ 一（A.9）因此，对于足够大的n，A′n A×A′n-1，（A.10）where\'n\'-1={a-1.∈ 一-1 |ρA（εA）-1，p）<2。（A.11）但在（A.7）中，这意味着（qn | An-1）（A′n-1） =qn（A×A′n-1) ≥ qn（A′n）>1- . （A.12）也就是说，qn | An-1a在交感神经上与pn相似-1.引理6设A为可分度量空间。还有，qn∈ P（An）每n∈ N和p，p′∈ P（A）。假设序列qn在符号上类似于序列pn。然后，序列p′×qn-1也将渐近类似于序列pn。证明：对于任何>0，由于序列qn与序列pn的渐近相似性，对于足够大的n，我们有qn-1（A\'n-1) > 1 - ，（A.13）在哪里-1={a∈ 一-1 |ρA（εA，p）<}。（A.14）通过引理4，我们得到ρA（ε（A，A），εA）≤NA.∈ A、 A∈ 一-1.（A.15）因此，对于足够大的n，A×A′n-1. A′n，（A.16）其中n′n={A∈ An |ρA（εA，p）<2}。（A.17）但在（A.13）中，这意味着（p′×qn-1）（A′n）≥ （p′×qn）-1）（A×A′n-1） =p′（A）×qn-1（A\'n-1) > 1 - . （A.18）即p′×qn-1与pn有交感相似。引理7设A和B是可分度量空间。还有，qn∈ 每n的P（An×Bn）∈ Nand p∈ P（A×B）。假设序列qn在符号上类似于序列pn。然后，序列qn | an将渐近地类似于序列（p | A）n。证明：对于任何>0，由于序列qn与序列pn的渐近相似性，对于足够大的n，我们有qn（C′n）>1- （A.19），其中c′n={c=（A，b）∈ An×Bn |ρA×B（εc，p）<}。（A.20）但通过杨[33]的（87），ρA（εA，p | A）=ρA（εc | A，p | A）≤ ρA×B（εc，p），c=（a，b）∈ C′n.（A.21）因此，C′n A′n×Bn，（A.22）其中n={A∈ An |ρA（εA，p | A）<。

37楼

能者818

发表于 2022-5-9 08:21:50

（A.23）结合（A.19）和（A.22），我们可以得到（qn | An）（A′n）=qn（A′n×Bn）≥ qn（C′n）>1- . （A.24）这表明，命题1：我们首先证明（i）第5节的qn |无符号相似（p | A）n.B证明。修好一些∈ (0, 1). 由于S的可数性，我们可以确定它的一些点。。。，所以每个σ（{sI}）>0和xi=1σ（{sI}）>1- . （B.1）为了方便起见，让\'S\'={S，\'S，…，\'sI}和\'S\'=S\\\'S\'。因为S是离散的，所以距离dS（\'S\'，\'S\'）=infs′∈\'S\'，S\'∈\'S′\'dS（S′，S′）大于0。对于i，j=1，2。。。，一、让我们用dijds（\'si，\'sj）和σifor（{\'si}）表示。现在定义δ=I∧ dS（\'S\'，\'S\'）∧ （mini6=jdij）∧ （miniσi），（B.2）仍然是严格正的。在本文中，我们使用∧ b代表min{a，b}和a∨ b代表max{a，b}。对任何人来说∈ N、定义S\'N∈ 所以这是n={s∈ Sn |ρS（εS，σ）<δ}。（B.3）通过假设π在鼻症状上类似于σn，我们可以确保πn（S′n）>1-（B.4）使n足够大。考虑任何这样的n，以及任何s=（s，s，…，sn）∈ S′与i=1，2。。。，I.从δ开始≤ dS（\'S\'，\'S\'）∧ （mini6=jdij）即（{si}）δ，其含义来自（？？），仍然是{si}本身。现在通过（B.3），εs（{si}）<σ（{si}）δ）+δ=σi+δ，（B.5）和εs（{si}）=1- εs（{sj|j6=i}∪\'S′）>1- σ（{sj|j6=i}∪\'S′）δ）- δ= 1 - σ（{sj|j6=i}∪\'S\'）- δ=σi- δ、（B.6）仍然高于δ>0，因为δ≤ 迷你σi/2。为了方便起见，假设ni（s）=n·εs（{si}），s中恰好为{si}的组分的数量。现在我们知道，对于每一个s，ni（s）都高于nδ∈ S′与i=1，2。。。，I.另一方面，通过引理2，每个I=1，2。。。，一、所以当ni>ni时，（χ（\'si））ni（X′ini）>1-2I，（B.7）其中x′ini={x∈ Xni |ρX（εX，χ（\'si））<δ}。

38楼

能者818

发表于 2022-5-9 08:21:54

（B.8）由于δ>0，我们可以确保每i=1，2，…，nδ和ni（s）高于nif。。。，我希望你足够大。修正一个既有利于（B.4）又有利于（B.7）的大n。对于任何（s，x）∈ Sn×Xn，设*xi（s，x）是xm的ni（s）长向量，其对应的sm恰好是*si:*xi（s，x）=（xm | m=1，2，…，n，但有sm=*si）∈ Xni（s）。（B.9）定义联合国∈ B（Sn×Xn），所以u′n={（s，x）∈ Sn×Xn | s∈ S′nandxi（S，x）∈ 每个i=1，2，…，的X′ini。。。，一} 。（B.10）通过（16），（B.4）和（B.7），我们得到了（πn） χn（U′n）=ZS′nπn（ds）·IYi=1（χ（\'si））ni（s）（X′ini（s））>（1-) · (1 -2I）I>1- . （B.11）对于U′n中的任何（s，x），让我们检查εsx=ε（（s，x），。。。，（sn，xn））等于σ χ. 重新调用S={S，\'S，\'sI}∪“S”。所以对于任何U\'∈ B（S×X），U′=（I[I=1{si}×X′I）[U′，（B.12）其中X′I∈ B（X）对于i=1，2。。。，一、而U′是这样的∈“S”表示任何（S′，x′）∈ U′\'。再次注意δ≤ dS（\'S\'，\'S\'）∧ mini6=jdij。当我们取dS×Xto平均值dS×X（（s′，X′，（s′，X′））=dS（s′，s′）∨ dX（x′，x′，（B.12）将导致toI[i=1{si}×（x′i）δ （U′）δ。（B.13）现在从（B.5）和（B.8）开始，εsx（{si}×X′i）=εs（{si}）·εxi（s，X）（X′i）<（σi+δ）.[χ（\'si}（X′i）δ）+δ]≤ (σ χ）（{si}×（X′i）δ）+2δ+δ<（σ） χ）（{si}×（X′i）δ）+3δ，（B.14），其中最后一个不等式是由于我们选择δ≤ /I<1。同时，εsx（U′）≤ εsx（\'S′×X）=εS（\'S′）=1-IXi=1εs（{si}）<1-IXi=1σi+iδ<+iδ，（B.15），其中倒数第二个不等式由（B.6）引起，最后一个不等式由（B.1）引起。结合（B.12）到（B.15），我们可以得到εsx（U′）<（σ） χ）（（U′）δ）++4Iδ。（B.16）因此，ρS×X（εsx，σ χ） <+4Iδ≤ 5，（B.17）最后一个不平等来自我们的选择，δ≤ /I.由于（B.11）和（B.17）将发生在任何足够大的n上，我们看到（I）是真的。然后我们证明（ii）。为了方便起见，我们用U，σ来表示S×X χ乘以τ，对于eachn∈ N、 πN χnbyνn。

39楼

大多数88

发表于 2022-5-9 08:21:58

从（i）中，我们得到了与τn序列相似的序列∈ (0, 1). 由于S和X的可数性，以及U的可数性，我们可以确定一些J点\'U，\'U。。。，uJ，使每个τ（{uJ}）>0和jxj=1τ（{uJ}）>1- . （B.18）为了方便起见，让\'U\'={U，\'U，\'uJ}和\'U\'=U\\\'U\'。因为S和X都是离散的，所以U也是离散的。因此，距离dU（\'U\'，\'U\'）=infu\'∈“你，你”∈\'U′\'dU（U′，U′）大于0。对于j，k=1，2。。。，J、让我们用d′jk表示dU（\'uj，\'uk），用τjj表示τ（{\'uj}）。现在定义δ=J∧ dU（\'U\'，\'U\'）∧ （minj6=kd′jk）∧ （minjτj），（B.19）仍然是严格正的。对任何人来说∈ N、定义∈ 所以u\'n={u∈ Un|ρU（εU，τ）U2·supu′∈Unmaxm=1ρS（g（u′，εu-m），g（u′，τ））]<δ}。（B.20）通过（i）νn与τn在症状上相似，假设g（u，·）以au无关速率连续，以及引理4，我们可以确保νn（u′n）>1-，（B.21）通过使n足够大，考虑任何这样的n，以及任何u=（u，u，…，un）∈ U′和j=1，2。。。，J.它从δ开始≤ dU（\'U\'，\'U\'）∧ （{uj}）δ仍然是{uj}本身。现在通过（B.20），εu（{uj}）<τ（（{uj}）δ）+δ=τj+δ，（B.22）和εu（{uj}）>1- τ（{uk|k6=j}∪\'U′）δ）- δ=τj- δ、（B.23）仍然高于δ>0，因为δ≤ minjτj/2。为了方便起见，设n′j（u）=n·εu（{uj}）。现在我们知道n′j（u）在上面nδ 对于每j=1，2。。。，J.由于U和引理3在均匀Glivenko-Cantelli性质上的可数性，存在一些与b和U无关的n′，因此当每个n′J（U）>n′（g（\'uj，εU\\\'uj））n′J（U）（S′\'jn′J（U）（U））>1-2J，j=1，2。。。，J、（B.24）如果每个u\\\'ujis- 1） -长向量，几乎与u相同，但仅与j（u）相同- 1等于‘uj，and′jn′（u′）=s的分量∈ Sn′|ρS（εS，g（\'uj，εu′\\\'uj））<δ}。

40楼

大多数88

发表于 2022-5-9 08:22:03

（B.25）但根据（B.20），我们可以保证（g（\'uj，εu\\\'uj））n′j（u）（S′jn′j（u））>1-2J，j=1，2。。。，J、（B.26）其中\'jn\'={s∈ Sn′|ρS（εS，g（\'uj，τ））<δ}。（B.27）由于δ>0，我们可以确保nδ 因此每j=1，2，…，n′j（u）在n′之上。。。，J.足够大。修正一个既有利于（B.21）又有利于（B.26）的大n。任何（美国）∈ Un×Sn，设| sj（u，s）是sm的n′j（u）长向量，其对应的um恰好是|uj:| sj（u，s）=（sm | m=1，2，…，n，但带有um=|uj）∈ Sn′j（u）。（B.28）定义V′n∈ B（Un×Sn），所以v′n={（u，s）∈ Un×Sn | u∈ U\'nandsj（U，s）∈ S′jn′j（u）对于每个j=1，2。。。，J} 。（B.29）让我们遵循从（B.11）到（B.17）在（i）证明中使用的相同逻辑，用适当的替换，例如J f或i，U代表s，s代表X，νnπn，τ代表σ，g（·，·，τ）代表χ，GN代表χn，V′n代表U′n，（B.4），和（B.26）代表（B.7）。然后我们可以导出（νn gn）（V′n）>1- ，（B.30）然而，对于V′n中的任何（u，s），ρu×s（εus，τ） g（·，·，τ））<5。（B.31）由于（B.30）和（B.31）发生在任何足够大的n上，我们看到 Gna在交感神经上类似于（τ 引理7将导致序列νn的渐近相似性⊙ gn=（νn） gn）| sn到序列（τ）⊙ g（·，·，τ））n=（（τ） g（·，·，τ））|S）n.因此（ii）是真的。对于（iii），用u表示给定的（s，x）。

[量化金融] 顺序半匿名非原子博弈与它们的大博弈之间的联系 [推广有奖]

浏览过的帖子

浏览过的版块

本版微信群