楼主: 何人来此
1520 33

[量化金融] 不完全信息博弈与近视均衡 [推广有奖]

11
何人来此 在职认证  发表于 2022-6-2 21:29:46
(此处不使用。)定理1的证明:设r:=Qn∈Nrn:RI→ , 其中每个rn(n∈ N) Rinto的对应映射(In)由引理1给出,J=In。我们将证明分为4个步骤。a) 近视平衡定义的直接结果是,x点∈  是函数w的近视平衡: → RIif且仅当r(w(x)+x)=x,即i ffr((w+x)(x))=x.b)乘以a),(w′,x)7→ (w′)-x、 x)是E′的同胚:={(w′,x)| w′∈W和r(W′(x))=x}到E,并作为映射到W× 通过同伦((w,x),t)7,它与E′上的恒等式是完全同伦的→ (w)- tx,x)。因此,仍然需要构造一个同胚φ′:W→ E′满足定理的要求,E和φ分别被E′和φ′代替。c) 我们现在Fix∈  和定义图φ′:W→ W× 和ψ′:E′→ Wby公式(省略组合符号):φ′(w)=(w+w(x)- wrw(x),rw(x)),(1)ψ′(w,x)=w- w(x)+w(x)。(2) 直接验证表明φ′(W) E′、ψ′φ′和φ′ψ′分别在W和E′上相同。因此,φ′是W到E′的同态。d) 投影到W的φ′的组成由公式W 7给出→ w+w(x)- wrw(x),我们通过公式H(w,t)=w+t(w(x),定义了一个将其与身份联系起来的ho mo t opy H- wrw(x))。为了证明H是正确的,让我们为W配备标准kwksup:=supx∈由RI上的范数k k诱导的kw(x)k。相反,假设存在wk∈ W和TK∈ [0,1](k∈ N) 这样kwkksup→ ∞ a和supkkH(wk,tk)ksup<∞. 通过kwkksupand划分后者,让uk:=wk/kwkksupwe推断uk+tk(uk(x))- ukrwk(x))→ 0 a s k→ ∞.通过{w | kwk=1}×[0,1]×的紧性, 三联体序列(uk、tk、rwk(x))有一个聚类点,比如(u、t、y)。因此我们得到u+t(u(x)- u(y))=0。上面的第二个和是一个常数函数,所以它是u。所以u(x)- u(y)=0,下一个u=0。

12
可人4 在职认证  发表于 2022-6-2 21:29:49
然而,Ui是范数1向量uk序列的一个聚类点,这个矛盾建立了H的性质并完成了证明。备注3。同胚φ:W→ 以上构造的E还具有以下特性:对于每个w∈ Wφ(W)的W分量通过常数函数(即RI向量)与W不同,其范数以2kwksup+δ为界,其中δ=supx∈kxk。同样,kφ-1(宽x)- 工作时间:≤2kwksup+δ(w,x)∈ E、 值得一提的是,如果是这样的话∈ W是常数,如inKohlberg和Mertens(1986)所述,那么可以通过让φ′(W)=(W,r(W))来完成这一过程。我们也有一个版本的纳什均衡存在定理。当打开时,可以方便地在脑海中扩展近视平衡的定义 一个具有多功能W(而不是单值功能W)。定义。让每个x∈  指定一个集合W(x) RI:=Qn∈NRIn。i) 我们说x∈  是多功能的近视平衡W: → Ri如果存在点y∈ W(x)使得当n∈ N安迪∈ 满足xni6=0,然后yi=maxj∈Inyj。ii)如果每组W(x)是m W(x)=Qn的乘积∈NQi公司∈InWni(x),其中Wni(x) R、 然后,在“对于多功能W”的计划中,我们还说“对于多功能系列(Wni)n∈N、 我∈英寸”。定理2。设W为多功能on 它取RIand的非nempty、闭、凸子集中的值,并且是上半连续的(意味着{x∈  | W(x)∩ K 6=} 已关闭 当K在RI中闭合时)。然后,W存在近视平衡。证明:如果W是单值连续的,现在用W表示,那么用brouwer定理映射  x 7→ r(w(x)+x)∈  有一个执行点x。(这里,r是定理1的证明。)根据该证明的a)部分,xis是w的平衡。在一般情况下,我们把no rm k k k放在RI上。

13
mingdashike22 在职认证  发表于 2022-6-2 21:29:52
对于每个正整数k,存在一个单值连续函数wk: → RIsuch那givenx∈  我们有ky-wk(x′)k+kx-对于某些x′,x′k<k∈  和y∈ W(x)。在上述特殊情况下,对于每个k,存在近视平衡xk∈ 用于功能工作。然后,集合{xk}的累积点∞k=1  是W的近视平衡。3博弈树和不完整信息我们必须修改有限博弈树的概念(库恩(1953),比照哈特(1985)),以便博弈的终点是持续过程的状态,无论是后续博弈还是其他。我们将此修改称为未经处理的博弈树。它包括从传统上被定义为博弈树的地方移除最终收益。之所以使用该术语,是因为截断博弈树的任何较短截断也是截断博弈树。在我们的应用中,不是由终点决定的支付,而是由已知共同终点上的诱导条件概率分布决定的连续支付(可以解释为一种子博弈)。但是,这些连续性支付及其与条件概率的关系是截断博弈树的外因。主要的灵感来自于所有玩家都观察所有动作的游戏,但他们不观察这些动作背后的决策过程。在不完全信息的游戏中,这种区别可能很强,玩家可以拥有一个秘密,并使其行为依赖于该秘密。就像玩扑克一样,虽然你可以完全观察其他玩家的行为,但作为一名玩家,你需要理解的是他们的个人知识和他们的行为之间的关系。游戏树具有顶点V和顶点之间的定向边或箭头。其顶点V可分为两种类型:节点和端点。

14
能者818 在职认证  发表于 2022-6-2 21:29:55
E是一组端点,每个箭头路径从根开始,到一个端点结束,每个端点确定一个唯一的箭头路径。节点集D是子集V\\E,这些是顶点(根r除外),其中正好有一个箭头,而fr-om则至少有两个不同的箭头,不失一般性。对于每个玩家n∈ 这里是一个子集Dn D使i 6=n Di∩Dn=.确定数据集D\\(∪n∈NDn)。给每个玩家n∈ N集合Dn有一个分区pn。对于每个W∈ PNW带W D有一组相应的动作,例如,每v留下的箭头和a之间有一个双射关系∈ W对于每v∈ D在离开节点v的箭头上有一个概率分布Pv,因此t也在紧接着节点v的节点上。在任意节点v∈ W∈ pn只有玩家n在做任何决定,这个决定完全决定了哪个顶点跟随v。在节点处,根据pv,自然正在做出关于哪个顶点跟随v的决定。如果游戏在节点v∈ D和v∈ W∈ Pnthen Player nis通知该节点位于集合W中,并且该玩家没有额外的LIN信息,因此在W内,玩家n无法区分W内的节点。请注意,任何同时移动游戏都可以这样建模,方法是选择任意玩家顺序,并对所有玩家进行不慎重的划分。对于传统的ga me树,我们假设一旦达到终点集E,游戏就结束了,玩家就知道了结果。但是,截断的博弈树可能是进一步活动的前奏,或者报酬可能是截断博弈树的外因。我们可能需要确定集合E中玩家的知识。对于每个玩家n∈ N让Qnbe在E上分配。

15
可人4 在职认证  发表于 2022-6-2 21:30:00
设Q:=∧n∈NQnbe E E上的连接分区,表示每n∈ N Qnis的每个成员都包含在Q的一些成员中。分区Q对应于公共知识的概念,这意味着一个成员C∈ Q是当e∈ C是最终目标。如果有continuationgame,则相应的集合C∈ Q定义适当的子游戏。定义:如果所有路径通过相同的前一个分区以相同的顺序且不重复地在pn或Qnpass中设置为相同的分区成员,则截断的g ame tree对播放器n具有完美的回忆。虽然没有完美回忆的假设,很多东西都被陈述和证明了,但如果没有完美回忆的假设,很难理解接下来的大部分内容的相关性。对于每个玩家n∈ N设sn为截断博弈树中玩家的纯决策策略的有限集,我们指的是一个函数,它在Pn中的每一个集W上决定应该选择哪个成员。如果每个这样的AnWhas基数l和k这样的集合,那么Snis的基数l。现在,我们从截断的博弈树和任何C∈ Q设通信FC(C) ×RC×Nof继续支付,每n∈ N和e∈ E letge,n:R→ R是一个函数。Fo r every x=(xn)n∈N∈  :=Qn公司∈N(Sn),由pxwe表示由x定义的E上的概率分布,对于C∈ Q,px(C)>0,px(·| C)C上的条件概率诱导x。对于s∈ Sn,由xswe表示 通过用s代替xnb从x获得。§4中的应用为ge,n(t)=λrne+(1- λ) 对于某些0<λ<1,其中∈Rn是与终点e相关的支付向量。

16
能者818 在职认证  发表于 2022-6-2 21:30:03
如果多重函数FCwereconstant,即FC(p)=FC(p′,对于p,p′∈ (C) ,我们定义的支付结构与传统博弈树的支付结构没有区别。我们说一个向量(yns)n∈N、 s∈x的Snis属性∈  Ifns=Xe∈Epxs(e)ge,n(νe,n),n∈ N、 s∈ Sn,对于某些ν=(νe,n)e∈E、 n个∈N∈ RE×Nsuch每个C∈ Q、 如果Px(C)>0,则自然投影到RC×Nbelongs到FC(Px(·| C)),否则,如果Px(C)=0,则对于某些Q,ν的图像属于某些FC(Q)∈ (C) 正如x以某种方式确定的那样,“操作值”一词指的是,假设条件概率分布定义良好,则连续支付对应于条件概率分布。当条件概率没有很好定义时,意味着∈ Q已经达到了根据x不应该达到的程度,继续支付对应于C上的一些分布。根据x达到C的零概率意味着有人以不适当的方式行事,使用这种继续支付可以解释为惩罚。然而,将这种惩罚视为对某个特定玩家的惩罚也存在一些问题,下面将对此进行讨论。定理3。让FC:(C)→ RC×N,C∈ Q、 是具有非空凸值的上半连续对应,且ge,n:R→ R、 (e,n)∈E×N,连续递增函数。然后存在x∈  和向量(yns)n∈N、 s∈snproperty代表x,因此yns≥ 所有n的YNTF∈ N和所有s,t∈ SN,xns>0。证明:设>0,设B为大于通信FC中任何payoff的正数。对于每个C∈ Q有一个函数φC,:(C)→ RC×Nthat是FC的连续近似值。

17
何人来此 在职认证  发表于 2022-6-2 21:30:06
如果px(C)≥然后定义λx,(C)=1,如果px(C),则定义λx,(C)=px(C)≤ .FOR每隔x∈ , n∈ N和e∈ E let▄fe,n(x)=ge,nλx,(C)φe,nC,(Px(·| C))+(1- λx,(C))2B,其中C包含e和φe,nC,是φC,的第(e,n)个坐标。如果px(C)=0,则n(x)=ge,n(2B)。对于每个s∈ Sn,我们让▄fns,(x)=Xe∈Epxs(e)~fe,n(x)。请注意,fns,(x)在x中是连续的。根据定理2,对于每一个大于0的,存在一个近视平衡,例如x(),对于家庭(~fns,)n∈N、 s∈序号:。因此,fns,(x())≥fnt,(x()),用于s,t∈ snx()ns>0。观察某些序列(k)k∈接近0时,我们有:(a)序列x(千)k∈nConverge to some▄x∈ ,(b) 对于每个n∈ N和s∈ 序列号,序列号fns,k(x(k))k∈Nconvergesto some  yns,(c)for each e∈ E和n∈ N、 序列νe,nkk∈N、 式中,eνe,Nk=λx(k),k(C)φe,nC,k(Px(k)(·| C))+(1- λx(k),k(C))2B收敛到一些eνe,n。注意,对于所有n∈ N和s∈ Snwe有▄yns=Xe∈Epxs(e)ge,n(eνe,n)。如果▄xns>0,则观察That,其中s∈ Sn,然后几乎所有k的x(k)ns>0。接下来是▄yns≥ yntfor s,t∈ sn▄xns>0。还要注意,序列px(k)(C)k∈nConverge到p▄x(C)。假设px(C)>0。然后px(k)(C)>所有足够大的k。对于这样的k,我们有eνe,nk=φe,nC,所有(e,n)的k(px(k)(·C))∈ C×N。因此,通过(C),序列eνC,kk∈N、 式中eνC,k=eνe,nke∈C、 n个∈N、 收敛到eνC∈ FC(Px(·| C))。现在,假设px(C)=0。如果几乎所有k,px(k)(C)=0,我们选择任意νCin FC((C) )。否则,作为νCwe,选择集合{φC,k(Px(k)(·| C)| Px(k)(C)>0}的任何簇点,该簇点也在FC中((C) )。现在,让ν=(νe,n)e∈E、 n个∈N∈ RE×Nbe,使得ν在RC×上的投影为向量eνCif px(C)>0,且上述向量νCif px(C)=0。

18
可人4 在职认证  发表于 2022-6-2 21:30:09
对于n∈ N和s∈ Sn,我们定义为Xe∈Epxs(e)ge,n(νe,n)。注意,通过定义向量(yns)n∈N、 s∈sni适用于▄x。自νe,n起≤ νe,对于所有e∈ E和n∈ N、 因此,yns≤ ynsforall n∈ N和s∈ 序号:。现在,对于任何x∈ , 如果某些s的xns>0∈ Snandpx(C)=0,然后pxs(C)=0。因此,对于某些s,如果▄xns>0∈ Snthenyns=~yns。因此,对于s,t∈ snxns>0时,我们有yns=~yns≥ ynt≥ ynt,完成了证明。备注:a)上述定理的证明类似于Selten(1975)中的“颤抖的手”ar guments,但给潜在不良行为带来小概率的机制非常不同。b) 玩家观察到的共同点是Q中的一些集合C。鉴于他们知道彼此的策略,在, 他们知道Q中集C中包含的元素有一个共同的条件概率分布。这并不意味着每个玩家都只知道这些关于支付的信息,无论是他或她的支付还是其他人的支付。一个玩家可能会学到更多,包括可能确切地知道∈ 对于任何给定的NC,都将达到C∈ Q、 在这种情况下,玩家根据对终点e的确切了解来评估自己的行为,但也知道e的报酬是由诱导的公共知识分布onC决定的。这与扑克有相似之处,玩家可能知道他或她拥有获胜的牌,但该玩家的下注策略反映了对所有玩家信仰的理解。c) 很容易将FCalways的持续支付定义为游戏的持续支付,即策略产生的支付。然而,我们需要∈ C∈ 每个玩家的报酬的确定∈ N、 包括一些W∈ Qngiven零概率通过相关策略x。

19
mingdashike22 在职认证  发表于 2022-6-2 21:30:12
定义一个在游戏中出现的概率为零,但获得的回报可能会破坏均衡属性的玩家存在一个问题。另一方面,我们确实需要确定这种支付,因为我们必须考虑根据tox以零概率选择决策函数的支付后果,并确保它们不会在决策函数产生正概率的问题上对参与者有利。d) 同样诱人的是将着陆点解释为C∈ x给出的概率为零∈  作为对玩家进行惩罚的导火索。对于两人游戏,如果只有一名玩家偏离了规则,那么确实可以让该玩家负责将游戏带到集合C。但是对于三名或三名以上的玩家,可能无法获得关于哪个玩家将游戏带到该禁止子集的共同知识。想象一下下面的例子;有三名球员i=1、2、3,每个球员有三个位置,左、右和中,每个球员只需打中锋。如果三名球员都选择中锋,那么三名球员都会被告知这一事实。如果玩家i选择向左,则玩家i- 1(模块3)被告知此事实,如果玩家i选择正确,则玩家i+1将被告知此事实;在任何一种情况下,如果球员i是唯一一个不听话的球员,那么第三个其他球员收到的唯一信息就是并非所有三个球员都选择了中锋。假设玩家1发现其他玩家中的一个不服从,但不是哪一个。有两种可能,要么球员2打右边,要么球员3打左边。球员2和3都可以保证他们没有不服从。

20
大多数88 在职认证  发表于 2022-6-2 21:30:16
对玩家3的有效惩罚可能对玩家2非常有利,因为玩家2可能会偏离规则,然后声称是玩家3偏离了规则,这可能会对其他合理平衡产生怀疑。对于两个玩家,这个问题不会出现,因为这两个玩家可能会互相惩罚。根据上述定理,所有参与者都可以通过选择某种连续支付来进行隐性惩罚,但没有明确的惩罚策略,这可能会带来问题。e) 我们本可以说明这个定理,以便通过策略可以产生仅对所有分布的支付函数的多功能性,但这并没有区别。这是因为由策略生成的分布集是闭合的,在闭合分布子集上描述和定义值的上半连续多函数可以扩展为在所有分布上定义的类似多函数。4局单方面信息不完整的游戏我们回到内曼的问题。自然界有一系列的状态。自然选择一个状态k∈ 根据众所周知的概率K,玩家一(而非玩家二)被告知na t ur e的cho ice。球员的最后一组动作f在所有州都是相同的,球员一的动作集合I和球员二的动作集合J。在游戏的每个阶段结束后,两个玩家都会被告知对方的动作。游戏会不确定地重复,并且选择的状态在整个游戏中保持不变。对于每个州k∈ K设Akand Bk为两个玩家的支付矩阵,I为行编制索引,J为列编制索引。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 14:59