楼主: 可人4
744 30

[量化金融] 在Dynkin游戏中与鬼魂玩耍 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-6-23 23:21:03
在同时停车的情况下,支付的替代规范显然是可能的,我们在本文中开发的方法可以扩展到涵盖各种情况。然而,为了简单起见,我们避免讨论这些扩展。参与者1(2)的目的是选择随机停止时间τ(γ),以最大化其预期贴现收益,由j(τ,γ;p,x)定义:=Ex[e-rτr(τ,γ)](J(τ,γ;p,x):=Ex[e-rτr(τ,γ)]),其中贴现率r≥ 0是给定常数,x∈ Rd.通过θifromfx的独立性,我们可以重写参与者1的预期支付asJ(τ,γ;p,x)=(1- p) Ex[e-rτg(Xτ)1{τ<∞}](7) +pEx[e-rτg(Xτ)1{τ<γ}]+pEx[e-rτg(Xτ)1{τ=γ<∞}].一个类似的表达式适用于玩家2的预期收益J,用pand替换pw,以明显的方式交换τ和γ。定义2.2。(纳什均衡。)给出n x∈ Rdand pi∈ (0,1),i=1,2,一对(τ*, γ*) ∈ TR×TRis a纳什均衡ifJ(τ,γ*; p、 x)≤ J(τ*, γ*; p、 x)andJ(τ*, γ; p、 x)≤ J(τ*, γ*; p、 x)对于所有对(τ,γ)∈ TR×TR.给定平衡对(τ*, γ*) ∈ TR×TRwe定义了平衡支付asvi(pi,x):=Ji(τ*, γ*; pi,x),对于i=1,2。(8) 备注2.1。在上面的公式中,每个参与者都是主动参与者,但我不确定另一个参与者是主动参与者还是被动参与者。另一种公式是,仅当伯努利随机变量θ3-它将值设为1(即,如果玩家i确实处于活动状态)。更准确地说,支付给参与者1的报酬为R(τ,γ):=g(Xτ)1{τ<γ}+g(Xτ)1{τ=γ}{^τ <∞}= 1{θ=1}R(τ,γ)(和Player 2的类似表达式)。然后,根据独立性,相应的预期贴现付款(τ,γ;pi,x):=Ex[e-rτ^Ri(τ,γ)],i=1,2,满足^Ji(τ,γ;pi,x)=p3-iJi(τ,γ;pi,x)。

12
何人来此 在职认证  发表于 2022-6-23 23:21:06
特别是一对策略(τ,γ)∈ TR×TRis是具有预期payoff s^Jiif且仅当它是具有预期payoff s Ji的博弈的纳什均衡时的纳什均衡,因此从博弈论的角度来看,这两个公式是等价的。备注2.2。我们的建立和本文的结果可以推广到考虑域I上的连续强M arkov过程,前提是X的边界行为我被仔细地解释了。当X是一个开放区间I上的正则维离散时,这种扩展很简单 R具有自然边界。6 TIZIANO DE ANGELIS和ERIK EKSTR–OM3。一些关于游戏收益的有用观察在本节中,我们做了一些一般性的观察,为两个玩家的均衡收益结构提供了一些直觉。3.1. 单人游戏的有效值范围。用(9)V(x)表示:=supτ∈特克斯[东]-rτg(Xτ)1{τ<∞}]相应单人停止游戏的值函数。(对于单个玩家游戏,不需要随机,因此,我们注意到,supremumin(9)将取代停止时间。)为了将来参考,我们表示(10)τ*五: =inf{t≥ 0:V(Xt)=g(Xt)}。从现在起,我们做出以下长期假设。假设3.1。可积条件(11)Ex支持≥0e-rtg(Xt)< ∞, x个∈ Rd、holds和函数V:Rd→ [0, ∞ ) 是连续的。此外,(12)lim支持→∞e-rtV(Xt)1{τ*五=+∞}= 0、备注3.1。已知V的连续性在关于最优停止的文献中讨论的几乎所有示例中都成立。可积性条件(11)和条件(12)保证停止时间τ*关于(9)中的最佳停车时间,请参见示例[23]。

13
nandehutu2022 在职认证  发表于 2022-6-23 23:21:10
此外,进程y:=e-rtV(Xt),t∈ [0, +∞]和Y∞:= 0是一个超鞅,mt:=e-r(t∧τ*五) V(Xt∧τ*五) ,t∈ [0, +∞)是一致可积鞅。虽然(12)对于我们在本文其余部分中开发的方法不是必需的,但这是一个方便的假设,有助于我们保持简单的阐述,避免定理5.1证明中的长局部化论点。从(7)中可以清楚地看出,J(τ,γ;p,x)≤ Ex[e-rτg(Xτ)1{τ<∞}] 对于任何(τ,γ)∈ TR×TR.此外,对于τ∈ TRwe haveEx[电子版]-rτg(Xτ)1{τ<∞}] =ZEx[e-rτg(Xτ)1{τ<∞}|U=U]du(13)=ZEx[e-rτug(Xτu)1{τu<∞}] 杜邦≤ V(x),其中τu∈ T的定义如(2)所示。因此,在单玩家游戏中允许随机分组并不会降低该值,我们有以下上限SUPτ∈TRJ(τ,γ;p,x)≤ supτ∈特雷克斯-rτg(Xτ)1{τ<∞}] = V(x)(14)表示任意γ∈ TR.同样的界限显然适用于玩家2的预期收益。接下来,我们得到有用的下界。首先,对于任何给定的γ∈ TRPlayer 1可以选择τ=τ*(10)中定义的Vde。因此,使用(7)我们得到supτ∈TRinfγ∈TRJ(τ,γ;p,x)≥ (1 - p) Exhe公司-rτ*Vg(Xτ*五) 1{τ*五<∞}i(15)=(1- p) V(x)。在DYNKIN游戏中玩鬼魂7秒钟,使用τ=0,P-A.s.,是一个允许的停止规则∈TRinfγ∈TRJ(τ,γ;p,x)(16)≥ infγ∈TRn(1- p) g(x)+pg(x)p(γ>0)+pg(x)p(γ=0)o=1.-pg(x)表示任意x∈ 总结(14)-(16),我们有(17)max{(1- p) V(x),(1- p/2)g(x)}≤ supτ∈TRinfγ∈TRJ(τ,γ;p,x)≤ V(x)和类似的参数也导致tomax{(1- p) V(x),(1- p/2)g(x)}≤ supγ∈TRinfτ∈TRJ(τ,γ;p,x)≤ V(x)。(18) 从(17)-(18)得出,(19)V(pi,x):=max{(1- pi)V(x),(1- pi/2)g(x)}是参与者i的“安全水平”。更准确地说,任何纳什均衡(τ)的均衡m值(见(8))*, γ*) ∈ TR×TR必须满足vi(pi,x)≥ V(π,x)。3.2. 更明确的预期回报形式。

14
何人来此 在职认证  发表于 2022-6-23 23:21:13
接下来,我们将提供一种重写问题的便捷方法,这将为我们在第4节中构建均衡提供信息。正如预期的那样,我们期望在与递增过程相关的随机策略中找到平衡。然而,暂时忘记平衡的考虑,如果玩家i玩一个随机的停止时间,那么根据上面(13)中的论点,玩家3- i的最佳响应可以在正常停车时间的类别中找到。特别是,让τ∈ TRandγ∈ TRbe任意一个hassupζ∈TRJ(ζ,γ;p,x)=supζ∈TJ(ζ,γ;p,x),(20)supζ∈TRJ(τ,ζ;p,x)=supζ∈TJ(τ,ζ;p,x)。(21)虽然这一论点通常不会导致均衡,但它表明,考虑到参与者i的随机策略,我们可以将注意力限制在参与者3的预期回报上- 我在正常停车时间进行了评估。在下一个命题中,我们给出了此类支付的明确公式。命题3.1。对于i=1,2 letΓi∈ A、 让τ∈ TRandγ∈ 分别由Γ和Γ生成TRbe。对于任何ζ∈ T和x∈ Rdwe haveJ(ζ,γ;p,x)=(1- p) Exhe公司-rζg(Xζ)1{ζ<+∞}i(22)+pExhe-rζg(Xζ)(1- Γζ)1{ζ<+∞}i+pExhe-rζg(Xζ)Γζ{ζ<+∞}iandJ(τ,ζ;p,x)=(1- p) Exhe公司-rζg(Xζ)1{ζ<+∞}i(23)+pExhe-rζg(Xζ)(1- Γζ)1{ζ<+∞}i+pExhe-rζg(Xζ)Γζ{ζ<+∞}i、 8 TIZIANO DE ANGELIS和ERIK EKSTR–公司。根据对称性,可以考虑i=2的情况。因此我们让γ∈ TRbegenerated byΓ∈ A、 我们要展示的是(22)个老人。从(7)中回忆出j(ζ,γ;p,x)=(1- p) Ex[e-rζg(Xζ)1{ζ<∞}] + pEx[e-rζg(Xζ)1{ζ<γ}](24)+pEx[e-rζg(Xζ)1{ζ=γ<∞}],(24)右侧sid e的第一项与(22)的第一项相同。

15
nandehutu2022 在职认证  发表于 2022-6-23 23:21:16
第二学期,根据定义2.1,我们有-rζg(Xζ)1{ζ<γ}]=排气-rζg(Xζ)Pxζ < γFXζ{ζ<∞}i=排气-rζg(Xζ)(1- Γζ)1{ζ<∞}i、 对于最终的表达,我们将其用于任何t≥ 0它容纳{t<U} {γ>t} {Γt≤ U} 。(25)(24)givesEx中的最终术语-rζg(Xζ)1{ζ=γ<+∞}] = Exhe公司-rζg(Xζ)Pxζ = γFXζ{ζ<+∞}i、 (26)现在我们注意到th atPxζ = γFXζ= 二甲苯γ ≥ ζFXζ- 二甲苯γ > ζFXζ= limδ→0Pxγ > ζ - δFXζ- (1 - Γζ)=limδ→0(1 - Γζ-δ) - (1 - Γζ) = Γζ,结合(26)得出我们的证明。4、构建候选战略4.1。调整信念。为了找到游戏的平衡点,我们研究了(游戏期间)玩家关于其对手存在的谎言的演变。换句话说,如果γ∈ Γ生成的TRis∈ A、 然后,玩家1动态评估玩家2处于活动状态的条件概率为∏t:=P(θ=1 | FXt,γ>t)=P(θ=1 | FXt)P(θ>t | FXt,θ=1)P(γ>t | FXt)(27)=pP(γ>t | FXt)1- p+pP(γ>t | FXt)=p(1- Γt)1- pΓt提供p∈ (0,1),其中我们回忆起^γ=γ1{θ=1}+∞1{θ=0}如(5)所示。这里,我们在第三个等式中使用了γ和dθ的独立性,在最后的等式中,我们使用了p(γ>t | FXt)=1- Γt由于(25)。同样,如果τ∈ Γ生成的TRis∈ A、 然后,玩家2将玩家1处于活动状态的条件概率评估为∏t:=P(θ=1 | FXt,^τ>t)=P(1- Γt)1- pΓt(28)提供p∈ (0, 1).注意,Γ3之间有一对一的对应关系-iand∏i,对于i=1,2。事实,(29)Γ3-it=pi- ∏itpi(1- πit),i=1,2。此外,等式(30)(1- pi)=(1- piΓ3-it)(1- πit),i=1,2,在DYNKIN游戏中与鬼魂玩9次。下面我们将看到这些公式如何成为我们游戏分析中的关键因素。4.2. 一个经过反思和调整的信念过程。我们现在给出一个右连续过程(Z,X)的构造,该过程必然在[0,1)×Rd(下面表示dc)的特定子集中演化。

16
能者818 在职认证  发表于 2022-6-23 23:21:19
过程Z将扮演调整信念过程∏的角色,对应于适当构造的递增过程Γ(通过关系式(29)从Z获得),见下文引理4.2。我们首先介绍不相交集合C:={(p,x)∈ (0,1)×Rd:(1)- p) V(x)≥ g(x)}(31)C′:={(p,x)∈ (0,1)×Rd:(1)- p/2)克(x)<(1- p) V(x)<g(x)}(32)S:={(p,x)∈ (0,1)×Rd:(1)- p) V(x)≤ (1 - p/2)g(x)}(33),注意C∪ C′∪ S=(0,1)×第7页以来的第三次→ (1 - p) V(x)是不存在的,如果(p,x),我们有∈C、 然后(0,p)×{x} C、 定义(x):=inf{p∈ [0, 1] : (1 - p) V(x)≤ g(x)}∈ [0, 1].同样,第7页→ (1-p) V(x)-(1-p/2)g(x)是非递增的,所以如果(p,x)∈ C′然后(b(x),p)×{x} C′,we definec(x):=inf{p∈ [0, 1] : (1 - p) V(x)≤ (1 - p/2)g(x)}∈ [0, 1].然后b(x)≤ c(x)代表x∈ Rd,我们有c={(p,x)∈ (0,1)×Rd:p≤ b(x)},(34)C′={(p,x)∈ (0,1)×Rd:b(x)<p<c(x)}(35)and={(p,x)∈ (0,1)×Rd:c(x)≤ p} 。引理4.1。功能b、c:Rd→ [0,1]是连续的。此外,(i)b(x)=c(x)=0<==> V(x)=g(x);(ii)b(x)=c(x)=1<==> g(x)=0。证据我们首先注意到RDX上的V>0,因为X是正则的,(3)成立。此外,V>g/2 on Rd(因为如果g(x)=0,则V(x)>0=g(x)/2,如果g(x)>0,则V(x)≥ g(x)>g(x)/2)。p 7的严格单调性和连续性→ (1 - p)V(x)表示对于anyx∈ Rd b(x)的值由(1)唯一确定- b(x))V(x)=g(x),(36)和严格m关于p7的耳鸣性和连续性→ (1 - p) V(x)- (1 - p/2)g(x)(因为V>g/2on Rd)表示c(x)由(1)唯一确定- c(x))V(x)=(1- p/2)克(x)。(37)因此,b(x)=1-g(x)V(x)(38)和C(x)=V(x)- g(x)V(x)- g(x)/2。(39)因此,b和c的连续性遵循假设3.1。最后,(i)和(ii)从V>0和V≥ g。提案4.1。Let(p,x)∈C给出并确定Px-a.s。

17
能者818 在职认证  发表于 2022-6-23 23:21:23
进程zt:=p∧ inf0≤s≤tb(Xs)。(40)那么Px-a.s.10 TIZIANO DE ANGELIS和ERIK Ekstrom(i)Z是非递增的和连续的;(二)(Zt、Xt)∈C代表所有t≥ 0;(iii)我们有dzt=1{(1-Zt)V(Xt)=g(Xt)}dZt(41)作为(随机)度量。证据自x 7起→ b(x)和t 7→ X连续,立即验证(i)是否成立。此外,根据定义Zt≤ b(Xt)代表所有t≥ 0,因此表示(ii)。为了检查(iii)是否保持we fixω∈ Ohm (在空集之外)并取任意t≥ 0,以便(1- Zt(ω))V(Xt(ω))>g(Xt(ω))。根据b的定义,上述严格不等式意味着Zt(ω)<b(Xt(ω))。然后通过t 7的连续性→ b(Xt)存在δt,ω>0,使得Zt(ω)<b(Xt+s(ω)),对于所有s∈ (0,δt,ω)。HenceZt+s(ω)=Zt(ω)∧ inf0<u≤sb(Xt+u(ω))=Zt(ω),对于所有s∈ (0,δt,ω)。后一个方程表示(41)中需要的dZt(ω)=0。我们指出,在Zt=Zp时,th取决于初始点(p,x)。与上面的Z关联,我们现在构造一个进程Γ∈ A、 这将用于生成博弈中纳什均衡的随机终止时间。特别是,在下一个引理中,我们将重新调用(27)和(28)中介绍的信念过程。引理4.2。对于(p,x)∈C、 定义流程Γt:=Γp,xt:=p- Zp,xtp(1- Zp,xt),t≥ 0,(42),带Zp,x=Z,如(40)中所示。则Γ=Γp,xis连续,Γ∈ A和由Γ生成的调整后置信过程,即过程∏t:=p(1- Γt)1- pΓt,(43)满意度∏Γ=Z,Px-a.s.因此(πΓt,Xt)∈C代表所有t≥ 0,Px-a.s.此外,如果τ∈ TRis由Γ生成,然后是τ≤ τ*五、 证明。对于第一项权利要求,通过比较g(42)和(43),可以立即检查∏Γ=Z。仍需验证Γ∈ A.

18
大多数88 在职认证  发表于 2022-6-23 23:21:26
这是因为Γ是连续的,通过Z的连续性和d,它是非递减的,因为过程Z和映射Z 7→ (p- z) /[p(1- z) ]不增加。对于第二个要求,我们有引理4.1和(40),τ*V=inf{t≥ 0:V(Xt)=g(Xt)}(44)=inf{t≥ 0:b(Xt)=0}=inf{t≥ 0:Zt=0}=inf{t≥ 0:Γt=1},由此得出τu=inf{t≥ 0:Γt>u}≤ τ*V或u∈ [0,1).依次为τ≤ τ*五、 Px-a.s。纳什均衡的构造在不损失一般性的情况下,我们假设pdominates p,即0≤ p≤ p≤ 1、我们首先对两种极端情况p=0和p=1进行了评论。如果p=1,则p=1(因为p≤ p) ,因此两个玩家都确定另一个玩家处于活动状态。在这种情况下,很明显imm mediate stopping,即(τ*, γ*) := (0,0),提供了一个纳什均衡,每个参与者对应的均衡值为g(x)/2。在DYNKIN游戏11中玩鬼魂如果p=0,则玩家1确定玩家2未处于活动状态,并将随后玩最优策略τ*= τ*Vfrom单人游戏。如果p=0,那么玩家2的最佳反应也是使用γ*= τ*五、 对于每个玩家,相应的均衡值由V(x)给出。相反,如果p>0,则情况会稍微复杂一些:玩家2的最佳响应是通过在τ之前停止来抢占玩家1*V(在τ处*五、-); 然而,这不是一个随机的停止时间,在这种情况下不存在平衡。在本节其余部分中,我们施加条件0<p≤ p≤ 1和p<1,因此排除了上述两种情况。然后,我们利用前两部分的结果为我们的博弈构建纳什均衡。一个有趣的特性是,我们的构造自然分为三个场景。也就是说,我们得到的平衡的定性性质取决于(p,x)所属的三个区域C,C′和S中的哪个区域。

19
kedemingshi 在职认证  发表于 2022-6-23 23:21:29
最引人注目的似乎是p的初始值∈ [p,1]对我们的建设的质量方面并不重要。我们将在下面的第5.3节对此功能进行更广泛的评论。在同一节中,我们还将讨论导致我们构建以下定理5.1和5.2中详述的平衡的心理学。5.1. (p,x)的平衡∈C∪C′。我们考虑的这一部分(p,x)∈ C∪C′。我们首先定义*:=p1.-(1 - p) V(x)g(x)+q:=p(1- Γ*)1.- pΓ*(45)并注意(46)(1)- pΓ*)(1 - q) =1- p、 引理5.1。对于(p,x)∈C∪ C′我们有(i)0≤ Γ*< 1,(ii)0<q≤ b(x)。此外,对于(p,x),0<q<b(x)∈ C′。证据如果p≤ b(x)然后Γ*= 0和q=p∈ (0,b(x)],s o(i)-(ii)保持。如果p∈ (b(x),c(x))然后Γ*=p1.-(1 - p) V(x)g(x)∈ (0,1)so(i)成立且q>0。此外,(45)中的第一个等式为(1- p) V(x)=g(x)1.-pΓ*.(47)结合后者和(46)我们得到(1- q) V(x)=1-pΓ*1.- pΓ*g(x)>g(x)(48),因为引理4.1中的(ii)必须是g(x)>0(否则p≤ b(x)=1)。因此,(q,x)位于setC的内部,因此q<b(x),这意味着(ii)。回顾命题4.1和引理4.2中介绍的过程Z和Γ,以及调整的信念过程∏Γ。定义2,*asΓ2,*t: =Γ*+ (1 - Γ*)Γq,xt,t≥ 0,(49)带Γ*如(45)和Γq,引理4.2中的xas,但对于p=q,让Γ1,*t: =ppΓ2,*t{t<τ*五} +1{t≥τ*五} ,(50)12 TIZIANO DE ANGELIS和ERIK EKSTR¨OMand let∏1,*t: =p(1- Γ2,*t) 1个- pΓ2,*t玩家1的调整信念对应于Γ2,*(回忆(27))。提案5.1。对于(p,x)∈C∪ C′以下性质成立:(i)(Γ1,*, Γ2,*) ∈ A.(ii)我们有Px-a.s。Γ2,*t型=Γ*, t=0,0,t>0;(iii)我们有Px-a.s。Γ1,*t型=ppΓ*, t=0,1- p/p,t=τ*V<∞,0,否则;(iv)(π1,*t、 Xt)∈C代表t≥ 0.证明。

20
nandehutu2022 在职认证  发表于 2022-6-23 23:21:32
回顾(42)中表示Γq,x和Zq,xin的表达式(40),立即验证Γq,x∈ [0,1]它是连续的。因此,Γ2,*∈ [0,1]并且它是正确的,在时间零点唯一可能的跳跃。因此(Γ1,*, Γ2,*) ∈ Aso(i)持有。(ii)和(iii)中的表达式表示Γ2,*和Γ1,*是(49)和(50)的中间结果。此外,关于{τ*V<∞} 对于t>τ,我们有Γq,xt=1*Vby(44),所以Γq的连续性,x乘以Γq,xτ*五、-= 1、因此Γ1,*τ*V=1-ppΓ2,*τ*五、-= 1.-pp,完成了(iii)的证明。对于(iv),回顾调整后信念∏1的表达式(27),*对于玩家1,simplealgebra产生∏1,*t=p(1- Γ2,*t) 1个- pΓ2,*t=p(1- Γ*)(1 - Γq,xt)1- pΓ*- p(1- Γ*)Γq,xt(51)=q(1- Γq,xt)1- qΓq,xt=∏q,xt。现在(51)表示(1),*t、 Xt)∈C代表t≥ 0,Px-a.s.根据引理4.2,so(iv)成立。我们现在准备制定我们的主要结果。定理5.1。Let(p,x)∈C∪ C′是给定和固定的(相当于,p<C(x)),和定义(Γ1,*, Γ2,*) ∈ 上述(50)和(49)中的Aas。然后是策略对(τ*, γ*) 生成者(Γ1,*, Γ2,*) 是纳什均衡。此外,双方的均衡报酬为(1- p) V(x)。证据考虑p进程{Nt,t≥ 0}定义如下:对于固定(p,x)∈ C∪ C′letNt:=1.-pΓ*g(x)1{t=0}+~Nt{t>0}(52),其中▄Nt:=(1{θ=0}+1{θ=1,U≥Γ*})(1 - q) e类-rtV(Xt),注意(45),(47)和(52)表示(53)N=g(x)∧ ((1 - p) V(x))。使用符号Yt:=e-备注3.1中引入的rtV(Xt),在{Yt,0≤ t型≤ ∞}和Y∞:= 0是一个超级鞅。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-5 20:45