楼主: 能者818
2474 78

[量化金融] 随机时间博弈中的对称均衡 [推广有奖]

11
大多数88 在职认证  发表于 2022-5-8 14:04:54
一方面,战略将以斯奈尔信封的形式呈现,这是我们所激励的。另一方面,在我们的游戏中,我们必须非常小心最优停止时间的存在,这在很大程度上取决于相关过程的路径属性,所以我们将讨论一些重要的细节。通过在第4节中首次应用该理论,我们在纯策略中建立了均衡,并认为它们通常会产生协调问题。第5节通过在混合策略中构建子博弈完美均衡来解决这些问题,这是具有系统后动优势的博弈的第一步。虽然我们对均衡策略的表述可以很好地解释,但我们在第6节中为一个市场退出的例子推导出了一个完全明确的均衡。在第7节中,我们使用上述策略扩展来处理其t-mover优势,这使我们能够构造和描述任意对称计时博弈的子博弈性能均衡。最后,我们在第8节中确定了具有最大收益和最小可能优先购买权的均衡。第9节结束。附录包含一些技术结果和所有证据。2时机博弈我们使用子博弈完美均衡的框架,以及在Riedel和Steg(2017)中开发的混合策略,其中对本节中总结的概念进行了更详细的解释。在这里,我们只考虑对称博弈,它允许将一些简化合并到以下内容中。计时游戏由两个玩家i=1,2组成,每个玩家在连续时间t内决定何时停止∈ [0, ∞] (在t处停止=∞ 解释为“永不停止”)。关于世界状态的潜在不确定性由固定概率空间建模(Ohm, F,P),一个关于真实状态的部分信息,可以通过过滤(Ft)t随时间向外演化≥0

12
能者818 在职认证  发表于 2022-5-8 14:04:57
当然,玩家的停止决定可能会使用这些信息,因此玩家何时停止可能取决于状态(有关策略的正式定义,请参见第2.1节)。和往常一样,在计时游戏中,我们关注的是还没有玩家突破的情况(分别是历史)。因此,一旦有玩家停止,游戏就结束了。一个最先停止的球员被称为领导者;在这种情况下,另一个玩家成为跟随者。它们各自的收益由两个给定的随机过程L=(Lt)t确定≥0andF=(英尺)t≥0.这两个过程都包含了追随者在更原始的模型中可能具有的(最优的、偶然的)停止决策的可能影响,假设支持者已经停止,如例2.3所示。如果游戏结束时两个玩家同时停止,那么他们的支付由第三个给定过程M=(Mt)t决定≥0,分别为随机变量M∞如果没有球员在最后时间停下来。所有的支付都是用同一个数字来衡量的,比如说,贴现到时间零点,参与者是风险中性的。均衡显然是基于解决涉及三个潜在支付过程的最优停止问题。我们需要做出一些弱正则性假设,以便在以下方面有明确的问题。假设2.1。(一)(Ohm, F,P)是一个固定概率空间,带有过滤(Ft)t≥0满足通常条件(即正确的连续性和完整性)。(ii)过程L、F和M经过调整,是右连续的(a.s.),属于(D)类,andE[|M∞|] < ∞.(iii)min(L,F)从左上半连续,实际上在[0,∞] 如果我们把我∞:= F∞:= M∞.备注2.2。(i) 支付过程L、F和M不必是随机的;确定论只是一个特例。

13
nandehutu2022 在职认证  发表于 2022-5-8 14:05:01
即使如此,概率空间和过滤也可能是不平凡的,并且可能存在公共随机化设备。公共信息Ft应知道任何时候的当前支付。动态信息(Ft)识别的状态相关日期为停止时间τ:Ohm → [0, ∞], i、 例如,将{τ≤ t}∈ 每一次FTT∈ R+。它们对战略和结果至关重要。让T表示所有停止时间的集合。(ii)这取决于模型,如果两个参与者“永不停止”,是否存在自然回报,这可能是M或L的某个限制。在后一种情况下,我们只需设置M∞≡ L∞和我一起工作∞对于统一的支付符号。为方便起见,我们还正式定义∞:= M∞.(iii)两个重要的一般技术问题是可测量性,尤其是与策略有关的可测量性和可集成性。我们需要确保期望值总是被很好地定义,并且逐点收敛的随机变量也会在期望值中收敛。类(D)是我们能处理的最弱的可积性条件。对于许多应用(例如涉及布朗运动)来说,有界性太强了。或者,我们可以将支付过程解释为以折扣“UTIL”衡量。可测量过程(Xt)t≥如果族{Xτ|τ∈ T,τ<∞ a、 s}是一致可积的。然后,在停止时间τ<∞也意味着在L(P)中收敛。这是一个温和的规律性条件,例如,e[supt|Xt|]∞或supτE[|Xτ| p]<∞ 对于一些p>1的人来说。

14
mingdashike22 在职认证  发表于 2022-5-8 14:05:04
我们可以等效地定义任何X∞∈ L(P)并考虑前一组中的所有(也不确定)停止时间τ;例如,参见Riedel and Steg(2017)中的引理B.1。(iv)为了得到任何关于平衡的普遍存在性结果,Payo-ff过程的一些路径规律是必要的,即使在确定性的单因素情况下也可以清楚地看到这一点。然而,只有在预期的情况下,我们才有可能从左到上半连续。这也是最优停止问题的一个已知必要条件。当存在(本地)次动优势时,我们将其用于混合策略中的均衡。当然,只有在L不超过F的情况下才需要。实际上,人们可以将注意力限制在区间[τ,inf{t]上≥ τ| Lt>Ft}],其中τ是停止时间;面积{L>F} Ohm ×R+仅在过渡时相关。例如,如果L和F的路径从左侧开始是a.s.(上半)连续的,则该假设成立。例2.3。让我们考虑一个市场退出问题,作为一个具有后动优势的随机计时博弈的简单例子,即F≥ 五十、 就像经典的消耗战。假设两个企业在同一个市场上运营,根据不确定的外部条件,双寡头的回报率在长期内是不可持续的。通常情况下,公司希望对手离开市场,以获得单极优势πM≥ πD,等待可能的随机事件可能代价太高。

15
mingdashike22 在职认证  发表于 2022-5-8 14:05:07
每个MTHU决定等待不再有希望的时间,以及如果另一个MTHU仍然存在,在什么时候离开市场。然后通过t=Mt:=ZtπDsds,Ft:=Lt+ess supτF给出支付过程∈T:τF≥tEZτFtπMsds英尺(2.1)每t∈ [0, ∞], 考虑到垄断者也可能在停止时间τF退出∈ T(参见备注2.2(i))时,即使是在opoly上的m回报也不可预测,因此立即退出是主要的,而后动优势并不严格。然而,我们不会对单个剩余公司的战略进行明确建模,而是将相应的最佳决策纳入支付流程;子博弈的完美性要求对后者进行最佳选择。假设2.1通过本例得到满足,前提是π和πMare进行了调整,且Pdt是可积的,因为所有过程都有一个可积随机变量的界。公约F∞=M∞= L∞这是自然的。根据我们在第3.1节中的讨论,存在一个右连续过程F,即使用一般停止时间τ代替t,关系式(2.1)仍然成立,这是从左边开始的连续时间eUpper半连续的最重要结果之一,期望值为E[Lτ∧ Fτ]≥ lim supnE[Lτn∧ Fτn]对于任何停止时间序列(τn)n∈n等于a.s.增加到停止时间τ。然后是lim supst(Ls∧ (财政司司长)≤ (lim supstLs)∧ (lim supstFs)≤ 书信电报∧ 全速飞行∈ [0, ∞] a、 我们注意到L和F属于(D)类。有关抢占类型的相关示例,请参见Steg(2018)。停止理论。此外,Fτ确实与最优跟随者停止决策τF一致*∈ T,τF*≥ τ ; 另请参见第6.2.1节“混合策略和均衡”中对更具体情况的讨论。我们在Riedel和Steg(2017)中开发的随机计时博弈中使用了以下亚博弈完美均衡的概念。

16
可人4 在职认证  发表于 2022-5-8 14:05:10
和往常一样,计时游戏的基本目标是为每个玩家制定移动计划,分别是。停止,只要没有其他玩家在此之前停止,就会跟随停止。因此,首先停止的玩家是那些计划时间最短的玩家,然后根据给定流程的规定产生报酬,这取决于哪些玩家的计划最短。可行的状态或有计划是一个停止时间τ,其集合由T表示(见备注2.2(i))。这些时间可通过动态信息(Ft)识别,因此也构成了修改计划时可行的连续时间决策节点。为了描述路径的行为,每一个停止时间都被认为是子游戏的开始,意味着没有玩家已经停止。在这个角色中,它们通常用θ表示∈ T在任何su B游戏中,玩家都可以通过指定分配函数Gθion[θ,∞] 这可能仍然会影响到州政府(英尺)。“纯”计划τ≥ θ则对应于Gθi(t)=1{t≥τ}. 不同子游戏的计划必须是时间一致的;特别是,不同起始日期的随机计划必须尽可能诱导相同的条件超越概率。对于具有先发优势的子游戏,需要添加传统策略扩展,以便在连续时间内适当地进行tomodel抢占。正如在Fudenberg和Tirole(1985)中,玩家还可以在每个点t上放置一个“原子”αθi(t)——一种条件停止概率∈ [0, ∞], 其目的是从离散时间中获取有限的结果。这些扩展包含在以下形式定义中,尽管我们在讨论具有后发优势的游戏时会忽略它们,只在以后的一般游戏中使用它们。定义2.4。

17
kedemingshi 在职认证  发表于 2022-5-8 14:05:13
玩家i的扩展混合策略∈ 在从θ开始的子游戏中{1,2}∈ T是一对过程(Gθi,αθi),既取[0,1]中的值,又满足以下条件。如果领导者的报酬也取决于追随者最终选择的停止时间,则这个问题对L来说更为微妙,就像在进入模型中一样;见Steg(2018)。跟随者决策的最佳性意味着(预期)结果支付过程的正确连续性,但对领导者而言并非如此,因为跟随者的决策通常与领导者的支付流无关(最佳停止)。然而,这种问题通常不会出现在扩散模型中。参见Laraki等人(2005年)或Fudenberg和Tirole(1985年),他们称这些计划为“简单策略”只考虑确定性时间t∈ R+及其子游戏开始时的信息结构通常是不完整的,因为停止时间θ∈ T及其信息结构Fθ={A∈F|T∈ R+:A∩ {θ ≤ t}∈ Ft可以(动态地)被(Ft)识别,但在不连续的时间内形成一个更丰富的系统。参见Hendricks和Wilson(1992)关于确定性抢占博弈的均衡存在问题。关于确定性情况下的实际极限分析,请参见Steg(2017)。财产。(i) Gθiis改编。它是a.s.不减损的,右连续的,满足Gθi(t)=0的所有t<。(ii)αθi逐渐可测量。它在所有t中都是a.s.连续的∈ 其中αθi(t)<1,且满足αθi(t)=0的所有t<。(iii)αθi(t)>0=> Gθi(t)=1代表所有t≥ 0,a.s.对于每个扩展的混合策略,也定义Gθi(0-) ≡ 0,Gθi(∞) ≡ 1和αθi(∞) ≡ 1.如果αθi(t)=0表示所有t,我们称之为“标准”混合策略∈ R+,即αθi≡ α∞i、 以下限制此类策略相当于仅定义具有给定属性且完全没有扩展的混合策略。

18
mingdashike22 在职认证  发表于 2022-5-8 14:05:17
如果进一步Gθi(t)=1{t≥τ} 一段时间τ∈ T,则相应的策略称为“纯”对于一对纯策略,对应于停止时间τi,τj≥ θ,玩家i在θ的预期报酬将是{τi<τj}Lτi+1{τi>τj}Fτj+1{τi=τj}MτiFθi.这是线性扩展到混合策略。定义2.5。给定两个扩展的混合策略(Gθi,αθi),(Gθj,αθj),i,j∈ {1,2},i6=j,从θ开始的子游戏中玩家i的支付∈ T isVθiGθi,αθi,Gθj,αθj:= EZ[0,^τθ)1.- θj(s)LsdGθi(s)+Z[0,^τθ)1.- θi(s)FsdGθj(s)+Xs∈[0,^τθ)θi(s)Gθj(s)Ms+λθL,iL^τθ+λθL,jF^τθ+λθMM^τθFθ,式中^τθ:=inf{t≥ θ|αθ(t)+αθ(t)>0}和λθL,i,λθL,jandλθMare是最终结果概率(球员i或j分别成为领先者或同时停止)由αθi、αθjat^τθ诱导,并在附录C中定义。扩展的结果概率和u p到(1- Gθi(^τθ)-))(1 - Gθj(^τθ)-)),使用前无人停车的概率。附录C中的定义简化了Riedel和Steg(2017)中的定义,因为其规律性稍强。如果两者都正常,则受限映射αθi:Ohm ×[0,T]→ R必须是FT B([0,T])-可测量任何T∈ R+。这是一个比适应性更强的条件,但比可选性弱,我们自动放弃了右连续性。渐进可测性意味着αθi(τ)对于任何τ都是Fτ-可测的∈ T由于我们这里只对对称博弈感兴趣,我们可能会要求αi(·)是右连续的,因为它的值为零,这简化了结果的定义。

19
kedemingshi 在职认证  发表于 2022-5-8 14:05:19
参见Riedel和Steg(2017),了解不对称博弈和相应较弱规则性限制的问题。玩家使用标准的混合策略,尤其是当他们为t=∞ , 那么^τθ=∞, λθL,i=λθL,j=0,相关的支付部分为(1- θi(∞-))(1 - Gθj(∞-))M∞.路径积分包括右连续积分器在零处的可能跳跃,因为玩家i确实可以从Gθi(Gθj)的初始跳跃变成领导者(跟随者)。假设2。1.确保薪酬在预期范围内得到明确界定;参见引理A.1。对于整个游戏的一致动态视图,不同子游戏策略在任何固定时间的条件停止概率必须尽可能相同。定义2.6。一种时间一致的扩展混合策略∈ 在计时游戏中,{1,2}是一个家庭((Gθi,αθi);θ ∈ T)所有子对策的扩展混合策略,例如对于所有θ,θ′,τ∈ T与θ≤ θ′≤ τ它认为(a.s.)Gθi(t)=Gθi(θ′)-) +1.- Gθi(θ′)-)Gθi(t)代表所有t≥ θ′和αθi(τ)=αθ′i(τ)。时间一致性意味着,对于任何两个子游戏。从θ,θ′开始∈ T indeedGθi≡ Gθi(a.s.)在事件{θ=θ′}上,正如预期的那样。定义2.7。子博弈完美均衡是一对时间一致的扩展混合策略(Gθ,αθ);θ ∈ (Gθ,αθ);θ ∈ T)使所有人θ∈ T,i,j∈ {1,2},i6=j,以及子对策在θ的扩展混合策略(Gθa,αθa),它认为vθiGθi,αθi,Gθj,αθj≥ VθiGθa,αθa,Gθj,αθja、 也就是说,每一对(Gθ,αθ),(Gθ,αθ)都是子博弈中的平衡点∈ T.3定义2.5中的最佳回报和最佳停止在策略上是线性的。在这一节中,我们推导出了更明确的线性表示,这将非常有助于严格的平衡验证和必要性论证。

20
nandehutu2022 在职认证  发表于 2022-5-8 14:05:23
为了构造或验证任何最佳回复,通常需要针对此类对象最大化过度(扩展)混合策略。在这里,我们做出了相关的声明,比如“支持混合策略的任何停止时间都需要是最优的”。我们进一步介绍了最优停止理论中的核心概念,尤其是斯内尔-恩韦洛普,它将在均衡m中混合策略的以下表示和解释中发挥关键作用。以下论点涉及分布Gθi,因此,我们专注于“标准”混合策略,忽略符号简单性的扩展αθiF,直到第7节(这并没有削弱我们的平衡概念,如引理3.1所示)。对于从977;开始的ubgame中玩家i的支付的替代表示∈ T,我们引入过程Sθigiven bySθi(T):=Z[0,T)FsdGθj(S)+Gθj(t)Mt+1.- Gθj(t)Lt(3.1)适用于所有t∈ [0, ∞), 其中,Gθjis来自于给定的对手混合策略。引理A.2表明Sθ表现良好:与L、F和M一样,它是可选的(因此特别适用),属于类(D),但不一定是右连续的。考虑到我∞∈ L(P),我们可以将Sθiin(3.1)的定义扩展到t=∞, 也意味着Sθi(∞) ∈ L(P)。Sθimay现在可以被dGθithanks整合到引理A.1中,这样一来,玩家i的预期收益为θ∈ 一对标准混合策略的T可以写成VθiGθi,Gθj= EZ[0,∞]Sθi(t)dGθi(t)Fθ. (3.2)(3.2)中的线性表明,当且仅当存在纯回复时,存在最佳回复。引理3.1。对任何人来说θ∈ T和标准混合策略Gθi,Gθjinθi,Vθi的子博弈Gθi,Gθj≤ ess supτ∈T:τ≥θESθi(τ)Fθa、 s.,(3.3)具有等式if且仅当a.e.x∈ [0,1),右侧由停止时间τG,θi(x):=inf{t获得≥ θGθi(t)>x}。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 10:16