楼主: 能者818
1886 50

[量化金融] 模型模糊下的最优停止:时间一致性均衡 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-24 01:53:30
当贴现率r>0时,代理人希望最大化eep[e-rτg(Bτ)],通过选择适当的τ∈ T,以不确定度P为准∈ 当前状态x下的P(x)∈ 这种停车问题已经被大量研究过,但几乎总是在最坏(或最好)的情况下。在当前的环境中,文献的重点是发现τ*∈ 最大化最坏情况(或最佳情况)值的T,即infP∈P(x)EP【e】-rτg(Bτ)]或支持∈P(x)EP【e】-rτg(Bτ)]。(2.4)引言中有大量参考文献。然而,实际决策要比最坏情况(或最佳情况)分析复杂得多。(2.4)中缺少的是代理对歧义的态度:即使感知到相同的歧义P(x),不同的代理可能有不同程度的歧义厌恶。正如Curley和Yates(1989年)以及Heath和T versky(1991年)的经验所表明的那样,个人之间的模糊态度是异质的:一些人的模糊性比其他人在各种情况下的模糊性要小得多。为了适应模糊态度,Ghir ardato et al.(2004)和Kliban o off et al.(2005)开发了效用最大化的一般模型。特别是,α-maxmin偏好是通用模型的一个流行而简单的版本,它规定,在当前状态x∈ Rd,代理最大化αinfP∈P(x)EP【e】-rτg(Bτ)]+(1- α) 支持∈P(x)EP【e】-rτg(Bτ)],(2.5),其中α∈ [0,1]是一个给定常数,反映了代理的模糊厌恶程度。这里,模糊度和模糊态度分别由P(x)和α捕获。情况α=1(分别α=0)对应于标准的最坏情况(分别最佳情况)问题,反映了极端偏差到(分别渴望)歧义。

12
何人来此 在职认证  发表于 2022-6-24 01:53:33
本文的范围是研究这两个极端之间的差异停止行为,即对于任何α∈ [0, 1].解决问题时supτ∈TαinfP∈P(x)EP【e】-rτg(Bτ)]+(1- α) 支持∈P(x)EP【e】-rτg(Bτ)], (2.6)出现了时间不一致的问题:我们今天发现的最优策略在未来可能不再是最优的。具体而言,假设最佳停止时间eτx∈ 对于(2.6)存在T,对于allx∈ Rd.如果对于任何x,p问题(2.6)被认为是时间一致的∈ RDT和t≥ 0,eτx(ω)=ω的t+eτBt(ω)∈ {τ ≥ t} P-a.s。,P∈ P(x)。(2.7)如果上述条件不能成立,(2.6)被称为时间不一致。关键条件时间一致性取决于条件期望的塔特性。在最坏情况(或最佳情况)的情况下,Epstein和Schneider(2003)表明,如果先验集合是矩形的,即在条件作用下闭合且s表下播,则时间一致性成立。类似的条件在数学金融文献中普遍存在;参见Nutz和van Handel(2013),Bay raktar和Yao(2014),Ekren等人(2014),以及Nutz和Zhang(2015)。这些工作中的技术努力确保了(2.4)形式的非线性条件期望的某些塔特性,从而实现了时间一致性。相比之下,时间不一致性是(2.6)中固有的。即使先验集合是矩形的,α-maxmin目标也不能保持时间一致性。Schr¨oder(2011)第7节中的最优停止问题以及Beissner、Lin和Riedel(2016)第2节中的简单两阶段模型详细说明了这一点。备注2.1。当先验集合被支配时(即,存在一个参考测度P,使得Q<< P对于每个先验Q),可以通过熵惩罚项(“文献中的最小惩罚”)来建模歧义规避。如Bayraktar等人所述。

13
何人来此 在职认证  发表于 2022-6-24 01:53:36
(2010),每个周期Q下的预期收益会被其与P的距离所惩罚,由此产生的鲁棒最优停止问题仍然是时间一致的。我们的框架在两个方面与此不同。从技术上讲,我们不要求先验集合处于支配地位,从而允许更一般形式的模型模糊性,例如波动率不确定性(在此情况下,先验可以是相互独立的)。从经济上讲,熵惩罚假设(i)一个代理人已经有一个特定的信念(参考度量值P)和(ii)他是模糊厌恶者,因此在4月Q下的预期收益是由Q与他的信念P的差异来加权的。本文既不假设(i)也不假设(ii)。通过α-maxmin目标,我们涵盖了广泛的歧义态度,从极端的歧义厌恶(α=1)到纯粹的歧义爱好(α=0),无需特定的信任。为了处理时间的不一致性,我们遵循Strotz(1955)提出的一致性计划:onetakes考虑到他未来自我的潜在不服从,并选择最好的当前行动来回应这一点。如果每个未来的自我都会以同样的方式进行推理,那么由此产生的策略将是一个(子博弈完美)均衡,未来的自我没有动机偏离这个均衡。如何准确地制定和定位这些战略一直是一个长期的挑战。在时间不一致停止的背景下,Huang和Nguyen Huu(2018)开发了一种通用的迭代方法:平衡策略,作为算子的固定点,可以通过固定点迭代方便地找到。它已成功应用于非指数统计(Huang and Nguyen Huu(2018),Huang and Zhou(2019,2020))和概率失真(Huang,Nguyen Huu and Zhou(2020))下的最优停车。

14
大多数88 在职认证  发表于 2022-6-24 01:53:39
现在,我们将进一步扩展这种迭代方法,以考虑模型歧义和歧义态度。2.2一致性规划由于(2.3)中的时间齐次马尔可夫设置,我们假设一个代理决定停止或继续,具体取决于其当前状态x∈ 也就是说,代理选择一些R∈ U(Rd),并在τR:=inf{t时刻停止≥ 0:Bt∈ R} 。(2.8)这与博弈论中的纯策略相对应。虽然这里也可以考虑混合策略,但我们将把它留给未来的研究。为方便起见,我们通常会打电话给R∈ U(Rd)本文其余部分中的停止策略。值得注意的是,我们并不局限于制定可衡量的政策,而是允许制定普遍可衡量的政策。这种通用性对于我们的后续定点公式(2.20)至关重要;详细说明见下文第2.3.1节。为了执行Strotz(1955)提出的一致规划,我们遵循Huang和Zhou(2020)第2.1节中的博弈论公式(符合Huang和Nguyen Huu(2018)第3.1节)。假设代理最初计划使用R∈ U(Rd)作为他的停止策略。给定当前状态x∈ 代理进行博弈论推理:“假设我未来的所有自我都会跟随R∈ U(Rd),针对这一点,今天最好的停车策略是什么?”今天的代理只有两种可能的操作:停止和继续。如果他停下来,黑格尔马上就得到g(x);如果他继续,考虑到他所有的未来都会跟随R∈ U(Rd),他最终会在ρR:=inf{t>0:Bt的时刻停止∈ R} 。(2.9)考虑到代理人的模糊态度以α为特征∈ [0,1],这导致α-最大预期payoff J(x,R):=αinfP∈P(x)EP【e】-rρRg(Bρr)]+(1- α) 支持∈P(x)EP【e】-rρRg(Bρr)]。(2.10)备注2.2。事实“ρR∈ T”可以用引理2.1中相同的方法证明。

15
大多数88 在职认证  发表于 2022-6-24 01:53:43
注意τ和ρR之间的细微差别:前者涉及“t≥ 0“,而后者“t>0”。在(2.10)中,哮喘是指在x∈ Rdchooses to continue(无论x是否∈ R) ,影响的停止时间是ρR,而不是τR。在(2.10)中,我们允许ρRto取值∞: 如果ρR(ω)=∞, 我们需要-rρRg(Bρr)(ω):=极限支持→∞e-rtg(Bt)(ω)。(2.11)这符合Karatzas和S hreve(1998)的附录D。为了找到今天的最佳停车政策,以应对R∈ U(Rd),代理只是比较g(x)和J(x,R)的支付。这导致Θ(R):=SR∪ (IR∩ R) ,(2.12)其中我们定义:={x∈ Rd:g(x)>J(x,R)},IR:={x∈ Rd:g(x)=J(x,R)},CR:={x∈ Rd:g(x)<J(x,R)}。(2.13)这里,SR、IR和CRare分别称为停止区、差异区和连续区。特别是在IR上,代理在停止和继续之间是不同的,因为它们产生相同的回报。因此,代理人没有动机偏离最初的排名策略R∈ U(Rd)。这就产生了IR一词∩ R英寸(2.12)。有兴趣确定th是否为新区域Θ(R) Rd,从原始Topping策略R获得∈ U(Rd)也是一种停止策略,即Θ(R)∈ U(Rd)。如果这是真的,它将促进下面(2.20)中的定点公式。鉴于(2.13),Θ(R)是否属于toU(Rd)取决于x 7的可测性→ J(x,R),现在将对其进行研究。2.3可测性首先,我们证明了τR∈ U(Rd)是一个定义明确的停车时间。请注意,此结果与标准首次发布的eorem不同;见下文备注2.3。引理2.1。对于任何R∈ U(Rd),τRin(2.8)属于T。证据对于每个固定版本≥ 0, ω 7→ Bs(ω)定义为可测量的FBs。

16
nandehutu2022 在职认证  发表于 2022-6-24 01:53:45
由于Bertsekas和Shreve(1978)的(2.1)和推论7.44.1,我们得到了∈ U(Rd)表示(Bs)-1(A)∈ U型(Ohms) =Fs FPS适用于所有P∈ P(Ohm), (2.14)式(2.2)中的等式。固定t>0,通过B的右连续性,我们可以构造一系列离散化过程{B(n)}n,如Karatzas和Shreve(1991)的命题1.1.13所示∈N、 满足B(N)s(ω)→ Bs(ω)表示所有(s,ω)∈ [0,t]×Ohm. 对于每个P∈ P(Ohm), 利用(2.14),构造了映射(s,ω)7→ B(n)s(ω)来自([0,t]×Ohm, 对于所有n,B([0,t])×FPt)到(Rd,U(Rd))是可测量的∈ N、 作为N→ ∞ , 我们得出结论,映射(s,ω)7→ Bs(ω),再次从([0,t]×开始Ohm , B([0,t])×FPt)到(Rd,U(Rd)),也是可测量的。给定R∈ U(Rd),则Γt:={(s,ω)∈ [0,t)×Ohm : Bs(ω)∈ R}∈ B([0,t])×FPt,t型≥ 0和P∈ P(Ohm). (2.15)现在,对于每个P∈ P(Ohm), 由于Revuz and Yor(1999)和(2.15)的定理I.4.14,我们得到了{τR<t}=p rojOhm(Γt)∈ FPt,适用于所有t≥ 因此,{τR<t}∈TP∈P(Ohm)FPt=Ft,对于所有t≥ 0.AsF=(Ft)t≥0is按构造右连续,τRis为F-停止时间,即τR∈ T备注2.3。如果我们有R∈ B(Rd),τR∈ T将直接遵循首个定理(见Revuz和Yor(1999)中的定理I.4.15或Bass(2010)中的定理2.1)。事实上,理论会证明≥ 0,{τR≤ t}∈ FPT所有P∈ P(Ohm), 很容易产生τR∈ T很明显,德布特定理要求{(s,ω):Bs(ω)的渐进可测性∈ R} ,我。e、 {(s,ω):0≤ s≤ t、 Bs(ω)∈ R}∈ B([0,t])×Ft,t型≥ 0。对于R来说,这很简单∈ B(Rd)(通过B是逐步可测量的事实),但对于R是有疑问的∈ U(Rd)。引理2.1在不使用首秀定理的情况下证明了τR∈ T一般用于所有R∈ U(Rd)。Huang g和Zhou(2020)的第2.1节中也有类似的公式。备注2.4。τR有两个相关但不同的“Borel可测性”:1。

17
mingdashike22 在职认证  发表于 2022-6-24 01:53:48
τRis是一个Borel可测的随机变量,即。{τR≤ t}∈ FB公司∞对于所有t≥ 0.2. τRis an(FBt)-停止时间,i。e、 {τR≤ t}∈ 所有t的FBT≥ 0.对于R∈ B(Rd),τRis始终是一个Borel可测量的随机变量,这要归功于Galmarino的检验(参见Revuz和Yor(1999)中的第46页练习4.21)。然而,当R打开时,对于持续时间,τRis不一定是(FBt)停止时间;见第43页,第4.6条提案,以及下面在列维乌兹和约尔(1999)中的讨论。一般来说,τR,即使有R∈ B(Rd),仅已知为an(Ft)-停止时间(即τR∈ T),如备注2.3所示。接下来,我们研究x 7的可测性→ J(x,R)。下面证明的关键是使用了非标准的可测投影定理(即下面的定理5.1),它不需要像所有经典投影定理那样的eBorel结构。第5节将专门讨论这个新的可测投影定理的推导。引理2.2。假设{(x,P(x)):x∈ Rd} Rd×P(Ohm) 是普遍可测的,g:Rd→ Ris普遍可测量。对于任何R∈ U(Rd),功能X 7→ infP公司∈P(x)EP【e】-rρRg(Bρr)]和x 7→ 支持∈P(x)EP【e】-rρRg(Bρr)](2.16)是普遍可测量的。因此,x 7→ (2.10)中的J(x,R)是普遍可测的。证据根据引理2.1,g的普遍可测性,以及Bertsekas和Shreve(1978)的命题7.44,函数e-rρRg(Bρr),映射Ohm 对于R,是普遍可测量的。下面是f(P):=EP[e-rρRg(Bρr)],视为P的映射(Ohm) 由于Bertsekas和Shreve(1978)的Corollary 7.46.1,R是普遍可测量的。对于任何K∈ R、 这意味着NP∈ P(Ohm) : EP[e-rρRg(Bρr)]<Ko(2.17)是普遍可测的。因此,A:=(x,P(x)):x∈ 研发部∩Rd×nP∈ P(Ohm) : EP[e-rρRg(Bρr)]<Ko(2.18)是普遍可测量的,因为假设(x,P(x)):x∈ 研发部是普遍可测量的。

18
kedemingshi 在职认证  发表于 2022-6-24 01:53:51
现在,请注意x个∈ Rd:infP∈P(x)EP【e】-rρRg(Bρr)]<K= projRd(A),(2.19),由于广义可测投影结果定理5.1,在Rd中普遍可测。因此,我们得出结论x 7→ infP公司∈P(x)EP【e】-rρRg(Bρr)]是普遍可测的。通过类似的论证和一个普遍可测集的补码是普遍可测的事实,我们得到了x 7→ 支持∈P(x)EP【e】-rρRg(Bρr)]也是普遍可测的。因此,根据(2.10)中的定义,x 7→ J(x,R)是不可测的。备注2.5。带R∈ U(Rd),经典的可测投影定理(参见Crauel(2002)的定理2.12或Castaing和Valadier(1977)的定理III.23)不能用于上述证明:应用这些定理需要(2.17)中se t的Borel可测性,这通常只能是完全可测的。定理5.1开始发挥作用:它获得了与经典定理相同的投影结果,但不需要Borel可测性。现在可以确定,每当R∈ U(Rd)。提案2.1。假设{(x,P(x)):x∈ Rd} Rd×P(Ohm) 是普遍可测量的→ R是普遍可测量的。那么,对于任何R∈ U(Rd),Θ(R)∈ U(Rd)。证据同于x 7→ J(x,R)是普遍可测的(引理2.2),g也是不可测的,SR、IR和CR(定义见(2.13))都属于U(Rd)。因此,Θ(R)=SR∪ (IR∩ R)∈ U(Rd)。2.3.1关于使用单一可测量停车政策的讨论我们选择使用停车政策R∈ U(Rd),而不是R∈ B(Rd),现在可以清楚地解释。鉴于命题2.1,(2.12)中定义的Θ是作用于U(Rd)的操作符,即Θ:U(Rd)→ U(Rd)。

19
mingdashike22 在职认证  发表于 2022-6-24 01:53:54
这是一个理想的特性:它有助于定义下面的平衡指数2.1,以及(2.20)中的定点迭代。如果我们与R合作∈ B(Rd),Θ(R)不一定是真的∈ B(Rd),即B(Rd)在操作员Θ下未关闭。具体而言,当我们关注R∈ B(Rd),引理2.2可以修改如下。假设{(x,P(x)):x∈ Rd} Rd×P(Ohm) Borel是否可测量,以及g:Rd→ R是Borel测量值。由于τRis现在是一个Borel可测的随机变量(见备注2.4),我们在引理2.2的证明中认为f(P):=EP[e-rρRg(Bρr)]是Borel可测的,这是Bertsekas和ShrEve(1978)的k sto推论7.29.1。因此,(2.17)中的s et现在是可钻孔测量的,而(2.18)中的集合A也是可钻孔测量的。有了A的这种增强的可测性(来自universalto Borel),我们可以应用经典的可测投影定理(参见Crauel(2002)的定理2.12或Castaing和Valadier(1977)的定理III.23),得出projRd(A)是普遍可测的,不需要广义投影结果定理5.1。然而,请注意,即使A现在是Borel,Projrd(A)也只能普遍测量。这反映了一个普遍的事实,即Borel可测集的投影不必是Borel可测的;见Bertsekas和Shreve(1978)第7.6节。(2.19)中的projRd(A)和(2.16)和x 7中的映射的通用性→ J(x,R)),集SR,IR,CR,因此Θ(R),通常仅是完全可测的。也就是说,用R∈ B(Rd),Θ(R)∈ 不保证B(Rd)。备注2.6。R的需要∈ 如上所述,U(Rd)是由模型模糊引起的。事实上,在没有歧义的情况下(即对于所有x∈ Rd,P(x)={Px}对于某些Px∈ P(Ohm)), (2.10)减小到j(x,R)=EPx[e-rρRg(Bρr)],其中B是(Px)x下的强马尔可夫∈Rd;召回(2.3)。

20
nandehutu2022 在职认证  发表于 2022-6-24 01:53:57
只要gis Borel可测量,x 7→ J(x,R)是对所有R可测量的Borel∈ B(Rd)。现在,随着可测量性越来越大(无需任何投影),人们可以只关注R∈ B(Rd)。2.4问题公式根据命题2.1,可以将(2.12)中定义的Θ视为作用于U(Rd)的操作符,即Θ:U(Rd)→ U(Rd)。然后将平衡定义为操作员的固定点。定义2.1。R∈ 如果Θ(R)=R,则称U(Rd)为平衡。我们用E表示所有平衡的集合。备注2.7(平衡的存在)。整个空间是平衡的。的确,对于anyx∈ Rd,ρRd=0,因此J(x,Rd)=g(x)。这意味着IRd=Rd,因此Θ(Rd)=Rd。找到平衡点(而不是整个空间Rd)的一般方法是执行定点迭代:从任意R开始∈ U(Rd),并对其重复施加Θ,直到达到平衡。也就是说,我们*:= 画→∞Θn(R)(2.20)作为候选平衡。为了使这一固定点方法更加严格,需要回答两个重要问题:(i)我们如何理解(2.20)中的限制,并进一步证明R*是否定义明确?(2.20)的右侧涉及Rd中的一系列集合,这些集合的收敛性很复杂,并且没有标准定义。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-4-28 09:42