模型模糊下的最优停止：时间一致性均衡 - 第2页 - 外文文献专区

11楼

发表于 2022-6-24 01:53:30

当贴现率r＞0时，代理人希望最大化eep[e-rτg（Bτ）]，通过选择适当的τ∈ T，以不确定度P为准∈ 当前状态x下的P（x）∈ 这种停车问题已经被大量研究过，但几乎总是在最坏（或最好）的情况下。在当前的环境中，文献的重点是发现τ*∈ 最大化最坏情况（或最佳情况）值的T，即infP∈P（x）EP【e】-rτg（Bτ）]或支持∈P（x）EP【e】-rτg（Bτ）]。（2.4）引言中有大量参考文献。然而，实际决策要比最坏情况（或最佳情况）分析复杂得多。（2.4）中缺少的是代理对歧义的态度：即使感知到相同的歧义P（x），不同的代理可能有不同程度的歧义厌恶。正如Curley和Yates（1989年）以及Heath和T versky（1991年）的经验所表明的那样，个人之间的模糊态度是异质的：一些人的模糊性比其他人在各种情况下的模糊性要小得多。为了适应模糊态度，Ghir ardato et al.（2004）和Kliban o off et al.（2005）开发了效用最大化的一般模型。特别是，α-maxmin偏好是通用模型的一个流行而简单的版本，它规定，在当前状态x∈ Rd，代理最大化αinfP∈P（x）EP【e】-rτg（Bτ）]+（1- α）支持∈P（x）EP【e】-rτg（Bτ）]，（2.5），其中α∈ [0，1]是一个给定常数，反映了代理的模糊厌恶程度。这里，模糊度和模糊态度分别由P（x）和α捕获。情况α=1（分别α=0）对应于标准的最坏情况（分别最佳情况）问题，反映了极端偏差到（分别渴望）歧义。

12楼

何人来此

发表于 2022-6-24 01:53:33

本文的范围是研究这两个极端之间的差异停止行为，即对于任何α∈ [0, 1].解决问题时supτ∈TαinfP∈P（x）EP【e】-rτg（Bτ）]+（1- α）支持∈P（x）EP【e】-rτg（Bτ）], （2.6）出现了时间不一致的问题：我们今天发现的最优策略在未来可能不再是最优的。具体而言，假设最佳停止时间eτx∈ 对于（2.6）存在T，对于allx∈ Rd.如果对于任何x，p问题（2.6）被认为是时间一致的∈ RDT和t≥ 0，eτx（ω）=ω的t+eτBt（ω）∈ {τ ≥ t} P-a.s。，P∈ P（x）。（2.7）如果上述条件不能成立，（2.6）被称为时间不一致。关键条件时间一致性取决于条件期望的塔特性。在最坏情况（或最佳情况）的情况下，Epstein和Schneider（2003）表明，如果先验集合是矩形的，即在条件作用下闭合且s表下播，则时间一致性成立。类似的条件在数学金融文献中普遍存在；参见Nutz和van Handel（2013），Bay raktar和Yao（2014），Ekren等人（2014），以及Nutz和Zhang（2015）。这些工作中的技术努力确保了（2.4）形式的非线性条件期望的某些塔特性，从而实现了时间一致性。相比之下，时间不一致性是（2.6）中固有的。即使先验集合是矩形的，α-maxmin目标也不能保持时间一致性。Schr¨oder（2011）第7节中的最优停止问题以及Beissner、Lin和Riedel（2016）第2节中的简单两阶段模型详细说明了这一点。备注2.1。当先验集合被支配时（即，存在一个参考测度P，使得Q<< P对于每个先验Q），可以通过熵惩罚项（“文献中的最小惩罚”）来建模歧义规避。如Bayraktar等人所述。

13楼

何人来此

发表于 2022-6-24 01:53:36

（2010），每个周期Q下的预期收益会被其与P的距离所惩罚，由此产生的鲁棒最优停止问题仍然是时间一致的。我们的框架在两个方面与此不同。从技术上讲，我们不要求先验集合处于支配地位，从而允许更一般形式的模型模糊性，例如波动率不确定性（在此情况下，先验可以是相互独立的）。从经济上讲，熵惩罚假设（i）一个代理人已经有一个特定的信念（参考度量值P）和（ii）他是模糊厌恶者，因此在4月Q下的预期收益是由Q与他的信念P的差异来加权的。本文既不假设（i）也不假设（ii）。通过α-maxmin目标，我们涵盖了广泛的歧义态度，从极端的歧义厌恶（α=1）到纯粹的歧义爱好（α=0），无需特定的信任。为了处理时间的不一致性，我们遵循Strotz（1955）提出的一致性计划：onetakes考虑到他未来自我的潜在不服从，并选择最好的当前行动来回应这一点。如果每个未来的自我都会以同样的方式进行推理，那么由此产生的策略将是一个（子博弈完美）均衡，未来的自我没有动机偏离这个均衡。如何准确地制定和定位这些战略一直是一个长期的挑战。在时间不一致停止的背景下，Huang和Nguyen Huu（2018）开发了一种通用的迭代方法：平衡策略，作为算子的固定点，可以通过固定点迭代方便地找到。它已成功应用于非指数统计（Huang and Nguyen Huu（2018），Huang and Zhou（2019，2020））和概率失真（Huang，Nguyen Huu and Zhou（2020））下的最优停车。

14楼

大多数88

发表于 2022-6-24 01:53:39

现在，我们将进一步扩展这种迭代方法，以考虑模型歧义和歧义态度。2.2一致性规划由于（2.3）中的时间齐次马尔可夫设置，我们假设一个代理决定停止或继续，具体取决于其当前状态x∈ 也就是说，代理选择一些R∈ U（Rd），并在τR：=inf{t时刻停止≥ 0：Bt∈ R} 。（2.8）这与博弈论中的纯策略相对应。虽然这里也可以考虑混合策略，但我们将把它留给未来的研究。为方便起见，我们通常会打电话给R∈ U（Rd）本文其余部分中的停止策略。值得注意的是，我们并不局限于制定可衡量的政策，而是允许制定普遍可衡量的政策。这种通用性对于我们的后续定点公式（2.20）至关重要；详细说明见下文第2.3.1节。为了执行Strotz（1955）提出的一致规划，我们遵循Huang和Zhou（2020）第2.1节中的博弈论公式（符合Huang和Nguyen Huu（2018）第3.1节）。假设代理最初计划使用R∈ U（Rd）作为他的停止策略。给定当前状态x∈ 代理进行博弈论推理：“假设我未来的所有自我都会跟随R∈ U（Rd），针对这一点，今天最好的停车策略是什么？”今天的代理只有两种可能的操作：停止和继续。如果他停下来，黑格尔马上就得到g（x）；如果他继续，考虑到他所有的未来都会跟随R∈ U（Rd），他最终会在ρR：=inf{t>0:Bt的时刻停止∈ R} 。（2.9）考虑到代理人的模糊态度以α为特征∈ [0，1]，这导致α-最大预期payoff J（x，R）：=αinfP∈P（x）EP【e】-rρRg（Bρr）]+（1- α）支持∈P（x）EP【e】-rρRg（Bρr）]。（2.10）备注2.2。事实“ρR∈ T”可以用引理2.1中相同的方法证明。

15楼

大多数88

发表于 2022-6-24 01:53:43

注意τ和ρR之间的细微差别：前者涉及“t≥ 0“，而后者“t>0”。在（2.10）中，哮喘是指在x∈ Rdchooses to continue（无论x是否∈ R），影响的停止时间是ρR，而不是τR。在（2.10）中，我们允许ρRto取值∞: 如果ρR（ω）=∞, 我们需要-rρRg（Bρr）（ω）：=极限支持→∞e-rtg（Bt）（ω）。（2.11）这符合Karatzas和S hreve（1998）的附录D。为了找到今天的最佳停车政策，以应对R∈ U（Rd），代理只是比较g（x）和J（x，R）的支付。这导致Θ（R）：=SR∪ （IR∩ R），（2.12）其中我们定义：={x∈ Rd:g（x）>J（x，R）}，IR：={x∈ Rd:g（x）=J（x，R）}，CR：={x∈ Rd:g（x）<J（x，R）}。（2.13）这里，SR、IR和CRare分别称为停止区、差异区和连续区。特别是在IR上，代理在停止和继续之间是不同的，因为它们产生相同的回报。因此，代理人没有动机偏离最初的排名策略R∈ U（Rd）。这就产生了IR一词∩ R英寸（2.12）。有兴趣确定th是否为新区域Θ（R） Rd，从原始Topping策略R获得∈ U（Rd）也是一种停止策略，即Θ（R）∈ U（Rd）。如果这是真的，它将促进下面（2.20）中的定点公式。鉴于（2.13），Θ（R）是否属于toU（Rd）取决于x 7的可测性→ J（x，R），现在将对其进行研究。2.3可测性首先，我们证明了τR∈ U（Rd）是一个定义明确的停车时间。请注意，此结果与标准首次发布的eorem不同；见下文备注2.3。引理2.1。对于任何R∈ U（Rd），τRin（2.8）属于T。证据对于每个固定版本≥ 0, ω 7→ Bs（ω）定义为可测量的FBs。

16楼

nandehutu2022

发表于 2022-6-24 01:53:45

由于Bertsekas和Shreve（1978）的（2.1）和推论7.44.1，我们得到了∈ U（Rd）表示（Bs）-1（A）∈ U型(Ohms） =Fs FPS适用于所有P∈ P(Ohm), （2.14）式（2.2）中的等式。固定t>0，通过B的右连续性，我们可以构造一系列离散化过程{B（n）}n，如Karatzas和Shreve（1991）的命题1.1.13所示∈N、满足B（N）s（ω）→ Bs（ω）表示所有（s，ω）∈ [0，t]×Ohm. 对于每个P∈ P(Ohm), 利用（2.14），构造了映射（s，ω）7→ B（n）s（ω）来自（[0，t]×Ohm, 对于所有n，B（[0，t]）×FPt）到（Rd，U（Rd））是可测量的∈ N、作为N→ ∞ , 我们得出结论，映射（s，ω）7→ Bs（ω），再次从（[0，t]×开始Ohm , B（[0，t]）×FPt）到（Rd，U（Rd）），也是可测量的。给定R∈ U（Rd），则Γt：={（s，ω）∈ [0，t）×Ohm : Bs（ω）∈ R}∈ B（[0，t]）×FPt，t型≥ 0和P∈ P(Ohm). （2.15）现在，对于每个P∈ P(Ohm), 由于Revuz and Yor（1999）和（2.15）的定理I.4.14，我们得到了{τR<t}=p rojOhm（Γt）∈ FPt，适用于所有t≥ 因此，{τR<t}∈TP∈P(Ohm)FPt=Ft，对于所有t≥ 0.AsF=（Ft）t≥0is按构造右连续，τRis为F-停止时间，即τR∈ T备注2.3。如果我们有R∈ B（Rd），τR∈ T将直接遵循首个定理（见Revuz和Yor（1999）中的定理I.4.15或Bass（2010）中的定理2.1）。事实上，理论会证明≥ 0，{τR≤ t}∈ FPT所有P∈ P(Ohm), 很容易产生τR∈ T很明显，德布特定理要求{（s，ω）：Bs（ω）的渐进可测性∈ R} ，我。e、 {（s，ω）：0≤ s≤ t、 Bs（ω）∈ R}∈ B（[0，t]）×Ft，t型≥ 0。对于R来说，这很简单∈ B（Rd）（通过B是逐步可测量的事实），但对于R是有疑问的∈ U（Rd）。引理2.1在不使用首秀定理的情况下证明了τR∈ T一般用于所有R∈ U（Rd）。Huang g和Zhou（2020）的第2.1节中也有类似的公式。备注2.4。τR有两个相关但不同的“Borel可测性”：1。

17楼

mingdashike22

发表于 2022-6-24 01:53:48

τRis是一个Borel可测的随机变量，即。{τR≤ t}∈ FB公司∞对于所有t≥ 0.2. τRis an（FBt）-停止时间，i。e、 {τR≤ t}∈ 所有t的FBT≥ 0.对于R∈ B（Rd），τRis始终是一个Borel可测量的随机变量，这要归功于Galmarino的检验（参见Revuz和Yor（1999）中的第46页练习4.21）。然而，当R打开时，对于持续时间，τRis不一定是（FBt）停止时间；见第43页，第4.6条提案，以及下面在列维乌兹和约尔（1999）中的讨论。一般来说，τR，即使有R∈ B（Rd），仅已知为an（Ft）-停止时间（即τR∈ T），如备注2.3所示。接下来，我们研究x 7的可测性→ J（x，R）。下面证明的关键是使用了非标准的可测投影定理（即下面的定理5.1），它不需要像所有经典投影定理那样的eBorel结构。第5节将专门讨论这个新的可测投影定理的推导。引理2.2。假设{（x，P（x））：x∈ Rd} Rd×P(Ohm) 是普遍可测的，g:Rd→ Ris普遍可测量。对于任何R∈ U（Rd），功能X 7→ infP公司∈P（x）EP【e】-rρRg（Bρr）]和x 7→ 支持∈P（x）EP【e】-rρRg（Bρr）]（2.16）是普遍可测量的。因此，x 7→ （2.10）中的J（x，R）是普遍可测的。证据根据引理2.1，g的普遍可测性，以及Bertsekas和Shreve（1978）的命题7.44，函数e-rρRg（Bρr），映射Ohm 对于R，是普遍可测量的。下面是f（P）：=EP[e-rρRg（Bρr）]，视为P的映射(Ohm) 由于Bertsekas和Shreve（1978）的Corollary 7.46.1，R是普遍可测量的。对于任何K∈ R、这意味着NP∈ P(Ohm) : EP[e-rρRg（Bρr）]<Ko（2.17）是普遍可测的。因此，A：=（x，P（x））：x∈ 研发部∩Rd×nP∈ P(Ohm) : EP[e-rρRg（Bρr）]<Ko（2.18）是普遍可测量的，因为假设（x，P（x））：x∈ 研发部是普遍可测量的。

18楼

kedemingshi

发表于 2022-6-24 01:53:51

现在，请注意x个∈ Rd：infP∈P（x）EP【e】-rρRg（Bρr）]<K= projRd（A），（2.19），由于广义可测投影结果定理5.1，在Rd中普遍可测。因此，我们得出结论x 7→ infP公司∈P（x）EP【e】-rρRg（Bρr）]是普遍可测的。通过类似的论证和一个普遍可测集的补码是普遍可测的事实，我们得到了x 7→ 支持∈P（x）EP【e】-rρRg（Bρr）]也是普遍可测的。因此，根据（2.10）中的定义，x 7→ J（x，R）是不可测的。备注2.5。带R∈ U（Rd），经典的可测投影定理（参见Crauel（2002）的定理2.12或Castaing和Valadier（1977）的定理III.23）不能用于上述证明：应用这些定理需要（2.17）中se t的Borel可测性，这通常只能是完全可测的。定理5.1开始发挥作用：它获得了与经典定理相同的投影结果，但不需要Borel可测性。现在可以确定，每当R∈ U（Rd）。提案2.1。假设{（x，P（x））：x∈ Rd} Rd×P(Ohm) 是普遍可测量的→ R是普遍可测量的。那么，对于任何R∈ U（Rd），Θ（R）∈ U（Rd）。证据同于x 7→ J（x，R）是普遍可测的（引理2.2），g也是不可测的，SR、IR和CR（定义见（2.13））都属于U（Rd）。因此，Θ（R）=SR∪ （IR∩ R）∈ U（Rd）。2.3.1关于使用单一可测量停车政策的讨论我们选择使用停车政策R∈ U（Rd），而不是R∈ B（Rd），现在可以清楚地解释。鉴于命题2.1，（2.12）中定义的Θ是作用于U（Rd）的操作符，即Θ：U（Rd）→ U（Rd）。

19楼

mingdashike22

发表于 2022-6-24 01:53:54

这是一个理想的特性：它有助于定义下面的平衡指数2.1，以及（2.20）中的定点迭代。如果我们与R合作∈ B（Rd），Θ（R）不一定是真的∈ B（Rd），即B（Rd）在操作员Θ下未关闭。具体而言，当我们关注R∈ B（Rd），引理2.2可以修改如下。假设{（x，P（x））：x∈ Rd} Rd×P(Ohm) Borel是否可测量，以及g:Rd→ R是Borel测量值。由于τRis现在是一个Borel可测的随机变量（见备注2.4），我们在引理2.2的证明中认为f（P）：=EP[e-rρRg（Bρr）]是Borel可测的，这是Bertsekas和ShrEve（1978）的k sto推论7.29.1。因此，（2.17）中的s et现在是可钻孔测量的，而（2.18）中的集合A也是可钻孔测量的。有了A的这种增强的可测性（来自universalto Borel），我们可以应用经典的可测投影定理（参见Crauel（2002）的定理2.12或Castaing和Valadier（1977）的定理III.23），得出projRd（A）是普遍可测的，不需要广义投影结果定理5.1。然而，请注意，即使A现在是Borel，Projrd（A）也只能普遍测量。这反映了一个普遍的事实，即Borel可测集的投影不必是Borel可测的；见Bertsekas和Shreve（1978）第7.6节。（2.19）中的projRd（A）和（2.16）和x 7中的映射的通用性→ J（x，R）），集SR，IR，CR，因此Θ（R），通常仅是完全可测的。也就是说，用R∈ B（Rd），Θ（R）∈ 不保证B（Rd）。备注2.6。R的需要∈ 如上所述，U（Rd）是由模型模糊引起的。事实上，在没有歧义的情况下（即对于所有x∈ Rd，P（x）={Px}对于某些Px∈ P(Ohm)), （2.10）减小到j（x，R）=EPx[e-rρRg（Bρr）]，其中B是（Px）x下的强马尔可夫∈Rd；召回（2.3）。

20楼

nandehutu2022

发表于 2022-6-24 01:53:57

只要gis Borel可测量，x 7→ J（x，R）是对所有R可测量的Borel∈ B（Rd）。现在，随着可测量性越来越大（无需任何投影），人们可以只关注R∈ B（Rd）。2.4问题公式根据命题2.1，可以将（2.12）中定义的Θ视为作用于U（Rd）的操作符，即Θ：U（Rd）→ U（Rd）。然后将平衡定义为操作员的固定点。定义2.1。R∈ 如果Θ（R）=R，则称U（Rd）为平衡。我们用E表示所有平衡的集合。备注2.7（平衡的存在）。整个空间是平衡的。的确，对于anyx∈ Rd，ρRd=0，因此J（x，Rd）=g（x）。这意味着IRd=Rd，因此Θ（Rd）=Rd。找到平衡点（而不是整个空间Rd）的一般方法是执行定点迭代：从任意R开始∈ U（Rd），并对其重复施加Θ，直到达到平衡。也就是说，我们*:= 画→∞Θn（R）（2.20）作为候选平衡。为了使这一固定点方法更加严格，需要回答两个重要问题：（i）我们如何理解（2.20）中的限制，并进一步证明R*是否定义明确？（2.20）的右侧涉及Rd中的一系列集合，这些集合的收敛性很复杂，并且没有标准定义。

[量化金融] 模型模糊下的最优停止：时间一致性均衡 [推广有奖]

浏览过的帖子

浏览过的版块

本版微信群