楼主: 可人4
1074 32

[量化金融] 分布约束优化问题的动态规划原理 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

76%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
49.1643
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24465 点
帖子
4070
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
可人4 在职认证  发表于 2022-5-31 06:51:14 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《A Dynamic Programming Principle for Distribution-Constrained Optimal
  Stopping》
---
作者:
Sigrid K\\\"allblad
---
最新提交年份:
2017
---
英文摘要:
  We consider an optimal stopping problem where a constraint is placed on the distribution of the stopping time. Reformulating the problem in terms of so-called measure-valued martingales allows us to transform the marginal constraint into an initial condition and view the problem as a stochastic control problem; we establish the corresponding dynamic programming principle.
---
中文摘要:
我们考虑了一个最优停止问题,其中对停止时间的分布施加了约束。用所谓的测度值鞅重新描述问题,可以将边缘约束转化为初始条件,并将问题视为随机控制问题;建立了相应的动态规划原理。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Quantitative Finance        数量金融学
二级分类:Mathematical Finance        数学金融学
分类描述:Mathematical and analytical methods of finance, including stochastic, probabilistic and functional analysis, algebraic, geometric and other methods
金融的数学和分析方法,包括随机、概率和泛函分析、代数、几何和其他方法
--

---
PDF下载:
--> A_Dynamic_Programming_Principle_for_Distribution-Constrained_Optimal_Stopping.pdf (314.08 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:动态规划 Mathematical distribution Quantitative Optimization

沙发
nandehutu2022 在职认证  发表于 2022-5-31 06:51:18
分布约束最优停车的动态规划原理。我们考虑一个最优停止问题,其中在停止时间的分布上放置了一个约束。用所谓的测度值鞅重新表述问题,可以将边缘约束转化为初始条件,并将问题视为随机控制问题;建立了相应的动态规划原理。1、导言我们考虑以下在停车时间分布上具有约束的最优停车问题:给定概率测度uon(0,∞)以及支持布朗运动(Bt)t的过滤概率空间≥0,我们的目标是确定SUPτ∈T(u)EcB·,τ,(1.1)式中,T(u)是分布为u的停车时间集,c是满足c(ω,T)=c(ω)的给定可测成本函数·∧t、 t)。该问题与具有悠久历史的第一次穿越时间逆问题有关;它最近也引起了人们的关注:参见[3,5,11],我们将进一步了解其在金融和精算数学中的作用,并参考和阐述。当基础过滤足够普遍,允许独立均匀分布的随机m变量时,问题(1.1)等价于其弱公式,其中上确界也占据潜在概率空间。这一观察结果为Beiglb¨ock等人的方法奠定了基础;具体地说,通过对某个标准产品集的度量来识别停止时间,可以得到一个优化子的存在性以及一个描述任何优化子的支持集的单调性原理。反过来,对于某些类别的成本函数,后者被用来推断所谓的障碍型解的存在性。

藤椅
可人4 在职认证  发表于 2022-5-31 06:51:21
在此,鉴于过滤在上述意义上是足够普遍的,并且在成本函数上具有一定的规律性,但明显没有特定的结构,我们用所谓的测度值鞅来重新表述问题,从而将问题作为随机控制问题来处理;建立了相应的动态规划原理。Cox和K¨allblad[9]使用测度值鞅的概念研究了一个鲁棒定价问题,其中优化设置在满足给定终端边际约束(保证满足给定市场数据)的一类鞅(潜在市场模型)上。然后用指定其终值的条件分布的过程识别每个鞅。后者自然属于一类在R上概率测度空间取值并满足一定鞅性质的过程;它们被称为测度值鞅(MVM)。至关重要的是,终端市场约束日期:2017年3月27日。奥地利维也纳韦德纳-豪普斯特拉斯韦恩科技大学,邮编:8-10,1040。电子邮件:sigrid。kaellblad@tuwien.ac.at.2然后,SIGRID K¨ALLBLADwas转化为相应MVM的初始条件,这使得问题m被视为一个随机控制问题,其中底层的条件定律表现为一个附加的稳定过程。因此,可以通过动态规划方法解决这个问题,在[9]中,建立了DP P,并推导出了值函数的HJB方程。同样的方法也可以自然地应用于最优停止概率问题(1.1),本文的目的是明确这一点并证明相关的DPP。

板凳
mingdashike22 在职认证  发表于 2022-5-31 06:51:24
具体而言,T(u)中的每个停止时间τ与MVM(ξT)T相同≥0给定当前信息的确定asits条件分布:ξt=L(τ| Ft);任何这样的过程都将满足初始条件ξ=u以及martinga性质和与τ的停止时间性质相对应的某种适应性条件。当将最优停车问题重新表述为此类MVM上的优化问题时,将分布约束合并为初始条件,允许将问题作为随机控制问题来处理;我们的主要结果表明,动态编程原理适用于这个问题。我们注意到,在Ankirchner等人【2】和Miller【20】中,研究了在停车时间上的期望值约束下的最优停车问题。然后将终端约束的条件期望值合并为一个附加的状态过程,并通过使用BSDE解决问题(参见[6]);因此,在抽象的层面上,我们的方法与他们的方法有某种相似之处。Bayraktar和Miller也从类似的角度研究了我们所考虑的分布构造问题[3]。然而,作者考虑了strong问题公式,并对原子约束的情况进行了严格的限制,而我们将u作为R+上的一般概率测度;我们还允许使用更一般的成本函数。我们注意到,我们的证明方法与他们的不同。事实上,[3]中的方法使用单位单纯形中的任何点都可以写成有限个点的线性组合,这些点的凸面包含该点;在我们看来,这种方法似乎很难推广到任意约束。

报纸
mingdashike22 在职认证  发表于 2022-5-31 06:51:27
此外,由于他们考虑了强大的公式,他们的过滤仅由布朗运动产生,而额外的随机性则是通过对布朗运动本身过去的假设获得的,这种方法似乎很难推广非路径依赖的成本函数。然而,值得注意的是,根据我们在本文中的结果以及他们的结果,我们得出,对于[3]中考虑的成本函数类,限制布朗过滤的问题与弱公式一致。因此,事后,我们将其主要结果恢复为我们的一个特殊案例。为了证明(1.1)问题(MVM版本)的DPP,我们在这里考虑它在相关规范路径空间上的弱公式;规范框架已经成功地用于研究随机控制问题。g、 El Karoui和Tan【17、18】,另见【21、22、25】。为了说明我们处理的是测度值鞅,我们的正则空间由从R+到R+概率测度空间的(连续)函数组成,其中,我们为后者配备了由第一个Wassersteindinance诱导的拓扑,使其成为一个波兰空间。然后,我们可以通过提供某种度量集的分析性以及在串联和分解下的稳定性来建立DPP,并在tur n中应用扬科夫·冯·诺依曼的可测选择定理。

地板
可人4 在职认证  发表于 2022-5-31 06:51:30
这种方法的基础是这样一个事实,即问题(1.1)与其弱公式等价;特别是,尽管有替代此约定的方法,但我们在此让MVM对应于(分解的)随机停止时间的条件分布。一个分布约束最优停止的DPP在先验条件下假设值函数的连续性,并限制为一类具有某种(马尔可夫)结构的代价函数,我们还提供了DPP的替代证明。虽然这个结果是我们主要结果的一个特例,但我们选择报告这个独立的论点,因为我们发现它是有意义的。具体而言,继Bouchard和Touzi【7】(se e也是【6】)之后,其想法是利用价值函数的连续性特性,以明确构建近似最优核,从而避免对可测量选择函数的需要。为了处理度量值的论点,我们在这里借鉴了最优运输理论的观点——该论点主要依赖于Firstwasserstein距离的结构。值得注意的是,这一论证适用的成本函数类别包括[3]中考虑的成本函数。除了DPP之外,我们还研究了分布约束d最优停止问题的稳定性,因为我们建立了问题值作为边缘约束函数的连续性性质。首先,根据文献[5]中证明优化子存在的论证,我们在相当一般的成本函数假设下,得到了该映射的上半连续性。

7
大多数88 在职认证  发表于 2022-5-31 06:51:33
利用代价函数的附加正则性,我们还建立了价值函数的某种“Right-continuity”;这个结果很有趣,因为它确保了带有基因ral约束的问题的值可以在一系列近似原子问题的极限下获得,这些问题更容易用数值方法解决。本文的其余部分组织如下:在第2节中,我们介绍了我们要研究的问题,并建立了连续性性质。在第3.1节中,我们用所谓的适应测度值鞅来描述这个问题;我们在第3.2节中提供DP P,并在第3.3节中提供其证明。DPP的替代证明推迟到附录中。2、分布约束最优停止问题2.1。研究的问题:定义和第一句话。给定固定定律u∈ P、 其中P表示(0,∞) 具有有限的初始时刻和经过过滤的概率空间(Ohm, G、 (Gt)t≥0,P)支持布朗运动(Wt)t≥0和一个独立的G-可测随机变量U~ U[0,1],我们考虑以下分布约束最优停止问题:v(u)=supτ∈T(u)EcW·,τ,(2.1)式中,T(u)是具有给定分布u的停车时间集,c是从c(R+)×R+到R的给定可测量成本函数,满足c(ω,T)=c(ω·∧t、 t)。在整个过程中,E[c(W·,τ)]被很好地定义并且<∞ 对于所有τ∈ ∪u∈PT(u);对于所有u∈ P、 存在一些τ∈ T(u),使得E[c(W·,τ)]>- ∞. 特别是,(2.1)中定义的v是从P到(-∞, ∞].2.1.1。弱问题公式的预备知识。对于我们的方法来说,至关重要的是,分布约束问题(2.1)实际上等价于相应的弱公式。

8
大多数88 在职认证  发表于 2022-5-31 06:51:36
为了使这一点正式化,在[4]和[5]之后,我们将使用随机停车时间的概念;但也可参见【13、16、17、18】。设C(R+)表示从R+到R的连续函数空间,从零开始,具有紧集上一致收敛的拓扑;我们用W表示C(R+)上的维纳测度,并让F=(Ft)t≥0通常是对规范过滤的强化。在【5】之后,请参见【4】,我们将进一步了解详情,然后定义乘积空间C(R+)×R+上的概率度量集RST(u),称为随机停止时间,具有4个SIGRID K–ALLBLADpre特定定律:RST(u):={γ∈ Cpl(W,u):Aγt(ω):=γω([0,t])是Ft可测量的,对于t≥ 0},其中(γω)ω∈C(R+)表示γ在第一坐标中的分解,而aγ(ω)是与γω相关的累积分布函数。根据文献[4]中的引理3.11,用(B,T)表示C(R+)×R+上的正则过程,分布约束问题可被视为正则空间上R和约化停止时间上的优化问题;具体而言,鉴于(Ohm, G、 (Gt),P)支持布朗运动和独立的均匀分布G-随机变量,问题(2.1)等价于最大化γ问题cB·,T, γ以上∈ RST(u)。特别是概率空间的具体选择(Ohm, G、 (Gt),P)因此对这个问题没有兴趣。

9
可人4 在职认证  发表于 2022-5-31 06:51:39
因此,用A(u)表示α=(Ohmα、 Gα,Gα,Pα,(Wα·),τα),使得(Ohmα、 Gα,Gα,Pα)是一个概率空间,其中Wα·是BM,τα是带τ的停止时间~ u,该值保持不变Wα·,τα] 所有术语α∈ A(u);(2.2)这进一步说明,我们确实在处理一个薄弱的问题公式。因为每个随机停止时间都允许在第一个变量(γω)ω中对其分解进行表征∈C(R+),致力于固定概率空间(Ohm = C(R+,F,F,W),仍然用B表示正则过程,我们的问题也可以等价地表示为优化Z∞c(B·,s)dAγs, γt(ω):=γω([0,t]),(2.3)在γ的分解核(γω)上∈ RST(u)。最后一个公式强调了以下关于随机停车时间的直观观点:虽然标准停车时间为每条路径指定了一个停车时间,但依赖于某些外部随机性的停车时间可以被视为一个分布,指定了在观察特定路径的情况下,在不同点停车的可能性。由于上述公式都是等效的,我们可以在它们之间自由切换,并将考虑在每种情况下最方便的公式。2.2。对约束的依赖:值函数的稳定性。在本节中,我们研究了问题对边际约束的依赖性,我们建立了映射u7的连续性属性→ v(u)。回想一下,问题优化者(2.1)的存在是在[5]中确立的;他们的论点稍有变化就会产生值函数的上半连续性:Propositi on 2.1。假设成本函数c从上到下是有界的,且为7→ c(ω·∧t、 t)对于W-a.e.ω是上半连续的∈ Ohm.

10
何人来此 在职认证  发表于 2022-5-31 06:51:42
然后,u7→ v(u)在W(第一个Wasserstein度量)诱导的拓扑中在P上是上半连续的。命题2.1的证明。设(un)是收敛到某个u的序列;w、 l.o.g.letW(un,u)n不增加。依次,let(γn)a seq uenc e,使γn∈ RST(un)和LIMN→∞Eγnc(B)·∧T、 T型= lim支持→∞v(un)。(2.4)在[4]中,子概率测量γ与projC(R+)γ≤ 考虑W。然而,由于我们需要projR+γ=u,其中u∈ P的质量为1,因此,so的质量为γ,因此必须严格遵守所谓的“有限”RST,其中projC(R+)γ=W,τ几乎对所有路径都是有限的;另见[5]第10页。分布约束最优停止的DPP 5我们首先表明序列(γn)是紧的;为此,必须表明其在C(R+)和R+上的各自投影是紧密的。在c(R+)上的投影都与维纳测度重合,因此非常紧密。另一方面,γn(T>r)=un([r,∞)). 对于任何ε>0,使用un收敛到u,我们现在可以选择一个r>0,使得un([r,∞)) < ε、 适用于所有n∈ N因此,R+上的投影也很紧密。设γ为累积点;如有必要,通过传递给子Q ue nc e,我们可以假设γn=> γ。自(ω,t)7→ ω是平凡连续的,因此γOhm= W、 进一步,使用(ω,t)7的连续性→ 结合un→Wu,对于任何g∈ Cb(R+),Zg(t)γR+(dt)=Eγ[g(T)]=limn↑∞Eγn[g(T)]=limn↑∞Zg(t)un(dt)=Zg(t)u(dt)。因此,γ∈ Cpl(W,u)。最后,利用文献[4]中的定理3.8(3),我们得到γ∈ RST(u)。接下来,根据[15]中的命题2.4(另见[13]中的引理4.2),在空间RST(u)上,弱收敛拓扑与稳定收敛拓扑重合,稳定收敛拓扑是γ→ Eγ[φ]对于所有有界可测函数φ是连续的:Ohm ×R+→ R使得t 7→ φ(ω,t)对于所有ω都是连续的∈ Ohm.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-25 13:07