楼主: 何人来此
1295 36

[量化金融] 条件McKean-Vlasov方程的线性二次最优控制 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.8012
学术水平
1 点
热心指数
6 点
信用等级
0 点
经验
24593 点
帖子
4128
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
何人来此 在职认证  发表于 2022-5-11 14:02:51 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Linear quadratic optimal control of conditional McKean-Vlasov equation
  with random coefficients and applications *》
---
作者:
Huy\\^en Pham (LPMA, CREST)
---
最新提交年份:
2017
---
英文摘要:
  We consider the optimal control problem for a linear conditional McKean-Vlasov equation with quadratic cost functional. The coefficients of the system and the weigh-ting matrices in the cost functional are allowed to be adapted processes with respect to the common noise filtration. Semi closed-loop strategies are introduced, and following the dynamic programming approach in [32], we solve the problem and characterize time-consistent optimal control by means of a system of decoupled backward stochastic Riccati differential equations. We present several financial applications with explicit solutions, and revisit in particular optimal tracking problems with price impact, and the conditional mean-variance portfolio selection in incomplete market model.
---
中文摘要:
研究了一类具有二次成本泛函的线性条件McKean-Vlasov方程的最优控制问题。系统的系数和成本函数中的权重矩阵可以根据公共噪声过滤过程进行调整。引入了半闭环策略,并遵循[32]中的动态规划方法,通过解耦的倒向随机Riccati微分方程组来解决问题并刻画时间一致性最优控制。我们给出了几个具有显式解的金融应用,并特别讨论了具有价格影响的最优跟踪问题,以及不完全市场模型中的条件均值-方差投资组合选择。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Probability        概率
分类描述:Theory and applications of probability and stochastic processes: e.g. central limit theorems, large deviations, stochastic differential equations, models from statistical mechanics, queuing theory
概率论与随机过程的理论与应用:例如中心极限定理,大偏差,随机微分方程,统计力学模型,排队论
--
一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--

---
PDF下载:
--> Linear_quadratic_optimal_control_of_conditional_McKean-Vlasov_equation_with_rand.pdf (272.9 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:McKean 最优控制 MCK Applications coefficients

沙发
可人4 在职认证  发表于 2022-5-11 14:02:56
随机系数条件下的线性二次型最优控制及其应用*法国巴黎大学,CNRS,UMR 7599,法国巴黎大学。巴黎迪多大学。frand CREST Ensamarch 9,2017Abstracts我们考虑了一个具有二次c ost泛函的线性条件McKean-Vlasov方程的最优控制问题。系统系数和成本函数中的加权矩阵可以在与常见噪声过滤相关的过程中进行调整。引入了半闭环策略,并遵循[32]中的动态规划方法,通过一个解耦的后向随机riccati微分方程组来解决该问题并刻画时间一致性最优控制。我们介绍了几种具有明确解决方案的金融应用,并特别回顾了不完全市场模型中价格影响的最优跟踪问题和条件均值-方差投资组合选择。理学硕士分类:49N10、49L20、60H10、93E20。关键词:随机McKean-Vlasov SDE,随机系数,线性定量优化控制,动态规划,Riccati方程,倒向随机微分方程。*这项工作是ANR项目CAESARS(ANR-15-CE05-0024)的一部分,也得到了FiME(能源市场金融研究中心)和“金融与发展持久性-认可性”EDF-CACIB主席的支持。1简介和问题公式让我们用随机系数(简称LQCMKV)对条件(也称为随机)McKean-Vlasov方程进行线性优化控制。考虑由dxt=bt(Xt,E[Xt | W],αt)dt+σt(Xt,E[Xt | W],αt)dWt+σt(Xt,E[Xt | W],αt)dWt(Xt,E[Xt | W],αt)dWt,0≤ T≤ T、 X=ξ。

藤椅
大多数88 在职认证  发表于 2022-5-11 14:03:00
(1.1)这里,W,Ware在概率空间上的两个独立的一维布朗运动(Ohm, F、 P),F=(英尺)0≤T≤这是由W,F=(Ft)0产生的自然过滤≤T≤这是由(W,W)生成的自然过滤,并加上独立的σ-代数ξ∈ L(G;Rd)是一个平方可积的G-可测随机变量,其值在Rd中,E[Xt | W]表示给定ftw的整个σ-代数的条件期望,并且控制过程α是一个F-逐步可测过程,其值等于Rmor到L(Rd;Rm)。控制集的这种区别将在后面的介绍中讨论,但目前,我们可以大致解释A=RMA为开环控制建模时的情况,以及A=L(Rd;Rm)为闭环控制建模时的情况。当A=Rm时,我们要求α满足平方可积条件L(Ohm ×[0,T]),即e[RT |αT | dt]<∞,我们用一组控制过程来表示。系数bt(x,\'x,a),σt(x,\'x,a),σt(x,\'x,a),0≤ T≤ T是F适应的过程,其值为Rd,对于任何x,\'x∈ Rd,a∈A、 线性形式和线性形式:bt(x,\'x,x,A)和线性形式:bt(x,x,A)和线性形式:bt(x,x,A)和线性形式:bt(x,x,A)和线性形式:bt(x)和线性形式:bt(x,x,x,A)和线性形式:bt(x,x,x,A)和(x,A)和(x,A)和(x)和(x)和(x)和(x)和(x)和(x)和(x,A)和(x)和(x)和(x,A)和(x)和(x,A)和(x,A)和(x)和(x)和(x)和(x)和(x)和(x)和(x)和(x,A)和(x,A)和(x)和(x)和(x)和(x)和(x)和(x)和(x)和(x)和(x)和(x)其中,b,γ,γ是f-适应过程,向量值为Rd,满足平方可积条件L(Ohm ×[0,T]:E[RT | bt |+| bt |+|γT |+|γT | dt]<∞, B、 “B,D,”“D,D,”“D本质上有界的F-适应过程矩阵,值为Rd×D,而C,F本质上有界的F-适应过程矩阵值为Rd×m。

板凳
kedemingshi 在职认证  发表于 2022-5-11 14:03:04
对于任何α∈ A、 存在唯一的强解X=Xα到(1.1),它是F适应的,并且满足平方可积条件S(Ohm ×[0,T]):Esup0≤T≤T | Xαs|≤ Cα1+E |ξ|< ∞, (1.3)对于依赖于α的某些正常数Cα:当A=Rm时,Cα依赖于αviaE[RT|αt|dt]<∞, 当A=L(Rd;Rm)时,Cα通过其Lipschitz常数依赖于α。最小化为α的成本函数∈ A是:J(α)=EhZTft(Xαt,E[Xαt|W],αt)dt+g(Xαt,E[Xαt|W])i,→ V:=infα∈AJ(α),其中{ft(x,\'x,a),0≤ T≤ T},是一个F-适应实值过程,g(x,\'x)是一个可测的随机变量,对于任何x,\'x∈ Rd,a∈ A、 重力形式:ft(x,\'\'x,A)=(xQtx+-x“Qt”x+Mtx+a如果A=Rmx,则为NtaQtx+-x“Qt”x+Mtx+a(x)如果A=L(Rd;Rm)g(x,\'\'x)=x,则为Nta(x)Px+-x“P”x+Lx、 (1.4)式中,Q,`Q本质上是有界的F-适应过程,SDR中的值Rd×d,P,`P中的对称矩阵集本质上是有界的FT-可测随机矩阵在Sd中,N是有界的F-适应过程,Sm中的值,M是有值Rd的Fadapt过程,满足平方可积条件L(Ohm×[0,T]),L是Rd中的FT可测平方可积ran dom向量,且表示任何向量或矩阵的转置。上述随机McKean-Vlasov方程的控制公式为一些重要的控制问题提供了一个统一的模型。特别是,在普通噪声(参见,例如[17],[19])下,在平均场相互作用中,大量粒子(参与者)的合作平衡的渐近形式(参见[17],[19])激励了这种合作平衡,并且当成本函数涉及状态过程(条件)定律的第一和第二矩时,也会发生这种合作平衡,例如,在(条件)均值-方差组合选择问题中(参见[27]、[7]、[10])。

报纸
可人4 在职认证  发表于 2022-5-11 14:03:07
当A=L(Rd;Rm)时,这对应于(代表性)代理的问题,即基于她/他在时间t的当前私有状态x使用控制α,以及公共噪声Ft带来的信息,通常是条件平均值E[Xt | W],在大种群均衡解译中,当所有参与者的数量因混沌传播而趋于一致时,所有参与者状态的经验平均值的极限。换句话说,控制α可以被视为半闭环控制,即闭单桅帆船w.r.t.状态过程和开环w.r.t.公共噪声w,或者可以被视为F-逐步可测量的随机场控制α={αt(x),0≤ T≤ T、 x∈ Rd}。这类s emi闭环控制扩展了McKean-Vlasov方程(或平均场随机微分方程)的LQ控制的闭环策略类别,没有公共噪声W,正如最近在[28]中研究的那样,其中控制在任何时间t以线性形式W.r.t.选择当前状态值Xt和确定性预期值E[Xt]。当A=Rm时,LQCMKV问题可能被视为(1.1)中状态动力学的一个特殊部分观测控制问题,其中控制是开环形式的,并且是自适应的w.r.t。由w驱动的一些外部随机因子过程I生成的观测滤波FI=fG。在σ=0的情况下,我们看到过程X是F自适应的,因此E[Xt | w]=Xt,LQCMKVP问题被简化为具有随机系数的经典LQ控制问题(参见[40]),其中A=RMO为开环控制,A=L(Rd;Rm)为闭环控制。注意,对于LQ控制问题,开环和闭环策略之间的这种区别最近在[36]中引入,其中闭环控制假设为线性形式。r、 t。

地板
nandehutu2022 在职认证  发表于 2022-5-11 14:03:10
当前状态值,而它被认为是ly Lipschitz w.r.t.的先验值。当前状态值。McKean-Vlasov方程的最优控制是随机控制和应用概率领域的一个相当新的课题,例如在[4]、[11]、[8]、[15]、[31]中讨论过。在这种McKean-Vlasov背景下,线性二次型最优控制的类别为可解应用提供了非典型案例,已经在几篇论文中进行了研究,其中[24]、[39]、[25]、[35],其中系数被假定为确定性的。人们经常争论说,由于状态定律以非线性方式存在(这里是LQ问题,是期望值的平方),这个问题是时间不一致的,从这个意义上说,从今天看的非最优控制在明天看时不再是最优的,这将先验地阻止使用动态规划方法。为了解决时间不一致性问题,人们通常会关注承诺前的两种策略,即。

7
能者818 在职认证  发表于 2022-5-11 14:03:13
对于在初始时间观察到的问题来说是最优的,但在未来日期可能不是最优的控制,或者博弈均衡策略,即,控制决策被认为是针对控制器将要做出的所有未来决策的博弈。在本文中,我们将关注具有随机系数的初始值Vof theLQCMKV问题的最优控制,但遵循[32]中提出的方法,我们强调,对于预承诺策略,时间一致性实际上可以恢复,前提是将状态过程的条件律而不是状态本身视为状态变量,因此,可以使用动态规划方法。我们发现,由随机场值函数定义的LQCMKV控制问题的动态版本,相对于状态过程的条件定律,具有二次结构,将最优控制归结为一个时滞随机Riccati方程(BSREs)的解耦系统,其存在性和唯一性与一个标准的LQ控制问题有关。这种推导的主要成分是沿条件测度流的It^o公式,以及关于概率测度的可微性的合适概念。我们用几个财务应用来说明我们的结果。对于一般的价格和目标过程,我们重新研究了具有价格影响的最优交易和基准跟踪问题,得到了封闭形式的解,扩展了文献中的一些已知结果。接下来,我们解决了

8
大多数88 在职认证  发表于 2022-5-11 14:03:16
第2节给出了一些关键的准备工作:我们将LQCMKV问题重新表述为一个涉及状态过程的条件律的问题,作为状态变量,其中陈述了动态编程验证定理,并且时间一致性成立。我们还可以通过一系列条件度量来调用It^o公式。第3节讨论了在控制集a=RMAN和a=L(Rd;Rm)的情况下,通过BSREs系统对最优控制的刻画。我们开发了应用程序。我们用一些符号来结束这篇介绍。符号。我们用P(Rd)表示Rd上的集概率测度u,它是平方可积的,即kuk:=RRd|x|u(dx)<∞. 任何情况下∈ P(Rd),我们用Lu(Rq)表示可测函数的集合→ Rq是squ,可积于u,byLuu(Rq)可测函数组ψ:Rd×Rd→ Rq,对于乘积测度u是平方可积的 u,我们设置u(u):=Zu(x)u(dx),\'u:=Zxu(dx),u u(ψ):=Zψ(x,x′)u(dx)u(dx′)。我们还定义了∞u(Rq)(分别为∞uu(Rq))作为元素的子集∈ Lu(Rq)(分别为Luu(Rq))是有界的u(分别为u u)a.e.和kаk∞是他们必不可少的补充。对于任意随机变量X(Ohm, F、 P),我们用L(X)表示其在P下的概率律(或分布),用L(X | W)表示其给定FT的条件律,我们假设W.L.o.g.在P(Rd)={L(ξ):ξ的意义上,g足够丰富∈ L(G;Rd)}.2任何α的预备∈ A、 Xα=(Xαt)0≤T≤在(1.1)的解中,我们定义ραt=L(Xαt | W)为Xαt对ft0的条件定律≤ T≤ T

9
可人4 在职认证  发表于 2022-5-11 14:03:20
由于Xα是F适应的,并且是a(P,F)-维纳过程,我们注意到ραt(dx)=P[Xαt∈ dx | FT]=P[Xαt∈ dx | Ft],因此{ραt,0≤ T≤ T}承认一个F-逐步可测量的修正(参见[5]中的定理2.24),该修正将在序列中与自身一致,并在P(Rd)中通过(1.3)进行估值,即:sup0≤T≤TkραTk≤ Cα1+E |ξ|.

10
何人来此 在职认证  发表于 2022-5-11 14:03:23
(2.1)此外,我们提到过程ρα=(ραt)0≤T≤在P(C([0,T];Rd)中取值的是连续轨迹。从[0,T]到Rd的连续函数的sp aceC([0,T];Rd)上的平方可积概率测度集。现在,根据迭代条件期望定律∈ A是渐进可测量的,我们可以重写成本函数asJ(α)=EhZTE英尺Xαt,ραt,αt英尺dt+EGXαT,ραT英尺i=EhZTραtft(,,ραt,αt)dt+ραTg(,ραT)i=EhZT^ft(ραt,αt)dt+^g(ραt)i,(2.2),其中我们在第二个等式中使用了{ft(x,\'x,a),x,\'x这一事实∈ Rd,a∈ A、 0≤ T≤ T}是一个随机场F-适应过程,g(x)是FT-可测量的,F-适应过程{^FT(u,a),0≤ T≤ T},FT可测量的随机变量^g(u),表示u∈ P(Rd),a∈ A、 定义为(^ft(u,A):=u英尺(μ,a)=Rft(x,\'u,a)u(dx)^g(u):=ug(,°u)=Rg(x,¨u)u(dx)。根据f,g in(1.4)的二次形式,随机场^ft(u,a)和^g(u),(t,u,a)∈[0,T]×P(Rd)×A由^ft(u,A)给出=Var(u,Qt)+v(u,Qt+\'Qt)+v(u,Mt)+a如果A=RmVar(u,Qt)+v(u,Qt+\'Qt)+v(u,Mt)+Z[A(x),则为Nta如果A=L(Rd;Rm),^g(u)=Var(u,P)+v(u,P+\'P)+v(u,L),(2.3),我们定义P(Rd)×sda和P(Rd)×Rdby:Var(u,k):=Z(x)上的函数- u)k(x)- u)u(dx),u∈ P(Rd),k∈ Sd,v(u,l) := ulu, u ∈ P(Rd),l ∈ Sdv(u,y):=yu, u ∈ P(Rd),y∈ Rd.我们都会对模型的系数做出以下假设:(H1)Q,Q+\'Q,P,P+\'P,N是非负的a.s。;(H2)以下两个条件之一成立:(i)N是一致正定义,即Nt≥ δIm,0≤ T≤ T,a.s.对于某些δ>0;(ii)P或Q是一致正定义,F是一致非退化的,即。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 16:12