楼主: mingdashike22
1129 20

[量化金融] 时间不一致随机线性二次控制:特征 [推广有奖]

11
能者818 在职认证  发表于 2022-5-8 01:12:45
我们有以下估计:limε↓0εZt+εtE[hYs,ηs- ηti]ds≤ limε↓0εsZt+εtE[Ys]dsZt+εtE[(ηs- ηt)]ds=limε↓0sεZt+εtE[Ys]dssεZt+εtE[(ηs- ηt)]ds≤ limε↓0sεZt+εtE[Ys]dsrsups∈[t,t+ε]E[(ηs- ηt)]≤ 2 limε↓0sεZt+εtE[Ys]dspE[(ηt+ε- ηt)]=0,其中最后一个不等式是由Doob的鞅不等式引起的,因为η是平方可积的。该定理的一个简单版本表明,如果η是[0,t]上的一个可积实函数,则λε↓0εRt+εtа(s)ds=а(t)a.e.t∈ [0,T]。鞅。因此对于任何η∈ D、 E[hYt,ηti]=E[hYt,ηi]=limε↓0εZt+εtE[hYs,ηi]ds=limε↓0εZt+εtE[hYs,ηsi]ds=limε↓0εZt+εtE[hYs,ηti]ds=limε↓0εZt+εtE[hEt[Ys],ηti]ds=limε↓0EhεZt+εtEt[Ys]ds,ηti.“从那时起”εZt+εtEt[Ys]ds#≤ EZt+εtεdsZt+εtEt[Ys]ds=εEZt+εtEt[Ys]ds≤εZt+εtEYds和limε↓0εRt+εtE[Ys]ds=E[Yt],存在一个常数δt>0,因此E“εZt+εtEt[Ys]ds#< 2EYt,  ε ∈ (0,δt)。这意味着tεRt+εtEt[Ys]ds在ε中是一致可积的∈ (0,δt)。亨塞利姆ε↓0EεZt+εtEt[Ys]ds= Elimε↓0εZt+εtEt[Ys]ds= 因为η本质上是有界的,所以ηt也是有界的;因此,存在一个常数c>0EhεZt+εtEt[Ys]ds,ηti≤ 总工程师εZt+εtEt[Ys]ds→ 0,意味着limε↓0EhεZt+εtEt[Ys]ds,ηti= 因此E[hYt,ηi]=0,a.E.t∈ [0,T]对于任何η∈ D、 这意味着y=0,a.e.t∈ [0,T],a.s。。Q.E.D.我们现在可以提交本节的ma结果。定理3.5给定一个控制u*∈ LF(0,T;Rl),让X*是对应的状态过程s和(p(·;t),k(·;t))∈ LF(t,t;Rn)×(LF(t,t;Rn))dbe是BSDE(3.1)的唯一解决方案。然后你*是平衡控制当且仅当(3.7)∧(t;t)=0,a.s.,a.e.t∈ [0,T]。证明:回想一下,我们有∧(s;t)=λ(s)+λ(s)ξt的表示。

12
能者818 在职认证  发表于 2022-5-8 01:12:48
因为λ是本质有界的,ξ是连续的,所以我们有limε↓0EtεZt+εt |λ(s)(ξs)- ξt)|ds≤ c limε↓0εZt+εtEt[|ξs- ξt |]ds=0,其中最后一个等式是因为Et[|ξs- ξt |]是s的连续函数,在s=t时消失。然后它跟随limε↓0εZt+εtEt[λ(s;t)]ds=limε↓0εZt+εtEt[λ(s;s)]ds。现在,如果(3.7)成立,那么limε↓0εZt+εtEt[λ(s;t)]ds=limε↓0εZt+εtEt[λ(s;s)]ds=0。相反,如果(3.4)成立,则limε↓0εRt+εtEt[λ(s;s)]ds=0,通过引理3.4的virtueof得到(3.7)。Q.E.D.4唯一性当状态是一维且系数是确定的时,在我们之前的论文[6]中,当状态变量是标量值,即n=1,且所有系数都是确定的时,显式平衡基本上是基于等价条件(3.7)构建的(尽管我们还无法在那里证明)。在本节中,我们将证明在相同的设置下,平衡实际上是唯一的,这要感谢(3.7)。在本节中,我们假设n=1,所有参数A、B、B、Cj、Dj、σj、qan和R都是t的确定函数。

13
能者818 在职认证  发表于 2022-5-8 01:12:52
在这种情况下,受控系统减少到(4.1)dXs=[AsXs+B′sus+bs]ds+[CsXs+Dsus+σs]′dWs;X=X,其中C:=(C,···,Cd)′,D:=((D)′,···,(Dd)′,σ:=(σ,··,σD)′。因此,BSDE(3.1)被简化为(还注意到k(s;t)≡ k(s))(4.2)dp(s;t)=-[Asp(s;t)+C′sk(s)+QsX*s] ds+k(s)′dWs,s∈ [t,t],p(t;t)=GX*T- hEt[X*[T]- uX*T- u,而相应的∧(s;t)现在的形式是∧(s;t)=Bsp(s;t)+D′sk(s)+Rsu*s、 在[6]中,通过以下常微分方程组的解构造了一个平衡控制(为了简化符号,我们抑制了下标s):0=˙M+(2A+|C |)M+Q-M(B′+C′D)(R+MD′D)-1[(M- N- Γ(1)B+MD′C],s∈ [0,T],MT=G;(4.3)0=˙N+2AN-NB′(R+MD′D)-1[(M- N- Γ(1)B+MD′C],s∈ [0,T],NT=h;(4.4)˙Γ(1)= -AΓ(1),s∈ [0,T],Γ(1)T=u;(4.5)0=˙Φ+{A- [(M)- N) B′+MC′D](R+MD′D)-1B}Φ+(M)- N) b+C′Mσ- [(M)- N) B′+MC′D](R+MD′D)-1MD′σ,s∈ [0,T],ΦT=-u.(4.6)如果这个方程组允许一个解(M,N,Γ(1),Φ),那么反馈控制器aw(4.7)u*s=αsX*s+βsde定义了一个平衡,其中(4.8)αs△= -(Rs+MsD\'sDs)-1[(毫秒)- Ns- Γ(1)s)Bs+MsD′sCs],βs△= -(Rs+MsD\'sDs)-1(ΦsBs+MsD的σs);参见[6,定理4.4]。[6]还研究了(4.3)-(4.6)解的存在性。下一个定理规定,上面构造的控制是唯一的平衡。定理4.1如果(4.3)-(4.6)允许解(M,N,Γ(1),Φ),则存在唯一的平衡控制。证明:假设存在另一个平衡态——控制对(X,u)。然后,随着符号的滥用,等式(3.1)与X*替换为X,允许满足∧(s;s)的唯一解(p(·;t),k(·))≡ Bsp(s;s)+D′sk(s)+RSU=0表示a.e。

14
何人来此 在职认证  发表于 2022-5-8 01:12:57
s∈ [0,T]。定义p(s;t):=p(s;t)- (MsXs)- NsEt[Xs]- Γ(1)sXt+Φs,\'k(s):=k(s)- Ms(CsXs+Dsus+σs)。(X,u)yieldsb的平衡条件p(s;s)+(Ms- Ns- Γ(1)s)Xs+Φs+ D\'s\'k(s)+Ms(CsXs+Dsus+σs)+ RSU=0。由于Rs+D′sMSD是可逆的,我们用上述方程求解f,得到以下表达式(4.9)us=-(Rs+D′sMsDs)-1.Bs-p(s;s)+D\'s-k(s)+(Bs(Ms)- Ns- Γ(1)s)+D′sMsCs)Xs+BsΦs+D′sMsσsi。另一方面,我们可以证明(\'p(·;t),\'k(·))满足以下BSDE(详见附录a):(4.10)dp(s;t)=-A\'p(s;t)+C\'k(s)- [C\'MD+MB\'][R+D\'MD]-1[B′p(s;s)+D′k(s)]+NB′[R+D′MD]-1EtB\'p(s;s)+D\'k(s)ds+k(s)′dWs,s∈ [t,t],\'p(t;t)=0,其中我们抑制了A,B,C,D,M,N,R的下标s,我们使用了M,N,Γ(1),Φ的方程。此外,很容易证明EhRT|k(s)|dsi<+∞ 和支持∈[0,T]E小吃≥t|p(s;t)|< + ∞.在下一个定理中,我们将证明方程(4.10)在空间L×L中最多允许一个解,其中L:=(X(·;·):X(·;t)∈ 左(t,t;R),支援∈[0,T]E小吃≥t | X(s;t)|< + ∞),andL:=(Y(·;·):Y(·;t)∈ 左(t,t;Rd),主管∈[0,T]EZTt | Y(s;t)|ds< +∞).因此“p(s;t)≡ 0和k(s)≡ 0.最后,堵塞\'p≡“k”≡ 0到(4.9),我们发现u的反馈控制形式与u完全相同*; 见(4.7)。这证明了你和你*导致相同的控制。Q.E.D.(4.10)解的唯一性还有待证明。

15
kedemingshi 在职认证  发表于 2022-5-8 01:13:01
事实上,我们将为更一般的方程式(4.11)做这件事dp(s;t)=-Fs、 \'p(s;t),\'p(s;s),Et[l(s)\'p(s;s)],\'k(s;t),Etl(s)k(s;t)ds+-k(s;t)′dWs,s∈ [t,t],\'p(t;t)=0,其中land是两个具有适当维数的本质有界的自适应向量过程,f(s,······)是一个确定性函数,满足除s以外的所有变量的统一m Lipschitz条件。定理4.2方程(4.11)在空间L×L中最多有一个解(\'p,\'k)。证明:假设有两个解(\'p(1),\'k(1))和(\'p(2),空间L×L.define’p(s;t)中的k(2)△= \'p(1)(s;t)- \'p(2)(s;t),\'k(s;t)△=\'k(1)(s;t)-\'k(2)(s;t)和f(s;t)△= f(s,\'p(1)(s;t),\'p(1)(s;s)等l(s)p(1)(s;s),\'k(1)(s;t)等l(s)k(1)(s;t))-f(s,\'p(2)(s;t),\'p(2)(s;s)等l(s)p(2)(s;s),\'k(2)(s;t)等l(s)k(2)(s;t)).然后|f(s;t)|≤ C|\'p(s;t)|+|k(s;t)|+|p(s;s)|+Et[|p(s;s)|]+Et|\'k(s;t)|对于某些常数c,和d′p(s;t)=-f(s;t)dt+\'k(s;t)\'dWs,\'p(t;t)=0。无论如何∈ [0,T],s∈ [t,t],根据它的^o公式,我们有| | p(s;t)|+ZTs | k(u;t)| du=2ZTs | p(u;t)f(u;t)du- 2ZTs‘p(u;t)’k(u;t)’dWu。苏斯|\'p(s;t)|+ EZTs|k(u;t)|du≤ 总工程师ZTs|p(u;t)||\'p(u;t)|+|k(u;t)|+|p(u;u)|+Et[|p(u;u)|]+Et|\'k(u;t)|杜≤ 总工程师中兴通讯|\'p(u;t)|+|p(u;u)|杜+EZTs|k(u;t)|du,我们使用了不平等性cxy≤ cx+y对于任何非负的c,x,y。因此,存在c>0使得(4.12)E|\'p(s;t)|+ EZTs|k(u;t)|du≤ 总工程师中兴通讯|\'p(u;t)|+|p(u;u)|杜.此外,对于任何∈ [t,t],我们有|p(s;t)|+ZTs|k(u;t)|du≤ c(T)- t) “苏普∈[t,t]E|\'p(u;t)|+ 苏普∈[t,t]E|“-p(u;u)|#≤ 2c(T)- t) 监督≤U≤s≤TE|\'p(s;u)|.因此(4.13)支持≤U≤s≤TE|\'p(s;u)|≤ 2c(T)- t) 监督≤U≤s≤TE|\'p(s;u)|.现在取δ∈ (0,1/(4c))。

16
能者818 在职认证  发表于 2022-5-8 01:13:04
那么对于任何一个t∈ [T]- δ、 我们有SUPT≤U≤s≤TE|\'p(s;u)|≤监督≤U≤s≤TE|\'p(s;u)|,这意味着支持≤U≤s≤TE[| | p(s;u)|]=0。因此,p(s;u)=0,a.s.几乎在{(s,u):t中的任何地方≤ U≤ s≤ T}。对于t∈ [T]- 2δ,T- δ] 和s∈ [T]- δ、 T],因为对于任何u,p(u,u)=0∈ [s,T],我们在(4.12)之前已经知道了(4.14)E|\'p(s;t)|+ EZTs|k(u;t)|du≤ 总工程师ZTs|p(u;t)|du.然后,Grownwall不等式会导致“p(s;t)=”k(s;t)=0。对于t∈ [T]-2δ,T-δ] 和s∈ [t,t]-δ] ,注意“p(T-δ; t) =0,我们可以将前面的参数应用于区域t∈ [T]- δ、 T]和s∈ [t,t]来推断`p(s;t)=`k(s;t)=0。然后我们可以以向后的方式重复相同的分析∈ [T]- 3δ,T- 2δ]所以当我们到达时间t=0时。Q.E.D.5随机参数完全市场中均值-方差均衡策略的唯一性[6]作为时间不一致LQ理论的应用,我们研究了具有随机模型系数的完全市场中的连续时间马尔科维茨均值-方差投资组合选择模型。我们的目标是建立均衡策略的唯一性。该模型在数学上是本文前面提出的一般LQ问题的特例,n=1。然而,由于一些系数允许是随机的,所以前一节的唯一性结果在这里不适用。我们使用与[6]相同的设置。财富方程式由SDE(5.1)管理dXs=rsXsds+θ′susds+u′sdWs,s∈ [t,t],Xt=Xt,其中r是(不确定的)确定性利息率函数,θ是本质上有界的随机风险溢价过程。状态为Xt=Xt的时间t的目标是最小化EJ(t,Xt;u)△=瓦特(XT)- (uxt+u)Et[xt](5.2)=Et[XT]- (Et[XT])- (uxt+u)Et[xt]与u≥ 0

17
可人4 在职认证  发表于 2022-5-8 01:13:08
如[6]所述,该模型中存在两个时间不一致性来源,一个来自方差t项,另一个来自均值和方差之间依赖于状态的权衡。在[6,第5节]中,我们通过溶液(M,U),(Γ(1),γ(1)),(Γ(2),γ(2))和(Γ(3),γ(3))构造了一个平衡点,以BSDE:(5.3)dMs=-[2rsMs+(θsMs+Us)′αs]ds+U′sdWs,MT=1,dΓ(1)s=-rsΓ(1)sds+(γ(1)s′dWs,Γ(1)T=u,dΓ(2)s=-[rsΓ(2)s+(θsMs+Us)′βs]ds+(γ(2)s′dWs,Γ(2)T=-u,dΓ(3)s=-[rsΓ(3)s+(θsMs+Us)′βs]ds+(γ(3)s′dWs,Γ(3)T=0,其中(5.4)αs△= -M-1s-θsΓ(1)s+Us- γ(1)s,βs△= -M-1shθs(Γ(2)s)- Γ(3)s)+γ(2)si。在这种情况下,对应于给定策略(控制)u的p(·;t)的BSD E(3.1)*通过财富(状态)过程X*专攻(5.5)dp(s;t)=-rsp(s;t)ds+k(s)′dWs,p(t;t)=X*T- Et[X*[T]- uX*T- u,对应的∧(s;t)是∧(s;t)=p(s;t)θs+k(s)。[6,命题5.1]证明了BSDEs系统(5.3)同时具有M和M的唯一解-1有界,且U·W为BMO鞅。此外,反馈策略(5.6)u*s=αsX*s+βsde在空间LF(0,T;Rd)中定义了一个控制,这是均值-方差投资问题的均衡策略。我们现在宣称上面的平衡是唯一的。对于任何q>1,定义(q):={X(·;·):X(·;t)∈ LqF(Ohm; C(t,t;R)) T∈ [0,T]},andL(q):=(Y(·):Y被调整,E“ZTt | Y(s)| dsq/2#+∞).定理5.1对于均值-方差问题(5.1)-(5.2),有一个唯一的均衡策略,它与反馈LAW(5.6)产生的均衡策略相同。证明:假设存在其他均衡财富——策略对(X,u)。然后方程(5.5),X*替换为X,允许满足∧(s;s)的唯一解(p(·;t),k(·))≡p(s;s)θs+k(s)=0表示a.e。

18
能者818 在职认证  发表于 2022-5-8 01:13:12
s∈ [0,T]。[6]证明了M,M-1、Γ(1)、Γ(2)和Γ(3)都是有界的,γ(2)·W和U·W都是BMO-mart内浇道。特别是,由于U·W是一个BMO鞅,它遵循John–Nirenberg不等式(见Kazamaki[5,定理2.2,p.29]),存在ε>0,使得EheεRT | Us | dsi<+∞. 所以呢RT | Us | ds齐<+∞ 对于anyq>0。定义p(s;t):=p(s;t)-hMsXs+Γ(2)s- EMsXs+Γ(3)s- Γ(1)sXti,\'k(s)=k(s)-Msus+UsXs+γ(2)s.检查这一点很容易∈ L(2)。另一方面,k∈ LF(0,T;Rd),Mu+γ(2)∈LF(0,T;Rd),对于任何q∈ (1,2),E“ZT | UsXs | dsq/2#≤ E“sups∈[0,T]| Xs | qZT | Us | dsq/2#≤E“sups∈[0,T]| Xs |#!q/2E“ZT | Us | dsq/(2)-q) #!1.-q/2<+∞.加上LF(0,T;Rd) L(q)Q∈ (1,2),暗示“k”∈ L(q)forq∈ (1, 2).此外,等价条件给出了‘p(s;s)θs+’k(s)+θs[Γ(2)s)- Γ(3)s- Γ(1)sXs]+[Msus+UsXs+γ(2)s]=0。求解(5.7)us中的uswe obta=-M-1sh(美国)- θsΓ(1)s)Xs+θs′p(s;s)+k(s)+θs(2)s- Γ(3)s)+γ(2)si=αsXs+βs- M-1s[θs\'p(s;s)+k(s)]。接下来,我们可以推导出(\'p(·;t)、\'k(·))满足的下列BSDE(详情见附录B)(5.8)dp(s;t)=-卢比(标准差)- (θs+UsM)-1s)′[θs′p(s;s)+k(s)]+Et(θs+UsM)-1s)′[θs′p(s;s)+k(s)]ds+k(s)′dWs,s∈ [t,t],\'p(t;t)=0。我们将在下一个定理中证明,对于某些q,这个方程在空间L(q)×L(q)中最多允许一个解(\'p,\'k)∈ (1,2),导致“p”≡ 0和k≡ 因此,我们有我们=αsXs+βs。换句话说,我们的反馈形式与u完全相同*s、 这就建立了独特性。任意Q的Q.E.D.定理5.2∈ (1,2),等式(5.8)几乎允许一个解(\'p,\'k)∈L(q)×L(q)。证明:固定t。在(5.8)的积分形式的两边取Et[·],注意到rst@k·W是鞅,我们得到Et[@p(s;t)]=ZTsrνEt[@p(v;t)]dν,这意味着对于任何s,Et[@p(s;t)]=0≥ T

19
何人来此 在职认证  发表于 2022-5-8 01:13:16
特别是,取s=t,我们得到了p(t;t)=0。因此,方程式(5.8)简化为(5.9)dp(s;t)=-卢比(标准差)- (θs+UsM)-1s)′k(s)+Et(θs+UsM)-1s)′k(s)ds+\'k(s)\'dWs,\'p(T;T)=0。由于r是确定性且有界的,我们可以用e来贴现p(s;t)-RTSRVDVT以删除该项-上述等式右侧的rs’p(s;t);因此,我们假设≡ 0而不丧失通用性。定义p(s;t):=\'p(s;t)-RTsEt(θv+UvM)-1v)′k(v)dv。然后,p(T;T)=0和dp(s;T)=(θs+UsM)-1s′k(s)ds+k(s)dWs。对于任何“q”∈ (1,q),表示^q=q/^q,和1/^p+1/^q=1。那就吃吧∈[t,t]ZTsEthθν+UνM-1ν′\'k(ν)idν“q”#≤ E“ZTtθν+UνM-1ν′\'k(ν)dν“q”#≤ 行政长官“ZTt|θ′νk(ν)|dν“q#+cE”ZTtM-1|U′νk(ν)|dν“q”#≤ 行政长官“ZTt|k(ν)|dν“q/2#+cE”ZTt | Uν| dν“q/2ZTt|k(ν)|dν“q/2#≤ c+cE“ZTt | Uν| dν“q^p/2#!”!1/^pE“ZTt|k(ν)|dνq/2#!1/^q<+∞,式中c,c,c表示适当常数。另一方面,假设∈ L(q)。因此,E小吃∈[t,t]|p(s;t)| q< + ∞.定义ξ=E(-(θs+UsM)-1s)·W)T≡ E-RT |θs+UsM-1s | ds-RT(θs+UsM)-1s)′dWs。自从嗯-1·W是BMO鞅,E[ξ]=1;因此,它可以用来定义一个新的概率测度bydQdP=ξ,其中^Ws=Ws+Rs(θv+UvM)-1v)dv是标准的布朗运动。此外,dp(s;t)=k(s)\'d^Ws,~p(t;t)=0。应用^o公式,我们得到了dm-1s=-M-2sdMs+M-3S USDS=M-1s(“θ(Γ(1)sMs- 1) UsMs+Γ(1)s |θs | M#ds-U\'sMsdWs)。亨塞姆-1T=M-1exp-ZTU′sθsMs- Γ(1)s |θs | Ms+| Us | Ms- Γ(1)sU\'sθsMsds-ZTU\'sMsdWs.ξ与M的比较-1T,我们推导出ξMT=Mexp-ZTΓ(1)s |θs | Msds经验-ZTΓ(1)sθ′smsusmds经验-ZT |θs | ds-ZTθsdWs.很明显,我-RTΓ(1)s |θs | Msdsis有界,e-RT |θs | ds-RTθ′sdWs∈ 对于任何q>1的。此外,对于任意q>1和任意ε>0,存在一个常数C>0,使得eE-RTΓ(1)sθsmsusmds“q”≤ CEheεRT | Us | dsi。我们之前已经证明存在ε>0,使得EheεRT | Us | dsi<+∞.

20
mingdashike22 在职认证  发表于 2022-5-8 01:13:19
因此e-RTΓ(1)sθsmsusmds∈ 这反过来证明了ξMT∈ L\'q.然而,M-1是不可能的,所以ξ∈ 对于任何q>1的。现在来看看“q”∈ (1,q)和^q∈ (1,\'q),我们有eq[sups]∈[t,t]|p(s;t)|q]=E“sups”∈[t,t]|p(s;t)|qξ#≤E“sups∈[t,t]| | p(s;t)| | q#!^q/^qEξ\'q/(\'q)-^q)(`q)-^q)/^q<+∞,这意味着p(·;t)是Q-鞅,因此p≡ 0和k≡ 0.因为p(s;t)=p(s;t)+RTsEt(θv+UvM)-1v)′k(v)dv,我们得出结论≡ 0.Q.E.D.6结论:在缺乏传统时间一致性的情况下,均衡控制是解决动态控制问题的一种替代的、较弱的概念。我们在本文中建立的唯一性结果(如果仅适用于某些特殊情况)不仅从一个重要方面证明了时间不一致动态决策的博弈公式,而且从另一个角度证明了对开放循环(而非反馈)控制集均衡的定义。他们还阐明了寻找更一般问题唯一性的条件。由于均衡是通过博弈公式的局部摄动来定义的,与时间一致性问题的最优解不同,它们本质上不会导致相同的价值过程。解决方案的唯一性确实意味着价值过程的唯一性,而价值过程又解决了诸如“为什么用这种方式定义均衡”或“如果有多个解决方案,选择哪一个”之类的问题。我们意识到,在本文中,唯一性仅针对LQ控制问题的一些特殊类建立。对于一般时间不一致的LQ问题,甚至没有n-LQ问题,平衡点的存在唯一性仍然是一个突出的研究问题。参考文献[1]Bj¨ork T.和A.Murgoci,《马尔可夫时间不一致随机控制问题的一般理论》,1694759,社会科学研究网络(SSR N),2010年。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 12:34