楼主: 可人4
876 20

[量化金融] 无界条件下折扣报酬控制问题的光滑解 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

76%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
49.0443
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24465 点
帖子
4070
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
可人4 在职认证  发表于 2022-5-10 17:45:39 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Smooth solutions to discounted reward control problems with unbounded
  discount rate and financial applications》
---
作者:
Dariusz Zawisza
---
最新提交年份:
2016
---
英文摘要:
  We consider a discounted reward control problem in continuous time stochastic environment where the discount rate might be an unbounded function of the control process. We provide a set of general assumptions to ensure that there exists a smooth classical solution to the corresponding HJB equation. Moreover, some verification reasoning are provided and the possible extension to dynamic games is discussed. At the end of the paper consumption - investment problems arising in financial economics are considered.
---
中文摘要:
考虑连续时间随机环境下的折扣报酬控制问题,其中折扣率可能是控制过程的无界函数。我们提供了一组一般假设,以确保相应的HJB方程存在光滑的经典解。此外,还提供了一些验证推理,并讨论了动态博弈的可能扩展。本文最后讨论了金融经济学中的消费投资问题。
---
分类信息:

一级分类:Mathematics        数学
二级分类:Probability        概率
分类描述:Theory and applications of probability and stochastic processes: e.g. central limit theorems, large deviations, stochastic differential equations, models from statistical mechanics, queuing theory
概率论与随机过程的理论与应用:例如中心极限定理,大偏差,随机微分方程,统计力学模型,排队论
--
一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Quantitative Finance        数量金融学
二级分类:Mathematical Finance        数学金融学
分类描述:Mathematical and analytical methods of finance, including stochastic, probabilistic and functional analysis, algebraic, geometric and other methods
金融的数学和分析方法,包括随机、概率和泛函分析、代数、几何和其他方法
--

---
PDF下载:
--> Smooth_solutions_to_discounted_reward_control_problems_with_unbounded_discount_r.pdf (219.54 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:控制问题 Applications Mathematical Differential Quantitative

沙发
能者818 在职认证  发表于 2022-5-10 17:45:44
折扣报酬控制问题的光滑解,具有无界折扣率和财务应用Dariusz ZAWISZAAbstract。我们考虑了连续时间随机环境下的折扣报酬控制问题,其中折扣率可能是控制过程的无界函数。我们提供了一组一般假设,以确保相应HJB方程存在光滑的经典解。此外,还提供了一些验证推理,并讨论了动态博弈的可能扩展。本文最后讨论了金融经济学中的消费-投资问题。1.引言当控制空间是紧集时,我们考虑了连续时间差环境下的折扣报酬随机控制问题。除了现有文献,我们假设贴现率可能是无界的(贴现率进一步用h表示)。我们考虑有限时间和有限时间范围公式,重点是后者。对于这两种情况,我们都提供了一组假设,确保我们问题的值函数是对应的半线性HJB方程的光滑经典解。这类方程本身就很重要,因为它们自然出现在许多优化问题中,例如最优投资-消费问题。在这种模型中,贴现因子可能是无界的这一事实使我们有可能考虑随机利率模型,如Vasicek模型和许多其他模型。上述方程可以作为解决许多无约束优化问题的第一步(见Fleming和Hernandez[6])。此外,Friedman[12]表明,此类方程可以用于解决许多确定性控制问题。

藤椅
可人4 在职认证  发表于 2022-5-10 17:45:48
有限水平情况下主要结果的证明依赖于考虑系数满足某些边界的第一个HJB方程。由于这种解的随机控制表示,我们得到了它的导数和函数本身的一些估计。当使用有界函数逼近无界函数时,这种估计进一步用于应用Arzell-Ascoli引理。有限视野案例中的证明基于2010年有限数学科目分类的近似值。93E20,91G80。关键词和短语。折扣成本控制,HJB方程,最优消费,组合优化。二维ZAWISZAhorizon模型使用有限的地平线控制问题,与Fleming和McEneaney[7]或Fleming和Hernandez[5]接近。除了HJB方程的存在性理论,我们给出了一些关于验证参数的结果,并讨论了动态博弈的可能扩展。最后,我们考虑一个消费投资优化问题作为我们一般理论的一个例子。正如前面提到的,我们的工作可以被视为Flemingand Mceney[7]的一些结果的推广。关于HJBEquation光滑解存在性的最新研究,请参见Rubio[21](有限视界问题)或Lopez Barrientos等人[16](有限视界公式)的工作。另一方面,有大量关于消费投资模型的文献,在这些文献中,我们可以找到许多关于某些HJB方程解存在性的结果:Aktar和Ta flin[1],Constaneda Leyva和Hernandez[3],Fleming和Hernandez[5]和Fleming和Pang[8],Hata和Sheu[14],Pang[19],Pham[20],Zawisza[25]。在大多数此类工作中,通常假设贴现率为常数或从上方开始。

板凳
大多数88 在职认证  发表于 2022-5-10 17:45:51
作为一个例外,我们应该提到弗莱明、庞[8]和庞[19]的工作,当考虑贴现率具有二次依赖性的一些特定模型时。此外,他们中的许多人更关注一些特定的无约束控制问题,而不是约束问题。2.让我们考虑参考概率系统(Ohm, F、 P)N维维纳过程{Wt}t≥0及其自然增强过滤和形式(2.1)dYt=i(Yt,δt)dt+dWt,t的随机微分方程∈ [0,T]或T≥ 0(δt,t∈ [0,T])或分别(δT,T≥ 0),是在固定的紧凑集合中逐渐可测量的过程 Rk。这组控件用D表示。为了便于注释,在不可能出现混淆的情况下,我们通常使用Y而不是Yδt。这里我们只考虑微不足道的扩散项(σ)≡ 1) ,但我们的结果也适用于Y的许多Lipschitz变换,因此我们也可以处理更复杂的动力学。我们假设控制器的目标是最大化ZTteRsth(Yk,δk)dkf(Ys,δs)ds+erth(Yk,δk)dkg(YT)或者在有限的地平线公式中,0Z+∞erh(Yk,δk)dkf(Ys,δs)ds.我们解释为贴现率的函数h。符号Ey用于反映这样一个事实,即预期值是在假设系统(2.1)从状态y开始时间t开始贴现奖励控制问题3的情况下计算的,但有时为了便于记法,我们切换记法,只写Yk(y,t)。我们考虑以下一组假设。假设1。

报纸
mingdashike22 在职认证  发表于 2022-5-10 17:45:56
函数f,g,h,i是连续的,而且存在L>0,L∈ R\\{0}使得对于g,f和ζ=f,h,i和所有y,\'y∈ RN,δ∈ D、 我们有| g(y)- g(\'y)|≤ L|y- \'y |,(2.2)|ζ(y,δ)- ζ(`y,δ)|≤ L|y- y |,(2.3)(y)- \'y)[i(y,δ)- i(\'y,δ)]≤ L|y- “y”。(2.4)注意,在假设1下,(2.1)存在唯一的强解。提议2.1。在假设1的条件下,对于任何T>0,存在MT,KT>0,而对于所有T∈ [0,T],y∈ RNand for allδ∈ DEy,0eRth(Yk,δk)dkmax{f(Yt,δt)|,g(Yt)|,1}≤ KTeMT | y |。证据注意,在假设1 | Yt |≤ |y |+最大值∈[0,T]| Wt |+ZtL(1+| Ys |)ds,T∈ [0,T],y∈ 注册护士。Gronwall引理确保(2.5)| Yt |≤LT+| y |+最大值∈[0,T]| Wt|eLT,t∈ [0,T],y∈ 注册护士。利用函数f,g,h是线性增长条件的事实,对于任何C>0(2.6)EeC maxt,都能有效地观察到∈[0,T]| Wt |<+∞.这很容易从一个事实得出,对于一维维纳过程,我们有Maxt∈[0,T]| Wt |≤ 马克斯特∈[0,T]Wt+maxt∈[0,T](-Wt)和P(最大值)∈[0,T]Wt>m)=2P(Wt>m)。备注2.2。根据命题2.1,值得注意的是,存在一个确定性函数κ(t,n),t∈ [0,T],n∈ N、 t中的连续序列和序列p(t,N),N∈ N那是4 D.扎维扎尔δ∈ D我们havey,0eRth(Yk,δk)dkmax{f(Yt,δt)|,1}≤ κ(t,n),(2.7)Ey,0eRTh(Yk,δk)dkmax{g(YT)|,1}≤ p(T,n)表示所有y∈ B(0,n)。(2.8)对于有限水平控制问题,条件(2.7)-(2.8)非常弱。对于这样的问题,我们不需要更多的条件,这些条件在下面的假设2中给出。假设2。

地板
kedemingshi 在职认证  发表于 2022-5-10 17:45:59
存在一个确定性函数κ(t,n),t>0,n∈ N、 所有δ的连续性∈ D、 y∈ R、 t∈ [0,T],我们有,第二(Yk,δk)dkmax{| f(Yt,δT)|,1}≤ κ(t,n),总的来说∈ B(0,n),Z+∞κ(t,n)dt<+∞,Z+∞eLtκ(t,n)dt<+∞,其中,假设1中的常数Lis和B(0,n)表示半径等于n的封闭球。备注2.3。假设2的条件完全满足,例如,如果h(y,δ)=u(y,δ,η)- w、 f是有界的,u是连续的,有界的,w>supy,Δu(y,δ)。根据下面给出的结果,还可以推断出另外两个例子。提议2.4。假设N=1,过程(Yt,t∈ [0,T])是(2.1)的强解,假设进一步存在α,β,P,Q≥ 0,α6=0,thati(y,δ)≤ -αy+β,h(y,δ)≤ -P+Qy,δ∈ D、 η∈ Γ,y∈ R.那么对于所有δ∈ 第二(Yk,δk)dk≤ eQy+αe(-P+Qβα+Q2α)t,t>0,y∈ R.证明。注意dyt=i(Yt,δt)dt+dwt使用Ito公式我们得到了αtYt=[αeαtYt+eαti(Yt,δt)]dt+eαtdWt≤ βeαt+eαtdWt,进一步eαtYt=y+Zt[αeαsYs+eαsi(Ys,δs)]ds+ZteαsdWs≤ y+Ztβeαsds+ZteαsdWs。这个庄园≤ 耶-αt+βα(1)- E-αt)+中兴α(s)-t) DWS发现了奖励控制问题5和ZTYS≤y+α+βαt+ZtZseα(k-t) dWkds=y+α+βαt+ZtZtseα(k-t) dkdWs=y+α+βαt+Ztα1.- eα(s)-(t)dWs。因此zth(Yk,δk)dk≤ -pt+Qy+α+Qβαt+QZtα1.- eα(s)-(t)第二个(Yk,δk)dkf(Yt,δt)≤ eQy+αe(-P+Qβα+Q2α)t。将上述结果推广到情况y并不困难∈ 注册护士。第二个例子出现在下面的命题中。提议2.5。如果h(y,δ)≤ -w、 f(y,δ)≤ L(1+| y |),其中w>max{0,L},那么对于所有δ∈ 第二个(Yk,δk)dkh(Yk,δk)≤ E-wt(1+| y | eLt),y∈ 注册护士。证据使用伊藤公式,我们得到了0 | Yk|≤ |y |+2LZkEy,0 | Yl | dl。Gronwall引理yieldsEy,0 | Yk|≤ |y | e2L(k-s) 最后,0 | Yk |≤ |麋鹿。这就完成了证明。3.

7
能者818 在职认证  发表于 2022-5-10 17:46:02
有限视界问题我们从形式为(3.1)ut的HJB方程开始+u+maxδ∈Di(y,δ)u+h(y,δ)u+f(y,δ)= 0,y∈ RN,t∈ [0,T),终端条件u(y,T)=g(y)。符号i(y,δ)u用于说明函数i和u的梯度之间的点积。众所周知,在某些温和条件下,该方程存在光滑解,因此我们首先考虑验证定理的以下形式。6 D.Zawisza3.1提案。假设假设1的所有条件都满足,并且存在u-a(3.1)的解和KT,MT>0,使得u∈ C2,1(RN×[0,T))∩C(RN×[0,T])和(3.2)| u(y,T)|≤ KTeMT | y |,y∈ RN,t∈ [0,T]。然后,u接受公式u(y,t)=supδ的随机表示∈戴伊,tZTteRsth(Yk,δk)dkf(Ys,δs)ds+erth(Yk,δk)dkg(YT),(3.3)其中Y是dYt=i(Yt,δt)dt+dWt的唯一解。此外,如果δ*(y,t)是等式(3.1)中的可测最大化子,然后它决定了一个最优控制过程。证据我们可以结合(3.2),(2.5),(2.6)来确保∈ RNandδ∈ D、 我们有≤s≤TeRsth(Yk,δk)dk|u(Yδs,s)|+∞.进一步假设δ*(y,t)是(3.1)的Borel可测最大化子。根据Veretennikov[24]在Mceney[17,引理3.2.1]中推广的结果,todYt=i(Yt,δ)存在一个强解*(Yt)dt+dWt。事实上,McEneney的结果是在假设有效函数1严格小于0的情况下证明的,但如果函数i是Lipschitz连续的,他的关键不等式2.7也成立。这些事实使我们能够使用标准的验证推理,这可以在许多经典教科书中找到。

8
kedemingshi 在职认证  发表于 2022-5-10 17:46:05
让uT(y,t)表示(3.1)的解,终端条件在时间t给出。现在我们主要感兴趣的是证明uT(y,0)及其第一个y导数的一些估计,当通过适当的极限时,这些估计将进一步用于应用Arzell-Ascolli引理。注意,表示法(3.3)保证了满足(3.2)的函数类的唯一性,这可能导致我们得到等式uT-t(y,0)=uT(y,t)(假设两个解都存在)。我们需要以下lemmaLemma 3.2。假设假设1的所有条件都满足,那么| Yk(y,s)- Yk(\'y,s)|≤ |Y- “y|eL(k-s) ,为了所有的y,\'y∈ RN,k≥ s≥ 0.证明。让k≥ 让我们确定下来。使用伊藤公式,我们得到| Yk(y,t)- Yk(\'y,t)|=(y)- \'y)+Zkt2(Yl(y,t)- Yl(`y,t))[i(Yl(y,t),δl)- i(Yl(y,t),δl)]dl。折扣报酬控制问题7使用(2.4)我们得到| Yk(y,t)- Yk(\'y,t)|≤ |Y- \'y |+2LZkt | Yl(y,t)- Yl(\'y,t)| dl。Gronwall引理产生| Yk(y,s)- Yk(y,s)|≤ |Y- \'y| e2L(k-s) 。提议3.3。假设假设1的所有条件都存在(3.1)的有界解。此外,让函数f有界,h从上面有界。那就好了∈ N uTare的以下估计值令人满意:uT(y,0)≤ZTκ(s,n)ds+p(T,n),uT(y,0)≤L+L | L|ZTmax{1,eLs}κ(s,n)ds+max{1,eLT}p(T,n),其中,函数κ(t,n)和p(t,n)取自(2.7)-(2.8)。证据让我们来看看∈ B(0,n)命题3.1确保ut(y,0)=supδ∈戴伊,0zterhs(Yk,δk)dkf(Ys,δs)ds+eRTh(Yk,δk)dkg(YT).从备注2.2我们得到| uT(y,0)|≤ZTκ(s,n)ds+p(T,n)。开往u将通过估算Lipschitz常数获得。

9
kedemingshi 在职认证  发表于 2022-5-10 17:46:09
为了方便起见,我们将用Ef(Yt(y,s))代替Ey,sf(Yt)|uT(y,0)- uT(y,0)|≤ supδ∈DEZT|f(Ys(\'y,0),δs)|erh(Yk(y,0),δk)dk- Ers(Yk(`y,t),δk)dkds+supδ∈Dextersh(Yk(y,0),δk)dkf(Ys(y,0),δs)- f(Ys(`y,0),δs)ds+supδ∈DE|g(YT(\'y,0))|eRTh(Yk(y,0),δk)dk- eRTh(Yk(`y,t),δk)dk+ supδ∈DEeRTh(Yk(y,0),δk)dkg(YT(y,0))- g(YT(y,0)).8 D.ZAWISZANote假设1满足,henceZs[h(Yk(y,t),δk)- h(Yk(`y,0),δk)]dk≤ LZs | Yk(y,0)- Yk(\'y,0)| dk≤ L|y- \'y | zselkd和相应的zsh(Yk(y,t),δk,η(δk))dk≤Zsh(Yk(`y,0),δk,η(δk))dk+L|y- “y|ZseLkdk。也就是说| f(Ys(\'y,0),δs)|erh(Yk(y,0),δk)dk- Ers(Yk(`y,0),δk)dk≤|f(Ys(\'y,0),δs)| ers(Yk(\'y,t),δk)dk+L | y-\'y | RseLkdk··Zs | h(Yk(y,t),δk)- h(Yk(`y,t),δk)|dk≤ L|y- y | | f(Ys(\'y,0),δs)| erh(Yk(\'y,t),δk)dk+L | y-\'y | RseLkdkZseLkdk≤L | L | max{1,eLs}| y- y | | f(Ys(\'y,0),δs)| erh(Yk(\'y,t),δk)dk+L | y-“y | RseLkdk,其中在第一个不等式中,我们使用了一个事实,即对于任何x,y≤ a、 |前- |≤ ea | x- y |。

10
大多数88 在职认证  发表于 2022-5-10 17:46:12
同样的推理也可用于获得| g(YT(\'y,0))|eRTh(Yk(y,0),δk)dk- eRTh(Yk(`y,0),δk)dk≤L | L | max{1,eLT}y- y | | g(YT(\'y,0))| | eRTh(Yk(\'y,t),δk)dk+L | y-\'y | RTeLkdk,eRTh(Yk(y,0),δk)dk | g(YT(y,0))- g(YT(\'y,0))|ds≤ L|y- \'y|eLTeRTh(Yk(y,0),δk)dk,erh(Yk(y,0),δk)dkf(Ys(y,0),δs)- f(Ys(`y,0),δs)ds≤ L|y- \'y|elsers(Yk(y,0),δk)dk。现在我们可以使用假设2将所有不等式归纳为| uT(y,0)- uT(y,0)|≤L+L | L||Y-y | EZTmax{1,eLs}| f(Ys(\'y,0),δs)| erh(Yk(\'y,t),δk,η(δk))ds+L |y-\'y | RseLkdkds≤L+L | L||Y- \'y|ZTmax{1,eLs}eL|y-\'y | RseLkdkκ(s,n)ds+max{1,eLT}eL |y-“y | RTeLkdkp(T,n),折扣奖励控制问题9,保证uT(y,0)≤L+L | L|ZTmax{1,eLs}κ(s,n)ds+max{1,eLT}p(T,n).现在我们准备证明,对于无界函数f和h,值函数也是(3.1)的光滑解。引理3.4。假设假设1的所有条件都满足,并让函数F有界,h从上面有界。那么函数h(y,u,p)=maxδ∈D(i(y,δ)p+h(y,δ)u+f(y,δ))在紧致子空间上是Lipschitz连续的,且存在K>0的| h(y,0,0)|≤ K、 y型∈ RNH(y,u,p)- H(y,u,p)≤ K(u)- “u”,如果u>“u,y”∈ RN,p∈ RN(3.4)|H(y,u,p)- H(\'y,u,p)|≤ K(1+| p |)| y- “y |,u”∈ R、 y,y,p∈ RN | H(y,u,p)- H(y,u,\'p)|≤ K(1+| y |)| p- “p|u”∈ R、 y,p,p∈ 注册护士。证据让我们定义负(δ,y,u,p)=i(y,δ)p+h(y,δ)u+f(y,δ)。我们从不等式的证明(3.4)开始。注意我们有maxδ∈DG(y,u,p,δ)- 最大δ∈DG(y,u,p,δ)≤ 最大δ∈D(G(y,u,p,δ)- G(y,`u,p,δ))。andG(y,u,p,δ)- G(y,u,p,δ)=h(y,δ)(u- ’u)≤ h+(y,δ)(u)- “\'u”),这给了我们期望的结果。在剩下的证明中,有必要指出G是连续的且| maxδ∈DG(y,u,p,δ)- 最大δ∈DG(\'y,\'u,\'p,δ)|≤ 最大δ∈D | G(y,u,p,δ)- G(\'y,\'u,\'p,δ)|。提案3.5。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 21:09