楼主: kedemingshi
1244 16

[量化金融] 能源市场中摆动合约的最优执行:一个积分 约束随机最优控制问题 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
89.2735
学术水平
0 点
热心指数
8 点
信用等级
0 点
经验
24665 点
帖子
4127
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
kedemingshi 在职认证  发表于 2022-4-16 14:49:35 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
摘要翻译:
我们将连续时间的摆动收缩值刻画为具有适当边界条件的Hamilton-Jacobi-Bellman方程的唯一粘性解。带有罚金的合同的情况很简单,在这种情况下,只需要一个最终条件。反之,对于严格约束的合同,则会产生一个带有非标准状态约束的随机控制问题。我们用惩罚方法来处理这个问题:我们考虑一个一般的约束问题,用一系列适当的无约束问题的值函数来逼近这个值函数,在目标泛函中带有惩罚项。回到具有严格约束的摆动契约的情形,我们最后将值函数刻画为Hamilton-Jacobi-Bellman方程在适当的边界条件下的多项式增长的唯一粘性解。
---
英文标题:
《Optimal exercise of swing contracts in energy markets: an integral
  constrained stochastic optimal control problem》
---
作者:
M. Basei, A. Cesaroni, T. Vargiolu
---
最新提交年份:
2013
---
分类信息:

一级分类:Mathematics        数学
二级分类:Optimization and Control        优化与控制
分类描述:Operations research, linear programming, control theory, systems theory, optimal control, game theory
运筹学,线性规划,控制论,系统论,最优控制,博弈论
--
一级分类:Mathematics        数学
二级分类:Probability        概率
分类描述:Theory and applications of probability and stochastic processes: e.g. central limit theorems, large deviations, stochastic differential equations, models from statistical mechanics, queuing theory
概率论与随机过程的理论与应用:例如中心极限定理,大偏差,随机微分方程,统计力学模型,排队论
--
一级分类:Quantitative Finance        数量金融学
二级分类:Pricing of Securities        证券定价
分类描述:Valuation and hedging of financial securities, their derivatives, and structured products
金融证券及其衍生产品和结构化产品的估值和套期保值
--

---
英文摘要:
  We characterize the value of swing contracts in continuous time as the unique viscosity solution of a Hamilton-Jacobi-Bellman equation with suitable boundary conditions. The case of contracts with penalties is straightforward, and in that case only a terminal condition is needed. Conversely, the case of contracts with strict constraints gives rise to a stochastic control problem with a nonstandard state constraint. We approach this problem by a penalty method: we consider a general constrained problem and approximate the value function with a sequence of value functions of appropriate unconstrained problems with a penalization term in the objective functional. Coming back to the case of swing contracts with strict constraints, we finally characterize the value function as the unique viscosity solution with polynomial growth of the Hamilton-Jacobi-Bellman equation subject to appropriate boundary conditions.
---
PDF下载:
--> English_Paper.pdf (1.13 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:控制问题 最优控制 Optimization Differential Applications

沙发
能者818 在职认证  发表于 2022-4-16 14:49:43
能量市场中摆动契约的最优执行:一个积分约束随机最优控制问题我们将连续时间摆动契约的值刻画为具有适当边界条件的Hamilton-Jacobi-Bellman方程的唯一性解。有惩罚的合同的情况很简单,在这种情况下只需要物质条件。相反,对于具有严格约束的合同,则产生了一个具有非标准状态约束的随机控制问题。我们用惩罚方法来处理这个问题:我们考虑一个一般的有约束问题,用一系列适当的无约束问题的值函数来逼近这个值函数,在目标泛函中带有惩罚项。回到具有严格约束的摆动合同的情况,我们将evalue函数描述为具有多项式增长的唯一粘性解,并服从适当的边界条件。关键词:摆动合同,能源市场,随机控制,状态约束,惩罚方法,动态规划,HJB方程,粘性解。1引言能源在金融市场中以其各种形式(电,煤,气,油等)交易,主要通过两种类型的合同,即远期和摆动。远期合同是两个部分之间的义务,以特定的形式(电力或燃料)交换一定数量的能量和预先确定的金额:一旦结算,该合同对两个部分都有严格的约束力,不给他们任何联系资格。相反,swing合同给买方一定数量的bovereXobility,同时也给买方提供了一定的保证,即最小数量的能量将被购买。这是因为能源储存在燃料中是昂贵的,而在电力中几乎是不可能的;此外,能源市场受到许多因素的影响(与天气突然变化有关的消费高峰、发电厂故障、金融危机等)。因此,能源的价格受显著性的影响,因此bovereXobility受到合同购买者的欢迎。swing合同中的bovereXobility是以这种方式实现的(我们在这里遵循[3]中的方法,并在连续时间内对合同进行建模):对于一个规定的合同成熟度*帕多瓦大学数学系,通过Trieste 63,35121 Padova,意大利。电子邮件:basei@math.unip d.it,acesar@math.unipd.it,vargiolu@math.unipd.it.T(通常是一年或几年),买方可以选择在每次s∈[0,T]时,以预先确定的执行价格K购买非边际量的能源u(s)∈[0,u],从而实现非边际利润(或损失)等于u(s)(P(s)-K),其中P(s)是该种能源的现货价格。这给了买方潜在的利润(或损失)ZTE-RSU(s)(P(s)-K)ds,r>0为无风险利率。然而,能量卖方通常希望能量总量Z(T)=RTU(s)dsto介于最小值和最大值之间,即Z(T)∈[m,m]。这主要通过两种方式实现。当Z(T)/∈[m,m]时,可以采取惩罚措施,即:当Z(T)/∈[m,m]时,采取惩罚措施。使买方支付一个penaltyeΦ(P(T),Z(T)),其中Φ(P,Z)是一个合同函数,对于Z∈[m,m]为零,并且通常在Z中是凸的。第二种方法是严格规定约束Z(T)∈[m,m],即迫使买方撤回最小累积能量m,并在达到最大m时停止给出能量。我们对在这两种情况下最优执行摆动期权的问题感兴趣。该问题可以被描述为一个连续时间随机控制问题,我们的目的是研究相应的值函数,并将其刻画为相关Hamilton-Jacobi-Bellman(HJB)方程的唯一性解。

藤椅
可人4 在职认证  发表于 2022-4-16 14:49:49
在这样做的过程中,我们感到我们填补了文献中的一个空白,即在非离散时间[1,2,7,11]中通过动态规划原理和连续时间[3,9]中的Bellman方程[3,9]来处理摆动契约,只是报告了HJB方程光滑解的验证定理,而没有报告该定理的存在性或唯一性结果。此外,我们还将文[3,9]中只处理m=0的方法推广到了m>0的情况,这是实际应用中最相关的情况(事实上,[13]典型地报道了m∈[0.8m,m])。我们还必须引用[4],其中continuoustime中的摆动收缩在连续时间中用多个停止技术处理,但是对于时间内的摆动契约的实际计算,将问题简化为离散的时间近似值。在带有惩罚的摆动契约的情况下,我们得到了一个标准的随机控制问题,当一个在泛型时间t∈[0,t]进入该区域的购买者的期望payo极值为byeV(t,p,z)=supu∈atetpz ztte-rs(p(s)-K)u(s)ds-e-rteΦ(p(t),z(t)),(1.1)时,(t,p,z)∈[0,t]×R,其中阿季斯[0,u]值累进可测过程集u={u(s)}s∈[t,t]。因此,在这种情况下,经典理论(见[6,8,10])可以应用:见第2节。相反,具有严格约束的摆动收缩产生了一个具有非标准状态约束的随机控制问题:V(t,p,z)=SUPU∈Aadmtzetpz ztte-r(S-t)(p(s)-K)u(s)ds,(1.2)在一个适当的区域D[0,t]×r中具有(t,p,z),其中Aadmtzz是过程集u∈ptpz-a.s。Z(T)∈[m,m]。由于Zt,z;u(T)上存在约束,经典理论在这里不适用。这促使我们在第3节中考虑一个更一般的积分约束随机问题,其形式为V(T,p,z)=SUPU∈AADMTZetPZ ZTTE-R(S-T)L(s,p(s),z(s),u(s))ds+E-R(T-T)Φ(p(T),z(T))(1.3),其中方程(1.2)是一个特例。关于确切的规定和假设,请参阅第3.1节;特别是,我们要求一个技术假设(假设3.5)成立。由于不可能对标准证明进行简单的修改,我们遵循ADI的方法:我们证明了在给定的D中,方程(1.3)中的函数V是适当的无约束问题的值函数VCON的极限,其中约束被目标函数中的适当惩罚所代替。更详细地说,主要结果是定理3.7:在每个集合Dρ(3.1)V局部一致地是函数Vcin(3.12)的极限。因此,在ρdρ,值函数是连续的(推论3.8)。在命题3.12和3.13中,我们证明了在适当的假设下,函数V(t,·,z)是Lipschitz连续的,且A.E。两次直缝可穿。在3.4节中,如果f和σ满足一个适当的条件,我们证明了假设3.5在g(s,v)=v和g(s,v)=vp(p≥1)中是充分的。在第4节中,我们将这些一般结果应用于(1.2)中的问题。在这种情况下,由于可以直接证明值函数不仅在D内是连续的,而且在整个域D内是连续的(命题4.1和4.3),因此将得到更强的结果。因此,在适当的边界条件下,V可以被刻画为唯一的粘性解,并具有HjBequique的多项式增长(定理4.4)。对于Vevalue函数的正则性,除了上述关于变量p的一般结果(命题4.5)外,我们还证明了V(t,p,·)是凹的,并研究了它的单调性(命题4.6)。积分约束控制问题是控制理论中的经典问题,有时在应用中自然出现:如控制器的lp范数有界的控制问题,给定的总变差或总能量有界的控制问题,设计不确定的控制系统。

板凳
mingdashike22 在职认证  发表于 2022-4-16 14:49:55
然而,动态规划方法提出了几个技术缺陷。其主要原因在于动态规划原理不能直接用值函数来体现,问题必须直接解决。关于确定性系统的情况,我们参考了[15,16]和其中的参考文献。对于随机控制的情况,上界Z(T)≤M类似于所谓的燃料问题的约束,后者是控制绝对值积分上有一个上界的最优控制问题(见[10,第八章]关于该问题的介绍,[14]和其中的参考文献)。相反,下界Z(T)≥m是非标准的。在方程(1.2)的特殊情况下,并且只有在m=0的情况下,这样一个界已经被研究过(在[3]中处理过,在[9]中得到了推广,仍然在m=0的情况下)。然而,我们已经说过,这种情况是非常不现实的,因为卖方想要确保出售一定数量的能量,所以典型地ym>0([13]报告了真实合同的典型值m∈[0.8m,m])。据我们所知,控制上具有一般积分约束的随机最优控制问题尚未得到研究。第二节研究了违约金合同的评估问题。第3节讨论了一般一类约束控制问题,如方程(1.3)所示。最后,在第4节中,我们深入分析了(1.2)中概述的具有严格限制符号的swing契约的最优执行问题。我们用k·k表示超范数。若B∈Mij(R)(即实i×j矩阵),则bt表示B的转置,而tr(B)表示其迹。B(x,R)是指Rn中中心为x,半径为R的闭球。若O Rnand k∈N,则用Ckb(O)(rep.cKP(O))表示Ck(O)类的函数集,其k阶导数是有界的(又是多项式增长的)。如果φ是来自(t)的函数,p,z)∈A R×rn×R to R,我们指的是关于t和z的导数,而dp,dp,我们指的是关于变量P.2的带惩罚的摆动契约的雅可比矩阵和海森矩阵。在本节中,我们考虑导言中所描述的带惩罚的摆动契约的最优执行问题:为此,我们将随机控制中的经典结果形式化为一个连续的时间模型,设t>0和一个带惩罚的概率空间(Ω,FT,{Fs}s∈[0,t],P)和一个实的{Fs}自适应布朗运动W={W(s)}s∈[0,t]。设t∈[0,t],p≥0。我们通过一个随机过程来建立能量价格模型{Pt,p(s)}s∈[t,t],它满足SDEdPt,p(s)=f(s,Pt,p(s))ds+σ(s,Pt,p(s))dW(s),s∈[t,t],(2.1),初始条件Pt,p(t)=p,其中f,σ∈C([0,t]×r;R)是关于第二个变量一致的Lipschitz连续的(众所周知,这个条件保证了SDE的一个路径唯一强解的存在性)。在每个s∈[t,t]中,持有者可以以一个规定的酉价K>0和购买强度u(s)∈[0,u]购买能量,其中u>0是一个常数:这给出了(Pt,p(s)-K)u(s)的净瞬时损失(或损失)。设At=所有[0,u]值累进可测过程u={u(s)}s∈[t,t](即契约的所有可能使用策略)的集合,设z为直到时间t的能量购买量,设u∈At=从时间t开始的一个练习策略;对于每一个s∈[t,t],我们用Zt,z;U(s)表示到时间s时购买的能量:Zt,z;U(s)=z+ZSTU(τ)Dτ,s∈[t,t]。如果全局购买的能量Zt,z;U(t)不在一个规定的范围[m,m](m,m∈R,其中m≤m),持有者必须支付一个penaltyΦ(Pt,p(t),Zt,z;U(t)),其中EEΦ是一个从R到R的函数。

报纸
可人4 在职认证  发表于 2022-4-16 14:50:02
在典型情况下(例如,参见[1,2,8]),惩罚与Pt,p(T)+和溢出或欠下的实体成正比:对于所有(p,z)∈R,通过设置Φ(p,z)=-ap+(z-m)+-bp+(m-z)+得到,其中A,B>0是适当的常数。在几个实际案例中,A=B。然而,其他种类的惩罚也是可能的(例如见[11]):通常,代表合约结束时T的价格的p+可以用spotprices的算术平均数(因此在问题中需要另一个状态变量)或一个固定的(高)惩罚来代替。根据上面的讨论,我们假定对于z∈[m,m],z中全凹的情况下,Φ(p+h,z)-eΦ(p,z)≤Ch(1+z),eΦ(p,z+h)-eΦ(p,z)≤Ch(1+p),φ(p,z)∈R,h>0,其中C>0是一个常数。设R≥0为无风险率。我们得到了一个随机最优控制问题,其值函数为:ev(t,p,z)=SUPU∈ATEJ(t,p,z);u),(2.2)对于每个(t,p,z)∈[0,t]×R,其中J(t,p,z;u)=etpz ztte-r(s-t)(Pt,p(s)-K)u(s)ds+e-r(t-t)eΦ(Pt,p(T),Zt,z;u(T))和由Etpzwe表示相对于概率p的中值。问题(2.2)属于广泛研究的一类控制问题:根据已知的经典结果(在定理2.1中总结),该值函数是相应的Hamilton-Jacobi-Bellman方程在适当的条件下的唯一粘性解(我们参考[5]了解粘性解)。函数ev是-evt(t,p,z)+reV(t,p,z)-f(t,p)eVp(t,p,z)-σ(t,p)eVp(t,p,z)+minv∈[0,u][-v(eVz(t,p,z)+p-k)]=0,π(t,p,z)∈[0,t[×R,2.3),条件为ev(t,p,z)=eΦ(p,z),π(p,z)∈R,(2.4),且对于某个常数,ev(t,p,z)≤c(1+p+z),π(t,p,z)∈[0,t]×R,(2.4)c>0。证明。参见定理3.6,该定理是其中的一个特殊情况。注2.2。由于问题(2.3)-(2.4)的解是唯一的,所以值函数不依赖于概率空间选择,我们现在列出关于变量p和z的函数的一些性质。让我们从关于变量p的正则性结果出发。命题2.3。对于每个(t,z)∈[0,t]×r,函数ev(t,·,z)是Lipschitz连续的,在t中是一致的。此外,对A.E.存在导数EVP(t,p,z)。(t,p,z)∈[0,t]×Randwe对于某个常数M>0,仅依赖于(3.1)和(3.4)中的常数,有eVp(t,p,z)≤M(1+z)。设(t,p,z)∈[0,t]×R,h>0和u∈At。通过[10,附录D]中的估计(D.8),我们得到了ej(t,p+h,z;u)-ej(t,p,z;u)≤etpz zttpt,p+h(s)-Pt,p(s)u(s)ds+CPt,p+h(·)-Pt,p(·)k]+cetpz[kPt,p+h(·)-Pt,p(·)k](1+z+ut)≤M(1+z)h,(2.5),其中M>0是常数。由于(2.5)对每个u∈At成立,我们得到ev(t,p+h,z)-ev(t,p,z)≤M(1+z)h。(2.6)因此,函数ev(t,·,z)是Lipschitz连续的,在t中是一致的,然后是A.E。可由Rademacher定理微分。通过标准参数,它可以得出A.E.存在EVP(t,p,z)。(t,p,z)∈[0,t]×R,关于导数的估计紧随(2.6)。在下面的命题中,我们收集了关于函数ev关于z的光滑性和单调性的一些结果。命题2.4。对于每个(t,p)∈[0,t]×R,函数ev(t,p,·)是-Lipschitz连续的,在t中是一致的。此外,对于A.E存在导子evz(t,p,z)。(t,p,z)∈[0,t]×r,对于某些常数M>0,仅依赖于(3.1)和(3.4)中的常数,我们有eVz(t,p,z)≤M(1+p)。两次可扩展;-在]-∞,m-(t-t)u]中弱增,在[M,+∞[中弱减。特别是,如果m-(t-t)_u≥M,则函数ev(T,p,·)在[M,m-(t-t)_u]中为常数(它们都是极大值点)。项目1。

地板
可人4 在职认证  发表于 2022-4-16 14:50:08
设(t,p,z)∈[0,t]×R,h>0和u∈At。回想一下[10,附录D]中的以下估计:对于每一个k≥0,存在一个常数Bk≥0,仅依赖于(3.1)和(3.4)中的常数,即pz=kpt,p;u(·)kk≤Bk(1+pk)。(2.7)由此和EΦ(Pt,p(T),·)的Lipschitzianity得到Ej(T,p,z+h;u)-Ej(T,p,z;u)≤Cetpz[(1+Pt,p(T))Zt,z+h;u(T)-Zt,z;u(T)]≤Ch(1+etpz[Pt,p(T)])≤M(1+p)h,其中M>0为常数。然后按照命题2.3.第2项进行辩论。设(t,p)∈[0,t]×R,z,z∈R和u,u∈AT。请注意(u+u)/2∈AT,且thatZt,z+z;u+u(T)=Zt,z;u(T)+Zt,z;u(T)。(2.8)通过函数酮Φ(Pt,p(T),·)的凹性和(2.8)我们得到了ej(T,p,z;u)+ej(T,p,z;u)≤ej T,p,z+z;u+u≤v T,p,z+z。(2.9)由于(2.9)对于每个u,u,At成立,我们得到ev(t,p,z)+ev(t,p,z)≤ev t,p,z+z,然后得到函数ev(t,p,·)的凹性。A.E.Alexandrov定理第二个导数的存在性。设(t,p)∈[0,t]×r,z≤z≤m-(t-t)_u(M≤z≤z相似),u∈At。对于Zt,Z;U(T)≤Zt,Z;U(T)=Z+ZTTU(s)ds≤Z+(t-t)_u≤M,由于函数酮Φ(p,p(T),·)在]-∞,M]中呈弱增长,我们得到J(T,p,z;u)≤ej(t,p,z;(2.10)当不等式(2.10)对于每个u∈At成立时,我们得到ev(t,p,z)≤ev(t,p,z)。第二部分紧随其后,因为]-∞,m-(t-t)u]à[M,+∞[=[M,m-(t-t)u]。命题2.4中的单调性结果如图1所示。mmtzt0m-Ωt减少V(t,p,±)增加V(t,p,±)常数。V(t,p,±)图1:单调性ov(t,p,±)命题2.4的第三部分提供了一个明显出乎意料的结果:对于suitablet和对于所有p,V(t,p,±)函数V(t,p,±)在一个区间内是常数。事实上,这是可以预见的:很容易检查,如果m-(t-t)u≥M且z∈[M,m-(t-t)u],那么对于每个u∈At,Zt,z;u(T)∈[M,M],这样,客观泛函中的惩罚项就消失了,初始值z就不是值泛函了。如[3,等式(3.9)]所观察到的,(2.3)一个候选最优控制策略isu(t,p,z)=(u ifeVz(t,p,z)≥p-k,0 ifeVz(t,p,z)<p-k,(2.11)注意,根据命题2.4,(2.11)中的候选控制策略是a.E。很好的。此外,由于Ceev在z中是凹的,因此对于每个(t,p),存在z(t,p)∈[-∞,+∞],使得evz(t,p,z)<p-k当且仅当z>z(t,p):对于t,函数z(t,·)(在[3]中称为练习曲线)可以用来写u asu(t,p,z)=(u,如果z≤z(t,p),如果z>z(t,p),则0。(2.12)3积分约束随机最优控制。我们现在考虑导言中概述的具有严格约束的最优练习Swing合同的问题。由于约束的存在,在这种情况下,不可能像第2节那样进行辩论,并使用控制理论中的经典结果。这促使我们研究一类更一般的带积分约束的随机最优控制问题,其中带有严格约束的摆动契约是一个特例。3.1问题集d,l,n∈n,r≥0,T>0和m,m∈r,m<m的公式化。设U Rlbe非空且f,σ,g,l,Φ是满足以下假设的函数:假设3.1。

7
kedemingshi 在职认证  发表于 2022-4-16 14:50:15
i)U是RL的紧子集;ii)f∈C([0,T]×Rn×U;Rn),σ∈C([0,T]×Rn×u;Mnd(R)),且存在C>0的条件,即f(t,p,v)-f(t,q,v)≤cp-q,p,q∈Rn,[0,t]×U,σ(t,p,v)-σ(t,p,v)≤cp-q,p,q∈Rn,ut(t,v)∈[0,t]×U;(3.1)iii)g∈C([0,t]×U;Iv)L∈C([0,T]×Rn×R×U;R),Φ∈C(Rn×R;R)存在常数~C,k>1这样,p,z,v)≤~C(1+pk+zk),(t),p,z,v)∈[0,T]×Rn×R×U,Φ(p,z)≤~C(1+pk+zk),(p,z)∈Rn×R(3.2)而且,对于每个紧子集A rn+1存在一个连续模ω,p,z,v)-L(t,q,y,v)≤ωr(p-q+z-y),(3.3)对于所有(t,v)∈[0,t]×U和对于所有(p,z),(q,y)∈.注意条件(3.1)意味着atf(t,p,v)≤c(1+p),th(t,p,v)∈[0,t]×rn×U,σ(t,p,v)≤c(1+p),th(t,p,v)∈[0,t]×rn×U,(3.4)其中c>0是一个常数。设(Ω,FT,{Fs}s∈[0,t],p,W)是一个有限的概率空间,其中d维{Fs}s自适应布朗运动W={W(s)}s∈[0,t],p,W)是一个有限的概率空间.若t∈[0,t],则设attenote所有u值渐进可测过程的集合u={u(s)}s∈[t,t](控制),即对于每一个p∈rn,n维随机二次方程。dpt,p;u(s)=f(s,Pt,p;u(s),u(s))ds+σ(s,Pt,p;u(s),u(s))dW(s),s∈[t,t],(3.5)具有初始条件Pt,p;u(t)=p,(3.6)有一个路径唯一的强解。设t∈[0,t],z∈R,u∈Atand letZt,z;u(s)=z+ZSTG(τ,u(τ))dτ,s∈[t,t]。(3.7)若过程Zt,Z;UA.S.达到区间[m,M]在时间T:aadmtz=u∈AT:Zt,Z;U(T)∈[m,M]PTPZ-A.S.我们经常写Puand Zu,为了缩短符号。给定(t,z)∈[0,T]×R和A R,我们说A是从(t)可达的,如果存在一个来自[t]的Borel可测函数u,T]to U(注意,那么U∈At)这样,zt,z;U(T)∈A。设D,eD,Dρ(for 0<ρ<(M-M)/2)表示[0,T]×Rn×Rdeford byD={(T,p,z)∈[0,T]×Rn×R:[M,M]可从(T,z)}到达,eD={(T,p,z)∈[0,T]×Rn×R:]M,M[可从(T,z)}到达,dρ={(T,p,z)∈[0,T]×Rn×R:[M+ρ,m-ρ]可从(T,z)}到达。注意ρdρ=eD。很容易证明这些集合是非空的。引理3.2。集合D,eD,Dρ是非空证明的。设0<ρ<(m-m)/2。作为Dρed D,它表明Dρ6=.由于g([0,T]×U)=[ζ,ζ],对于合适的(~T,~z)∈[0,T]×R,对于从[~T,T]到U的每个Borel可测函数U,我们有z~T,~z,U(T)∈[~z+ζ(t-~T),~z+ζ(t-~T)][m+ρ,m-ρ],因此(~T,~p,~z)∈Dρ(任意的~p∈R)。如果(T,p,z)∈D,由Etpzwe表示相对于概率的平均值yptpz=p(下标召回初始数据)。我们现在可以解析值函数了。解析3.3。对于每个(t,p,z)∈D,我们设V(t,p,z)=SUPU∈Aadmtzj(t,p,z;u),(3.8),其中J(t,p,z;u)=etpz ztte-r(s-t)L(s,Pt,p;u(s),Zt,z;u(s),u(s),u(s),u(s))ds+e-r(t-t)Φ(p,p;u(t),Zt,z;u(t)).让我们证明值函数(3.8)是好的。引理3.4。(3.8)中的期望是适定的,V(t,p,z)<∞和V(t,p,z)≤à(1+pk+zk),(3.9)对于每个(t,p,z)∈D,其中k与(3.2)相同,γ≥0是一个常数,只依赖于U,t,C,~C,C和max g。而且,D是表达式(3.8)证明的最大集合。首先,注意aadmtz6=当且仅当(t,p,z)∈D,对于每个p∈Rn。Recallestimate(2.7):可以表明bkte只依赖于集合U和常数T,C,C(见[10,附录D]。通过(3.2)和(2.7)我们得到了pz ztte-r(s-t)L(s,Pt,p;U(s),Zt,z;U(s),U(s))ds+e-r(t-t)Φ(Pt,p;U(T),Zt,z;U(T)))≤~cetpz ztt(1+Pt,p;U(s)k+Zt,z;U(s)k)ds+(1+Pt,p;U(T)k+Zt,z;U(s)k)ds+(1+Pt,p;对于适当的常数C,C>0,k)≤cetpz[1+kPt,p;U(·)kk+kZt,z;U(·)kk]≤C(1+pk+zk),(3.10)。

8
nandehutu2022 在职认证  发表于 2022-4-16 14:50:21
给定0<ρ<(m-m)/2和一个紧子集a dρ,存在ε>0和函数0<η≤(m-m)/2,两者都只依赖于ρ、a、T和U,具有以下性质:对于每个0<ε<ε,(T,p,z)∈a,U∈Aadmtz,存在~U∈J(T,p,z;U)-J(T,p,z;~U)≤ε和a.s。在3.4节中,我们将给出满足假设3.5.3.2逼近问题的两个广泛的问题类:值函数的连续性和Hamilton-Jacobi-Bellman(HJB)方程对值函数的刻画。直截了当的方法是不可能的,因为条件u∈aadmtz防止简单地适应经典的证明。因此,思想是:找出适当的无约束问题来逼近我们的约束问题,然后通过一个极限过程获得值函数(3.8)的性质。近似问题的构造是基于在目标函数中加入一个适当的项来惩罚情形Zt,z;u(T)/∈[m,m]的思想。给定c>0,设ΦCBE从R到R的函数为Φc(z)=-c“z-m-√c++m+√c-z+#,(3.11),对于每个z∈R,假定3.1节的假设成立,并考虑以下无约束问题:VC(T,p,z)=SUPU∈ATJC(T,p,z;u),(3.12)其中(t,p,z)∈[0,t]×Rn×R,Jc(t,p,z;u)=etpz ztte-r(s-t)L(s,Pt,p;u(s),Zt,z;u(s),u(s),u(s))ds+e-r(t-t)Φ(Pt,p;u(T),Zt,z;u(T))+e-r(t-t)Φc(Zt,z;u(T)),这一次在所有控制的集合上进行最大化。问题(3.12)是一个经典的无约束随机控制问题;因此,根据经典结果,函数Vcis由HJB方程表征。这里有一个精确度。定理3.6。设3.1节的假设成立,并设c>0和k如(3.2)所示。那么VC1是-Vct(t)的唯一粘度解,p,z)+rVc(t,p,z)+minv∈u-f(t,p,v)·DpVc(t,p,z)-g(t,v)Vcz(t,p,z)-trσ(t,p,v)σt(t,p,v)DpVc(t,p,z)=0,π(t,p,z,v)∈[0,t[×rn×R,(3.13),条件为vc(t,p,z)=Φ(p,z)+ΦC(z),π(p,z)∈rn+1,(3.14),且此条件为vc(t,p,z)≤c(1+pk+zk),ut(t,p,z),ut(t,p,z),ut(t,p,)∈[0,t]×rn×R,对于某个常数πc>0。证明。根据无约束控制理论的标准结果,该值函数是(3.13)的粘度解(例如,可以通过稍微修改[10,第四章]中的论点来实现证明)。关于唯一性,见[6,THM.3.1].3.3值函数的性质我们现在证明了本文的中心结果:值函数Vcin(3.12)在每个dρs的紧子集上一致收敛于(3.8)中的值函数V。一方面,这个结果提供了V的一个近似(回想函数的特征Vcin定理3.6);另一方面,V以这样的方式继承了函数VC定理3.7的连续性。让3.1节的假设成立。然后,当c→+∞时,对于每个0<ρ<(m-m)/2,泛函VC在Dρ的紧子集上一致收敛到V。设0<ρ<(m-m)/2,A是Dρ的紧子集,R>0是B(0,R)A,对于每个ε>0,我们必须证明存在δ>0,使得SUPU∈ATJC(t,p,Z;u)-SUPU∈AADMTZJ(t,p,z;u)≤ε,(3.15)对于每个c≥δ和(t,p,z)∈A。步骤1:Vcin A的下界。根据Dρ,对于每个(t,p,z)∈A从[t,t]到u,使得Zutpz(t)∈[m+ρ,m-ρ]。由于[m+ρ,m-ρ][m+c-,m-c-]对于c≥ρ-2,注意Jc(t,p,z;对于所有c≥ρ-2的可求常数Ktpz,utpz)Ktpz.通过如(3.10)所示的估计,可以很容易地表明,对于常数c>0和对于k≥0如(3.2)所示的,对于每个(t,p,z)∈a我们有Ktpz≤c(1+pk+zk)≤c(1+2rk),因此k:=inf(t,p,z)∈Aktpz∈R。

9
能者818 在职认证  发表于 2022-4-16 14:50:29
因此,Vc(t,p,z)≥Jc(t,p,z;utpz)=ktpz≥K,(3.16)对于每个(t,p,z)∈A和c≥ρ-2。第二步:(3.15)的新公式。设(t,p,z)∈A.对于每个n∈n,我们设btpzn=u∈AT:n+1<Ptpz(Zu(t)/∈[m,m])≤n。设c≥ρ-2,n∈n和u∈btpzn。通过注意到ΦC≤0和ΦC(x)≤-√C forx/∈[m,m],并通过如(3.10)所示的估计,我们得到JC(t,p,z;u)=J(t,p,z;u)+etpzhen-r(t-t)ΦC(Zu(t))i≤J(t,p,z;u)+etpzhen-r(t-t)ΦC(Zu(t))i≤J(t,p,z;u)+etpzhen-r(t-t)ΦC(Zu(t))/∈[m,m]}i≤C(1+pk+zk)-e-rt"acppz(Zu(t))/∈[m,m]}.由(3.17)可知,对于每一个n∈n,存在sc(n)≥ρ-2,使得JC(t,p,z;u)<K,对于每一个c≥c(n)和u∈Btpzn,K如步骤1所示。由(3.16)我们得到:对于每一个c≥ρ-2,我们得到SUPU∈ATJC(t,p,z;u)=SUPU∈AT\\S{i∈N:c(i)≤c}BtpziJc(t,p,z;u),(3.18)。序列{c(n)}明显增加;因此,从[ρ-2,+∞[到N存在一个m,使得{i∈N:c(i)≤c}={1,。当eachc≥ρ-2时,.,m(c)}。因此,我们可以将(3.18)改写为:SUPU∈ATJC(t,p,z;u)=SUPU∈AT\\sm(c)i=1BTPZIJC(t,p,z;u)。(3.19)注意m(·)增加,且m(c)→+∞。设ε>0。通过(3.19),对于c≥ρ-2,不等式(3.15)等价于-ε≤SUPU∈AT\\sm(c)i=1btpzijc(t,p,z;u)-SUPU∈Aadmtzj(t,p,z;u)≤ε。(3.20)因此,我们必须证明存在δ≥ρ-2,使得(3.20)对于每个c≥δ,对于每个(t,p,z)∈A成立。在步骤3中,我们将证明(3.20)中的右不等式,而在步骤4中,将证明左不等式,从而结束证明。步骤3:(3.20)中的右不等式。让我们证明(t,p,z)∈A存在δ≥ρ-2无关性,即对于每个c≥δ,supu∈AT\\sm(c)i=1btpzij(t,p,z;u)≤supu∈Aadmtzj(t,p,z;u)+ε,(3.21)。由于jc≤J,通过(3.21)我们得到了(3.20)中的右不等式,设c≥ρ-2,(t,p,z)∈A,u∈AT\\sm(c)i=1btpzi。我们集合πu={Zu(T)/∈[m,m]};注意0≤Ptpz(πu)≤1/(m(c)+1)。设~u是按以下方式定义的过程:~u在πu中与保证[m+ρ,m-ρ]可达性的过程重合(见dρ),以及~uu在Ω\\πu中。一个简单的检验表明~u∈atandthatz~u(T)∈[m,m]ptpz-A.S.(3.22)通过回忆Ω\\πu中的~uu,通过H-older不等式(两次)和(3.10)中的估计,我们得到了对于某个常数C>0,J(t,p,z;u)-J(t,p,z;~u)≤C(1+pk+zk)Ptpz(πu)≤C(1+2rk)(m(C)+1),(3.23)。然后,通过(3.23)和(3.22)得到J(t,p,z;u)≤J(t,p,z;~u)+c(1+2rk)(m(c)+1)≤SUPU∈AADMTZJ(t,p,z;u)+c(1+2rk)(m(c)+1),该不等式对于(t,p,z)∈A和u∈AT\\sm(c)i=1btpzi均成立。由于m(c)→+∞,对于su大的c(且此选择与(t,p,z)和u无关),我们得到c(1+2rk)/(m(c)+1)≤ε,从而得到(3.21)。步骤4:左不等式(3.20)。我们还必须证明(3.20)中的左不等式,即:对于c≥δ,δ≥ρ-2与(t,p,z)∈A无关,SUPU∈AADMTZJ(t,p,z;u)≤SUPU∈AT\\sm(c)i=1btpzijC(t,p,z;u)+ε,(3.24)。设c≥ρ-2,(t,p,z)∈A和u∈AADMTZ。通过假设3.5,设~u∈Atbe为J(t,p,z;u)-J(t,p,z;~u)≤ε(3.25)且具有z~u(t)∈[m+η(ε),m-η(ε)]ptpz-a.s。(3.26)首先要注意的是,在\\sm(c)i=1btpzi处,~u∈Aadmtz。(3.27)通过(3.25)我们得到J(t,p,z;u)-Jc(t,p,z;~u)=J(t,p,z;u)-J(t,p,z;u)-J(t,p,z;~u)-etpz"ee-r(t-t)Φc(z~u(t))≤ε+etpzΦc(z~u(t))。注意到通过(3.26)第二项等于零,对于c≥η(ε)-2(实际上是[m+c-,m-c-]中的Φc0);通过回顾(3.27),我们得到了对于每个c≥max{η(ε)-2,ρ-2},j(t,p,z;u)≤Jc(t,p,z;~u)+ε≤supu∈at\\sm(c)i=1btpzijc(t,p,z;u)+ε。由于这个不等式对每个(t,p,z)∈A和u∈Aadmtz成立,我们得到(3.24)推论3.8。让3.1节的假设成立。然后给出函数Vcconvergepointwise到V ineD和V是连续的。它直接从定理3.7(回想一下ρdρ=ed)引出。推论3.9。

10
nandehutu2022 在职认证  发表于 2022-4-16 14:50:36
让3.1节的假设成立。证明了函数V是方程(3.13)的粘性解。由于方程(3.13)的粘性解在[0,T]×Rn(定理3.6)中,且对于每0<ρ<(m-m)/2它们对函数V局部一致收敛于dρ(定理3.7),因此得到了粘性解关于一致收敛的稳定性的结论,并证明了该结论=sρdρ.注3.10。我们证明了该集合中的值函数是函数VC的局部一致极限。在某些特殊情况下,可以得到更有力的结论:值函数在其整域D上用HJB方程刻画。见第4节。注3.11。利用随机控制理论中的标准结果,可以证明Value函数不依赖于我们所选择的概率空间,我们现在面临函数V的正则性问题。在控制理论中,正则性的结果通常是通过传递J(t,p,z;u)-J(t,p,z;u)或J(t,p,z;u)-J(t,p,z;u)等量的估计的上确界来得到V的相应不等式。对于有约束的问题,这种方法不能应用于V(t,p,·)。事实上,考虑J(t,p,z;u)-J(t,p,z;u):一方面,这样的量只对u∈Aadmtz"aAadmtz进行定义,另一方面,上确界应该是关于di-erent集的(准确地说,是Aadmtzand Aadmtz)。当然,对于V(t,p,·)也可以得到具体的案例正则性结果,见第4节。这种方法仍然有效的唯一情况是关于V(t,·,z)的估计,假定在t和z之间,允许的控制集不依赖于p。因此,对于V(t,·,z),我们可以遵循这个方法。命题3.12。让3.1节的假设成立。假定存在aconstant c>0,且对于每个p,q∈Rn,t∈[0,t],v∈U和z∈R,t(t,z)-L(t,q,z,v)≤cp-q,Φ(p,z)-Φ(q,z)≤cp-q,(3.28),则函数v(t,·,z)是Lipschitz连续的,一致在(t,z)中。此外,对A.E.存在梯度DpV(t,p,z)。(t,p,z)∈D,对于某个常数m>0,仅依赖于U,t,c,且依赖于(3.1)和(3.4)中的常数,我们有DpV(t,p,z)≤m,证明。设(t,p,z)∈D,h>0,ζ∈RN,且ζ=1,u∈AT。为了避免歧义,我们将省略中值表示法中的下标(初始数据是不确定的,但概率显然是相同的)。根据[10,附录D]中的(3.28)和估计(D.8),对于某个常数C>0,我们有J(t,p,z;u)-J(t,p+hζ;u(s)-Pt,p+hζ;u(s)-ds+Pt,p;u(t)-Pt,p+hζ;u(t)≤c(t-t+1)e[kPt,p;u(·)-p,p+hζ;u(·)k]≤c(t+1)p-p+h=c(t+1)h,(3.29)。估计(3.29)对于每个u∈At成立;因此,V(t,p,z)-V(t,p+hζ,z)≤Mh,(3.30),其中m:=c_c(t+1)。因此,函数V(t,·,z)是Lipschitz连续的,在(t,z)中一致,然后是A.E。可由Rademacher定理判定。经典结果表明A.E.存在DpV(t,p,z)。(t,p,z)∈D。最后,如果梯度存在且ei∈Rnis为规范基的向量(i=1,....,n),通过(3.30)得到(DpV(t,p,z))i=limh→0+V(t,p,z)-V(t,p+hei,z)h≤M,然后关于梯度的估计紧随命题3.13。让3.1节的假设成立。假定Φ∈C(rn+1),函数f(t),·,v),σ(t,·,v),L(t,·,·,v)每一项(t,v)∈[0,T]×U,且存在常数c≥0,j∈N,使得Dpf(T,p,v)+Dpf(T,p,v)+dpσ(T,p,v)+dpσ(T,p,v)+dpσ(T,p,v)≤c,D(p,z)L(T,p,z,v)+D(p,z)Φ(p,z)+D(p,z)Φ(p,z)≤c(1+pj+zj),对于每个p∈Rn,T∈[0,T],v∈U和z∈R,则函数v(T,·,z)局部半ve.X,在T和A.E中一致。两次可测。证明。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 07:15