楼主: 可人4
1624 32

[量化金融] 经济环境变化下储能设施的最优控制 [推广有奖]

11
可人4 在职认证  发表于 2022-5-10 18:54:45
所以我们有ut∈ [u(Qt),u(Qt)]代表t∈ [0,T],其中u,u:R-→ R、 与-穆≤ u(q)≤ 0,0 ≤ u(q)≤ Mu和u(q)=u(q)=0是充分光滑且有界的函数,分别描述了能量出售或购买的最大速率,并且Mu是常数。图1展示了[q,q]上的函数u,u。请注意,对于某些储能设施,例如天然气储能设施,q的所有级别的u、u都在下降。然而,由于我们研究的是一般的储能设施,我们没有制定确定这些界限的特定物理定律。感兴趣的读者可以参考,例如[34]。我们对u,u的选择保证了过程Q反映在边界上,如果从内部开始,则保持在[Q,Q]内。请注意,我们的模型从物理角度考虑了最重要的运行条件,但忽略了一些技术要求的详细建模,因为本文的主要目的是获得不可观察的外部影响的影响的印象。储能经理的目标是最大限度地提高储能设施的效益。定义F:R×[q,q]×[-穆,穆]-→ R byF(s、q、u)=-Us+d+- cq,u≥ 0(充电)-Us- D-- cq,u<0(卸货),图1:函数u和u,固定成本d±≥ 0和存储成本c≥ 0.关于F的定义,参见[5,第2.3节],[4,第2节],[34,第2节]和[37,第2节]。在计划期T结束时,储存设施中剩余能量的价值是立即以cSST(0<cS<1)的价格在市场上出售所有产品所获得的回报。CSI是必须由存储经理支付的报废率。因此,我们定义了终端奖励函数Φ:R×[q,q]-→ R乘以Φ(ST,QT)=QTcSST- D-. (7) 现在我们已经准备好描述正在研究的随机优化问题。标志Ohm := R×[q,q]×\'S×[0,T]。

12
nandehutu2022 在职认证  发表于 2022-5-10 18:54:49
我们希望最大化预期的折扣利润:Ohm -→ R由j(s,q,ν,t;u)=Es,q,ν,thTZte给出-ρ(r)-t) F(Sr、Qr、ur)dr+e-ρ(T)-t) Φ(ST,QT)i通过找到最优控制u∈ U、 其中ρ>0是一个常数贴现率,Es,q,ν,t(·)是起始值St=s,Qt=q,πt=ν的期望值。目的是找到最佳值函数V:Ohm -→ R由v(s,q,ν,t)=supu给出∈UJ(s,q,ν,t;u),(8)和(如果存在)最优控制策略u*= 阿格马苏∈UJ(s,q,ν,t;u)。引理2.2。值函数V是连续的,满足线性增长条件,即存在常数c,c>0,使得| V(s,q,ν,t)|≤ c+ck(s,q,ν,t)k证明。直接来自[15,第3章,定理5]以及F和Φ的构造。备注2.3。价值函数V也与实物期权的公平价格相关联,如果在时间t出售,则代表时间t时储能设施的价值。应用动态规划原理(参见。

13
可人4 在职认证  发表于 2022-5-10 18:54:52
[25,第3.3节,定理3.3.1]),我们推导了与系统(6)和优化问题(8)相关的HJB方程,Vt+(L- ρ) V+supu∈[u(q),u(q)]Vq+F= 0,V(s,q,ν,T)=Φ(s,q)(9)表示所有(s,q,ν,T)∈ Ohm 式中lv(s,q,ν,t)=κDXi=1uiπit+K(t)- sVs(s,q,ν,t)+σVss(s,q,ν,t)+DXi=1DXk=1(λkiπkt)Vνi(s,q,ν,t)+DXi=1κπitui-DXk=1ukπktVsνi(s,q,ν,t)+DXi,j=1κσπitπjtui-DXk=1ukπktuj-DXk=1ukπktVνiνj(s,q,ν,t)。解决逐点优化问题会导致以下候选最优充电策略:u*t=u*(s,q,ν,t)=u(q),s≤ s(s,q,ν,t)0,s(s,q,ν,t)<s<s(s,q,ν,t)u(q),s(s,q,ν,t)≤ 其中(s,q,ν,t)=(Vq(s,q,ν,t)- d+)和s(s,q,ν,t)=(Vq(s,q,ν,t)+d-) (10) 是战略在购买能源、等待和出售能源之间切换的边界。由于HJB方程是退化抛物线方程,我们几乎没有希望找到解析解,或者证明经典解的存在。对于一个完全信息下的问题,Chen和Forsyth[5]提出了用粘性解证明所有问题的可能性,这是一个弱解的概念,它只需要解的连续性,但仍然足够强,足以证明唯一性,并进一步建立数值实验的基础。关于粘度解的概念,我们请感兴趣的读者参考Crandall等人[9]、Fleming和Soner[11],以及Barles和Souganidis[2]的数字。允许Ohm, \'S表示封闭的边界Ohm, S、 分别。我们从(9)的粘度解的定义开始。定义2.4(粘度溶液)。1.

14
大多数88 在职认证  发表于 2022-5-10 18:54:55
函数w:“”Ohm -→ R是(9)的粘度亚解,如果φt(\'s,\'q,\'ν,\'t)+(L- ρ) φ(\'s,\'q,\'ν,\'t)+supu∈[u(q),u(q)]uφq(\'s,\'q,\'ν,\'t)+F(\'s,\'q,u)≥ 0表示所有(\'s,\'q,\'ν,\'t)∈ Ohm 无论如何∈ C(Ohm) 以至于-φ在w(\'s,\'q,\'ν,\'t)=φ(\'s,\'q,\'ν,\'t)时在(\'s,\'q,\'ν,\'t)达到最大值。函数w:“”Ohm -→ R是(9)的粘性上解,如果ψt(\'s,\'q,\'ν,\'t)+(L- ρ) ψ(\'s,\'q,\'ν,\'t)+supu∈[u(q),u(q)]uψq(\'s,\'q,\'ν,\'t)+F(\'s,\'q,u)≤ 0表示所有(\'s,\'q,\'ν,\'t)∈ Ohm 尽管如此,ψ∈ C(Ohm) 以至于-ψ在w(\'s,\'q,\'ν,\'t)=ψ(\'s,\'q,\'ν,\'t)时达到最小值。w:\'Ohm -→ R是(9)的粘性解,如果它既是粘性子解又是粘性上解。从[25,定理4.3.1]我们知道,值函数V是(9)的粘性解。证明唯一性的标准论据是,两个粘性解在域的边界上相等,在域的内部也相等。然而,我们在q的方向上和在ν的方向上都没有边界条件。由于Q永远不会离开[Q,Q],如果从内部开始,我们也可以在整个R上定义Q(实际上,我们总是从储能设施容量范围内的值开始)因此,由于Q与Sπ解耦,我们不需要Q方向的边界条件,参见[37,p.429和p.431]。进一步,从[8,推论2.2]我们知道HMM滤波器达到了边界在有限时间内,概率为零。因此,我们可以根据[22,定理II.2和定理II.3以及备注II.4]来论证(9)的粘性解的唯一性。还有待证明,如果(9)有一个光滑解,那么这就是最优值函数。提议2.5。设v是(9)的粘性上解,v∈ 几乎到处都是。

15
能者818 在职认证  发表于 2022-5-10 18:55:00
然后V≤ v、 此外,如果有一个策略u∈ 使得J(~U)是具有J(~U)的粘性上解∈ Calmost everywhere,那么J(~u)=V,~u是最佳充电策略。证据设φ(s,q,ν,t):=πD+2e-(s+q+PD)-1i=1νi+r),其中π是半径为1且φn(s,q,ν,t):=nD+2Z的圆的面积∞-∞. . .Z∞-∞v(s)- r、 q- r、 (ν)- RνD-1.- rD+1),t- rD+2)~n(nr)dr。drD+2,其中nr=(nr,…,nrD+2)。为了n→ ∞, ~nn→ v和Lаn→ Lv,见[38]。让u=(ut)t≥这是一个可接受的策略。Thene-ρ(T)-t) ~nn(ST,QT,πt,t)=~nn(s,q,ν,t)+ZTte-ρ(r)-(t)[-ρ~nn(Sr,Qr,πr,r)+~nnr(Sr,Qr,πr,r)+L~nn(Sr,Qr,πr,r)+ur nx(Sr,Qr,πr,r)]dr+Mt,其中(Mt)t≥0是一个鞅。因为v是一个粘性上解,属于Ca.e类,所以它满足-ρv+vt+Lv+F(u)+u vq≤ 0 a.e.,这允许我们选择足够大的-ρ~nn+~nnt+L k n+F(u)+u k nq≤ ε .以我们得到的期望值,q,ν,tE-ρ(T)-t) νn(ST,QT,πt,t)= νn(s,q,ν,t)+Es,q,ν,t中兴通讯-ρ(r)-(t)[-ρ~nn(Sr,Qr,πr,r)+~nnr(Sr,Qr,πr,r)+ρ~nn(Sr,Qr,πr,r)- νnr(Sr,Qr,πr,r)- F(高级、高级、高级)- ur~nnq+ε+ur~nnx(Sr,Qr,πr,r).作为n-→ ∞ 我们得到,q,ν,tE-ρ(T)-t) v(ST,QT,πt,t)≤ v(s,q,ν,t)- Es,q,ν,t中兴通讯-ρ(r)-t) F(高级、高级、高级)博士由主导收敛和asε>0是任意的。因此,Es,q,ν,tE-ρ(T)-t) v(ST,QT,πt,t)+ Es,q,ν,t中兴通讯-ρ(r)-t) F(高级、高级、高级)博士= Es,q,ν,t中兴通讯-ρ(r)-t) F(Sr、Qr、ur)dr+e-ρ(T)-t) Φ(ST,QT)= J(s,q,ν,t;u)≤ v(s,q,ν,t)。通过占领整个美国∈ [u(q),u(q)]在推导中我们得到V(s,q,ν,t)≤ 数值研究在本节中,我们用数值方法求解HJB方程(9)。本文的重点在于影响能源价格的不可观察因素。由于季节性是可以明显观察到的,这些影响是可以识别的,我们可以假设我们模型中的能源价格已经不受季节性影响。

16
nandehutu2022 在职认证  发表于 2022-5-10 18:55:03
因此,对于数值部分——为了能够识别不可观测因素的影响——weset K(t)≡ 0.我们采用半拉格朗日法和完全隐式时间步进法(见[5,第3节])以及有限差分法(见[28,第3章,第5.3节]),以获得价值函数的近似值以及最佳收费政策。由于满足[5,第4节]的条件,该方法收敛于HJB方程的粘度解。我们对具有两种状态的马尔可夫链进行了数值研究,即D=2和以下参数集:u=50,u=30,κ=15,σ=50,λ=λ=-0.5,ρ=0.05,T=1年,c=0,d+=d-= 10,cS=0.95,q=0,q=100,Mu=730。图2显示了t=0和ν=0.5的结果值函数和收费策略。最优控制为阈值型,具有两个阈值水平。对于低能源价格,以最高价格购买能源(红色区域)。然后,如果能源价格超过较低的阈值水平,即s的价格≈ 25(取决于q),最佳策略是等待(绿色区域)。如果能源价格进一步超过s的更高阈值水平≈ 45,然后出售Energy(蓝色区域)。对于值函数,我们观察到V在q中增长。因此,存储设备中的能量越多,存储设备的价值就越高。此外,对于中高能源价格,V在s中增长,但如果q也很小,对于低能源价格,V在s中下降。这与最终的控制策略直接相关。

17
大多数88 在职认证  发表于 2022-5-10 18:55:06
对于低能源价格,能源是被购买的,因此,当价格还在购买范围内时,价格上涨会降低价值。此外,请注意,在将图扩展到s的负值时,行为的发展方式与s的小值相同。图2:结果值函数(左)和收费政策(右)。图3显示了t=0和三个不同过滤值的值函数和相关控制,ν∈ {0, 0.5, 1}. 我们观察到,ν越高,值函数越高。这有以下原因。由于u>u,这意味着,如果处于价格过程平均回复水平较高的状态的概率增加,那么储能设施的价值也会增加。对于最优控制,较高的ν意味着较低的阈值水平,即区分购买能源和等待能源的区域(红色区域和绿色区域之间)和较高的阈值水平(绿色区域和蓝色区域之间)向上移动,因此,总的来说,购买面积(红色区域)增加,销售面积(蓝色区域)缩小。这意味着存储经理将购买更多能源,因为她预计能源价格会上涨。之后她可以以更高的价格出售。图3:从上到下增长ν值的价值函数(左)和收费策略(右)。在图4中,我们将t=0,fix q=50,这种影响变得更加明显。虽然价值函数在ν中缓慢增长,但买入等待区域和等待卖出区域之间的水平在ν中增长。因此,对于更高的ν,存储经理将购买更多的能源,因为她希望以后能够以更高的价格出售。注意,增长的ν并不一定意味着所有参数集中的值都在增长。例如,考虑u的情况 u.

18
何人来此 在职认证  发表于 2022-5-10 18:55:09
如果存储水平很低,能源价格很高(约u),那么小的ν意味着价格下降,这样将来人们可以买到更便宜的东西,而增长的ν意味着价格可能会保持较高水平,使充电变得昂贵,从而导致价格下降。这种效应如图5所示,在图5中,我们计算s=u,并比较q=0(红色)和q=100(蓝色)的值函数与ν的关系。对于我们的参数集,对于q=0,V在ν中适度下降。图4:价值函数(左)和收费政策(右)对过滤器的依赖性。图5:q=0(红色虚线)和q=100(蓝色)的值函数。在图6中,我们fix q=50,而ν=0.5。我们观察到,价值函数在t中下降,因为随着t的增长,控制系统从而赚钱的时间就所剩无几了。此外,在规划期结束时,有一个倍增的废品率cS,它放大了这种影响。因为收费政策越来越严格,这意味着购买和等待,以及等待和销售之间的水平下降,以避免罚款。最后,我们将参数集中的规划范围更改为T=3,并将其与T=1 fort=0和ν=0.5的情况进行比较,见图7。对于较长的规划期,对于较小的价格,价值函数尤其高,因为较长的规划期增加了价格增长的机会。这种影响在收费政策方面变得更加明显。对于T=3,下限水平更高,因此将储存更多的能量,以更高的价格出售。

19
大多数88 在职认证  发表于 2022-5-10 18:55:13
此外,对于高q值和不断增长的规划期,更高的阈值水平更高,因此储能经理将开始以更高的价格销售。对于T→ ∞ 价值函数和收费策略将收敛于价值自治的平稳情形。在我们所有的例子中,我们观察到最优控制的候选者达到三种状态,即销售能量状态、等待状态和购买能量状态。(10)中的函数s、s描述了最佳充电率在这些状态之间切换时的临界能源价格。因此,产生的策略是reshold类型。备注3.1。[20,第7节]表明,价值函数是其HJBFigure 6的唯一粘度解:价值函数(左)和收费政策(右)对时间的依赖性。具有固定阈值策略的方程,如果满足弱意义下的凹性条件。在我们的例子中也可以得到相关结果。然后,阈值策略是最优的,如果它们导致一个平滑的奖励函数,请参阅Proposition 2.5。还有待于检查阈值类型的策略是否可以接受。结果策略的可接受性问题归结为基础过程是否存在的问题,或者等价地,描述基础过程的DES系统是否有解决方案的问题。事实证明,这个问题并不简单。记住底层系统dst=κDXi=1uiπit+K(t)- 圣!dt+σdBt,S=S,dQt=u(Qt)1{St≥s(St,Qt,πt,t)}+u(Qt)1{St≤s(St,Qt,πt,t)}dt,Q=Q,dπt=∧>πtdt+σ-1.diag(πt)at- 蝙蝠πtdBt,π=ν。(11) 系统(11)的漂移是不连续的,因此我们不能应用第1节中提到的经典理论。因此,我们对这个问题进行了详细的研究。

20
何人来此 在职认证  发表于 2022-5-10 18:55:16
在第4节中,我们考虑一个更一般的设置。4存在唯一性结果我们考虑以下d维时间非均匀SDE:dXt=α(Xt,t)dt+β(Xt,t)dWt,X=X,(12)式中α:Rd×R+-→ Rd,β:Rd×R+-→ Rd×d,W=(Wt)t≥0是d维标准布朗运动。众所周知,如果α和β是(局部)Lipschitz,并且满足线性增长,则存在唯一的全局强解。对于仅α有界且可测量,以及β有界、Lipschitz且一致非退化,即存在一个常数λ>0,使得对于所有x∈ RDV∈ 我们有v>β(x)β(x)>v≥ λv>v,Zvonkin[42]和Veretennikov[35]证明了仍然存在唯一的全局强解。一个推广是Veretennikov[36],其中β只需要在漂移不是Lipschitz的那些分量中是非退化的。另一个推广是Zhang[40],其中只需要局部可积漂移。处理连续漂移的第一个想法是用光滑函数近似α,并分析近似极限,参见Krylov和Liptser[16]。Meyer Brandis和Proske[24]利用Malliavin演算的技术证明了漂移仅可测量情况下的进一步存在性和唯一性结果。然而,所有这些结果都如图7所示:价值函数(左)和收费政策(右)用于不断增长的规划期(上面T=1,下面T=3)。严重依赖于非退化扩散系数。对于退化情形,Halidias和Kloeden[13]通过子解和上解的近似,证明了漂移系数增加的SDE的存在唯一性结果。关于退化情况,Leobacher等人最近得出了一个结果。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-13 06:24