楼主: 能者818
1072 31

[量化金融] 弱链矩阵、策略迭代和脉冲控制 [推广有奖]

21
kedemingshi 在职认证  发表于 2022-5-9 07:23:29
在汇率问题的半拉格朗日格式的特殊情况下,可以使用简单的三对角解,因为该问题是一维微分。策略迭代在达到所需的容错能力时终止:maxivki- vk-1i最大值vki, 规模< 托尔。比例参数确保不会对解决方案施加不切实际的精度级别。我们取10-6对于本次测试和所有未来测试,ANDSCALE=1。在上一个时间步un+1中,最初的猜测是解决方案。[16]之后,我们将:= Dt和δ:=1/ D=10-2.为了完整性,我们提到^u(t,x):=0和^f(t,x)的明显分裂:=-p(x)用于半拉格朗日格式。续集(6.2和6.3)的数值例子也使用了明显的分裂。直接控制和惩罚方案超线性收敛。我们推测这种情况发生在7世纪→ u(t,x)与x=η(t)的右边成线性关系,因此在近似术语dxuan和dxuther时没有误差。假设半拉格朗日格式的解un+1与η(tn+1)右侧成线性关系,则由于η(tn)与η(tn+1)的近似而引入误差。这表明,对于具有简单连续区域和线性交易费用的问题,直接控制和惩罚方案可能优于半拉格朗日方案。毫不奇怪,直接控制方案和惩罚方案在性能和精度上几乎相同,因为比例因子和惩罚因子的选择是相同的(即δ=1)/). 我们提到,选择δ=1(即无缩放)会在直接控制设置中产生较差的性能(有关解释,请参见[16])。请注意,每次调用Solvec的BiCGSTAB迭代的平均次数可能少于一次,这表明有时在策略迭代的第3行不需要BiCGSTAB迭代。

22
能者818 在职认证  发表于 2022-5-9 07:23:32
当初始残差b(P`)时,就会发生这种情况-A(P`)v`-1,小到足够大(即在收敛前的最后一次策略迭代)。HU(t=0,x=0)平均政策。比克斯塔布的平均值。比率标准。时间1-0.60685256 3.13 0.74 1.32e+011/2-0.61187228 2.88 0.90 6.99e+011/4-0.61300925 2.58 0.93 4.42 3.98e+021/8-0.61317577 2.49 0.94 6.83 2.77e+031/16-0.61321292 2 2.48 0.95 4.48 2.09e+041/32-0.61321903 2.46 0.95 6.08 1.61e+05(a)直接控制,H u(t)Avg=0。比克斯塔布的平均值。比率标准。时间1-0.60717652 3.19 0.71 1.38e+011/2-0.61194960 2.88 0.76 6.96e+011/4-0.61302973 2.55 0.91 4.42 3.95e+021/8-0.61317966 2.48 1.28 7.20 2.76e+031/16-0.61321390 2.48 1.33 4.38 2.09e+041/32-0.61321928 2.46 0.99 6.36 1.61e+05(b)DH=0常模比。时间1-0.69277804 1.00e+001/2-0.64806716 6.49e+001/4-0.62865965 2.30 4.90e+011/8-0.62027822.32 3.86e+021/16-0.61653511 2.24 3.17e+031/32-0.614800123 2.16 2.64e+041/64-0.61398311 2.12 2.17e+05(c)半拉格朗日方程6.1.3:汇率的最优组合控制:收敛性检验6。2具有固定和比例交易成本的最优消费和投资组合[]研究了以下内容。假设一个投资者在任何时候都有两个投资机会:一个股票和一个银行账户。让我们来看看≥0和(Bt)t≥0表示分别投资于这两个项目的金额。投资者能够连续消费(随机控制)(脉冲控制)。用(wt)t表示≥0消耗率为0≤ wt≤ wmax。在任何时间点,投资者都可以将资金转移到(z>0)或(z<0)股票,从而产生λ| z |+C的交易成本,其中C>0和0≤ λ < 1.

23
能者818 在职认证  发表于 2022-5-9 07:23:35
这可以通过dst=uStdt+ξStdWtifτj<t<τj+1(随机控制)来获取;dBt=(rBt)- wt)如果τj<t<τj+1(随机控制);Sτj+1=Sτj+1-+ zτj+1(脉冲控制);Bτj+1=Bτj+1-- zτj+1- λzτj+1- C(脉冲控制)。组合控制θ:=(w,τ,τ,…,zτ,zτ,…)如果股票持有量和银行账户始终为非负,则可接受。设Θ表示所有可容许控制的集合。银行账户中的tsbt=b由u(t,s,b)给出:=eρtsupθ∈ΘE(t,s,b)“中兴通讯-ρtwγtγdt+e-ρTmax(BT+(1- λ) 圣- C、 0)γ#式中0≤- γ<1是投资者的相对风险规避和ρ≥0是时间首选项的比率。到期时收到的效用相当于清算资产并立即消耗所有东西。相关的HJBKVIOhm:= (0, ∞)和∧:=由(1.1)给出,其中g(T,x):=max(b+(1- λ) s- C、 0)γ/γ和w:=[0,wmax];Z(t,x):={Z:x+Γ(t,x,Z)≥ 0} ;Lw:=ξss+uss+(rb)- w)b>0;否则为0;Γ(t,x,z):=(z,-Z- λ| z |- C) );fw:=b>0时wγ/γ;否则为0;K(t,x,z):=0。在上面的表达中,比如ass·/当n=0时,应解释为相同的零。公约[q,q]= 如果q>QI使用。参数值贴现系数ρ10%年利率r 7%年利率裂开u11%年收益率ξ30%年利率T 40年相对风险规避1- γ0.7标度交易成本λ0.1固定交易成本C 0.05最大取款率W最大初始股票价值s$45.20初始银行账户价值b$45.20表6.2.1:最优消费:来自§6.1.1中直接控制方案收敛的参数,[0,T]×0,∞)andZ(t,x)被截断,因此anxit,xi,zixisi,Bit之后的状态直接控制问题由(4.3)根据(5.1)和(5.2)给出。假设存在一个网格节点exi和p:=(w,z,ψ),使得ψi=1,并且不存在从某个点到ψj=0的路径inB(z)。

24
能者818 在职认证  发表于 2022-5-9 07:23:38
因为CEC>0,所以存在一个路径→ 我→ · · ·有限长度,使得所有q的si+bi>si+bi>·和ψiq=1。由于网格的有限性,对于某些<`,xiq=xi`(hencesiq+biq=si`+bi`),这是一种传统。6.2.2最优控制在[]中,在最优控制中观察到三个区域:买入(B)、卖出(S)和继续/无交易(NT)区域。在B和S区域,控制器通过跳回标记的两条线中最近的一条进行干预和. 在NT中,控制器持续消费。6.2.3收敛测试收敛测试如表6所示。2.3. 我们提到了arti ficial Neumann边界条件曲/sq=0和u/b=0用于截断的boundariess=smax和bbmax。前者要求每个时间步有明显更多的策略迭代。半拉格朗日格式的收敛速度在更高水平的情况下变为次线性。6.3可变年金中的保证最低支取福利(GMWB)可变年金中的保证最低支取福利(GMWB)为投资者提供可变年金的税收递延性质以及保证最低付款。GMWB定价以前被认为是[,]和H s节点b节点w节点z节点时间步120 20 15 321/2 40 30 64。。。。。。。。。。。。。。。。。。表6.2.2:最优消费:数值网格u(t=0,s,b)平均政策。比克斯塔布的平均值。比率标准。时间1 56.062123 7.63 1.28 1.63e+011/2 58.739224 8.80 1.90 2.93e+021/4 59.420125 10.4 2.28 3.93 5.66e+031/8 59.658413 11.8 3.28 2.86 1.03e+051/16 59.754780 13.4.45 2.47 1.85e+061/32 59.797206 14.2 6.54 2.27 3.05e+07(a)直接控制u(t=0,s,b)平均政策。比克斯塔布的平均值。比率标准。

25
nandehutu2022 在职认证  发表于 2022-5-9 07:23:42
时间1 56.058496 4.09 1.43 1.03e+011/2 58.739041 3.95 1.77 1.47e+021/4 59.420075 3.40 2.35 3.94 1.99e+031/8 59.658399 3.04 3.69 2.86 2.69e+041/16 59.754778 2.80 5.50 2.47 4.02e+051/32 59.797215 2.58 5.98 2.27 5.86e+06(b)平均处罚DH u(t=0,s,b)及其标签。比率标准。time1 55.621632 1.00 1.00e+001/2 58.782064 2.00 1.55e+011/4 59.404576 3.00 5.08 2.60e+021/8 59.569370 4.00 3.78 4.05e+031/16 59.651186 6.00 2.01 6.68e+041/32 59.705315 8.00 1.51 1.11e+061/64 59.748325 10.8 1.26 1.85e+07(c)半可计算的6.2.3:最佳消费:40万元汇合银行账户(100808080808080808080808080800B)股票1.20510152025最优消费(w)(a)最优控制股票持有量020406081000银行账户020406081000价值(u(t=0,s,b))020406080100(b)价值图6.2.1:初始时间的最优消费(与[11,图1和图2]相比)作为[]中的脉冲控制问题。[1]中考虑了具有年度提取的GMWBs的最优控制。GMWB由投资和担保账户(St)t组成≥0和(At)t≥分别为0。它是通过向保险公司支付一次总付,存入(风险)投资账户(即S=S)来实现的。GMWB承诺至少一次性偿还,前提是合同持有人的提款率不超过一定的比率。这是取款时的一美元对一美元的基础。只要保证账户为正,持有人可以继续提款。

26
可人4 在职认证  发表于 2022-5-9 07:23:46
特别是,在合同T到期之前的任何时间点,持有人可以:oG≥投资(随机控制)按超额提取率即时减少提取金额0≤ κ ≤ 1(脉冲控制)。持有人获得投资账户中较大的一个,到期时全额取款。担保账户可以连续或即时提取:dAt=-如果τj<t<τj+1(随机控制),则为wtdt;Aτj+1=Aτj+1-- zτj+1(脉冲控制)。让ρ≥ 0表示无风险利率。考虑一个指数(Yt)t≥0YTDYT=风险中性度量下的ρYtdt+ξYTDWTU。投资账户跟踪指数,并通过从担保账户取款进行调整:dSt=(ρ - η) 圣- wt{St>0}dt+ξStdWtifτj<t<τj+1;Sτj+1=最大值Sτj+1-- zτj+1,0.每笔交易的一次性支付成本参数:$10%每年10%的年利率≤ η ≤ ρ是从投资账户中扣除的比例利率,用作θ:w,τ,τ,z、 z。任何时候,担保账户都是非负的。设Θ表示所有可容许控制的集合。保险人最坏情况下的套期保值成本(在[]中讨论)风险账户中的金额t=s和金额at=a isu(t,s,a):=eρtsupθ∈ΘE(t,s,a)“中兴通讯-ρtwtdt+e-ρTmax(ST,(1- κ) 在- C) +Xτj≤Te-ρτj(1 - κ) zτj- C#其中C>0为固定交易成本。最终支付金额对应于投资账户的最大金额,或按照超额提取率提取整个担保账户。Letx:=(s,a)和ζ:=ρ- η.

27
mingdashike22 在职认证  发表于 2022-5-9 07:23:49
相关的HJBKVIOhm:= (0, ∞)和∧:=由(1.1)和g(T,x)给出:=max(s,(1)- κ) a- C) 和w:=[0,G];Z(t,x):=[0,a];Lw:=ξss+ζss+-Wa+s如果s,a>0;-Waifa>0;否则为0;Γ(t,x,z):=- (最小(z,s,z);fw:=w如果a>0;否则为0;K(t,x,z):=(1)- κ) z- C.6.3.1直接控制模式的收敛性i,ai,直接控制问题由(4.3)根据(5.1)和(5.2)给出。假设(H4)不满足,因此对于某些解决方案V,存在vi=[Bv]i=[Bv]i=。因为CEC>0,所以它就是vi=-∞, 矛盾。因此,(H4)成立。0 50 100 150 200 250 300投资账户020406081000担保账户(a)以Gw的利率支取固定金额Z01020304050607080最佳脉冲支取(z)图6.3.1:GMWB:初始时间的最佳控制,η=0.03126来自[12]Pcontrols P:=(w,z,ψ),当ai=0时满足ψi=0,当ai6=0时满足zi6=0。如例4所示。5,(H2)源于zi的单向性。(4.7)是通过指出Zi=0会产生有限成本(因此是次优的)来确定的。然后,从定理4.10和6.2的应用中得出收敛性。条件Zi=0符合直觉:持有者永远不应该为零美元的提款支付C>。6.3.2最佳控制图6。在最坏的情况下,如何考虑WBA的最佳成本。我们参考[12]来解释三个不同的撤退区域。6.3.3收敛测试收敛测试如表6所示。3.3. 从7号开始→ L(t,x,w)是线性的,我们取wh={,G}独立于h。在截断边界处使用渐近边界条件(沿方向)。有关详细信息,请参见[]。

28
mingdashike22 在职认证  发表于 2022-5-9 07:23:53
直接控制和惩罚方案产生几乎相同的结果,并表现出相似的执行时间。7结论性意见这项工作建立了(1.3)的适定性,并给出了相应策略迭代收敛的充分条件。(1.3)已应用于H w节点a节点z节点时间步长1 64 50 2 321/2 128 100 4 64的数值解。。。。。。。。。。。。。。。表6.3.2:GMWB:数值网格u(t=0,s,s)平均策略。比克斯塔布的平均值。比率标准。时间1 107.68342 3.47 1.47 1.71e+011/2 107.70679 4.25 1.64 2.03e+021/4 107.71878 4.34 1.85 1.95 2.60e+031/8 107.72578 4.43 2.22 1.71 3.46e+041/16 107.72964.31 2.71 1.81 4.75e+051/32 107.73176 4.15 3.40 1.83 7.55e+06(a)直接控制u(t=0,s,s,s)平均政策。比克斯塔布的平均值。比率标准。时间1 107.68243 3.47 1.58 1.80e+011/2 107.70639 4.08 1.65 2.06e+021/4 107.71870 3.95 1.76 1.95 2.45e+031/8 107.72576 3.98 1.97 1.74 3.22e+041/16 107.72964 3.71 2.39 1.82 4 4.34e+051/32 107.73175 3.32 3.01 1.83 6 6.62e+06(b)平均惩罚DH u(t=0,s,s,s,s,s+s)及其标签。比率标准。时间1 107.42351 1.00 1.00e+001/2 107.68443 1.00 1.02e+011/4 107.70841.00 10.9 1.39e+021/8 107.72257 1.00 1.70 2.03e+031/16 107.73015 1.00 1.87 3.31e+041/32§107.73224 1.98 3.62 6.10e+051/64 107.73337 2.90 1.85 1.13e+07(c)半稳定的6.3.3:ShGMWB+1.3:ShQ5收敛系数与Lagrange.4的拉格朗日(MD4)视界(§5)的收敛系数和消失系数。HJBKVI(1.1)的半拉格朗日格式易于实现,并且每个时间步只需要一个线性解。然而,如果潜在随机过程的扩散或跳跃到达速度依赖于控制,则不能使用该方法。直接控制和惩罚计划并不支持这些限制。Numericalevidence表明这两种方案的性能相似。

29
大多数88 在职认证  发表于 2022-5-9 07:23:56
然而,应用于直接控制方案的策略迭代可能会失败(例4.9),除非采取额外措施消除某些次优控制。取消这些控制措施是临时的(即取决于问题)。迭代求解得到的非线性方程组。Bellman问题(2.1)的一般适定性通过修改策略迭代,可以得到命题2的一个版本。2独立基金(H1.ii)。我们可以将该算法解释为考虑了在策略迭代中逼近上确界的误差。与[算法Ho-4]密切相关的算法XrmCrxCxC,每个组件都添加了c):-策略迭代(P,A(·),b(·),v)1选择一个正序列(`)`≥在这种情况下`≥1.`< ∞2表示“=1,2。3.挑选这样的人-A(P`)v`-1+b(P`)+`≥ 晚餐∈P{-A(P)v`-1+b(P)}4v`:=Solve(A(P`)、b(P`)、v`-1) 下面出现在[7]:引理A.1中。五``≥0R(`)`≥在这种情况下`≥1.`< ∞ 和v`- 五`-1.≥ -`为了`≥ 1.我们需要下面的引理,它的证明很简单,因此省略了:引理A.2。设一个集合,是赋范线性空间,T:X×Y→ R、 andQ:X→ 如上图所示。假设每个xinx,Tx:Y→ Rdefined byTx(y):=T(x,y)是线性的,且TxHas算子范数关于tox一致有界。马皮7号→ 好的∈X{T(X,y)+Q(X)}是一致连续的。定理A.3。假设(H0),(H1.i),a(P)是allPinP的单调矩阵。(v`)`≥1定义人-策略迭代收敛到(2.1)的唯一解v。证据首先,注意a(P`)五`- 五`-1.= -A(P`)v`-1+b(P`)≥ 晚餐∈Pn-A(P)v`-1+b(P)o- `. (A.1)对于“>1,支持∈Pn-A(P)v`-1+b(P)o≥ -A(P`-1) 五`-1+b(P`-1) = 0.结合(A.1),v`- 五`-1.≥ -A(P`)-1(`, . . . , `)|≥ -C`为了一些C≥ 0.P7→ 美联社-1(H0)A.1v`→ v代表RM中的一些v。

30
kedemingshi 在职认证  发表于 2022-5-9 07:24:00
取(A.1)中的极限并应用引理A.2,0=lim`→∞晚餐∈Pn-A(P)v`-1+b(P)o!=晚餐∈P{-A(P)v+b(P)}。因此,v是(2.1)的解。唯一性的证明类似于定理4.8。引理4.1的证明。我们把aδ和bδ写成δ的应力依赖关系。设δ=1的(4.3)解。Apigeonhole原理参数允许我们选择一个序列(P`)`≥0:=(w`,z`,ψ`)`≥因此ψ`=ψ是常数,且-A(P`)v+b(P`)→0.两边乘以i-ψ+Δψ(其中ψ:=diag(ψ))产生-Aδ(P`)v+bδ(P`)→0和hencesupP∈P{-Aδ(P)v+bδ(P)}≥假设这个不等式是严格的,那么对于somePandi[-Aδ(P)v+bδ(P)]i>0。两边乘以[I]-Ψ +δ-1ψ]Iyelds[-Aδ=1(P)v+bδ=1(P)]i>0,与v是一个解相矛盾。反之亦然。参考文献[1]P.Azimzadeh和P.A.Forsyth。gmxb合同最优bang-bang控制的存在性。暹罗J.金融数学。,6(1):117–139, 2015.[2] P·阿齐姆扎德、P·A·福赛斯和K·R·维扎尔。制度转换下可变年金的套期保值成本。《金融学中的隐马尔可夫模型》,第133-166页。斯普林格,2014年。[3] J.巴宾、P.A.福赛斯和G.拉班。政权转换下美式期权的迭代最优停止和局部政策迭代的比较。J.Sci。计算机。,58(2):409–430, 2014.[4] 巴勒斯和苏加尼迪斯。完全非线性二阶方程近似格式的收敛性。渐近线。肛门。,4(3):271–283, 1991.[5] E.Bayraktar和H.Xing。为跳转差异定价亚洲期权。数学《金融》,21(1):117–143,2011年。[6] A.本苏桑和J.L.狮子。脉冲控制与拟变分不等式。Gaunthier Villars,巴黎,1984年。[7] O.博卡诺夫斯基、S.马罗佐和H.齐达尼。Howard\'salgorithm的一些收敛结果。暹罗J.努尔。肛门。,47(4):3001–3026, 2009.[8] J·H·布拉姆布尔和B·E·哈伯德。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 16:17