楼主: 大多数88
1151 26

[量化金融] 学习型实物期权中的技术不确定性 [推广有奖]

11
可人4 在职认证  发表于 2022-6-9 18:59:10
具体而言,以g(u)提取商品并以现货价格出售所产生的现金流的贴现价值由DCFT=Zt给出++t型+e-ρ(u-t) (苏- c) g(u)du,(9)一个很好的例子是储存的天然气,其中总是有无法从储存中提取的残留物。图1:一旦代理人在时间t投资于储量,开采开始时间t+ 并持续到提取实际(未知)储量的γ百分比,该百分比出现在随机时间t+ + .式中,ρ是代理人对其承担的项目风险水平的贴现系数,c是指只要开采作业持续,投资者就会产生的运营成本。为了计算储备中商品的市场价值(我们用Pt表示),我们计算从出售提取商品获得的现金流的预期贴现价值。即,我们在(9)中插入:商品的现货价格(5),在(8)中给出的提取完成时间,以及提取率(7)。最后,我们将DCFt的期望值取为pt=E[DCFt | Ft]=EZt公司++t型+e-ρ(u-t) (英尺(u)- c) g(u)du英尺, (10) 式中,Ft=σ(苏、武)u∈[0,t]是由S和V产生的自然过滤(或相当于前面介绍的马尔可夫链Z),在风险中性度量Q和Ft(u)=E[Su | Ft]=expθ+e-κ(u-t) x+σ4κ1.- e-2κ(u-t)是标的资产的远期价格。因此,(10)中的期望值超过了消耗的随机时间, 这进一步取决于储量。为了计算这个期望值,我们需要未知储量水平θ的条件分布,即我们需要Pθ=v(j)| Ft. 假设θ=limt→∞Vta。s、 ,这需要确定底层马尔可夫链极限的条件分布。

12
能者818 在职认证  发表于 2022-6-9 18:59:14
具体而言,Pθ=v(j)英尺= P限制→∞Vt=v(j)英尺= P限制→∞Zt=jZt=i=eHtA公司ij,其中Ht=R∞thudu,符号[·]ij表示方括号中矩阵的ij元素,回想一下上文(4)中定义了矩阵A。因此,储量预期折现值的最终表达式为:isPt=p(Zt)(t,Xt)=mXj=1eHtA公司Zt,jZt+-β对数1.-βαγv(j)t型+e-ρ(u-t) (英尺(u)- c) g(u)du。(11) 该表达式有两个不确定性来源,第一个来源于通过OU过程Xt得出的社区现货价格,第二个来源于通过马尔可夫链状态Zt得出的储量估计。由于提取率模型在时间上呈指数衰减,参见(7),可以根据特殊函数写出方程式(11)右侧的积分,但是,这样的重写不会增加清晰度,因此我们选择保持如上所示的积分。3、实物期权估价既然我们有了储备价值的模型,我们将重点放在开发商品储备所需的成本和灵活性的价值上,以决定何时进行投资。投资保护区的成本是不可逆的,用I(k)表示,其中k是储量估算的制度。在这里,我们假设成本I(k)与产量估计有关,因为提取大型储备可能需要比从小型储备中提取商品所需的更大的前期投资。我们假设投资成本isI(k)=c+cv(k),(12),其中c≥ 0是固定成本,c≥ 0,并记住v(k)是可能的保留卷,请参见(3)。请注意,投资成本取决于储量估算。

13
mingdashike22 在职认证  发表于 2022-6-9 18:59:17
这反映了投资者将根据其对储量的估计来确定开采规模的事实:他们认为储量越大,所需的开采规模就越大。运行成本c确保投资者的运行成本仍然与真实准备金金额挂钩。我们用Lt=`(Zt)(t,Xt)表示选项的值,其中函数集合`(1)(t,x)`(m) (t,x)表示状态Zt=1,…,条件下的实物期权值,m(上标索引)和Xt=x。代理人必须在timeT之前做出决定,否则他们将失去进行投资和开采储量的选择权。标准理论表明,不可逆地投资于储备的期权的价值,以及开始的不确定性,由最优停止问题给出:Lt=supτ∈TE公司e-ρτmaxPτ- I(Zτ),0|英尺(13a)=supτ∈TE公司e-ρτmaxPτ- I(Zτ),0|Zt,Xt. (13b)这里,T表示允许的停车时间集,是限制在ti=i的Fstopping时间的有限集合t、 i=0,N带tN≤ T换句话说,代理仅限于在ti日做出投资决策。在此期间,代理可以获取更多信息,以改进其储量估计。为了便于标注,我们定义了偏差值过程‘’(j)(t,x):=e-ρt`(j)(t,x),(14)并观察到,在投资日期之间,j=1,····,m的衰减值过程`(j)(t,x)是鞅。此外,由于在投资日期之间没有行使期权的机会,`(j)(t,x)与欧洲债权相同,支付额等于下一个行使日期的价值。因此,\'`(j)(ti,x)=最大值限制↓ti‘’(j)(t,x);e-ρtip(j)(t,x)- I(j), (15) 式中,p(j)(t,x)如(11)所示,并且回想一下,j=1。

14
nandehutu2022 在职认证  发表于 2022-6-9 18:59:21
,m表示政权状态。最后,在间隔t中∈ (ti,ti+1)过程‘’(j)(t,x)满足耦合系统of PDES(t+L)`(j)(t,x)+htmXj=1Ajk `(k)(t,x)=0,t∈ (ti,ti+1),(16),其中L=-κxx+σXXI是过程Xt的最小生成器。(15)中的最大化表示代理人在tior立即投资时持有投资期权的选择权。如果第二个论点达到最大值,则代理人行使其选择权,以I(j)的成本投资储备,并获得现金流p(j)(t,x)的预期贴现价值,该现金流p(j)(t,x)是在现货市场提取和出售商品的结果。该投资决策通过制度j与储量估计值挂钩。不同的制度j将导致不同的行权政策,我们将在下一节探讨这种关系。Jaimungal和Surkov(2011)研究了由L'evy过程驱动的多重商品的期权,受他们工作的推动,我们通过使用'`(j)(t,x)相对于x的傅里叶变换递归求解PDE(16)系统,我们用'`(j)(t,ω)表示。具体来说,我们写`(j)(t,ω)=Z∞-∞e-ωx‘(j)(t,x)dx和‘(j)(t,x)=Z∞-∞eiωx `(j)(t,ω)dω2π,(17)式中=√-1、将傅立叶变换应用于(16),我们得到了一个新的PDE,它不含抛物项,它依赖于状态变量ω而不是状态变量x,即:t+(κ-σω) + κ ω ω`(j)(t,ω)+htmXj=1Ajk  `(k)(t,ω)=0。(18) 在区间(tk,tk+1)内,我们引入一个移动坐标系,并写出^`(j)(t,ω)= `(j)(t,e-κ(tk+1-t) ω),去掉ω中的导数,我们发现函数^`(j)满足耦合线性常微分方程组t^′(j)(t,ω)+κ -σωe-2κ(tk+1-t)^`(j)(t,ω)+htmXj=1Ajk^`(k)(t,ω)=0。

15
可人4 在职认证  发表于 2022-6-9 18:59:24
(19) 通过写入A=U DU-1其中,U是A的特征向量矩阵,D是A的特征值对角矩阵,上述耦合常微分方程组可以被改写为独立的常微分方程组,其矢量形式如下:t型U-1^′(t,ω)+ψ(ωe)-κ(tk+1-t) )I+htDU-1^`(t,ω)=0,(20),其中^`(t,ω)=(1)(t,ω),^`(n)(t,ω)),ψ(ω)=κ-σω和I是n×n单位矩阵。这些不耦合的常微分方程有解u-1^`(t+k,ω)=expZtk+1tkψ(ωe-κ(tk+1-s) )ds I+Ztk+1tkhsds DU-1^’(tk+1,ω)。(21)式中,^`(tk+,ω)=limt↓tk^′(t,ω)。接下来,我们左乘U得到^`(t+k,ω)=expZtk+1tkψωe-κ(tk+1-s)ds公司经验值Ztk+1tkhsds A^`(tk+1,ω),(22)且不可逆投资期权波动值的傅立叶变换为`(t+k,ω)=expZtk+1-tkψ(ωeκs)ds经验值Ztk+1tkhsds A~`tk+1,ωeκ(tk+1-tk). (23)这个结果有几个有趣的特点。第一,均值反转的作用与推动产量估计的马尔可夫链脱钩。第二,时间t+kat频率ω的值取决于时间tk+1at频率ωeκ(tk+1)的值-tk)。这需要在频率空间中进行外推,因为计算选项值的算法会在时间上后退。当我们将状态空间离散化时,这种外推可能导致不准确的结果,因为状态空间的边缘是外推值的最重要贡献。相反,我们在傅里叶变换中利用了频率和实空间之间的逆关系∞-∞eiωxg(x/a)dx=Z∞-∞ei(aω)xg(x)dxa=a▄g(aω),写入▄`(t+k,ω)=expZtk+1-tkψ(ωeκs)ds经验值Ztk+1tkhsds A`(tk+1,ω),其中`(tk+1,x)=`(tk+1,x e-κ(tk+1-tk)和`表示``的傅里叶变换。因此,实物期权在t+kis时的投资权利极限值是根据x的插值(而不是ω的外推)确定的。

16
大多数88 在职认证  发表于 2022-6-9 18:59:28
在图2中,我们总结了不可逆地投资储备的实际期权的估值方法。1、设置实空间和频率空间网格x=[-x:x:x],x=e-κtx和ω=[0:ω : ω].2、放置终端条件:`(tn,x)=e-ρtn(P(tn,x)- 一) +。3、设置k=n.4。从tk+1后退到tk:(a)` tk+1=interp(x,` tk+1,x)(b)` tk+1(ω)=F[` tk+1(x)](c)` t+k(x)=F-1.eRtk+1-tkψ(ωeκs)dseRtk+1tkhsds A` tk+1(ω)(d) ` tk=最大值\'t+k(x);e-ρtk(P(tk,x)- (一)+5、设置k→ k- 1,如果k≥ 0转到步骤4。图2:计算不可逆投资储备期权价值的算法。4、校准和学习利用第2节中的模型和第3节中开发的评估程序,我们详细讨论了马尔可夫链参数的校准程序和(4)中给出的投资者学习函数Ht。总体思路是使用投资者关于估计的先验信息来确定可能的储量估计,以马尔可夫链的状态表示,以及基本生成器矩阵的转移率。下一步是使用关于未来某个日期可以减少多少剩余估计方差的信息来校准学习函数。4.1. 马尔可夫链参数的校准在时间t=0时,代理对真实储量进行估计,用u表示,并对估计的波动性进行估计,用σ表示。因此u=E[θ| F]和σ=V[θ| F]。(24)校准程序的第一步是选择马尔可夫链状态下的储备量状态,即选择v(1),v(m)。由于储量的t=0估计值代表储量的无偏估计值,因此马尔可夫链应在储量的初始估计值周围对称。

17
可人4 在职认证  发表于 2022-6-9 18:59:31
为了确保这种对称性,我们假定(i)马尔可夫链状态的基数为奇数,即对于某些正整数L,m=2 L+1;(ii)v(L+1)=u,其中u是储量的初始估计值,(iii)v(k)以k为单位增加,(iv)v(L+1+i)- u = u - v(L+1-i) ,则, i=1,L(25)我们进一步假设代理人对交易量的估计是正态分布的(该假设可以修改为代理人认为代表其先验知识的任何分布):θ| F~ N(u,σ),(26)因此,我们选择v(k)在正态随机变量支持的N个标准偏差上等距分布,即,我们选择v(k)=u- nσ+(k- 1) 2 nσm- 1. k=1,m(27)在储量估计器的状态上放置对称性不足以确保其分布的对称性。我们进一步要求基本生成器速率矩阵A中的对称性,并假设Aλ1,1=-λ、 Aλ1,2=λ,(28a)Aλi,i-1=λi,Aλi,i=-2λi,Aλi,i+1=λi,i=2,L,(28b)AλL+1,L=λL+1,AλL+1,L+1=-2λL+1,AλL+1,L+2=λL+1,(28c)Aλm-i、 m级-我-1=λi,Aλm-i、 m级-i=-2λi,Aλm-i、 m级-i+1=λi,i=1,L- 1,(28d)Aλm,m-1=λ,Aλm,m=-λ. (28e)对于λ={λ,λ,…,λL+1}的某个集合,其中λ,λ,λL+1>0。这里λ,{λ,…,λL}和λL+1分别确定了边缘态、内部态和中间态的跃迁速率。λ的形式确保仅在相邻状态之间发生跃迁,并确保跨越平均估计的状态跃迁速率的对称性。对参数λ进行校准,使θ的不变分布在无需学习的情况下与正态随机变量的离散近似值一致,平均值为u,方差为σ。这确保了马尔可夫链生成的不变分布等于储量分布原始估计值的离散近似。

18
大多数88 在职认证  发表于 2022-6-9 18:59:35
形式上,让Pλ=eAλ表示一个时间单位后的转移概率,让πλ表示P的不变量分布,即πλ解特征值问题Pπλ=πλ。然后,我们选择λ,使得πλ=Φu,σv(1)+v(2)- Φu,σ五(1)+五(1)-五(2)- 五(1), (29a)πλ=Φu,σ(v(i+1)+v(i))- Φu,σ(v(i)+v(i)-1)), i=2,2L,(29b)πλm=Φu,σv(m)+v(m)+v(m)- v(m-1)- Φu,σ(v(m)+v(m-1)), (29c)其中Φu,σ(·)表示具有平均u和方差σ的正态分布的正常累积密度。请注意,Φu,σ是在可能储量之间的中点进行计算的,我们通过线性外推获得边缘状态的方程。4.2. 校准学习函数随着时间的推移,代理收集有关储备商品数量的更多和更好的质量信息。因此,预计储量中估计体积的方差将在一定时间内从σ减小到σT<σ。具体σT=V【θ| FT】。(30)该参数以及初始储量估计方差σ是学习函数的主要决定因素。为了节约,我们假设代理的学习函数的形式为ht=a e-b t对于某些a,b>0,其中参数a表示马尔可夫链状态之间的初始转移率,即h=a,因此反映了储量初始估计的不确定性。学习参数b表示代理学习的速率–b越大(或越小),学习过程越快,因为b的大(或小)值会使过渡速率随着时间的推移衰减得更快(或更慢),因此储量估计值很快(或更慢)变得稳定。

19
nandehutu2022 在职认证  发表于 2022-6-9 18:59:38
回想一下,学习率函数在马尔可夫链的生成矩阵中起着关键作用,参见(4),因为它捕获了代理如何学习储备中商品的数量。校准学习率函数h中的参数,以遵守约束条件(24)和(30)。由于基态跃迁速率A的对称性和剩余体积态v(k)的对称性,我们自动满足平均约束Tse[θ| v=u]=u,E[θ| VT=u]=u。(31)为了满足方差约束,我们需要Markovchain从时间t的任意状态到其有限视界状态的转移概率,我们表示pt,ij:=P限制→∞Zt=j | Zt=i, bept,ij=经验值R∞图杜A.ij公司=经验值abe公司-b tAij。(32)请注意,上面等式的右侧是矩阵指数,与前面一样,符号[·]ij表示方括号中矩阵的ij元素。现在我们必须求解参数a和b的两个耦合非线性方程组:σ=V[θ| V=u]=2L+1Xk=1v(k)(p0,Lk- u,(33a)σT=V[θ| VT=u]=2L+1Xk=1v(k)(pT,Lk- u),(33b)原则上,我们可以开发一个可以校准到一系列时间和方差的模型,然而,一步缩减足以说明此缩减中的基本思想。其中,V[···]是以第二个参数中的事件为条件的第一个参数的方差运算符。之后,所有技术不确定性模型参数都将根据初始储量估计的分布特性进行校准,并根据学习结果减少方差。现在可以使用第3节中的方法来评估通过学习投资保护区的不可逆期权的价值,图2所示的算法中给出了该方法的总结。

20
大多数88 在职认证  发表于 2022-6-9 18:59:42
可以通过在没有学习的情况下考虑期权价值,并将其与没有学习的期权价值进行比较,来评估勘探价值,从而提高服务量估计值的方差。5、数值结果在本节中,我们研究了agent的最佳运动策略,并评估了学习的价值。在整个过程中,我们使用以下参数和建模选择:o储量。初始储量估算:u=10,初始储量估算方差:σ=3×10投资成本。固定成本参数:c=10,可变成本参数:c=3×10。这意味着当储量估算值最低时,投资成本为1.12×10,当储量估算值最高时,投资成本为1.48×10期权到期。T=5年,包括255周其他模型参数:–基础资源模型参数:κ=0.5,θ=log(100),σX=0.5贴现率:ρ=0.05–萃取率参数:α=1,β=0.05,γ=0.9, = 2.–马尔可夫链参数:31个状态。此外,我们将考虑缓慢学习和快速学习的情况,我们通过将储量估计方差的减少量(σT=2.5×10与σT=10)更改为T=2年来建模。我们还将考虑有无运行成本的情况(分别为c=20和c=0)。最后我们通过设置a=1和b=0.4 6 8 10 12 14 1600.020.040.060.080.10.120.140.160.184 6 8 10 12 14 1600.020.040.060.080.10 120.140.160.18图3:在缓慢学习的情况下,在t=0和t=2(方差缩减时间段)下,以初始估计u=v(L+1)为条件的真实储量的模型隐含分布快速学习(右面板)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-26 00:49