楼主: 可人4
1328 19

[量化金融] 期权定价的门控神经网络:设计合理性 [推广有奖]

11
何人来此 在职认证  发表于 2022-5-25 16:47:39
J是隐藏层中的神经元数量。要学习的参数是权重(w、\'w和^w)和偏差(b和\'b)项。我们可以看到,这是一个具有两面性的agated神经网络(Sigaud et al.2015):左侧取m,生成j=1。J神经元σ(~bj)-mewj),右侧取τ,产生j=1。J神经元σ(\'bj+τe\'wj)。然后用乘法门将两侧成对的神经元(索引相同)合并。最后,J倒数第二层神经元使用权重^w生成最终预测y。为了验证合理性,我们现在展示了EQ网络。3符合前面列出的合理性条件。softplus的导数是sigmoid函数:σ(x)=σ(x),sigmoid的导数是σ(x)=σ(x)(1- σ(x))。因此,我们可以看出σ(x)、σ(x)、σ(x)和σ(x)=σ(x)都产生正值。请注意,重量为。。。?。。。。。。图1:拟议模型(单个)。请注意,存在偏差项,尽管为了整洁的外观省略了它们。 是输出输入乘积的乘法门。受约束符号:通过施加-通过施加e’wand e^w,ew和右侧和顶层权重为正。我们可以验证等式3满足条件C1-C3,因为ym=JXj=1-e▄wjσ(▄bj- me▄wj)σ(▄bj+τe▄wj)e^wj≤ 0ym=JXj=1e2wjσ(bj- me▄wj)σ(▄bj+τe▄wj)e^wj≥ 0yτ=JXj=1e'wjσ(▄bj- me▄wj)σ(▄bj+τe▄wj)e^wj≥ 0条件C1、C2和C3可以重写为,cK级=猪圈K=Stym级m级K=StymSt公司=ym级≤ 0cK级=ym级K级=ym级m级K=Stym级≥ 0cτ=猪圈τ=Styτ≥ 0条件C4可以很容易地验证为m→ ∞ Whink公司→ ∞, 和σ(¢bj- m时,mewj)=0→ ∞. 因此,y=0,然后▄c=Sty=0。这也解释了为什么顶层没有偏置项。条件C5和C6很难通过网络体系结构设计实现(例如,权重约束或激活功能选择)。

12
能者818 在职认证  发表于 2022-5-25 16:47:42
因此,我们通过在培训中综合虚拟期权合同来满足这些要求–它们在实际市场中不存在,并且它们的真实价格c等于它们的理论估计价格^c。具体而言,为了满足条件C5,我们生成了许多虚拟数据点:对于每个单一任务,我们确定τ=0,并在[0,St]中统一采样K,并且期权价格应该是最精确的- K、 虚拟选项的示例如表1所示。条件C6更为棘手。对于上界,我们再次合成虚拟训练选项:对于每个唯一的τ,我们创建一个K=0的选项,对应于最昂贵的选项。根据经验,下限不太可能是τe-rτStK^c和cc y(预期)0 1 1000 10 990 990 0 0.99000 1 1000 20 980 980 0 0.98000 1 1000 990 10 0.0100。。0 1 1100 10 1090 1090 0 0.99090 1 1100 20 1080 1080 0.98180 1 1100 1090 10 0.0091。。表1:条件C5τe的虚拟选项-rτStK^c和cc y(预计)7 0.98 1000 0 1000 1020 1.020014 0.95 1100 0 1100 1158 1.0526。。表2:违反条件C6的虚拟选项,因为(i)当K≥ St下限为0–这是由于神经网络设计(ii)当NK<St时,条件C5的虚拟数据和市场数据不太可能被错误定价,因为我们将(货币外)看跌期权转换为(货币内)看涨期权(详情见实验部分的第一部分),所以NNmodel从数据中学习该下限。表2中给出了虚拟选项的示例。多模型之前的网络为所有选项提供了一个单一的rational predictionmodel。我们的完整模型联合训练多个定价模型,以及一个加权模型来软切换它们。如图2所示,整个模型的左侧有i=1。

13
可人4 在职认证  发表于 2022-5-25 16:47:45
I单一定价模型:yi(m,τ)=JXj=1σ(~b(I)j-me▄w(i)j)σ(▄b(i)j+τe▄w(i)j)e^w(i)j(4)其右侧分支是一个具有一个K单元隐藏层的网络,顶层具有一个i-way softmax激活功能,为左侧分支提供模型选择器。wi(m,τ)=ePKk=1σ(m˙W1,k+τW2,k+˙bk)¨Wk,i+¨biPIi=1ePKk=1σ(m˙W1,k+τW2,k+˙bk)¨Wk,i+¨bi(5)最后,总输出y是i本地期权定价模型输出的软最大加权平均值。由于SoftMax激活,权重之和(wi’s)为1。y(m,τ)=IXi=1yi(m,τ)wi(m,τ)。(6) 人们可以将多模型视为专家集合的混合(Jacobs et al.1991)或多任务学习模型(YangandHospedales 2015)。表3总结了单模型和多模型方法的参数。验证合理性可以验证上述多网络仍然满足条件C1、C3和C4。条件C5、C6再次由feed虚拟数据软强制执行?y1 y2 yI。。。m?。。。w1 w2 wI。。。图2:提议的模型(multi):右侧是权重生成模型,左侧是一组单个模型。请注意,左侧不是单层。每个(m,τ)→ yi(通过两个虚线箭头连接)由一个全尺寸的单一模型实现。⊕是输出输入总和的加法门。符号。Shape CommentNumberInSingleNumberInMultiw 1×J货币权重1 Ib J货币偏差项1 I'w 1×J到期时间权重1 I'b J到期时间偏差项1 I'w J×1最终定价权重1 I'w 2×K输入权重0 1'b K隐藏偏差项0 1'w K×I隐藏输出权重0 1'b I输出偏差项0 1表3:符号和参数摘要。顶部:单pricingmodel。底部:多模型中的加权网络(右分支)。培训数据。悬而未决的问题是,多模型打破了条件C2。

14
kedemingshi 在职认证  发表于 2022-5-25 16:47:48
为了缓解这种情况,我们使用了从提示中学习的技巧(Abu Mostafa 1993)。表示y(m,τ)w.r.t.m asg(m,τ)的一阶导数=ym、 我们引入了一个新的损耗,PXp=1QXq=1max(0,g(mp,q,τq)- g(mp,q+, τq))(7)式中 是一个小数字,例如。, = 0.001。Q是训练集中的唯一成熟时间数,P是为每个唯一成熟时间生成的伪数据数。公式7将g(m,τ)推至单调递增函数w.r.t.m,因此g级m(等效ym) 倾向于大于零。回想一下cK=Stym、 因此,等式7确定了负二阶导数问题。与条件C5和C6的虚拟化不同,我们不考虑这些数据点的价差造成的损失,即生成的数据仅用于确保二阶导数属性,我们不实际对其进行定价。总之,多式联运现在也通过了所有合理性检查。损失函数和优化期权定价可能对损失函数的选择敏感(Christoffersen和Jacobs 2004)。我们结合了两个目标:均方误差(MSE)和平均绝对百分比误差(MAPE)。对于多模型,我们在公式7中有额外损失。为了训练theNNs,我们使用Adam Optimizer(Kingma和Ba 2015)。标准普尔500指数的实验数据和期权数据预处理来自OptionMetrics和Bloomberg,它们提供了历史的日终买入和卖出报价。数据样本涵盖1996年1月4日至2016年5月31日期间。OptionMetrics和彭博社也提供了相应的无风险利率和指数股息收益率。无风险利率采用三次样条插值以匹配期权性质。在模型校准之前,应进行多个数据过滤器。买卖中间价作为收盘价的代理计算。

15
大多数88 在职认证  发表于 2022-5-25 16:47:53
我们放弃现金期权报价,因为这些期权的交易非常不活跃,因此其价格不可靠。此外,我们的目标是尽可能多地保留合同。我们只省略到期日少于2天的合同。完成这些步骤后,我们剩下3029327个选项报价。由于我们的模型侧重于定价看涨期权,我们将看跌价格转换为看涨价格吞吐量看涨平价,而不是放弃所有看跌价格–这将引入许多货币内看涨期权作为补充,因为我们放弃了最初的货币内看涨期权报价。到期时间每年标准化,例如,对于τ=7(七天),实际输入为=0.019178。实验一:定量比较我们将实验设计如下:我们用五个连续交易日的数据训练一个模型,并用接下来的一天进行测试。我们将表示为单一和多重的模型与五种基线方法进行比较:PSSF(Dugasetal.2000)、模块化神经网络(MNN)(Gradojevic、Gencay和Kukolj 2009)、Black-Scholes(BS)(BlackandScholes 1973)、方差Gamma(VG)(Madan、Carr和Chang 1998)和Kou-Jump(Kou 2002)。对于三种计量经济学方法,即BS、VG和Kou跳跃,我们仅使用最后一个训练日的数据来校准其参数(参见讨论了解原因)。对于Single和PSSF,隐层神经元的数量为J=5。由于MNN有此设置,Multi中的定价模型数为I=9。多分支权网络的隐层神经元数为K=5。我们在(c,e)上报告了MSE和MAPE-rτSty)进行有意义的比较,但为了数值稳定性,我们训练模型(等效)最小化(erτcSt,y)上的差异。表4和图3显示了我们的多模式在性能和稳定性方面的优势。我们注意到,所有方法的性能都会同时下降,如图。

16
何人来此 在职认证  发表于 2022-5-25 16:47:56
3在与Dot com泡沫(1998)、全球金融危机(2008)和欧洲债务危机(2011)相对应的几个时间点。我们在Github中发布了这些方法的代码:https://github.com/arraystream/fftoptionlibFigure3:季节测试地图:阴影部分对应以下事件:网络泡沫(1998年)、全球金融危机(2008年)和欧洲债务危机(2011年)。训练测试MSE MAPE(%)MSE MAPE(%)PSSF 267.48 25.77 269.56 26.25MNN 50.08 16.89 63.16 18.22单个579.74 34.74 580.47 34.99多个9.91 5.75 12.11 6.84BS 63.73 21.64 64 64 64.71 22.42VG 55.40 18.42 61.57 22.64Kou跳跃18.37 8.69 20.13 9.90表4:3M合同定价的定量比较。实验二:贡献分析在本节中,我们说明并验证了满足条件C5和C6的虚拟期权策略,以及我们的C2多模型使用的二阶导数fix。我们举了一个例子,测试日是2008年5月15日,标准普尔指数是1423。我们绘制了7天后标准普尔指数的风险中性密度(即τ=7)。图4显示了虚拟期权合约和正二阶导数强制执行的必要性。两者都需要生成有效概率密度,即(i)非负和(ii)积分toone。此外,概率密度函数应在经济上合理,例如,τ=7天后接近零的资产价格应为罕见事件(小概率)。我们的模型产生了一个有效的密度,这是约束C1-C6的自然结果。相比之下,图5中的PSSF(Dugas et al.2000)仅满足条件C1-C3,并产生无效密度和。不合理的大零价格概率。从理论上讲,MNN(Gradojevic、Gencay和Kukolj,2009)不能产生密度函数,因为其导数w.r.t.K没有很好的定义。数值结果如图所示。

17
mingdashike22 在职认证  发表于 2022-5-25 16:47:59
5(右)说明了这一点,我们可以看到一个不连续点。讨论我们解释了为什么我们只向计量经济学方法提供一天的数据,而向NNs提供五天的数据。与基于机器学习的方法不同,计量经济学方法中的每个参数都有特定的含义。通过增加参数数量来增加模型容量是不可比拟的。相反,NN方法提供灵活的模型容量,例如改变隐藏神经元的数量。计量经济学方法的设计原则是,在STI唯一的情况下,最多可填写一天的数据(其中一些只能用唯一的τ来拟合一天的数据,因此a0 500 1000 1500 2000SP 500指数00.0050.01概率密度完整模型:有C5 C6,C20 500 1000 1500 2000SP 500指数-0.0100.010.020.03概率密度有C5 C6,没有C20 500 1000 1500 2000SP 500指数01234概率密度×10-4没有C5 C6,有C20 500 1000 1500 2000SP 500指数-0.0100.010.02概率密度有C5 C6中,不含C2Integral:1.4Integral:0.1Integral:1.0 Integral:1.0图4:未来资产价格的隐含分布。左上角:我们的多模型。右上:没有二阶导数约束(C2),我们观察到无效的负值。左下:没有虚拟选项(条件C5和C6):我们看到密度在零附近,这是毫无意义的。右下角:没有导数约束或虚拟选项提供无效且无意义的密度。0 1000 2000SP 500指数01234概率密度SSF1000 2000SP 500指数0246概率密度×10-4PSF1000 2000SP 500指数02468概率密度×10-3MNNIntegral:149.01积分:0.0413积分:2.0046图5:PSSF和MNN均不产生有效分布。左:X轴范围的PSSF风险神经密度[0,2000]。中间:X轴范围内的PSSF风险神经密度【4002000】(注意Y轴标度上的差异)。

18
可人4 在职认证  发表于 2022-5-25 16:48:03
右图:MNN的风险神经密度。还需要单独的插值步骤)。将多天的数据输入计量经济模型会导致严重的拟合不足和灾难性的糟糕表现。事实上,要求我们的模型拟合多天的数据(对应于多个StValue)会增加培训难度。在我们的实验中,我们发现基于神经网络的模型的性能与训练天数呈负相关。如果使用一天的数据进行训练,表4中的神经网络模型的性能将得到改善。这与更多的训练数据会带来更好的表现这一既定理念背道而驰。原因是,提供multipledays的数据隐含地假设当时的市场结构是稳定的。随着天数的增加,很可能会违反这一规定,从而引入域转移问题。我们为什么要采取这种做法?因为当人们想在高频数据上应用期权定价模型时,适应不同基础资产价格的模型是非常有价值的:STI不再是一个常数(作为基础资产的收盘价格),而是一个不断变化的价值(作为基础资产的当前价格)。我们倾向于在模型中输入五天而非一天的数据,以说明使用高频数据建模看涨期权价格是可能的。结论我们引入了一种用于期权定价的神经网络,其性能优于现有的基于学习的方法和一些计量经济学方法,并保证了其输出的经济合理性。在未来的工作中,我们将在高频数据上应用该期权定价模型,并利用类似的约束条件解决其他金融问题,如隐含波动率面。致谢:该项目获得了欧盟地平线2020研究与创新计划的资助,资助协议为#640891。参考Abu Mostafa,Y.S.1993。

19
可人4 在职认证  发表于 2022-5-25 16:48:07
从提示中学习的一种方法。在神经信息处理系统(NIPS)中。巴恩多夫·尼尔森,O.E.1997年。正态逆高斯分布和随机波动率建模。斯堪的纳维亚统计杂志24(1):1–13。Bennell,J.,和Sutcliffe,C.,2004年。Black–scholes与人工神经网络在富时100指数期权定价中的应用。会计、财务和管理智能系统12(4):243–260。Black,F.和Scholes,M.1973年。期权和公司负债的定价。政治经济学杂志81(3):637–654。Boyle,P.P.1977年。选项:蒙特卡罗方法。《金融经济学杂志》4(3):323–338。Carr,P.,和Geman,H.,2002年。资产回报的具体结构:一项实证调查。《商业杂志》75(2):305–332。Carr,P.,和Madan,D.B.,1999年。使用快速傅立叶变换进行期权估值。计算金融杂志2:61–73。Christoffersen,P.,和Jacobs,K.,2004年。损失函数在期权定价中的重要性。《金融经济学杂志》72(2):291–318。Cooley,J.W.和Tukey,J.W.1965年。复傅立叶级数的机器计算算法。数学计算19:297–301。Cox,J.C。;Ross,S.A。;和Rubinstein,M.1979。期权定价:一种简化的方法。金融经济学杂志7(3):229–263。杜加斯,C。;Bengio,Y。;Belisle,F。;纳多,C。;和Garcia,R.2000。结合二阶功能知识,实现更好的期权定价。在神经信息处理系统(NIPS)中。F¨ollmer,H.,和Schied,A.,2004年。随机金融:离散时间的介绍。德格鲁特学习数学。Walter de Gruyter。Garcia,R.,和Genc,ay,R.,2000年。使用神经网络和同质性提示对衍生证券进行定价和分类。计量经济学杂志94(1):93–115。加西亚,R。;Ghysels,E。;雷诺,E.2010。期权定价的计量经济学。爱思唯尔股份有限公司。

20
大多数88 在职认证  发表于 2022-5-25 16:48:10
479–552。Gradojevic,N。;Gencay,R。;和Kukolj,D.2009。模块化神经网络期权定价。IEEE Transactionson神经网络20(4):626–637。Heston,S.L.1993年。具有仓促波动性的期权的封闭式解决方案,应用于债券和货币期权。财务研究回顾6:327–343。Jacobs,R。;Jordan,M.I。;J、 ,N.S。;和Hinton,G.E.,1991年。当地专家的适应性混合。《神经计算》第3卷,79–87。Jeanblanc,M。;约尔,M。;和Chesney,M.,2009年。金融市场的数学方法。斯普林格金融公司。Springer Verlag London Ltd.Kingma,D.,和Ba,J.,2015年。Adam:一种随机优化方法。在国际学习代表大会(ICLR)上。Kou,S.G.2002年。期权定价的跳扩散模型。管理科学48(8):1086–1101。Madan,D.B。;卡尔,P。;和Chang,E.C.1998年。方差伽马过程和期权定价。欧洲金融评论2:79–105。Malliaris,M.,和Salchenberger,L.,1993年。估计期权价格的神经网络模型。应用智能3(3):193–206。默顿,R.C.1976年。基础股票收益不连续时的期权定价。《金融经济学杂志》3:125–144。Roper,M.2010年。无套利隐含波动率表面。预印本;有效时间:http://www.maths.usyd.edu.au/u/pubs/publist/preprints/2010/roper-9.pdf.Schwartz,E.S.1977年。认股权证估值:实施新方法。《金融经济学杂志》4(1):79–93。Sigaud,O。;Masson,C。;Filliat,D。;和Stulp,F.2015。GatedNetwork:目录。更正abs/1512.03201。Yang,Y.,和Hospedales,T.M.2015。多领域、多任务学习的统一视角。参加国际学习表征会议(ICLR)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-21 17:43