楼主: mingdashike22
1653 52

[量化金融] 用于投资组合估值和风险的核机器学习 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-6-24 03:38:54
首先,与LQ相比,当H相对“大”时,我们避免过度拟合,引理A.2中给出了RKHS可分性的不充分条件。到(8),我们得到了J:H→ LpQis是一个具有kJk的有界算子≤ kκkp,Q,对于任何p≤ ∞ 使得kκkp,Q<∞.Im J=LQ的感觉,尤其是当dim(LQ)<∞, 如下文第C节和样本估计所述。其次,问题(10)总是有唯一的解h=fλ∈ H,它是给定的nbyfλ=(J*J+λ)-1J*f、 (11)见【EHN96,定理5.1】。从(9)和(11)可以很容易地得出,fλ可以表示为fλ=J*gλ=ZEk(·,x)gλ(x)Q(dx)(12),其中gλ=(JJ*+ λ)-1f。(13) 方程式(12)被称为再中心定理,参见,例如,【PR16,第8.6节】。它产生了一个重要的金融应用问题,我们将在下面看到。对于分布的内核嵌入定义,请参考[SGF+10]。定义2.1。如果条件核嵌入Mt(y)=EQ[k(X,y)| Ft]以闭合形式给出,则我们称核k可跟踪,对于所有y∈ E、 t=0,T引理2.2。假设k是可跟踪的,并且gλ由(13)给出。对于所有t=0,…,则等式[fλ(X)| Ft]=ZEMt(y)gλ(y)Q(dy)(14)以闭合形式给出,服从Q积分,T我们现在讨论极限λ→ 其中,我们用f表示∈ Im J是f ontoIm J在LQ中的正交投影。f的正交性- 风扇f- fλ在LQ中,我们可以分解平方近似errorkf-fλk2,Q=kf-fk2,Q+kf- fλk2,qin为投影误差平方kf之和- fk2,qa和平方正则化误差kf- fλk2,Q。下一个结果是众所周知的,并且表明正则化误差收敛到零,即λ→ 0,尽管收敛速度可能很慢,请参见[DVRC+05,提案4]。引理2.3。

12
何人来此 在职认证  发表于 2022-6-24 03:38:57
kf公司- fλk2,Q→ 0为λ→ 根据引理2.3,k的以下性质是可取的,因为它意味着零投影误差,f=f,因此近似误差收敛为零λ→ 定义2.4。如果Im J=LQ,则内核k称为LQ通用。我们在C和D节中详细讨论了有限维目标空间Lqa和有限维RKHS H的特殊情况。机器学习文献中的一个标准假设是∈ Im J,当且仅当ifproblem(10)有λ=0的解时成立。在这种正则性假设下,可以得出收敛速度(14)中的积分归结为下面fλ的样本估计的有限和,见引理4.1。实际上,{J(J*J+λ)-1J*| λ>0}是LQ上的一个有界算子族,kJ(J*J+λ)-1J*k≤ 1通过B.1节,其弱收敛于Im J,fλ上的投影算子→ fasλ→ 0,但通常在运算符范数中不是这样。[Ste02,MXZ06]引入了通用内核。另请参见[SFL10]。在引理2.3中,参见,例如,[CDV07]。然而,请注意,除非RKHS H是有限维的,否则该假设具有很大的限制性,难以在实践中验证。因此,在本文中,我们放弃了这一假设。因此,我们承认给定λ>0的近似误差,由于引理2.3和定义2.4,该误差可以假设为任意小,并将重点放在后续的样本误差上。3样本估计我们接下来从有限样本中学习近似值fλ。以前的机器学习文献在f和k的正则性和有界性假设下导出了样本误差界,这些假设通常不适用于金融应用。因此,我们将以下设置添加到文献中。因此,我们将f和k转换为有界函数,并在必要时通过在某些替代度量下采样来补偿此转换。

13
何人来此 在职认证  发表于 2022-6-24 03:39:00
具体而言,我们确定了等效的抽样测量~ Q与Radon–Nikodym导数w=deQ/dQ,我们定义了可测函数f=f/√w和可测核函数k(x,y)=k(x,y)/pw(x)w(y)。我们假设w的选择使得kefk∞,Q<∞ (15) andkeκk∞,Q<∞ (16) 其中,我们定义了eκ(x)=qek(x,x)=κ(x)/pw(x)。我们用Eh表示对应于toek的RKHS。很容易看出,线性算子U:LeQ→ LQ由Ug给出=√wg是一个等距图,带有U-1g=U*g=g/√w、 因此,kefk2,eQ=kfk2,Qand keκk2,eQ=kκk2,Q。此外,根据[PR16,命题5.20],我们推断线性算子T:eH→ H由T H给出=√whis等距,带T-1h=T*h=h/√w、 因此,eH是可分离的,从Ej=U的意义上看,下图是相互转换的-1JT,eH LeQH LQeJ×√wJ×√w(17)其中EJ:eH→ LeQdenotes映射h的线性算子∈eH到其Q-等价类。因此,第2节的所有结果都可以提升,并实际应用toeQ、ek、eH、eJ、ef代替Q、k、H、J、f。特别是,我们得到了LeQ中fλ的近似值,我们得到了fλ=√wefλ。还请注意,当且仅当k是LQ universal时,EK是LeQ universal。我们现在让n∈ N和X=(X(1),X(n))是具有X(i)的i.i.d.E值随机变量的样本~公式。在不丧失一般性的情况下,我们假设随机变量X(i)定义在产品可测量空间E=E×E×··························································· E ···, 赋予产品概率度量eQ=eQ均衡器 ···.我们确定了E上的经验测量值Eqx=nPni=1δX(i)。然后,第2节的所有结果再次适用于J:H→ LQis是一个紧算子,根据开映射定理,我们得到Im J=Im J当且仅当dim(Im J)<∞. 在这种情况下,很明显,f∈ Im J.如脚注4所示,鉴于(8)和(16),我们必须有kκkp,Q≤ k√wkp,Qkeκk∞,Q<∞, 对于任何p≤ ∞ 这样的话√wkp,Q<∞. 最后一个显然适用于p=2。样品方面,foreQXin代替了Eq。

14
mingdashike22 在职认证  发表于 2022-6-24 03:39:03
我们用EJX表示:呃→ LeQXandefX=(eJ*XeJX+λ)-1eJ*Xef样品类似物ofeJ:eH→ 分别为LeQandefλ。与(17)一致,我们最终确定了fλbyfX的样本估计量=√wefX。(18) 我们的第一个主要结果是一对极限定理,它显示了H中被视为函数的估计量(18)的一致性。关于Hilbert空间上具有均值m和协方差算子Q的高斯测度N(m,Q)的概念,我们参考a.4节。我们表示g的方差∈ LeQby VeQ【g】=kgk2,等式- hg,1ieQ。定理3.1。(i) H中的大数定律:fXa。s--→ fλ为n→ ∞.(ii)H中的中心极限定理:√n(外汇)-fλ)d-→ N(0,Q)为N→ ∞, 式中Q:H→ H是由hQh给出的非负自伴迹类算子,hiH=VeQ[(1/w)(f- fλ)(J*J+λ)-1h],对于h∈ H、 定理3.1的直接结果是以下弱中心极限定理,它适用于任何H∈ H√nhfX公司- fλ,hiHd-→ N(0,hQh,hiH)为N→ ∞. (19) 备注3.2。从定理3.1和连续映射定理,我们立即得到了LQ中相应的大数定律和中心极限定理。后者为√n(外汇)- fλ)d-→N(0,JQJ*) 作为n→ ∞, 其中JQJ*: LQ公司→ LQis hJQJ给出的非负自伴迹类算子*g、 giQ=VeQ[(1/w)(f-fλ)(J*J+λ)-1J*g] ,对于g∈ LQ。弱中心极限定理(19)如下√nhfX公司- fλ,giQd-→ N(0,hJQJ*g、 giQ)作为n→ ∞.备注3.3。定理3.1在弱于(15)–(16)的假设下实际成立,即kefeκk2,eQ<∞和keκk4,eQ<∞. 这从其证明中可以明显看出,请参见(44)和(50)。我们的第二个主要结果为估计量提供了有限的样本保证(18)。定理3.4。对于任何η∈ (0,1),我们有KFx- fλkH<p2 log(2/η)k(1/w)(f- fλ)κk∞,Qλ√n(20),采样概率Q至少为1- η.备注3.5。

15
kedemingshi 在职认证  发表于 2022-6-24 03:39:06
请注意,定理3.4中的界是无量纲的,因为尽管常数可能取决于E的维数,但n中的收敛速度并非如此。从证明中,我们看到这是Hoeffing不等式(37)的直接结果,它是无量纲的。我们还观察到,fλ与f的近似值越接近,有限样本误差界限越小。至于选择满足条件(15)和(16)的抽样测量Eq,有一个最优性测量可以产生最小的L∞-内核在以下意义上的范数。引理3.6。对于任何取样测量~ Q、 我们有keκk∞,Q≥ kκk2,Q,当且仅当k>0且w=kκk2,Q,Q-a.s.(21)在这种情况下,eκ=kκk2,Qis常数Q-a.s.如上所述,对于任何函数h:e→ R、 我们将为其eqx等价类编写h。通过选择(21),我们得到keκk∞,Q=kκk2,Q,表示条件(16)。对于条件(15),结合选择(21),我们总是可以选择原始核k,使得kf/κk∞,Q<∞,这就意味着(15)。除上述考虑外,对于实际问题,选择采样测量值Eq是很方便的~ Q,以便从EQ中采样是可行的。(22)机器学习文献中已推导出类似于(20)的有限样本保证,例如[CS02b、CS02a、SS05、WYZ06、WZ06、CDV07、BPR07、SZ07、WYZ07、RS17、LRRC18],但假设条件比我们更严格。例如,[RS17]假设f∈ Im J,这在我们下面第6节的示例中不成立。事实上,高斯指数核是LQ通用的,参见引理6.1,因此f=f不在任何支付函数f的Im J中。在另一个例子中,[LRRC18]假设E是紧的,这在我们的示例中同样不成立。

16
何人来此 在职认证  发表于 2022-6-24 03:39:09
这些假设在上述文献中是标准的,其中大多数论文旨在确定总误差kfX的最佳学习率-fk2,Q。这些是形式为Q[kfX]的语句- fk2,Q<c(η,n)]≥ 1.- η表示所有n≥ n(η),对于η∈ (0,1).迄今为止获得的最佳学习速率为c(η,n)=O(n-1/2),与(20)一致。然而,我们认为,将固定λ>0的样本误差界(20)与近似误差分离,可以提高参数的透明度,并使我们的框架能够灵活地遵守财务应用程序。因此,我们在最小假设下陈述了定理3.4,以涵盖财务示例。事实上,机器学习文献中所述的有限样本保证在更严格的假设下成立,并要求财务用户仔细检查这些证明,以检查它们是否也适用于我们较弱的假设。这可以说是一项繁琐的任务。为了方便读者,我们给出了定理3.4的一个自包含的简短证明。这些论点是以[RS17,定理3.1]的证明为精神的,该证明再次建立在[DVRC+05,定理2]和[CDV07,定理4]的基础上,然而,这是在上述严格假设下陈述的。有趣的是,据我们所知,文献中没有这种形式的定理3.1。4计算我们展示了如何计算外汇。我们还推导了引理2.2的样本模拟,它以闭合形式给出了估计值过程VXin(4)。我们明确考虑到采样点可能重叠。我们首先注意到,n=dim LeQX≤ n、 当且仅当ifX(i)6=X(j)对于所有I6=j.(23)时相等,因此,我们让'X(1),\'X(\'n)是E中的不同点,因此{\'X(1),…,\'X(\'n)}={X(1),…,X(n)}。定义指数集Ij={i | X(i)='X(j)},j=1,n.我们考虑正交基{ψ。

17
nandehutu2022 在职认证  发表于 2022-6-24 03:39:12
,由ψi((R)X(j))=| Ii给出的Leqx的ψ\'n}|-1/2δij,因此hψi,ψjieQX=nδij,对于1≤ i、 j≤ n.任意g的坐标向量表示∈ Leqxaccording由g=(| I | 1/2g(| X(1))|1/2g(\'X(\'n)))>。(24)我们通过Kij=| Ii | 1/2ek(| X(i),| X(j))| Ij | 1/2定义正半无限n×| n矩阵K,对于1≤ i、 j≤ \'\'n.此排序步骤增加了计算成本。在C.1节中,我们将演示如何在不排序的情况下计算FX。(53)我们看到NK是Ejxej的矩阵表示*十: LeQX公司→ LeQX。因此,我们得到了以下引理,它显示了如何根据K和f=(| I | 1/2ef(| X(1)),…,计算fx和vx|I'n'1/2ef('X('n)))>,Leqx中的EF坐标符合(24)。引理4.1。独特的解决方案g∈ R'nto(nK+λ)g=f,(25)给出fX=nP'nj=1k(·,'X(j))| Ij'1/2gj√w((R)X(j))。此外,如果内核k可跟踪nVx,t=n'nXj=1Mt('X(j))| Ij'1/2gjpw('X(j)),t=0,T、 (26)以封闭形式给出。备注4.2。当n在内存和计算方面显著大于10时,计算n×n矩阵K是不可行的,请参见[MV18]。在这种情况下,可以考虑formek(x,y)核的低阶近似值≈eφ(x)>eφ(y)对于某些特征映射eφ:e→ Rm。这将我们带到下面引理D.3中讨论的有限维情况。最近有很多关于这种低Rankaproximations的研究。E、 g.,[DXH+14,LHW+16]使用如表a.1(ii)所示的核概率表示,其中,通过有限样本ω,…,得出的经验度量,它们近似于M,从而近似于k,ωm∈ Ohm 如我们所见,从M.5可跟踪核中得出,如果所选核对于给定的随机驱动是可跟踪的,则上述核方法可以有效地用于近似V。幸运的是,正如我们现在所看到的,有许多这样的内核k和分布Q。

18
nandehutu2022 在职认证  发表于 2022-6-24 03:39:15
因此,我们假设k是可测核kton的乘法形式k(x,y)=TYt=0kt(xt,yt)(27),使得κt∈ κt(x)=pkt(x,x),且具有可分离的RKHS-Ht。然后,可以用张量积H=H来确定k的RKHS ···  HT,见【PR16,定理5.11】。特别地,对于函数g(x)=QTt=0gt(xt)和h(x)=QTt=0ht(xt),hg,hiH=QTt=0hgt,htihtf。然后很容易看出,如果内核嵌入mt(y)=REtkt(x,y)Qt(dx),参见[SGF+10],对于所有y都是闭合的,那么(27)中的内核k是可处理的∈ E和t=0,T实际上,条件内核嵌入扫描现在可以写成asMt(y)=EQ[k(X,y)| Ft]=tYs=0ks(Xs,ys)tYs=t+1ms(ys),y∈ E、 (28)接下来,我们假设每个ETI都是某个dt的RDTF的可测量子集∈ N、 然后,Bochner定理[Sat99,命题2.5]暗示,Rdt上的任何对称概率测度∧,以及参数β≥ 0,在形式kt(x,y)=eβx>yZRdtei(x)的Etof上产生一个核-y) >λ∧(dλ),x,y∈ Et.(29)至于随机驱动因素分布,我们假设每个QTi都是可整除的,并且对于所有x,都允许βx阶的指数矩∈ 然后,L'evy–Khintchine公式为(扩展的)特征函数bqt(u)=REteu>yQt(dy)生成一个闭合形式表达式,用于所有容许的u∈ Cdt,见[Sat99,定理8.1]。示例包括(离散时间)L'evy过程X,这是金融模型中广泛存在的随机驱动因素。核嵌入变为smt(x)=ZRdtZEte(βx+iλ)>yQt(dy)e-ix>λ∧(dλ)=ZRdtbQt(βx+iλ)e-ix>λ∧(dλ),x∈ Et,(30)为闭合形式,受∧(dλ)积分的影响。为了理解这一发现,我们注意到,傅里叶型积分(如(30)中右侧的积分)是常规计算的,例如,在L’evy型或a ffine模型中,[DFS03]。

19
能者818 在职认证  发表于 2022-6-24 03:39:18
因此,我们可以利用大量可用的计算机代码库。可追踪测度∧包括对称的不可整除分布,对于该分布,L'evy–Khintchine公式得出了ktin(29),kt(x,y)=eβx>ye的闭合表达式-(十)-y) >A(x-y) +RRdt(cos((x-y) >ξ)-1) ν(dξ),x,y∈ Et,其中A是一个正半有限矩阵,ν是Rdt上的对称L'evy测度,参见[Sat99,定理8.1和E 18.1]。[NF16]最近也对β=0的此类核进行了研究。对于ν=0和A=2αIdt,其中Idt是单位矩阵,我们得到高斯指数核kt(x,y)=e-αkx-yk+βx>y,x,y∈ Et,(31),参数α≥ 0和β≥ 作为特例,它包含高斯核(β=0)和指数核(α=0)。Sobolev空间的核也是β=0的形式(29)。[NUWZ18]最近表明,s阶弱导数大于dt/2的函数的Sobolev空间Ws(Rdt)的生成核是平方可积的,由概率测度∧(dλ)=(2π)给出-dt(1+P0<|α|≤sλα)-1dλ。这一点值得注意,因为Sobolev空间是函数近似的通用工具,因此对于可分割的金融应用可能很有用。6个示例我们在介绍性示例的基础上,对具有d名义股价过程的Black-Scholes模型进行了扩展,对于某些维度d∈ N、 特别地,我们假设Xtare i.i.d.标准Gaussianson Et=Rd,t=1,T对于核(27)的分量,我们考虑参数α>0和β的高斯指数核(31)∈ [0,1/2)。β的上界是必要的,并且对于(7)保持有效。如果∧,则∧是对称的(-B) =λ(B),其中-B={-x | x∈ B} ,对于每个Borel可测集B Rdt。请注意,我们没有指定Xhere,其中可能包括将累积现金流量函数f(X)参数化的投资组合特定值。

20
何人来此 在职认证  发表于 2022-6-24 03:39:21
这可能包括嵌入期权的执行价格或基础金融工具的初始价值。我们可以从贝叶斯先验Q中抽取xf。从此我们省略X,这相当于设置k=1。只要合适,我们通过将x=(x,…,xT)叠加到列向量中,用rdtb标识路径空间E。因此,Q=N(0,IdT)是RdT上的标准高斯度量,我们可以写出(x,y)=e-αkx-yk+βx>y。根据引理A.2,每h∈ H是连续的,H是可分的。对于以下重要属性,我们回顾定义2.4。引理6.1。高斯指数核k是LQ普适的。至于采样测量eq,我们考虑氡-尼科德姆导数w=dQ/dQ,由w(x)=(1)给出- 2γ)dT/2eγkxk,参数γ<1/2。则等式=N(0,(1-2γ)-1IdT)是具有标度方差的中心高斯度量,因此(22)明显满足。我们得到eκ(x)=(1-2γ)-dT/4e(β/2-γ/2)kxk。因此,条件(16)成立且仅当β≤ γ、 (32)我们从此假定。注意,对于β=γ,我们得到了Radon–Nikodym导数(21),它在引理3.6的意义上是等时的。对于高斯抽样测量eq,(23)几乎可以肯定适用于任何有限样本,因此对于所有j=1,…,n=n,\'X(j)=X(j)和| Ij |=1,n、 这简化了估值器VX,tin(26)的表达式,其中还包括(28)中给出的条件核嵌入Mt。直接的计算表明,所涉及的内核嵌入是闭合形式的ms(ys)=(1+2α)-d/2eβ+4αβ-2α4α+2kysk。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 23:10