楼主: 大多数88
1227 17

[量化金融] 基于数据的非参数分布自动离散化 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-6-10 01:57:03
首先,将具有两个分量的高斯混合分布输入年度对数超额回报数据。各混合物成分的比例、平均值和标准偏差arep=(pj)=(0.1392,0.8608),u=(uj)=(-分别为0.2242、0.1064)和σ=(σj)=(0.2164、0.1453)。接下来,我假设true超额收益分布是这种高斯混合,并解决了相对风险厌恶γ的最优投资组合问题∈ {2,4,6}使用高斯求积(Golub-Welschalgorithm 1)计算具有11个点的高斯混合。最后,我用不同的样本大小从这个高斯混合中提取随机数,用不同的方法离散这些分布,并计算最优投资组合。我用M=1000蒙特卡罗复制品重复此过程,并计算相对偏差和平均绝对误差(MAE)偏差=MMXm=1bθm/θ*- 1., (A.1a)MAE=MMXm=1bθm/θ*- 1., (A.1b)其中bθmis模拟m和θ的最优投资组合*是理论上最优的投资组合。对于样本量,我考虑T=100、1000、10000,对于正交节点的数量,我考虑N=3、5、7、9。对于离散化方法,我考虑了三种情况。FIRS t是非参数高斯回归法(算法2),我称之为“NP-GQ”。其次是高斯-厄米特求积,其中平均值和标准偏差通过最大似然估计。如果回报分布为对数正态分布,则这是最自然的方法。thir d是田中和Toda(201 3,2015)以及Farmer和Toda(2 017)提出的最大熵方法,其中引入了核密度估计器(带高斯核),我称之为“NP-ME”。对于这种方法,需要指定网格和匹配的动量数。

12
能者818 在职认证  发表于 2022-6-10 01:57:07
根据Farmer和Toda(2017)的推论3.5,我使用了以样本平均值That spansp2(N)为中心的等距网格- 1)乘以两侧的样本标准偏差,其中N是网格点的数量。我匹配4个样本时刻,如果N可能≥ 5,否则我匹配2个样本矩(均值和方差)。有关exactalgorithm的更多详细信息,请参阅Tanaka和Toda(2013、2015)以及Farmer和Toda(2017)的第2节和第3.2节。表1和表2分别显示了最优投资组合的相对偏差和平均绝对误差。正如预期的那样,使用高斯-埃尔米特(Gauss-Hermite)计算的最优投资组合偏向上,因为它使用高斯分布,这低估了崩溃的可能性。在两种非参数化方法中,NP-GQ在偏差和平均绝对误差方面均优于NP-ME,尤其是当样本量较小(T=100)时。对于N=3个gr id点,在这种情况下,不可能用NP-ME匹配4个矩,建议的NP-GQ方法表现明显更好。

13
mingdashike22 在职认证  发表于 2022-6-10 01:57:10
最后,将N增加到5以上不会改善NP GQ的偏差或平均绝对误差,这表明使用五点分布就足够了(至少对于解决这个投资组合问题而言)。表1:最优投资组合的相对偏差。方法NP-GQ Gauss-Hermite NP-MET Nγ=2 4 6γ=2 4 6γ=2 4 6 3 0.054 0.053 0.053 0.168 0.123 0.109 0.140 0.113 0.1055 0.051 0.053 0.053 0.159 0.123 0.109 0.096 0.082 0.0777 0.051 0.053 0.053 0.158 0.123 0.109 0.082 0.074 0.051 0.053 0.053 0.053 0.157 0.109 0.070 6 0.071 0.06810003 0.005 0.005 0.005 0.105 0.060 0.047 0.089 0.059 0.0505 0.004 0.005 0.005 0.103 0.060 0 0.047 0.031 0.0190.0167 0.004 0.005 0.005 0.103 0.060 0.047 0.022 0.014 0.0119 0.004 0.005 0.005 0.103 0.060 0.047 0.018 0.012 0.010100003 0.001 0.001 0.001 0.098 0.054 0.041 0.084 0.054 0.0455 0.001 0.001 0.001 0.001 0.098 0.054 0.020 0.011 0.0087 0.001 0.001 0.098 0.051 4 0.041 0.012 0.006 0.0049 0.001 0.001 0.001 0.098 0.054 0.041 0.008 0.004 0.003注:该表报告了最佳投资组合由(A.1a)定义。对于离散化方法,“NP-GQ”使用算法2,“Gauss-Hermite”使用Gauss-Hermite求积(通过最大似然估计平均值和标准偏差),“NPME”使用最大熵方法和核密度估计器。T是每个模拟中的样本大小。N是求积公式中的节点数。γ是相对风险厌恶。所有结果均基于1000次蒙特卡罗复制。B高斯求积在本附录中,我们证明了高斯求积的一些性质。为了符号的简单性,让我们省略a,b(soRmeansRba),并假设所有n的tRw(x)xndxexists≥ 对于函数f,g,通过(f,g)=Zbaw(x)f(x)g(x)dx定义内积(f,g)。(B.1)通常,通过kf k=p(f,f)确定f的范数。

14
nandehutu2022 在职认证  发表于 2022-6-10 01:57:13
第一步是构造与内积(B.1)相关的正交多项式{pn(x)}Nn=0。定义1(正交多项式)。多项式{pn(x)}Nn=0称为正交多项式,如果(i)deg pn=n,且pn的前导系数为1,(ii)对于所有m 6=n,我们有(pm,pn)=0。一些作者要求多项式是正交的,所以(pn,pn)=1。在本文中,我们通过要求前导系数为1来规范化多项式,这对计算很有用。以下三项复发率表2:最优投资组合的相对平均绝对误差。方法NP-GQ Gauss-Hermite NP-MET Nγ=2 4 6γ=2 4 6γ=2 4 63 0.239 0.247 0.249 0.323 0.306 0.301 0.296 0.293 0.2925 0.236 0.247 0.249 0.314 0.305 0.301 0.267 0.271 0.2707 0.236 0.247 0.313 0.305 0.301 0.256 0.264 0.2659 0.236 0.247 0.312 0.305 0.301 0.251 0.262 0.26310003 0.068 0.072 0.073 0.125 0.100 0.095 0.112 0.098 0.0955 0.067 0.072 0.073 0.124 0.101 0.095 0.078 0.0780.0787 0.067 0.072 0.073 0.124 0.101 0.095 0.074 0.076 0.0769 0.067 0.072 0.073 0.124 0.101 0.095 0.072 0.075 0.07610003 0.021 0.023 0.098 0.056 0.045 0.084 0.056 0.0485 0.021 0.023 0.098 0.056 0.045 0.0257 0.0257 0.021 0.023 0.023 0.098 0.056 0.045 0.024 0.0249 0.021 0.023 0.023 0.098 0.056 0.045 0.023 0.023 0.023注:表r报告了相对平均绝对误差(A.1b)定义的最佳投资组合。变量定义见表1。关系(TTRR)证明了正交多项式的存在性,并给出了计算它们的显式算法。命题2(三项递推关系,TTRR)。设p(x)=1,p(x)=x-(xp,p)kpk,对于n≥ 1定义n+1(x)=x-(xpn,pn)kpnk!pn(x)-kpnkkpn-1kpn-1(x)。(B.2)那么pn(x)是n次正交多项式。证据

15
何人来此 在职认证  发表于 2022-6-10 01:57:16
让我们通过对n的归纳来证明:(i)pn是一个前导系数为1的n次多项式l,并且(ii)(pn,pm)=0表示所有m<n。对于n=0,这种说法是微不足道的。对于n=1,通过构造一个导频系数为1的1次多项式,由于p(x)=1,我们得到(p,p)=x-(xp,p)kpk!p、 p!=(xp,p)- (xp,p)=0。假设权利要求的有效期为n。那么对于n+1,由(B.2)可知,pn+1的领先系数与xpn的领先系数相同,即1。如果m=n,则(pn+1,pn)=x-(xpn,pn)kpnk!pn编号-kpnkkpn-1kpn-1,pn!=(xpn,pn)- (xpn,pn)-kpnkkpn-1k(pn-1,pn)=0。如果m=n- 1,然后(pn+1,pn-1) =x-(xpn,pn)kpnk!pn编号-kpnkkpn-1kpn-1,pn-1!= (xpn,pn-1) -(xpn,pn)kpnk(pn,pn-1) - kpnk=(pn,xpn-1) - kpnk。由于pn的领先优势,pn-1关于1,我们可以编写xpn-1(x)=pn(x)+q(x),其中q(x)是最大n的degr e的多项式- 1、清晰的q可以表示为p,p,…,的线性组合,pn编号-1,SO(pn,q)=0。因此(pn+1,pn-1) =(pn,pn+q)- kpnk=kpnk+(pn,q)- kpnk=0。最后,如果m<n- 1,则(pn+1,pm)=x-(xpn,pn)kpnk!pn编号-kpnkkpn-1kpn-1,pm!=(xpn,pm)-(xpn,pn)kpnk(pn,pm)-kpnkkpn-1k(pn-1,pm)=(pn,xpm)=0,因为xpmis是1+m<n次的多项式。下面的引理表明,n次正交多项式正好有n个实根(因此它们都很简单)。引理3。pn(x)在(a,b)上正好有n个实根。证据根据代数基本定理,pn(x)在C上有n个正根。相反,假设pn(x)在(a,b)上的实根少于n个。Letx,xk(k<n)pn(x)改变其符号的根。设q(x)=(x- x) ···(x)- xk)。

16
mingdashike22 在职认证  发表于 2022-6-10 01:57:19
由于pn(x)q(x)>0(或<0)几乎在(a,b)上的任何地方,我们得到(pn,q)=Zw(x)pn(x)q(x)dx 6=0。另一方面,由于deg q=k<n,我们得到(pn,q)=0,这是一个矛盾。以下定理表明,使用阶N正交多项式pN(x)的N根作为求积节点,并选择特定的权重,我们可以积分所有阶数高达2N的多项式- 1完全正确。因此,高斯性质总是存在的。定理4(高斯求积)。设a<x<···<xN<b是N次正交多项式pn的N根,对于N=1,…,定义N=Zw(x)Ln(x)dx,N、 式中,ln(x)=Ym6=nx- xmxn- Xm是N度- 1个多项式,在x取1,在xm取0(m∈{1,…,N}\\N)。然后zw(x)p(x)dx=NXn=1wnp(xn)(B.3),对于阶数为t到2N的所有多项式p(x)- 1.证明。自deg p起≤ 2N个- 1和deg pN=N,我们可以写ep(x)=pN(x)q(x)+r(x),其中deg q,deg r≤ N- 因为q可以表示为N次正交多项式的线性组合- 1,我们有(pN,q)=0。HenceZw(x)p(x)dx=(pN,q)+Zw(x)r(x)dx=Zw(x)r(x)dx。另一方面,由于{xn}Nn=1是pN的根,所以对于所有n,我们有p(xn)=pN(xn)q(xn)+r(xn)=r(xn),特别是rnxn=1wnp(xn)=NXn=1wnr(xn)。因此,对于阶数高达N的多项式r,必须显示(B.3)- 让我们证明r(x)=NXn=1r(xn)Ln(x)相同。要看到这一点,请将r设为右侧。因为Ln(xm)=δmn(Kroneckerδ),我们有▄r(xm)=NXn=1r(xn)Ln(xm)=NXn=1δmnr(xn)=r(xm),所以r和▄r在N个不同的点{xn}Nn=1上。因为每个Ln(x)是一个degreeN- 1多项式,我们有deg▄r≤ N- 因此,它必须是r=~r。因为r可以表示为Ln的线性组合,所以必须显示所有Ln的(B.3)。

17
可人4 在职认证  发表于 2022-6-10 01:57:22
但由于根据定义zw(x)Ln(x)dx=wn=NXm=1wmδmn=NXm=1wmLn(xm),该说法是正确的。在实践中,我们如何计算n点高斯求积的节点{xn}Nn=1和权重{wn}Nn=1?解决方案由以下Golub-Welsch算法给出。定理5(Golub和Welsch,1969)。对于每个n≥ 1,定义αn,βnbyαn=(xpn-1,pn-1) kpn公司-1k,βn=kpnkpn-1k>0。定义(2.2)中的N×N对称三对角矩阵TNas。然后高斯求积节点{xn}Nn=1是TN的特征值。让vn=(vn1,…,vnn)′是TN的特征向量,对应于特征值xn,那么权重{wn}Nn=1由wn=vn1kvnkZw(x)dx>0给出。(B.4)证明。根据(B.2)和αn,βn的定义,对于所有n≥ 0我们有pn+1(x)=(x- αn+1)pn(x)- βnpn-1(x)。请注意,通过定义p,这对于n=0是正确的-1(x)=0,β=0。对于每个,让p*n(x)=pn(x)/kpnk是非标准化正交多项式。然后上述方程变成skpn+1k p*n+1(x)=kpnk(x- αn+1)p*n(x)- 荷兰皇家电信-1kβnp*n-1(x)。将两侧除以kpnk>0,使用βn、βn+1的定义和重新排列项,我们得到βnp*n-1(x)+αn+1p*n(x)+βn+1p*n+1(x)=xp*n(x)。特别是,设置x=xk(其中xkis是pN的根),我们得到βnp*n-1(xk)+αn+1p*n(xk)+βn+1p*n+1(xk)=xkp*n(xk)。对于所有n和k=1,N定义β=0,p*N(xk)=0(sinc e xkis a root o f pn,因此p*N=pN/kpNk),让P(x)=(P*(x) ,p*N-1(x))′,并将上述方程收集到一个向量中,我们得到NP(xk)=xkP(xk),对于k=1,N、 通过P=(P(x),…,定义N×N矩阵P,P(xN))。然后tnp=诊断(x,…,xN)P,so x,假设p是可逆的,则取tn的特征值。现在自{p*n} n个-1n=0是归一化的,高斯求积将所有次数高达2N的多项式进行积分- 确切地说,我们有δmn=(p*m、 p*n) =Zw(x)p*m(x)p*n(x)dx=NXk=1wkp*m(xk)p*n(xk)表示m,n≤ N- 1、设W=diag(W。

18
何人来此 在职认证  发表于 2022-6-10 01:57:25
,wN),该方程变成sp WP′=I。因此P,W是可逆的,x,n的特征值。求W并求逆,我们得到W-1=P′P<==>wn=N-1Xk=0p*k(xn)>0对于所有的n。为了显示(B.4),设Vn为与IgenValue xn对应的t的特征向量。对于某些常数c 6=0,则vn=cP(xn)。取范数,我们得到kVnk=ckP(xn)k=cN-1Xk=0p*k(xn)=cwn<==> wn=ckvnk。比较vn=cP(xn)的第一个元素,注意p(x)=1和hencep*= p/kpk=1/kpk,我们obta inc=vn1kpk=vn1Zw(x)p(x)dx=vn1Zw(x)dx,这意味着(B.4)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 13:32