楼主: mingdashike22
1102 41

[量化金融] 聚类移动函数中值在层次结构鲁棒预测中的应用 [推广有奖]

21
大多数88 在职认证  发表于 2022-6-1 12:03:45
为了研究我们的提案在设置偏离独立且相同分布的情况下的性能,我们考虑了一个由相对流行的一阶函数自回归过程(FAR(1))组成的层次系统。5.1 FAR(1)过程一阶函数自回归过程,即FAR(1),定义为Xn+1=ψ(Xn)+n+1,其中误差和观测值都是函数,运算符ψ:L(Ohm) → L(Ohm) 是将一个函数转换为另一个函数的线性算子,即ψ(X)(t)=Rk(t,s)X(s)ds,其中k(t,s)是一个二元核。请注意,每个内核都可以重写为(默瑟定理)k(s,t)的形式=+∞Xn=1λnen(t)en(s),(5.1),其中λ是特征值,λ>λ>…>0和{en}+∞n=1是L中的异常基础(Ohm) 空间如果核是连续的,则序列一致收敛。此外,总体特征函数可以通过经验特征函数进行一致估计(见Horváth和Kokoszka(2012)[10]的定理13.2)。常用的条件| | k | |<1确保了FAR(1)方程的平稳解的存在。然而,条件可以被削弱,如Horváth和Kokoszka(2012)[10]的引理13.1,在模拟研究中,我们使用引理的C0条件:存在一个| |ψj | |<1的正整数jsuch。该条件确保FAR(1)方程存在唯一的平稳因果解(见[10]的定理13.1)。此外,H"ormann和Kokoszka[9]表明(参见他们的示例2.1),平均误差为零的FAR(1)过程也是Lp- m级- 可与P逼近≥ 2(创新过程不需要任何平滑特性),这类似于FTSsetup中基于矩的依赖性概念。因此,考虑FAR(1)过程,我们考虑了函数随机变量之间的弱时间依赖性。

22
mingdashike22 在职认证  发表于 2022-6-1 12:03:48
consideredexample表明,我们对函数数据的建议对某种时间依赖具有鲁棒性,即它适用于从FAR(1)过程生成的函数观测。在模拟框架中,FTS样本观测值之间的时间依赖性强度也可以使用功能数据的Kendall相关系数来考虑(见[39])。5.2层次结构模拟框架考虑图4所示的层次结构,其中底层的每个进程(在层次结构最底层的每个节点中)是一个遥远的(1)进程,而更高层的进程是他下面一层的进程加上一个错误的总和,例如,H=H+H+H+e,H=H+H+H+e,H=H+H+H+e,和H=H+H+e,以及所有错误,即e,e,e,e,e,e,e,e,e,e是相互独立的标准维纳过程乘以,例如,e=e(t)=W(t),因此误差不会支配FAR(1)过程。模拟研究的目的是在层次结构的各个层次上与我们的提案共同获得预测。综上所述,我们给出了一些关于仿真研究的细节。在模拟中,根据模型Xn+1(t)=ZTk(s,t)Xn(s)ds+n+1(t),其中n=0。。。,N- 1和错误n+1(t)是标准的维纳过程。在[6]之后,我们决定考虑以下形式的核:s的斜面,即k(s,t)=Cs,t的斜面,即k(s,t)=Ct,以及指数核,即k(s,t)=C exp{-|s-t |}。

23
nandehutu2022 在职认证  发表于 2022-6-1 12:03:51
然而,为了明确模拟研究演示,我们只展示了使用最复杂指数核执行的模拟。规格化常数C的选择应确保| |ψ| |=| | k | |=0.5或| |ψ|=| k |=0.8。在HFTS模拟研究中,我们使用了以下软硬件环境:I7 6700、Ubuntu 16.04 LTS、128 GB RAM。我们使用一个免费的R包far(请参见[5])从far(1)过程中为所考虑的层次结构的底层节点生成样本。我们使用模拟。远的带有参数d.rho的维纳命令,它是Karhunen Loéve基中算子ψ的近似值,被截断为三个特征函数。我们为层次结构底层的18个节点中的每个节点生成了100个FAR(1)样本。我们计算了一个移动函数medianw。r、 t.MBD和GBD,对于层次结构底部的每个节点,窗口长度分别为3、5和10个观测值。之后,添加了层次结构底层三个对应节点的函数样本和相应的误差EI,从而得到了六个扰动样本,即XHin(t),其中1=1,2,6,对于层次结构中最低但只有一级的节点(见图4)。同时,对节点H、…、,hh已计算,例如,His^XHn+1(t)=MEDF D{XHn(t),…,XHn的预测-k+1(t)}++MEDF D{XHn(t),…,XHn-k+1(t)}+MEDF D{XHn(t),…,XHn-k+1(t)},其中F D表示选择的功能深度,GBD或MBD,k是移动窗口的长度,即。

24
何人来此 在职认证  发表于 2022-6-1 12:03:55
k=3、5、10。添加了来自节点Hi,i=1,2,3的函数样本和相应的误差,以及来自节点Hi,i=4,5,6的函数样本和相应的误差E,并获得了层次结构顶层节点的两个扰动样本,即XHn(t)和XHn(t)。同时,计算了两个预测,例如,His^XHn+1(t)=MEDF D{XHn(t),…,XHn的预测-k+1(t)}++MEDF D{XHn(t),…,XHn-k+1(t)}+MEDF D{XHn(t),…,XHn-k+1(t)}。最后,来自节点的两个函数样本手动添加了错误eh,我们获得了层次结构顶层节点的扰动样本,即XHn(t)。层次结构顶层节点的预测由公式^XHn+1(t)=MEDF D{XHn(t),…,XHn给出-k+1(t)}++MEDF D{XHn(t),…,XHn-k+1(t)}。通过这种方式,我们获得了所考虑的层次结构中的每个节点的功能层次结构和预测。我们把整个实验重复了三十次。注意,由于FAR(1)过程生成的函数的形状,使用GBD和MBD获得的函数中介非常相似。因此,考虑MBD诱导的功能性介质就足够了。另请注意,在经济学中,在尽可能长的不间断子区间内监控某些属性的持续性尤其重要。

25
能者818 在职认证  发表于 2022-6-1 12:03:57
这就是为什么从优点的角度来看,有必要区分GBD和MBD,因为在使用GBD时,我们将注意力集中在功能领域的某个部分。对于层次结构的四个层次(见表1-3),使用平均绝对预测误差(MAFE,见[35])对预测质量进行了评估,并对所考虑的层次结构的27个节点中的每个节点进行了功能箱线图(见图5-8)。函数箱线图和α体积-尤其是中部地区,已被用来评估预测因子的“有效性”。我们比较了使用我们的方法、移动函数平均法、污染数据集和清洁数据集获得的预测(例如,请参见图5和图6以获取顶层比较)。在受污染数据的情况下,我们用5%、10%和40%的外围函数替换层次结构底层节点中FAR(1)样本中的部分观测值。污染数据由以下过程生成:fs(t)=60W(t)sin(2πt)+√2W(t)cos(2πt),其中W(t)和W(t)是标准维纳过程。污染既涉及形状异常值,也涉及震级异常值,这些异常值是由过程fs(t)产生的。ArribasGil和Romo[1]的离群图已用于验证被替换函数是否为实际形状的离群值,Tarabelloni[38]的调整函数箱线图已用于验证被替换函数是否为实际的函数幅值离群值。使用二项式分布将外围函数随机放置在层次结构底层节点的观测值中,其中参数p(成功概率)是外围函数的一部分。

26
能者818 在职认证  发表于 2022-6-1 12:04:01
最后,我们使用聚合的medianmethod来获得层次结构中所有节点的预测。我们的方法的稳健性已通过与清洁样品相比,污染样品的FES和功能箱线图的变化进行了评估。从表1-3可以得出结论,我们的方法允许在函数观测值之间相关性较弱的情况下,对形状和震级异常值进行相对稳健的预测。进行广泛的模拟研究涉及对我们的方法和移动函数平均值方法所考虑的层次结构的27个节点中的每个节点的FunctionalBoxPlot进行比较(顶层比较见图5和图6)。同样,从表1-3可以得出结论,我们的方法对于相同分布的函数数据是相对稳健的。图5中有预测误差的函数箱线图示例,这些函数是真实值和预测值之间的差异,预测值是使用移动窗口长度为10的聚合函数中值方法得出的,对于FAR(1)HFT的顶层,无异常值(左)和10%形状异常值(右)。图6中有预测误差的函数箱线图示例,这些函数在真实值和使用移动窗口长度为10的移动函数门方法获得的预测值之间存在差异,对于最顶层的距离(1)HFT,没有异常值(左)和10%形状异常值(右)。FAR情况下HFTS模拟研究结果的简要总结(1):1。MAFE随层次结构的级别而增加。对于任何级别的两种方法,MAFE都会随着污染量的增加而增加。3、在干净数据的情况下,移动窗口越长,聚合函数中值法和移动平均法的isMAFE越小。4.

27
能者818 在职认证  发表于 2022-6-1 12:04:03
与移动函数平均值预测相比,移动窗口越长,聚合中值预测的MAFE越差(见表1)。在数据受到污染的情况下,聚合函数中值优于movingfunctional mean方法。然而,在清洁数据的情况下,情况并不明朗,移动平均法往往优于我们的方法。可以观察到,虽然功能箱线图的中心区域随着功能域的扩展而扩展,但聚合的FunctionalMedia接近于零功能(见图5和图6),这表明存在中间无偏性。6、我们的程序似乎是稳健的,即即使是10%的外围功能也不会显著扭曲功能方框图中心区域的功能中值和体积,这在功能方框图上是可以识别的(见图5和图6)。我们考虑了图4所示的层次结构,其中底层的每个流程(在层次结构最低层的每个节点中)都是标准的维纳流程乘以10,而更高层的流程是底层的多个流程加上一个错误,正如上面针对FAR(1)的情况所述。换言之,与上述情况的唯一区别是,我们在层次结构的最底层考虑每个节点中的10×W(t)过程,而不是FAR(1)过程。

28
mingdashike22 在职认证  发表于 2022-6-1 12:04:06
表1:移动函数平均值和聚合中值方法的MAFE的稳健性,其中FAR(1)样本未被异常值污染。移动平均聚合mediank窗口长度3 5 10 3 5 10底层0.69 0.68 0.65 0.67 0.69 0.70层2 1.29 0.96 0.77 1.47 1.01 0.90层3 3 3.88 1.77 1.31 4 1.41 1.68 1.50顶层11.65 2.43 1.85 8.83 2.43 2.02表2:移动函数平均值和聚合中值方法的MAFE,其中FAR(1)样本被10%的异常值所污染,这些异常值是形状和大小异常值。异常值由fs(t)过程生成。移动平均聚合mediank窗口长度3 5 10 3 5 10底部级别2.41 2.29 2.12 1.70 1.69 1.71级别2 5.80 5.41 5.04 4,61 4,59 4,59级别3 12.01 11.55 11.06 10.74 11.33 10.72顶部级别17.53 17.92 29.54 17.94 17.47 17.41表3:移动函数平均值和聚合中值方法的MAFE,其中FAR(1)样本被40%的异常值所污染,这些异常值是形状和大小异常值。

29
可人4 在职认证  发表于 2022-6-1 12:04:09
异常值由fs(t)过程生成。移动平均聚合mediank窗口长度3 5 10 3 5 10底部级别5.65 5.25 4.84 4.51 4.10 4.11级别2 11.00 10.31 9.83 9.87 9.13 9.17级别3 20.24 19.28 18.72 19.15 17.99 18.08顶部级别27.82 27.91 28.43 28.13 26.63 26.88\'&$%HHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH-20-10010200 20 40 60级100%95%50%5%0%-60-300300 20 40 60水平100%95%50%5%0%图5:无异常值(左)和有10%形状异常值(右)的顶层离散度(1)HFT预测误差的函数箱线图。已应用聚合函数中值法,窗口长度k=10,DepthProc R包。-10010200 20 40 60级100%95%50%5%0%-60-300300 20 40 60level100%95%50%5%0%图6:无异常值(左)和有10%形状异常值(右)的顶层离差(1)HFT预测误差的函数箱线图。已采用移动平均法,窗长k=10,DepthProrc软件包。表4:移动函数平均值和聚合中值法的MAFE,其中维纳过程样本不受异常值污染。移动平均聚合mediank窗口长度3 5 10 3 5 10底部水平0.72 0.68 0.65 0.74 0.69 0.70水平2 1.95 0.96 0.77 2.21 1.01 0.90水平3 5.86 1.77 1.31 6 3 1.68 1.50顶部水平11.72 2.43 1.85 13.27 2.43 2.02方法根据污染样品的MAFE变化与清洁样品进行了比较(见表4-6)。在图7中,有预测误差的函数箱线图示例,这些函数是真实值和预测值之间的差异,预测值是使用移动窗口长度为10的聚合函数中值方法得出的,对于维纳HFT的顶层,无异常值(左)和10%形状异常值(右)。

30
能者818 在职认证  发表于 2022-6-1 12:04:12
图8中有预测误差的函数箱线图示例,这些函数在真实值和使用移动窗口长度为10的移动函数门方法获得的预测之间存在差异,对于维纳HFT的顶层,没有异常值(左)和10%形状异常值(右)。Wiener过程HFTS模拟研究结果小结:1。MAFE随层次结构的级别而增加。对于任何级别的两种方法,MAFE都会随着污染量的增加而增加。3、在干净数据的情况下,移动窗口越长,聚合函数中值法和移动平均法的smalleris MAFE越小。两种方法都给出了可比较的结果(见表4-6)。4、在数据被污染的情况下,聚合函数中值优于移动函数法。可以观察到,虽然功能箱线图的中心区域随着功能域的扩展而扩展,但聚合的功能域接近于零功能(见图7和图8)。我们的程序具有鲁棒性,即。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-26 21:08