楼主: nandehutu2022
1768 27

[量化金融] 基于离散小波变换的股指预测研究 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-5-25 07:50:18
它们通常是数据驱动和自适应的。2、ANN模型能够对非线性数据进行建模和预测。3、ANN模型可以逼近任意连续函数,精度令人满意。2.3支持向量回归(SVR)基于VC理论(VC Vapnik,Chervonenkis)或统计学习理论,近年来支持向量回归(SVR)在非线性回归建模方面得到了广泛的应用。与人工神经网络相似,SVR是一种数据驱动的监督学习模型。VR的示意图如图4所示。图4:SVR示意图SVR模型(Vapnik,1995)表示为:()(.())f x bz(8),其中b是偏差,z是权重向量,Ф(x)是核函数,它将非线性输入数据转换为高维特征空间中的线性数据。核函数通常是非线性函数。广泛使用的核函数有径向基函数(RBF)核和多项式核。参数使用ε-不敏感损失函数估计,该函数定义为:|()|()|()|(())0f x y if f x yL f x y   (9) 其中,y是期望(目标)输出;ε被定义为ε-不敏感区域。SVR的工作原理是结构风险最小化。

12
nandehutu2022 在职认证  发表于 2022-5-25 07:50:21
当经验风险和结构风险同时考虑时,目标函数定义为:**1:()2,0tiitii i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i in Cy x b b y      zzzz(10) 式中,i=1,。。。,n是训练数据的个数*()二是经验风险;12TZZI是防止过度学习和缺乏应用普遍性的结构风险;C是一个修正系数,表示经验风险和结构风险之间的权衡。权重的最佳值可以使用拉格朗日条件来求解各种修正系数C、带宽ε和核函数K的值。基于SVR的回归的近似函数定义为**1(,)(,)()(,)Ni i iif x f x K x b      z(11),其中αi和αi*是满足等式条件*0ii的拉格朗日乘子.Sapankevych&Sankar(2009)对SVR在时间序列预测中的应用进行了调查。另一种损失函数是二次损失函数,但其局限性在于它依赖于异常值。理论风险表示值2的估计过程产生的误差。4拟议的混合模型拟议的用于预测股价的混合模型(MODWT-ANN和MODWT-SVR)综合了分解模型(即MODWT)和机器学习模型(即ANN和SVR)的优点。这些步骤(参见图5)列举如下:1。原始序列使用DWT分解为一组不同的子序列(也称为小波)。2、对于混合MODWT ANN和MODWT-SVR模型,分别使用ANN和SVR对每个子序列进行预测。3、重新组合预测子序列,以获得最终预测值。通过将最终预测值(在上一步中获得)与原始序列进行比较,计算性能/误差度量。5.

13
kedemingshi 在职认证  发表于 2022-5-25 07:50:25
为了了解所提出模型的有效性,采用Wilcoxon符号秩检验和非参数统计模型比较了MODWT ANN和MODWT-SVR与ANN和SVR模型(无分解)的预测能力。实证分析3。1 DataNational Stock Exchange 50(俗称NIFTY 50或NIFTY)和孟买证券交易所敏感指数(俗称SENSEX)是印度股市的主要股指。图5:1995年投资的拟议混合模型流程图,国家证券交易所50指数是印度国家证券交易所的基准指数,孟买证券交易所敏感指数是孟买证券交易所的基准指数。前者由代表22个行业的50只股票组成,而后者仅由30只股票组成。国家证券交易所50指数是印度股市的较好代表。本研究所考虑的指数为国家证券交易所50指数。数据样本包括从2007年9月至2015年7月的8年期内的每周收盘价,因此共有409个数据点。本研究所考虑的时期涵盖了2008年金融危机。包括印度经济在内的世界经济受到了影响。印度股市下跌的原因如下:(i)在国内市场筹集资金时遇到困难,(ii)外国机构投资者(FII)资金来自股市,(iii)银行信贷紧缩。国家证券交易所50指数的表现如图6所示。图6:2008年金融危机期间国家证券交易所50指数的表现国家证券交易所50指数3。2第一阶段:国家证券交易所50指数分解。

14
nandehutu2022 在职认证  发表于 2022-5-25 07:50:27
小波滤波器类型和分解级别:MODWT用于对每周全国证券交易所50指数收盘价进行分解,以克服WT的限制(参见第2.1节)。这里选择的小波滤波器类型是“Haar”。Haar小波捕捉相邻观测值之间的波动,称为差分滤波器。它还消除了别名问题。要选择的分解级别取决于可用数据点的数量。根据蔡和江(2003),当分解级别为6时,数据中的所有隐藏信息都会被揭示出来。然而,当分解级别增加时,数据将在更大程度上平滑,从而导致信息丢失(Lahmiri,2014)。因此,这里选择的分解级别是3。b、 分解:MODWT(类型:Haar)用于将国家证券交易所金融指数分解为多个子系列,也称为小波。在这里,我们得到了三个小波系数(W、W和W)和一个尺度系数(V)。序列的MODWT分解如图7所示。第一行表示缩放系数V。这是平滑的组件,其模式与原始系列非常相似。这代表了股指的走势。第2、3和4行分别表示小波系数W、Wand W。Wis为高频分量。最后一行代表原始时间序列x(t)。3.3第二阶段:子序列预测在这一阶段,使用两种机器学习模型(即ANN和SVR)预测获得的每个子序列。

15
kedemingshi 在职认证  发表于 2022-5-25 07:50:31
这两个模型的参数最初是使用自相关函数(ACF)和偏自相关函数(PACF)选择的。图7:国家证券交易所50指数的小波。检查平稳性:在此步骤中,使用广泛使用的增强Dickey-Fuller(ADF)测试(Dickey&Fuller,1979;Dickey&Fuller,1981)检查获得的每个子系列的平稳性。在这里,子系列Wand W被发现是静止的,而Wand V则不是。如果发现一个序列是非平稳的,则获得序列的第一个差分,并使用ADF检验检查其平稳性。该过程一直持续到序列变得稳定或达到最大迭代次数。魔杖的第一个区别是固定的。b、 滞后参数的识别:在各自的混合模型中,将序列与其过去值之间的关系(估计为滞后参数)用作ANN和SVR的输入。ACF和PACF用于确定每个子系列中的滞后。系列第一个差异的差异。假设F(t)=y(t),y(t-1)。。。y(t-n),那么第一个差是d1={y(t-1)-y(t)},{y(t-2)-y(t-1)},。。。第二个差分d2={y(t-2)-2y(t-1)+y(t)},{y(t-3)-2y(t-2)+y(t+1)},。。。图8所示的软件的ACF和PACF图。ACF图显示牵引模式,PACF图显示递减和振荡模式。这表明AR组件的存在。从两个图中可以看出,子系列Wcuts脱离atlag 4。因此,Wat time t的值取决于它过去的4个值。

16
可人4 在职认证  发表于 2022-5-25 07:50:34
相同的数据格式可以表示为: X(t)=f X(t-1),X(t-2),X(t-3),X(t-4)(12)以类似的方式,确定其他子序列的滞后参数。图8:小波系数Wc的ACF和PACF。预测:使用ANN(混合MODWT-ANN模型)和SVR(混合MODWT-SVR模型)对每个系列进行一步超前预测。70%的数据用于训练模型,其余30%用于测试模型。作为ANN和SVR模型的数据预处理步骤,数据在[-1,1]、[0,1]之间进行归一化,并使用z分数。这有助于模型克服陷入局部极小和过度拟合的限制。此外,它还加快了培训过程(Crone、Guajardo和Weber,2006;Wu和Lo,2010)。使用z评分作为预处理步骤的模型似乎比剩下的两个归一化过程表现更好。  ANN模型:如前所述,神经网络模型有三层,每层由一定数量的神经元组成。因为这是一个预测问题,所以输出层的神经元数量是1。输入层的神经元数目由滞后参数获得。例如,在W的情况下,识别的滞后参数是4,而输入层中的神经元数量是4。这在数学上表示为: 1 1 1 1 1 1 1 1 W(t)=f W(t-1),W(t-2),W(t-3),W(t-4)(13)没有确定的规则来确定隐藏层中的神经元数量,因此,它们是根据模型的最佳性能选择的。每层神经元的数量如表1所示。该模型使用弹性传播(RP)算法(Riedmiller&Braun,)进行训练。RP优于最常用的BP算法,因为其性能优越(Liu等人,2012)。

17
大多数88 在职认证  发表于 2022-5-25 07:50:37
此外,神经网络模型的训练速度更快,并且在训练过程中不需要指定学习速度和动量等参数。表1:ANNWarkets各层神经元数神经元输入层隐藏层输出层1W2W3V3  SVR模型:这里,与ANN模型类似,小波及其以前的值(根据滞后参数识别)被用作输入变量。由于SVR模型对所选参数(C和ε)敏感,本文采用Lin、Hsu和Chang(2003)提出的网格搜索。在这种方法中,ε和C的最佳值由ε和C的指数增长序列(C=2-3,2-1,…,2)确定。最佳参数有助于最小化预测均方误差。分析是在统计计算语言和环境inR语言中进行的。在重新组合子序列的预测之前,应删除应用于数据集的所有转换。例如,应该对数据进行非规范化。在第一个差异和第二个差异的情况下,转换应恢复为原始形式。d、 获得最终预测:将使用ANN获得的子系列预测汇总,以获得最终预测。同样,对于使用SVR模型生成的预测,也会获得最终预测。

18
能者818 在职认证  发表于 2022-5-25 07:50:40
最后的预报可以用以下公式得到:1 2 3 3 3’()\'()\'()\'()\'()\'()X t W t W t W t V t   (14) 其中,X’(t)是最终预测W’(t),W’(t),W’(t)和V’(t)是使用ANN和SVR模型获得的W(t),W(t),W(t)和W(t)的各自预测值。然后将获得的最终预测与原始序列进行比较,以计算误差度量。为了分析所提出方法(混合MODWT-ANN和MODWTSVR模型)的有效性,使用SVR和ANN模型对原始序列(即没有MODWT分解的序列)进行建模和预测。结果和讨论4。1误差度量基于两个性能度量:均方根误差(RMSE)和方向精度(DA),评估各种预测模型,即ANN、SVR、MODWTANN和MODWT-SVR的预测性能。原始序列(Xi(t))与相应预测值(Fi(t))之间的差值称为误差(Ei(t))。均方根误差计算为误差值平均值的平方根。RMSE值越低,预测模型越好。RMSE在数学上表示为:21()/niiRMSE E t n(15) 其中,i i iE(t)=X(t)-F(t)(16)方向精度,以百分比表示,表示预测值与符号方向匹配的次数,然后是原始序列。DA值越高,预测越好。这些错误度量是使用testdataset的预测值计算的。四种预测模型的性能指标如表2所示。从表中可以看出,基于分解的混合模型比没有分解的模型具有更好的性能。

19
kedemingshi 在职认证  发表于 2022-5-25 07:50:44
与其他模型相比,混合MODWT-SVR模型在RMSE和DA方面具有显著的更好性能。HybridMODWT SVR模型的RMSE最低,为50.08,方向精度为80%。该模型在80%的时间里准确预测了股票价格的运动方向。当RMSE和DA分别为155.45%和74.95%时,混合MODWT-ANN模型的性能明显优于ANN和SVR模型。图9显示了使用所有四个模型获得的一步aheadForecast的结果。表2:误差测量模型MSEDA(%)ANN184。2853.06SVR169。4558.16混合动力MODWT-ANN155。4574.95混合动力MODWT-SVR50。0880.00图9:ANN、SVR、混合MODWTANN模型和混合MODWT-SVR模型的一步预测比较。4.2。显著性检验使用一种流行的非参数无分布技术,即Wilcoxon符号秩检验(WSRT),对两种不同模型的预测能力进行评估(Diebold&Mariano,1995;Kao,Chiu,Lu,&Chang,2013)。在这个测试中,比较预测值的符号和等级,以确定两个预测模型是否不同。因此,使用WSRT来评估所提出的混合MODWT-SVR和MODWT ANN模型的性能是否优于SVR和ANN模型(无分解)。进行双尾WSRT以评估所提议模型(混合MODWT-ANN和混合MODWT-SVR)和其余模型(ANN和SVR模型)的预测性能。试验结果如表3所示。从表中可以看出,zstatistics值超过(-1.96,1.96),因此不接受两个模型相同的零假设。结果在99%置信水平下显著(α=0.01)。

20
能者818 在职认证  发表于 2022-5-25 07:50:47
表格中的符号“+”表示混合MODWT-SVR模型的预测能力优于两种传统的计算智能技术,即SVR和ANN。符号“-”和“=”分别表示混合动力车型与其他两款车型相比表现不佳和类似。WSRT结果证实,混合MODWT-SVR和MODWTANN模型优于传统SVR和ANN模型。表3:混合MODWT-ANN、混合MODWT-SVR、ANN和SVR模型之间的WSRT混合MODWT-SVRzWSRTzWSRTANN-3.188+-3.980+SVR-4.509+-4.558++:DWT-SVR>SVR,DWT-SVR>ANN,DWT-ANN>SVR,DWT-ANN>ANN=:DWT-SVR=SVR,DWT-SVR=ANN,DWT-ANN=SVR,DWT-ANN=ANN-:DWT-SVR<,DWT-SVR SVR<ANN,DWT-ANN<SVR,DWT-ANN<AN4。3、买卖决策使用上述预测模型,可以合理准确地预测下周第一个交易日的股票收盘价。投资者可以利用这些预测,使用很少的交易规则做出与投资相关的决策。由于方向精度高,RMSE值低,所以使用了MODWT SVR模型的预测。设^ky和yk分别为交易周第一个交易日的预测收盘价和实际收盘价。考虑一种情况,即交易周k的收盘价预计上涨,但下跌或保持不变,然后使用误差指数Ek(Hsu,)表示,其定义如下:11^1 2,3,。。。,0k k k kKif y y和y y k nEotherwise   (17) 其中,n是总周数。虽然已经使用指数值进行了分析,但同样的模型和交易规则也可以用于股票。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 10:16