楼主: 可人4
1017 24

[量化金融] 工作论文:基于 [推广有奖]

11
可人4 在职认证  发表于 2022-6-14 05:10:48
随着我国证券市场体系的逐步完善,市场投资者的构成、市场环境和原有的投资理念都发生了相应的变化。市场投资风格、投资理念和投资策略开始多元化。小盘股投资策略已成为股票市场交易的热门策略,而小盘股投资策略也是股票交易者交易行为调整的体现。因此,本文选择了小盘股策略具有普遍性的时期。期间范围为2009年1月1日至2016年12月31日。根据中信一级行业分类,对2009年HS300指数成分股进行分类。结果表明,HS300成份股涵盖28个行业,具有一定的代表性。图1 HS300指数成份股行业分布所有技术影响因素和情绪指标的换手率和特质率(IVR)均来自Wind Filesync数据库。运动指标的AR、ADTM和OBV来自uqer数据库。所有天气指标均来自NOAA(国家海洋和大气管理局)数据库。由于数据汇编和样本问题,有298只股票最终被纳入计算。4.2数据预处理数据预处理主要包括异常值处理和数据正则化。首先,删除暂停期间每个股票的数据。然后用MAD方法(中值绝对偏差)对样本中的极值进行筛选和处理。

12
何人来此 在职认证  发表于 2022-6-14 05:10:51
MAD方法是对平均标准偏差方法的改进,其具体步骤如下:步骤1:计算样本标准偏差{},1,2,。。。,imd中值x i n==(12)步骤2:计算结果(中值偏差){},1,2,。。。,iMAD中值x md i n=-=(13) 步骤3:异常值校正。本文选取5倍阈值作为置信区间。5*iif x md MAD>+=5*ix md MAD+5*ielse如果x md MAD<-= 5*ix md MAD-(14) 在处理校正后的异常值后,使用范围归一化在区间[-1,1]之间对样本数据进行正则化。一方面,它消除了分布范围大或分布范围小的因素对ComprnonmtbankPharmCommFood&BVRGPetrlchmCretailtdLightIndustrasutombafahfcoaltransconsbdmthomappcmptbschmcachmentdfsteelnonfntxtl&gmtREElcmpPowereqpElec&utltMediaCate&trvresults的影响,另一方面它可以解决支持向量机回归的过拟合问题。其形式如下:\'min2 1,1,2,。。。,最大minixixxxx英寸-=× -=-(15) 其中:\'ixis \\转换样本数据,ixis原始样本数据,minxis是样本数据的最小值,Maxxis是样本数据的最大值。4.3技术参数的设置和选择支持向量机回归预测的关键在于技术参数的设置和选择。它直接决定了是否能找到最优解,决定了模型的泛化能力和泛化能力。本文选择径向基函数(RBF)作为ε-SVR的核函数。在灰色关联度计算中,用于获取权重值的样本与总样本的比率为1:20。在SVR中,用于训练的样本与用作测试数据的样本之间的比率为4:1。

13
大多数88 在职认证  发表于 2022-6-14 05:10:53
此外,本文还利用k-foldCross验证方法获得了其他三个核心参数:不敏感参数ε、正则化参数c和RBF核参数γ。其具体步骤如下:步骤1:将样本集S随机划分为k个不相交的子集,每个子集中的样本数为m/k。这些子集分别记录为S1、S2、,。。。,Sk公司。步骤2:对于每个型号Mi:对于j=1到k:设置11。。。jj kS SS S-+∪∪ ∪ ∪∪作为训练集和训练模型Mi,然后获得训练功能。SetjSas测试集并计算泛化误差。步骤3:计算每个模型的平均泛化误差,并从模型MIT中选择平均泛化误差最小的参数。本文采用网格回归搜索法对k-折叠交叉验证进行处理,以获得最佳参数。4.4预测结果的评价体系为了衡量预测结果的准确性,本文主要采用以下四个评价指标:均方误差(MSE)是指参数估计值与参数真值之差的平方的期望值。MSE可以评估数据的变化程度。MSE值越小,模型的精度越高。公式如下:211=()NtttMSE观测预测n=-∑(16) 平均绝对误差(MAE)是指绝对误差的平均值。MAE能更好地反映预测值误差的实际情况。MAE值越小,模型的精度越高。公式如下:11=NtttMAE预测观测值n=-∑(17) 方向对称性(DS)以百分比表示预测值的预测方向的正确性。DS值越大,模型的趋势预测能力越精确。

14
可人4 在职认证  发表于 2022-6-14 05:10:56
公式如下:1111=*100%1()()00Nittt t tiDS dNif observed observed predicted否则=--- -≥=∑(18) 平方相关系数(SCC)衡量参数估计值与参数真实值之间的相关程度。SCC值越大,模型的相关性越好。公式如下:21 1122221 11 11(*)=()()N NNtt tt ttN NNt tt ttt ttt ttt ttt ttt ttN xy x ySCCNx xNy y==========---∑ ∑∑∑ ∑∑ ∑ ∑∑(19) 其中:x为原始数据,y为预测数据。4.5因素筛选体系由于选择了包括技术因素和行为因素在内的15个影响指标,并不是所有选择的影响指标都具有很好的股价预测能力。因此,应在最终预测前建立因子筛选体系,剔除预测能力较差的指标。这样不仅可以避免最终支持向量机回归的过度拟合,而且可以提高计算效率,减少系统资源浪费。本文主要设计了一种基于灰色关联度的两步筛选方法。4.5.1基于灰色关联的初步筛选根据第3节的解释,灰色关联度可以更好地描述系统参考序列和因子序列之间的相似性。因此,我们首先计算每个预测指标的灰色关联度。步骤1:选择库存i,i=1,2,。。。,298,计算所有15个影响指标与股票i收盘价之间的灰色关联度,并将其记录为1 2 15,。。。,ii irr第2步:计算所有影响指标的平均灰色关联度。11= , 298, 1,2,...,15【0,1】ni ji ijr rn i rn===∑,(20) 第三步:设置平均灰色关联度阈值为0.6。

15
能者818 在职认证  发表于 2022-6-14 05:10:59
平均灰色关联度低于0.6的影响指标被标记为要观察的指标12,。。。,0 15ihh h i≤≤这些指标需要遵循第二步:SVR的随机筛选。将平均灰色关联度大于0.6的影响指标标记为基本预测指标12,。。。,0 15jll l j≤≤这些指标可直接用于FWSVR。4.5.2随机筛选待观察的指标12,。。。,0 15ihh h i≤≤需要对SVR进行随机筛选。它是指所有基本预测指标的选择12,。。。,0 15jll l j≤≤以及a待观察指标—治疗时间,以形成aquasi预测指标组。随机选取总库存量为1/10的库存作为测试样本,分别进行c-SVR和FWSVR处理,并对评价指标DS、MSE、MAE和SCC进行比较。计算FWSVR优于c-SVR的评估指数数量,并将其记录为NDS、NMSE、NMEAN和NSCC。重复3次,然后更换。如果NDS、NMSE、NMEANDNSCC。低于总样本数的一半,说明指标的预测能力较差。所以去掉指示符号。如果没有,IH可以被视为基本预测指标之一。经过上述两步筛选方法后,所有天气指标和ADTMof情绪指标均被剔除。所有技术因素和周转率、IVR、AR和OBV都可以作为基本预测指标。5、预测结果在本节中,我们主要使用从第4节得到的基本预测指标作为最终预测因子。本文首先仅使用技术因素来检验FWSVR的性能是否优于c-SVR。

16
大多数88 在职认证  发表于 2022-6-14 05:11:02
然后加入行为因素来检验行为的有效性和FWSVR的优势。5.1技术因素预测由于技术因素在预测股价的研究中被广泛使用,本文最初仅使用技术因素分别处理FWSVR和c-SVR。以下是关于一只股票技术因子灰色关联度归一化的图2。可以看出,五大技术因素的权重相对平均,均对当日收盘价有一定影响。当天的最高和最低价格表现更为突出。图2五个技术因素的权重然后使用python 3.5中工具箱libsvm的gridregression函数进行K折叠交叉验证,以获得c-SVR中的最佳参数:不敏感参数ε、正则化参数c和RBF核参数γ。k的默认值为10。表1从k-fold交叉验证CGAMaepsilon000001中获得的几个最佳参数。SZ 64 0.003906 0.003906000002。SZ0.031250.015625000009。SZ0.0078130.015625000012。SZ0.0078130.007813000021。SZ0.0156250.015625000024。SZ 64 0.03125 0.0312500027。SZ0.0039060.0312500031。SZ0.0078130.003906000039。SZ0.0156250.007813最后,根据优化参数,分别处理FWSVR和c-SVR。图3是FWSVR下000001和600143两种股票的原始数据和预测结果的比较。0.020.040.060.080.10.120.140.160.180.2Pre\\u closeHighLowVolumeAMTHS300(a)000001原始数据和预测结果(b)600143原始数据和预测结果图。3 FWSVR下原始数据和预测结果的比较在每个评估指标下,FWSVR表现优于C-SVR的数量。无花果

17
nandehutu2022 在职认证  发表于 2022-6-14 05:11:05
4在各评价指标下,FWSVR表现优于C-SVR的数量结果表明:除SCC指标FWSVR略优于C-SVR外,FWSVR的其他三个评价指标明显占主导地位。通过比较FWSVR和C-SVR的SCC指数,表明两种SCC指数之间的差异小于0.01,可以推测FWSVR对SCC指数的改善程度较小。进一步统计分析改进后的评价指标,均方误差提高幅度最大,平均增长65.30%。MAE的改善率为第二,平均改善率为37.02%。DS也得到了改善,平均增长23.52%。SCC的改善程度最低,增加了5.38%。因此,结果一方面表明,技术因素可以对股票进行指数预测。另一方面,也证明了FWSVR模型可以改进C-SVR模型,改善误差和趋势。5.2技术因素和行为因素预测5.2.1预测结果与基本预测指标的C-SVRAdd行为因素(离职率、IVR、AR和OBV)结果的比较。MSEMASCCDSFW SVRC SVRFig。5 10个影响因素的权重如上所示为一只股票各因素灰色关联度的归一化图。可以看出,这10个因素的权重也是相对平均值,都对当日收盘价有一定影响。当天的最高价和最低价仍然表现得更加突出。通过k-fold交叉验证得到最优参数后,分别处理fwsvr和c-SVR。图5是FW-SVR下000001和600143两支股票原始数据和预测结果的比较。(a) 000001原始数据和预测结果(b)600143原始数据和预测结果图。

18
能者818 在职认证  发表于 2022-6-14 05:11:08
6 FWSVR下原始数据和预测结果的新比较在每个评估指标下,FWSVR表现优于C-SVR的数量。0.020.040.060.080.10.12图。7在各评价指标下,新的FWSVR数均优于C-SVR。结果表明:加入行为因素后,FWSVR的所有评价指标均明显优于C-SVR。这表明影响因素不会改变FWSVR模型的稳定性,FWSVR模型具有较强的鲁棒性。进一步统计分析改进后的评价指标,均方误差提高幅度最大,平均增长66.59%。MAE的改善率为第二,平均改善率为46.56%。DS也得到了改善,平均增长38.26%。SCC的改善程度最低,增加了3.49%。因此,研究结果一方面表明,技术因素和行为因素确实可以对股票进行预测。

19
能者818 在职认证  发表于 2022-6-14 05:11:11
另一方面,也证明了FWSVR模型可以改进C-SVR模型,改善误差和趋势。5.2.2预测结果与仅包含技术因素的预测结果的比较各估值指数下FWSVR优于C-SVR的股票数量:表2在DEXMESMAESCCDSFW-SVR1FW-SVR2 270 255 157 293中,FW-SVR1是指仅包含技术因素的股票数量,FW-SVR2是指包括技术和行为因素的股票数量。结果表明,在考虑行为因素后,FWSVR模型减少了预测误差的数量,改善了预测结果的趋势和相关性。从评价指标的平均改善程度来看:MSEMASCCDSFW SVRC SVRTTable 3各评价指标的评价指标平均改善程度语义CCDSFW-SVR165.30%37.02%5.38%23.52%FW-SVR2 66.59%46.56%3.49%38.26%,FWSVR模型对预测误差和预测趋势有一定程度的改善,预测相关性的改善程度有一定程度的降低。从每只股票的角度:分别统计每只股票的评价指标,其中只包含技术因素,同时包含技术和行为因素。

20
可人4 在职认证  发表于 2022-6-14 05:11:14
对于每只股票,如果后评估指数优于前一个,则将相应因子计为1。表4后一个评价指标优于前一个评价指标的个股数SemaseCDCDSFW-SVR3FW-SVR4结果表明,添加行为因素可以显著改善每个股票预测结果的趋势和相关性,但同时会改善预测误差。(a) SCC改良股票的行业分布(b)DS改良股票的行业分布。8改良股票的行业分布进一步统计具有改良评价指标的股票的行业分类(中信一级)。通过计算行业所占比例,发现行为因素在电力设备、纺织服装、煤炭、商业零售、石化和食品饮料行业更为突出,尤其是在电力设备和石化行业,改良库存占很大比例。综上所述,在加入行为因素后,评价的改善表现出数量少、改善大的特点,食品和BVRGPetrlchmCretailtdLightIndustrocAltl和gmtREBankPharmCommFood和BVRGPetrlchmCretailtdLightIndustrEsprediction结果有了显著改善,但预测误差有所改善的库存数量很少。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 12:25