楼主: 可人4
1406 41

[量化金融] 基于异构信息融合的股市预测改进 [推广有奖]

31
nandehutu2022 在职认证  发表于 2022-6-2 20:29:55
比较方法和度量我们提出的模型的以下基线和变化用于比较SVM:我们直接将股票数量特征、事件模式特征和情绪模式特征串联成一个线性向量,并将它们作为SVM的输入进行预测PCA+SVM:采用主成分分析(PCA)技术对原级联向量进行降维,然后将新向量作为SVM的输入TeSIA:【12】中提出的基于张量的学习方法是利用多源信息的最新基线。具体而言,它使用三阶张量来建模固定模式、事件模式和情感模式数据。请注意,他们在每个交易日为每个股票构建了一个独立的张量,而没有考虑股票之间的相关性CMT:CMT表示我们提出的模型,即两个辅助矩阵和张量被分解在一起。请注意,股票相关性矩阵可以通过四种方法获得。默认CMT使用couplestock关联方法。我们还将评估CMT方法与其他股票相关性矩阵,包括协同进化方向相关性、协同进化p变化相关性和用户感知相关性CMT-Z:为了研究股票相关性矩阵Z的有效性,我们使用不含Z的CMT作为基线CMT-Z-X:为了研究两个辅助矩阵X和Z的有效性,我们仅使用张量分解作为基线。在之前的研究【5,17】之后,使用标准准确度(ACC)和马修斯相关系数(MCC)作为评估指标。这两个指标的值越大,表示性能越好。6.3. 预测结果表1显示了测试期间所有78只股票和13只香港股票的平均股票走势预测精度。

32
何人来此 在职认证  发表于 2022-6-2 20:29:59
就中国股市而言,可以观察到,我们提出的CMT达到了最佳表现,ACC为62.5%,MCC为0.409。SVM方法表现出最差的性能,表明仅使用特征的线性组合无法捕获耦合效应,这对于提高性能至关重要。PCA+SVM的性能优于SVM,这主要是因为PCA可以去除一些噪声。CMT的表现优于CMT-Z,表明股票相关性信息起着重要作用。类似地,CMT-Z可实现表1:中国A股移动方向方法预测结果HKACC MCC ACC MCCSVM 55.37%0.014 55.13%0.08PCA+SVM 57.50%0.104 56.07%0.092TeSIA 60.63%0.190 60.38%0.205CMT-Z-X 59.03%0.162 59.36%0.137CMT-Z 60.25%0.306 60.29%0.252CMT 62.50%0.409 61.73%0.331优于CMT-Z-X,验证股票数量特征矩阵的有效性。因此,这两个辅助矩阵都为股票预测提供了有效的知识。还可以观察到,与TeSIA相比,CMT提高了3%的准确性,显著提高了115%的ESMCC。我们还在香港股市数据集上评估了我们的建议,预测结果与A股数据集相似。结果表明,多任务学习思想可以成功地应用于股票预测问题,从而显著提高预测精度。除了优于TeSIA的预测精度外,我们的方法还需要比TeSIA少得多的参数来调整。注意,TeSIA忽略了股票之间的关系,并将每个股票的预测作为单任务回归学习。由于不同股票的不同特征,学习所有股票的通用回归函数可能无法实现最佳表现。

33
何人来此 在职认证  发表于 2022-6-2 20:30:02
因此,需要TeSIA分别学习不同股票的不同回归函数。因此,在TeSIA中调整所需的参数数量与库存量呈线性关系,这是因为市场上的库存量很大。表2:不同股票相关性方法的结果中国A股HKACC MCC ACC MCC无股票相关性矩阵60.25%0.306 60.29%0.252协进化方向相关性62.06%0.382 61.39%0.290协进化p变化相关性60.91%0.300 61.22%0.205用户感知相关性61.64%0.402 60.77%0.263协进化股票相关性(CMT)62.50%0.409 61.73%0.3316.4。结果使用不同的股票相关性方法由于可以使用不同的方法获得股票相关性矩阵,我们在我们的框架中比较了它们的表现,结果如表2所示。可以观察到,对于这两个数据集,耦合stockcorrelation方法在ACC和MCC方面都优于所有其他方法。这意味着,考虑属性之间的耦合效应确实有助于获得股票之间更现实的相关性,并最终获得更好的预测能力。作为比较,对于中国a股而言,用户感知相关性的表现在MCC方面排名第二,在ACC方面排名第三,这表明从社交网络获得的此类信息也可以用来捕捉有效的相关性。这是有道理的,因为用户帖子中股票之间的共生关系实际上在某种程度上是基本分析的结果,代表了股市散户的集体智慧。此外,与其他定量方法相比,这种与社交媒体中的语境的相关性更易于解释。

34
mingdashike22 在职认证  发表于 2022-6-2 20:30:05
然而,使用用户感知的相关性与香港股市数据的相关性不如使用中国A股数据的相关性好。可能的原因是,我们选择的港股数量和与港股相关的社交媒体数据量都少于中国A股,因此获得的港股相关性可能(A)λ(b)λ(c)λ图4:λ、λ和λ的敏感性分析。x轴表示参数的各种值,y轴表示测试精度。不如A股准确。对于这两个数据集,协同进化方向相关的性能优于协同进化p变化相关。它们之间的区别在于,p-changecorrelation也考虑了价格的波动范围。因此,它表明,在有效挖掘相关性之前,运动方向比运动范围更重要。与没有股票相关性矩阵作为输入的方法相比,几乎所有具有股票相关性的方法都表现出更好的性能,验证了这种知识在股票预测中的有效性。6.5. 参数敏感性拟议模型方程(2)中有三个主要参数λ、λ和λ。接下来,我们进行实验,研究参数对模型性能的影响。为了找到参数的最佳设置,我们首先确定两个参数的值,然后调整第三个参数的值。在发现一个参数的最佳设置后,我们接下来以相同的方式调整另一个参数。经过多次迭代,我们可以找到最佳参数设置。图4(a)、4(b)和4(c)分别显示了三个参数对模型性能的影响。对于每个图,我们确定两个参数的最佳设置,并调整第三个参数的值。

35
大多数88 在职认证  发表于 2022-6-2 20:30:09
可以观察到,当λ在[0.21,0.71]范围内,λ在[0.21,0.71]范围内,λ在[0.01,0.4]范围内时,两个数据集的精度相对稳定。表3:三一重工银行代码名称Industry Correlation1 600150前10名相关值最高的股票。上海中船重工有限公司机械0.8062 601989。SH中国船舶重工有限公司机械0.8003 601766。上海中车有限公司机械0.7734 601668。SH中国建筑工程有限公司建筑0.6595 601618。中国SH冶金建设有限公司0.6166 601600。SH中国铝业有限公司材料0.6157 600010。SH内蒙古包头钢铁联合有限公司有限公司材料0.6138 601088。SH中国神华能源有限公司能源0.6129 601699。SH Power Construction Co.,Ltd.Construction 0.60810 601186。SH中国铁建有限公司建设0.607表4:三一重工银行代码名称行业相关性前5名相关值最低的股票1 600518。上海康美制药有限公司医药0.1832 300104。深圳乐视互联网信息技术有限公司,北京互联网0.2003 600637。上海东方明珠传媒有限公司有限公司传媒0.2024 601727。上海电气集团有限公司电器0.2275 600050。SH中国联合网络通信有限公司有限公司电信0.2336.6。股票相关性矩阵的案例研究为了证明股票相关性结果的有效性和可解释性,我们从A股股票中选择了三一重工(股票代码600031)和中国铁建(股票代码601186)两支股票作为两个例子,以显示它们与其他股票的相关性。具体而言,使用组合股票相似性方法,表3列出了与三一重工最相关的前10只股票。

36
何人来此 在职认证  发表于 2022-6-2 20:30:12
可以看出,最相关的股票(前3名)与三一重工属于同一行业类别(即机械),相关值大于0.7%。其他相关股票不属于同一行业,但它们与机械行业的上游或下游相关,相关值在0.6到0.7之间。表4显示了三一重工前5位关联度最低的股票,这些股票都是关联值低于0.2的非关联股票。与中国铁建5的相关结果也可以得到类似的观察结果:中国铁建前10名相关值最高的股票排名代码名称行业相关性1 601390。SH中国中铁建设集团有限公司0.8942 601800。SH中国交通建设有限公司建设0.8693 601668。SH中国建筑工程有限公司建筑0.8624 601699。SH Power Construction Co.,Ltd.Construction 0.8525 601618。中国SH冶金建设有限公司0.8316 601818。SH中国光大银行股份有限公司有限公司银行0.6027 000001。深圳平安银行股份有限公司有限公司银行0.5838 601766。上海中车有限公司机械0.5699 600015。上海华夏银行有限公司银行0.56310 600031。三一重工有限公司机械0.554表6:中国铁建前五名关联值最低的股票排名代号行业关联1 600518。上海康美制药有限公司医药0.1122 600893。上海中航航空发动机股份有限公司。航空航天0.1443 600637。上海东方明珠传媒有限公司有限公司传媒0.1464 002024。苏宁商业集团有限公司电子零售0.1605 601727。SH上海电气集团有限公司有限公司电器0.189度如表5和表6所示。因此,相关值具有良好的可解释性,并且在我们的框架中发挥着重要作用。7.

37
大多数88 在职认证  发表于 2022-6-2 20:30:15
结论和未来工作在本文中,我们提出了一种用于股市预测的耦合矩阵和张量因子分解方法。与以往通常只利用一个或两个数据源的研究不同,我们的模型集成了从各种数据源中提取的事件、情绪和定量特征,包括网络新闻、社交媒体和股票定量数据提供者。然后构造股票运动张量来模拟股票、事件和情绪之间的内在关系。然而,由于事件的稀疏性,分解传感器具有挑战性。为了解决这个问题,我们用各种方法学习了股票相关性,并通过使用两个辅助矩阵协同分解张量,将这些知识应用于促进多任务学习。利用分解的低秩矩阵,我们可以通过完成稀疏张量中的缺失值,有效地预测股票运动。对中国A股数据和香港股市数据的评估显示了我们模型的有效性。未来工作的潜在方向包括合并其他数据源,例如知识图信息,以丰富稀疏事件。为了更好地对事件进行分类,还需要高级NLP技术,例如使用领域知识学习事件表示。此外,提出一种更准确的领域特定情感分类方法也是一个挑战。研究如何将我们的模型扩展到时间序列预测框架将是一件有趣的事情。根据现有的行为金融研究,金融市场的决策过程受到过度自信等心理偏见的影响,这也可以在未来工作的预测中加以考虑。8.确认这项工作得到了中国基础研究国家重点发展项目(No。

38
nandehutu2022 在职认证  发表于 2022-6-2 20:30:19
2013CB329604)、中国自然科学基金会(编号61300014、61370068、61602237)、东莞创新研究团队项目(编号20163600010038)和国家科学基金会通过grantsIIS-1526499和CNS-1626432。参考文献[1]E.F.Fama,《股票市场价格行为》,《商业杂志》38(1)(1965)34–105。[2] Y.Pan,Z.Xiao,X.Wang,D.Yang,《混合频率抽样股票指数预测的多重支持向量机方法》,知识系统122(2017)90–102。[3] S.C.Johnson,《分析:虚假的白宫推特暴露了持续的贸易危险》,http://www.reuters.com/article/us-usa-markets-tweet-idUSBRE93M1FD20130423,2013,(访问日期:17.01.14)。[4] X.Ding,Y.Zhang,T.Liu,J.Duan,《利用结构化事件预测股价变动:一项实证调查》,载于:自然语言处理实证方法会议(EMNLP-14),2014年,第1415-1425页。[5] X.Ding,Y.Zhang,T.Liu,J.Duan,《事件驱动股票预测的深度学习》,载于:《第24届国际人工智能联合会议论文集》(ICJAI-15),2015年,第2327-2333页。[6] 丁X,张Y,刘T,段J.股票预测中的知识驱动事件嵌入,摘自:第26届国际计算语言学会议论文集(COLING-16),2016年,第2133-2142页。[7] R.R.Prechter,《人类社会行为的波动原理与社会经济学的新科学》,第1卷,新古典图书馆,1999年。[8] J.R.Nofsinger,《社会情绪与金融经济学》,J.Finance 6(3)(2005)144–160。[9] J.Bollen,H.Mao,X.Zeng,《推特情绪预测股市》,J.Comput。Sci。2 (1) (2011) 1–8.[10] T.H.Nguyen,K.Shirai,《基于主题建模的社交媒体情绪分析用于股市预测》,载于:计算语言学协会第53届年会论文集(ACL-15),2015年。[11] R.Feldman,B。

39
mingdashike22 在职认证  发表于 2022-6-2 20:30:21
Rosenfeld,R.Bar Haim,M.Fresko,《基于混合方法的股票情绪分析》,载于:第二十三届AI会议,2011年。[12] Q.Li,L.Jiang,P.Li,H.Chen,《基于张量的学习预测股票走势》,载于:第二十九届AAAI艺术情报会议(AAAI-15),2015年,第1784-1790页。[13] Q.Li,Y.Chen,L.L.Jiang,P.Li,H.Chen,基于张量的股市预测信息框架,ACM Trans。知会系统。(TOIS)34(2)(2016)11。[14] D.M.Cutler,J.M.Poterba,L.H.Summers,《股价的变动》,J.Portf。管理。15 (1989) 4–12.[15] P.C.Tetlock,M.SAAR-TSECHANSKY,S.Macskassy,《不止一句话:量化语言来衡量企业基础》,J.Finance 63(3)(2008)1437–1467。[16] R.Luss,A.D\'Aspremont,《利用文本分类预测新闻的异常回报》,定量金融15(6)(2015)999–1012。[17] B.Xie,R.J.Passonneau,L.Wu,G.G.Creamer,《预测股价运动的语义框架》,载于:计算语言学协会第51届年会论文集,2013年,第873-883页。[18] W.Y.Wang,Z.Hua,《用于预测盈利电话财务风险的半参数高斯copula回归模型》,载于:计算语言学协会第51届年会(ACL-14),2014年,第1155-1165页。[19] Y.Peng,H.Jiang,《利用金融新闻利用单词嵌入和深度神经网络预测股价变动》,arXiv预印本XIV:1506.07220。[20] B.S.Kumar,V.Ravi,《文本挖掘在金融领域的应用调查》,Knowl-基于系统。114 (2016) 128–147.[21]C.-Y.Chang,Y.Zhang,Z.Teng,Z.Bozanic,B.Ke,《衡量金融新闻的信息含量》,载于:《第26届计算语言学国际会议论文集》(COLING\'16),2016年,第3216-3225页。【22】A.Yoshihara,K.Fujikawa,K.Seki,K。

40
nandehutu2022 在职认证  发表于 2022-6-2 20:30:25
Uehara,《通过递归深层神经网络预测股市趋势》,摘自《环太平洋国际艺术智能会议》,斯普林格出版社,2014年,第759-769页。【23】R.P.Schumaker,H.Chen,基于金融新闻、信息处理与管理的定量股票预测系统45(5)(2009)571–583。【24】R.P.Schumaker,H.Chen,《利用突发性金融新闻对股市预测的文本分析:AZFin文本系统》,ACM Trans。知会系统。(TOIS)27(2)(2009)1139–1141。[25]李克强,谢浩,陈立军,王建军,邓克强,情绪分析对股价收益率的影响,Knowl-基于系统。69 (2014) 14–23.【26】B.Wang,H.Huang,X.Wang,《金融时间序列预测的新文本挖掘方法》,神经计算83(2012)136–145。【27】R.P.Schumaker,Y.Zhang,C.-N.Huang,H.Chen,《金融新闻评论评论》,决策支持系统53(3)(2012)458–464。[28]X.Liang,R.-C.Chen,Y.He,Y.Chen,基于支持向量回归的股票价格与网络财务信息时间序列关联,神经计算115(2013)142–149。[29]李Q,王T,龚Q,陈Y,林Z,宋S-k.基于公共网络信息的媒体感知定量交易,决策支持系统61(2014)93-105。[30]X.Zhang,H.Fuehres,P.A.Gloor,通过推特预测股市指标?我希望它没有我担心的那么糟糕,Proc-Soc。贝哈夫。Sci。26(2011) 55–62.【31】J.Si、A.Mukherjee、B.Liu、Q.Li、H.Li、X.Deng,《利用基于主题的智慧情绪进行股票预测》,摘自:计算语言学协会(ACL-13)第51届年会,2013年,第24-29页。【32】J.Si,A.Mukherjee,B.Liu,S.J.Pan,Q.Li,H.Li,《利用社会关系和情绪进行股票预测》,摘自:自然语言处理经验方法会议(EMNLP-14),2014年第14卷,1139-1145页。[33]Q.Li,T。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 18:03