楼主: 可人4
1676 20

[量化金融] 基于ARIMA-LSTM混合模型的股价相关系数预测 [推广有奖]

  • 0关注
  • 2粉丝

会员

学术权威

77%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
46.1232
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24788 点
帖子
4166
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
可人4 在职认证  发表于 2022-6-10 09:15:59 |只看作者 |坛友微信交流群|倒序 |AI写论文
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Stock Price Correlation Coefficient Prediction with ARIMA-LSTM Hybrid
  Model》
---
作者:
Hyeong Kyu Choi
---
最新提交年份:
2018
---
英文摘要:
  Predicting the price correlation of two assets for future time periods is important in portfolio optimization. We apply LSTM recurrent neural networks (RNN) in predicting the stock price correlation coefficient of two individual stocks. RNNs are competent in understanding temporal dependencies. The use of LSTM cells further enhances its long term predictive properties. To encompass both linearity and nonlinearity in the model, we adopt the ARIMA model as well. The ARIMA model filters linear tendencies in the data and passes on the residual value to the LSTM model. The ARIMA LSTM hybrid model is tested against other traditional predictive financial models such as the full historical model, constant correlation model, single index model and the multi group model. In our empirical study, the predictive ability of the ARIMA-LSTM model turned out superior to all other financial models by a significant scale. Our work implies that it is worth considering the ARIMA LSTM model to forecast correlation coefficient for portfolio optimization.
---
中文摘要:
预测未来时期两种资产的价格相关性在投资组合优化中非常重要。我们应用LSTM递归神经网络(RNN)预测两支股票的股价相关系数。RNN能够理解时间依赖关系。LSTM单元的使用进一步增强了其长期预测特性。为了在模型中同时包含线性和非线性,我们也采用了ARIMA模型。ARIMA模型过滤数据中的线性趋势,并将残值传递给LSTM模型。ARIMA LSTM混合模型与其他传统预测财务模型(如全历史模型、常数相关模型、单指数模型和多组模型)进行了对比测试。在我们的实证研究中,ARIMA-LSTM模型的预测能力在很大程度上优于所有其他金融模型。我们的工作表明,ARIMA LSTM模型用于预测投资组合优化的相关系数是值得考虑的。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Computational Engineering, Finance, and Science        计算工程、金融和科学
分类描述:Covers applications of computer science to the mathematical modeling of complex systems in the fields of science, engineering, and finance. Papers here are interdisciplinary and applications-oriented, focusing on techniques and tools that enable challenging computational simulations to be performed, for which the use of supercomputers or distributed computing platforms is often required. Includes material in ACM Subject Classes J.2, J.3, and J.4 (economics).
涵盖了计算机科学在科学、工程和金融领域复杂系统的数学建模中的应用。这里的论文是跨学科和面向应用的,集中在技术和工具,使挑战性的计算模拟能够执行,其中往往需要使用超级计算机或分布式计算平台。包括ACM学科课程J.2、J.3和J.4(经济学)中的材料。
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Portfolio Management        项目组合管理
分类描述:Security selection and optimization, capital allocation, investment strategies and performance measurement
证券选择与优化、资本配置、投资策略与绩效评价
--

---
PDF下载:
--> Stock_Price_Correlation_Coefficient_Prediction_with_ARIMA-LSTM_Hybrid_Model.pdf (982.09 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:ARIMA 相关系数 混合模型 Rim ima

沙发
mingdashike22 在职认证  发表于 2022-6-10 09:16:04 |只看作者 |坛友微信交流群
ARIMA LSTMHybrid ModelHyeong Kyu Choi,B.A学生部股票价格相关系数预测。韩国大学工商管理学院,Koreaimhgchoi@korea.ac.krAbstractPredicting两种资产在未来时间段的价格相关性在投资组合优化中很重要。我们将LSTM递归神经网络(RNN)应用于预测两支独立股票的股价相关系数。RNN能够理解时间依赖关系。LSTM细胞的使用进一步增强了其长期预测特性。为了在模型中同时包含线性和非线性,我们还采用了ARIMAmodel。ARIMA模型过滤数据中的线性趋势,并将残值传递给LSTM模型。ARIMA-LSTM混合模型与其他传统预测财务模型(如全历史模型、常数相关模型、单指数模型和多组模型)进行了对比测试。在我们的实证研究中,阿里玛LSTM模型的预测能力在很大程度上优于所有其他金融模型。我们的工作表明,值得考虑ARIMALSTM模型来预测投资组合优化的相关系数。关键词–递归神经网络、长-短期记忆细胞、ARIMAmodel、股票相关性系数、投资组合优化内容1简介12用于相关性预测的各种金融模型22.1完整历史模型。32.2常数相关模型。32.3单指数模型。42.4多组模型。43 ARIMA-LSTM混合模型53.1 ARIMA模型部门。63.2 LSTM模型扇区。

使用道具

藤椅
kedemingshi 在职认证  发表于 2022-6-10 09:16:07 |只看作者 |坛友微信交流群
74研究方法104.1 ARIMA。104.1.1数据。104.1.2模型装配。114.1.3算法。134.2 LSTM。134.2.1数据。134.2.2模型培训。134.2.3评估。154.2.4算法。175结果和评估176结论20附录21A 150标准普尔500股票21B LSTM模型源代码22ii1简介在构建和选择投资组合时,对其预期收益和风险的评估被视为底线。马科维茨在其论文《投资组合选择》(1952)中介绍了现代投资组合理论,该理论提出了量化投资组合回报和风险的方法。利用导出的收益和风险,我们绘制了有效边界,即连接所有预期收益和风险组合的曲线,从而产生最高的收益风险比。然后,投资者根据其风险承受能力,在有效前沿选择投资组合。然而,有人对马科维茨的假设提出了批评。其中之一是用于衡量风险的相关系数是恒定不变的。根据Francois Chesnay和Eric Jondeau对相关系数的实证研究,在金融动荡时期,股票市场的价格往往具有正相关性[6]。这意味着任何两项资产的相关性也可能根据财务状况偏离平均历史相关系数;因此,相关性不稳定。

使用道具

板凳
大多数88 在职认证  发表于 2022-6-10 09:16:10 |只看作者 |坛友微信交流群
弗兰克·法博齐(FrankFabozzi)、弗朗西斯·古普塔(FrancisGupta)和哈里·马科维茨(HarryMarkowitz)本人也在他们的论文《现代投资组合理论的遗产》(the Legacy of Modern Portfolio Theory)(2002)[7]中讨论了现代投资组合理论的缺陷。认识到完整的历史相关性系数评估指标存在这样的缺陷,已经设计了许多相关性系数预测模型。一种替代方法是常数相关模型,该模型将所有资产对的相关性设置为等于投资组合中资产所有相关系数的平均值[3]。其他一些预测模型包括多组模型和单指数模型。我们将在第2部分“相关性预测的各种金融模型”中介绍这些模型。虽然有许多财务和统计方法可以估计未来的相关性,但很少有人使用神经网络来完成这项任务。神经网络经常被用来预测未来的股票回报,并产生了值得注意的结果。考虑到股票相关性数据也可以表示为时间序列数据——通过滚动时间窗口导出相关性系数数据集——可以预期神经网络在预测未来相关性系数方面的应用也会取得成功的结果。我们没有通过预测个别资产回报来计算相关系数,而是直接对相关系数值本身进行预测。Y、 Yoon,G.Swales(1991)[18];A、 N.Refenes等人(1994年)[1];K、 Kamijo,T.Tanigawa(1990)[11];M、 Dixon et al.(2017)[12]在本文中,我们提出了ARIMA和神经网络的混合模型,以预测在标准普尔500公司中随机选择的股票对的未来相关系数。

使用道具

报纸
何人来此 在职认证  发表于 2022-6-10 09:16:13 |只看作者 |坛友微信交流群
该模型采用具有长-短期记忆单元的theRecurrent神经网络(为方便起见,在本文的其余部分,使用该单元的模型将被称为LSTM)。为了更好地预测时间序列趋势,我们还使用ARIMA模型。在第一阶段,ARIMA模型捕捉时间序列数据中的线性趋势。然后,LSTM模型试图捕捉前一阶段输出的剩余值中的非线性。Peter Zhang的文献[19]讨论了这种ARIMA和神经网络混合模型,James Hansen和Ray Nelsonon对各种时间序列数据进行了实证研究[10]。这些文献中使用的模型架构与本文中演示的不同。我们只关注混合模型的多功能预测潜力,以捕获线性和非线性。进一步的模型细节将在第3部分“ARIMA-LSTM混合模型”中详细阐述。在最终评估步骤中,ARIMA-LSTM混合模型将在训练步骤中未涉及的两个时间段上进行测试。本研究的布局和方法将在第4部分“研究方法”中详细讨论。本节还将探讨这些数据。然后将该模型的性能与完整历史模型以及第2部分介绍的其他常用预测模型的性能进行比较。最后,将在第5部分“结果与评估”中总结和评估结果。2相关性预测的各种财务模型相关性预测的完整历史模型的不精确性已在很大程度上得到承认[6,7]。有很多人试图弥补预测失误。在本节中,我们将讨论其他三种常用的模型,以及完整的历史模型;Elton等人在文献中引用了其中三个。

使用道具

地板
大多数88 在职认证  发表于 2022-6-10 09:16:16 |只看作者 |坛友微信交流群
(1978)[3]——Elton等人(1977)[5]的另一篇论文中介绍了全历史模型、恒常相关模型、单指数模型和多组模型。2.1全历史模型全历史模型是实现投资组合相关性估计的最简单方法。该模型采用过去的相关值来预测未来的相关系数。也就是说,未来某一时间段内两项资产的相关性预计等于过去某一时期的相关性值[3]。^ρ(t)ij=ρ(t-1) ij(1)i,j:相关系数矩阵中的资产指数然而,与其他等效模型相比,该模型的预测质量相对较差,因此受到批评。2.2常数相关模型常数相关模型假设完整的历史模型仅包含平均相关系数的信息【3】。平均相关系数的任何偏差都被视为随机噪声;将每对资产的相关性估计为给定投资组合中所有资产对的平均相关性是很有效的。因此,应用常数相关模型,单个投资组合中的所有资产都具有相同的相关系数。ρ(t)ij=Xi>jρ(t-1) ijn(n- 1) /2(2)i,j:相关系数矩阵中的资产指数xn:投资组合中的资产数量2.3单指数模型单指数模型假定资产回报率与“单指数”即市场回报率系统地移动[3]。为了量化关于市场回报的系统运动,我们需要指定市场回报本身。我们称这种规格为“市场模型”,这是由H.M.设计的。

使用道具

7
kedemingshi 在职认证  发表于 2022-6-10 09:16:20 |只看作者 |坛友微信交流群
马科维茨(Markowitz)[4],夏普(Sharpe)(1963)[17]进一步推动了这一观点。“市场模型”将资产i的回报与市场回报时间t联系起来,用以下等式表示:Ri,t=αi+βiRm,t+i、 tRi,t:资产i在时间tRm的回报,t:市场在时间tαi的回报:资产iβi的风险调整超额回报:资产i对市场的敏感性i、 t:剩余收益;错误术语,例如,E(i) =0;V配置总成(i) =σ在此,我们使用资产i和j的β(β)来估计相关系数。方程为:Cov(Ri,Rj)=ρijσiσj=βiβjσmσi/σj:资产i/j回报的标准偏差σm:市场回报的标准偏差估计相关系数ρij为,ρ(t)ij=βiβjσmσiσj(3)2.4多组模型[5]考虑了资产的行业部门。在同一行业部门的资产通常表现相似的假设下,该模型将资产对的每个相关系数设置为与行业部门对相关值的平均相关性相同。换句话说,多组模型是一种将恒常相关模型应用于每对业务部门的模型。例如,如果A公司和B公司都属于行业部门α和β,则它们的相关系数将是具有相同行业部门组合(α,β)的资产组合的所有相关系数的平均值。根据α和β两个行业是否相同,预测公式略有不同。方程式如下所示。ρ(t)ij=nαXi∈αnβXj∈β;i6=jρ(t-1) ijnα(nβ- 1) ,其中α=βnαXi∈αnβXj∈β;i6=jρ(t-1) ijnαnβ,其中α6=β(4)α/β:行业部门符号nα/nβ:每个行业部门的资产数量3 ARIMA-LSTM混合模型时间序列数据假定由线性部分和非线性部分组成[19]。

使用道具

8
何人来此 在职认证  发表于 2022-6-10 09:16:24 |只看作者 |坛友微信交流群
因此,我们可以表示如下。xt=Lt+Nt+TLTre表示时间t的数据线性,而Nt表示非线性。这个 值是错误项。自回归综合移动平均(ARIMA)模型是时间序列预测的传统统计模型之一。众所周知,该模型在处理线性问题时表现良好。另一方面,长-短期记忆(LSTM)模型可以捕捉数据集中的非线性趋势。因此,这两个模型连续组合在一起,以包含模型中的线性和非线性趋势。前者是ARIMA模型,后者是LSTM模型。3.1 ARIMA模型部分ARIMA模型基本上是一种线性回归模型,用于跟踪平稳时间序列数据的线性趋势。模型表示为ARIMA(p,d,q)。参数p、d和q是决定时间序列模型结构的整数值;参数p、q分别是AR模型和MA模型的顺序,参数d是应用于数据的差异水平。有序RMA模型(p,q)的数学表示如下。^xt=c+φxt-1+φxt-2+···+φpxt-p-θεt-1.- θεt-2.- · · · - θqεt-q=c+pXk=1φkxt-k-qXl=1θlεt-lTerm c是一个常数;AR模型变量xt的φkandθkare系数值-k、 和MA模型变量εt-l、 εt-在周期tl(εt)处的错误表示法-l=xt-l- ^xt-l) 。假设εt-lhas为零均值,方差恒定,满足i.i.d条件。Box&Jenkins[9]引入了一种标准化的方法来构建anARIMA模型。该方法由三个迭代步骤组成。(1) 模型识别和模型选择确定模型类型,AR(p)或MA(q),或RMA(p,q)。(2) 参数估计调整模型参数以优化模型。

使用道具

9
可人4 在职认证  发表于 2022-6-10 09:16:27 |只看作者 |坛友微信交流群
(3) 为了改进模型,进行了模型检验残差分析。在模型识别和模型选择步骤中,确定AR和MA模型中的适当模型类型。为了判断哪个模型最适合,需要提供平稳的时间序列数据。平稳性要求基本统计特性,如平均值、方差、协方差或自相关在一段时间内保持不变。在处理非平稳数据的情况下,应用一次或两次差分以实现平稳性。不经常执行两次以上的差分。满足静态条件后,检查自相关函数(ACF)图和偏自相关函数(PACF)图以选择模型类型。参数估计步骤涉及使用数学错误度量的优化过程,如Akaike信息准则(AIC)、贝叶斯信息准则(BIC)或Hannan-Quinn信息准则(HQIC)。在本文中,我们决定使用AIC度量来估计参数。AIC=-2 ln(^L)+2 ln(^L)表示法是似然函数的值,k是自由度,即使用的参数数。具有较小AIC值的模型通常被认为是更好的模型。有不同的方法来计算似然函数ln(^L)。我们使用最大似然估计进行计算。这种方法往往速度较慢,但会产生准确的结果。最后,在模型检查步骤中,进行残差分析以确定ARIMA模型。如果残差分析得出残差值不符合标准,则重复这三个步骤,直到获得最佳ARIMA模型。这里,我们使用ARIMA模型计算的残差作为后续LSTMmodel的输入。

使用道具

10
大多数88 在职认证  发表于 2022-6-10 09:16:30 |只看作者 |坛友微信交流群
由于ARIMA模型确定了线性趋势,残差被假设为包含非线性特征[19]。xt公司- Lt=Nt+t该tvalue将是我们模型的最终误差项。3.2已知LSTM模型扇区神经网络在非线性任务上表现良好。由于该模型因参数维数大而具有通用性,并且在每一层中都使用了非线性激活函数,因此该模型能够适应数据中的非线性趋势。但对财务数据的实证研究表明,神经网络的性能参差不齐。例如,在D.M.Q.Nelsonet等人的文献[2]中,LSTM神经网络用于股价预测的准确性通常高于其他非神经网络模型。然而,在每个模型的精度范围内都有重叠部分,这意味着该模型的性能并不总是优于其他模型。这为我们的论文提供了一个基础,即使用ARIMA-LSTM混合模型,该模型同时包含线性和非线性,从而产生比纯LSTM神经网络模型更复杂的结果。为了理解LSTM模型,应首先讨论递归神经网络(RNN)的机制。RNN是一种对时间序列数据有效执行的序列模型。它将一系列时间序列数据向量作为输入X=[X,X,X,····,xt],并输出由模型单元中的神经网络结构计算的avector值,如图1所示。向量X是跨越t个时间段的时间序列数据。向量X中的值依次通过单元A。在每个时间步,单元输出一个值,该值与下一个时间步数据和单元状态C串联。输出值和C用作下一个时间步的输入。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-9-6 18:57