楼主: kedemingshi
1644 26

[量化金融] 预测经济和金融时间序列:ARIMA与LSTM [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
89.3335
学术水平
0 点
热心指数
8 点
信用等级
0 点
经验
24665 点
帖子
4127
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
kedemingshi 在职认证  发表于 2022-6-9 19:07:16 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Forecasting Economics and Financial Time Series: ARIMA vs. LSTM》
---
作者:
Sima Siami-Namini and Akbar Siami Namin
---
最新提交年份:
2018
---
英文摘要:
  Forecasting time series data is an important subject in economics, business, and finance. Traditionally, there are several techniques to effectively forecast the next lag of time series data such as univariate Autoregressive (AR), univariate Moving Average (MA), Simple Exponential Smoothing (SES), and more notably Autoregressive Integrated Moving Average (ARIMA) with its many variations. In particular, ARIMA model has demonstrated its outperformance in precision and accuracy of predicting the next lags of time series. With the recent advancement in computational power of computers and more importantly developing more advanced machine learning algorithms and approaches such as deep learning, new algorithms are developed to forecast time series data. The research question investigated in this article is that whether and how the newly developed deep learning-based algorithms for forecasting time series data, such as \"Long Short-Term Memory (LSTM)\", are superior to the traditional algorithms. The empirical studies conducted and reported in this article show that deep learning-based algorithms such as LSTM outperform traditional-based algorithms such as ARIMA model. More specifically, the average reduction in error rates obtained by LSTM is between 84 - 87 percent when compared to ARIMA indicating the superiority of LSTM to ARIMA. Furthermore, it was noticed that the number of training times, known as \"epoch\" in deep learning, has no effect on the performance of the trained forecast model and it exhibits a truly random behavior.
---
中文摘要:
预测时间序列数据是经济学、商业和金融学中的一个重要课题。传统上,有几种技术可以有效预测时间序列数据的下一个滞后,如单变量自回归(AR)、单变量移动平均(MA)、简单指数平滑(SES),以及更显著的具有多种变化的自回归综合移动平均(ARIMA)。特别是,ARIMA模型在预测未来时间序列滞后的精度和准确性方面表现出了卓越的性能。随着计算机计算能力的不断提高,更重要的是,随着更先进的机器学习算法和方法(如深度学习)的发展,人们开发了新的算法来预测时间序列数据。本文研究的问题是,新开发的基于深度学习的时间序列数据预测算法,如“长-短期记忆(LSTM)”是否以及如何优于传统算法。本文进行和报告的实证研究表明,基于深度学习的算法(如LSTM)优于基于ARIMA模型的传统算法。更具体地说,与ARIMA相比,LSTM获得的错误率平均减少84-87%,表明LSTM优于ARIMA。此外,我们还注意到,深度学习中称为“epoch”的训练次数对训练后的预测模型的性能没有影响,它表现出真正的随机行为。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
--> Forecasting_Economics_and_Financial_Time_Series:_ARIMA_vs._LSTM.pdf (2.58 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:金融时间序列 ARIMA 时间序列 STM Rim

沙发
何人来此 在职认证  发表于 2022-6-9 19:07:22
预测经济和金融时间序列:ARIMA VS.LSTM SIMA SIAMI NAMIN1,AKBAR SIAMI NAMIN2 1。sima农业和应用经济学系研究生助理和博士生。西亚米-namini@ttu.edu2、阿克巴大学计算机科学系副教授。namin@ttu.edu德克萨斯理工大学卢伯克分校,德克萨斯州,美国2018年3月15日摘要预测时间序列数据是经济学、商学和金融学的一门重要学科。传统上,有几种技术可以有效预测时间序列数据的下一个滞后,如单变量自回归(AR)、单变量移动平均(MA)、简单指数平滑(SES),以及更显著的具有多种变化的自回归综合移动平均(ARIMA)。特别是,ARIMA模型在预测未来时间序列滞后的精度和准确性方面表现出了卓越的性能。随着计算机计算能力的不断提高,更重要的是,随着更先进的机器学习算法和方法(如深度学习)的发展,人们开发了新的算法来预测时间序列数据。本文研究的问题是,新开发的基于深度学习的时间序列数据预测算法,如“长-短期记忆(LSTM)”是否以及如何优于传统算法。本文进行和报告的实证研究表明,基于深度学习的算法(如LSTM)优于基于ARIMA模型的传统算法。更具体地说,与ARIMA相比,LSTM获得的错误率平均减少84-87%,表明LSTM优于ARIMA。

藤椅
能者818 在职认证  发表于 2022-6-9 19:07:25
此外,我们还注意到,深度学习中称为“epoch”的训练次数对训练后的预测模型的性能没有影响,它表现出真正的随机行为。关键词:预测;经济和金融时间序列数据;深度学习;长短时记忆;自回归综合移动平均(ARIMA);均方根误差(RMSE)。3预测经济和金融时间序列:ARIMA VS.LSTM 1简介经济和金融时间序列数据的预测是一项具有挑战性的任务,主要是因为一方面经济趋势和条件发生了前所未有的变化,另一方面信息不完整。近年来,市场波动给经济和金融时间序列预测带来了严重问题。因此,当采用各种形式的预测方法时,评估预测的准确性是必要的,更具体地说,使用回归分析进行预测,因为它们在应用中有许多局限性。本文的主要目的是研究哪种预测方法能够在较低的预测误差和较高的预测精度方面提供最佳预测。在这方面,时间序列预测中有各种各样的随机模型。最广为人知的方法是单变量“自回归滑动平均(ARMA)”,用于将自回归(AR)和移动平均(MA)模型相结合的单个时间序列数据。单变量“自回归综合移动平均(ARIMA)”是一种特殊类型的ARMA,模型中考虑了差异。

板凳
nandehutu2022 在职认证  发表于 2022-6-9 19:07:29
多元ARIMA模型和向量自回归(VAR)模型是另一种最流行的预测模型,它们又通过允许多个演化变量来推广单变量ARIMA模型和单变量自回归(AR)模型。机器学习技术和更重要的深度学习算法为预测问题引入了新的方法,其中变量之间的关系在深层层次中建模。近年来,基于机器学习的技术(如支持向量机(SVM)和随机森林(RF)以及基于深度学习的算法(如递归神经网络(RNN)和长-短期记忆(LSTM))在包括金融在内的许多学科中得到了广泛的关注。深度学习方法能够识别数据的结构和模式,例如时间序列预测中的非线性和复杂性。特别是,LSTM已用于许多应用领域,如自然语言处理【Tarwani和Edem,2017】、手写识别【Graves等人,2009】、语音识别【Robinson,2002;Eyben,2009;Graves等人,2013;Sak等人,2014】,时间序列预测【Hochreiter和Schmidhuber,1997年;Gers,2000年;Yim,2002年;Zhang,2005年;Graves等人,2009年,2013年;Schmidhuber,2015年;Brownlee,2016年;Gamboa,2017年;Rondiwala,2017年】及其在经济和金融数据中的应用,如预测标准普尔500指数的波动性【Kohzadi,1996年;Giles等人,2001年;Huck,2009年;Xiong,2015年】和衡量纳入选定公司的新闻【Siah和Myers,Joshi等人,2013年;Ding等人,2015年】。

报纸
nandehutu2022 在职认证  发表于 2022-6-9 19:07:32
与基于深度学习的预测算法相比,传统预测技术的准确性和精确度是一个有趣而重要的研究问题。据我们所知,在预测经济和金融计时器系列数据时使用LSTM方法来评估其性能,并将其与ARIMA等传统计量经济预测方法进行比较,没有具体的经验证据。本文比较了ARIMA和LSTM模型在降低错误率方面的性能。作为传统预测建模的代表,由于收集和建模的数据4具有非平稳特性,因此选择ARIMA。作为基于深度学习的算法的代表,LSTM方法被用来在较长的时间内保持和训练数据的特征。本文为一组经济和金融时间序列数据的LSTM模型的数据处理和训练提供了深入的指导。本文对文献的贡献是利用ARIMA和LSTM模型预测各种经济和金融时间序列。本文的主要贡献是:-进行实证研究和分析,目的是调查传统预测技术和基于深度学习的算法的性能。-比较LSTM和ARIMA在预测误差率最小化方面的性能。研究表明,LSTM优于ARIMA。与ARIMA相比,LSTM获得的错误率平均减少84-87%,表明LSTM优于ARIMA调查培训次数的影响。

地板
可人4 在职认证  发表于 2022-6-9 19:07:35
研究表明,在深度学习中,对数据进行的训练次数(称为“历元”)对经过训练的预测模型的性能没有影响,它表现出真正的随机行为。本文的结构如下。第2节概述了时间序列预测的现状。第3节讨论了ARIMA和LSTM的数学背景。第4节描述了ARIMA与LSTM模型的实验研究。第5节介绍了开发和比较的ARIMA和LSTM算法。第6节介绍了数据分析结果和实证结果。第7节讨论了迭代次数对拟合模型的影响。最后,第8节对本文进行了总结。2时间序列预测:最先进的时间序列分析和动态建模是一个有趣的研究领域,在商业、经济、金融和计算机科学中有着大量的应用。时间序列分析的目的是研究时间序列的路径观测,并建立一个模型来描述数据结构和预测时间序列的未来值。由于时间序列预测在许多应用科学分支中的重要性,为了提高预测精度,必须建立有效的模型。各种时间序列预测模型已在文献中发展。时间序列预测通常在计量经济学中使用由Box和Jenkins(1970)推广的ARIMA模型进行。长期以来,ARIMA一直是时间序列预测的标准方法。尽管ARIMA模型在经济和金融时间序列建模中非常普遍【Banerjee 2005;Khashei和Bijari,2011;Alonso和Garcia-Martos,2012;Adebiyi et al。

7
kedemingshi 在职认证  发表于 2022-6-9 19:07:38
2014年),他们有一些主要的局限性【Armstrong 2001;Earnest等人,2005;】。对于istance,在简单的ARIMA模型中,很难对变量之间的非线性关系进行建模。此外,假设ARIMA模型中的误差存在一个恒定的标准差,这在实践中可能无法满足。当ARIMA模型与广义自回归条件异方差(GARCH)模型相结合时,可以放宽这一假设。另一方面,GARCH模型及其参数的优化可能具有挑战性和问题性【凯恩,2014年】。5最近,开发了深度学习的新技术,以应对与预测模型相关的挑战。LSTM(长-短期记忆)是递归神经网络(RNN)方法的一种特例,最初由Hochreiter和Schmidhuber提出【Hochreiter和Schmidhuber,1979年】。尽管这是一种相对较新的解决预测问题的方法,但基于深度学习的方法在研究人员中得到了普及。例如,Krauss等人【Krauss等人,2017年】使用各种形式的预测模型,如深度学习、梯度增强树和随机森林,对标准普尔500指数构成进行建模。令人惊讶的是,他们报告说,基于深度学习的建模不足的梯度促进了树木和随机森林的生长。此外,Krauss等人报告说,训练神经网络和基于深度学习的算法非常困难。Lee和Yoo【Lee和Yoo,2017年】引入了基于RNN的方法来预测股票回报。其想法是通过调整RNN内部各层的threhshold回报水平来构建投资组合。

8
能者818 在职认证  发表于 2022-6-9 19:07:41
在本文中,我们比较了ARIMA模型和LSTM模型在经济和金融时间序列预测中的性能,以确定典型预测模型中所涉及变量的最佳质量。3数学背景本节回顾了本文中使用和比较的时间序列技术的数学背景。更具体地说,介绍了自回归综合移动平均(ARIMA)和基于深度学习的长-短期记忆(LSTM)技术的背景知识。3.1自回归综合移动平均模型(ARIMA)ARIMA【Pesaran,2015】是自回归移动平均(ARMA)的广义模型,它将自回归(AR)过程和移动平均(MA)过程相结合,并构建时间序列的复合模型。正如首字母缩略词所示,ARIMA  p, d, q  捕获模型的关键元素:-AR:自回归。一种回归模型,使用一个观测值和多个滞后观测值之间的依赖关系(p).  -  一: 集成。通过测量不同时间观测值的差异,使时间序列平稳(d).  -  MA:移动平均线。当移动平均模型用于滞后观测值时,考虑观测值与残差项之间相关性的一种方法(q).  AR序模型的一种简单形式p, i、 e.,AR(p), 可以写成线性过程,由以下公式给出:x!=  c + !!! !!x!!!+ ε! 哪里x! 是平稳变量,c  是常数,在!  是滞后1,2,…,处的自相关系数,p 和ε! , 残差是均值为零且方差为零的高斯白噪声序列σ!!.

9
何人来此 在职认证  发表于 2022-6-9 19:07:44
订单的MA模型q, i、 e.,MA(q), 可写形式:6x!=  μ + θ!!! !!ε!!! 哪里μ 是对x! (通常假定为零),则θ! 项是应用于时间序列中随机项的当前值和先验值的权重,以及θ!= 1、我们假设ε! 是均值为零且方差为零的高斯白噪声序列σ!!. 我们可以通过将这两个模型相加来组合这两个模型,并形成一个序的ARMA模型(p, q): x!= c + !!! !!x!!!+ ε!+ θ!!! !!ε!!! 哪里!≠ 0, θ!≠ 0,和σ!!  > 0.参数p 和q 分别称为AR和MA指令。ARIMA预测,也称为Box和Jenkins预测,由于其“集成”步骤,能够处理非平稳时间序列数据。事实上,“积分”部分涉及对时间序列进行差分,以将非平稳时间序列转换为平稳时间序列。ARIMA模型的一般形式表示为ARIMA  p, d, q .  对于季节性时间序列数据,短期非季节性成分可能会对模型产生影响。因此,我们需要估计季节ARIMA 该模型将非季节性因素和季节性因素结合在一个乘法模型中。季节ARIMA模型的一般形式表示为ARIMA  p, d, q × P, D, Q S, 哪里p 分别为非季节性AR阶、d为非季节性差分、q为非季节性MA阶、P为季节性AR阶、d为季节性差分、q为季节性MA阶、S为重复季节模式的时间跨度。估计季节ARIMA模型最重要的步骤是确定p, d, q  和P, D, Q . 根据数据的时间图,例如,如果方差随时间增长,则应使用方差稳定变换和差分。

10
mingdashike22 在职认证  发表于 2022-6-9 19:07:48
然后,使用自相关函数(ACF)测量由滞后分隔的时间序列中观测值之间的线性依赖量p, 和偏自相关函数(PACF)来确定有多少个自回归项q  是检测过差的必要和逆自相关函数(IACF),我们可以识别自回归阶p、差分阶d、移动平均阶q的初始值及其相应的季节参数p,D和Q。参数D是从非平稳时间序列到平稳时间序列的差频变化顺序。3.2长-短期记忆(LSTM)LSTM【Patterson,2017】是一种递归神经网络(RNN),具有记忆早期值以备将来使用的能力。在深入研究LSTM之前,有必要先了解一下神经网络的样子。3.2.1人工神经网络(ANN)神经网络至少由三层组成,即:1)输入层、2)隐藏层和3)输出层。数据集的特征数决定了输入层中的维度或节点数。这7个节点通过称为“突触”的链接连接到隐藏层中创建的节点。突触链接为输入层中的每个节点携带一些权重。权重基本上起着决策者的作用,决定哪些信号或输入可以通过,哪些不可以。权重还显示隐藏层的强度或范围。神经网络基本上通过调整每个概要的权重进行学习。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-17 03:08