楼主: 能者818
323 27

[量化金融] CNNPred:基于CNN的股市预测,使用多个数据源 [推广有奖]

  • 0关注
  • 6粉丝

会员

学术权威

79%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
34.5488
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24952 点
帖子
4198
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《CNNPred: CNN-based stock market prediction using several data sources》
---
作者:
Ehsan Hoseinzade, Saman Haratizadeh
---
最新提交年份:
2018
---
英文摘要:
  Feature extraction from financial data is one of the most important problems in market prediction domain for which many approaches have been suggested. Among other modern tools, convolutional neural networks (CNN) have recently been applied for automatic feature selection and market prediction. However, in experiments reported so far, less attention has been paid to the correlation among different markets as a possible source of information for extracting features. In this paper, we suggest a CNN-based framework with specially designed CNNs, that can be applied on a collection of data from a variety of sources, including different markets, in order to extract features for predicting the future of those markets. The suggested framework has been applied for predicting the next day\'s direction of movement for the indices of S&P 500, NASDAQ, DJI, NYSE, and RUSSELL markets based on various sets of initial features. The evaluations show a significant improvement in prediction\'s performance compared to the state of the art baseline algorithms.
---
中文摘要:
金融数据的特征提取是市场预测领域的一个重要问题,人们提出了许多方法。在其他现代工具中,卷积神经网络(CNN)最近被应用于自动特征选择和市场预测。然而,在迄今为止报道的实验中,作为提取特征的可能信息来源,对不同市场之间的相关性关注较少。在本文中,我们提出了一个基于CNN的框架,该框架带有专门设计的CNN,可以应用于来自各种来源(包括不同市场)的数据收集,以便提取特征,预测这些市场的未来。所建议的框架已被应用于预测标普500指数、纳斯达克指数、道琼斯指数、纽约证券交易所指数和罗素市场指数第二天的走势,这些指数基于不同的初始特征集。评估表明,与最先进的基线算法相比,预测性能有了显著改善。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Computer Science        计算机科学
二级分类:Computational Engineering, Finance, and Science        计算工程、金融和科学
分类描述:Covers applications of computer science to the mathematical modeling of complex systems in the fields of science, engineering, and finance. Papers here are interdisciplinary and applications-oriented, focusing on techniques and tools that enable challenging computational simulations to be performed, for which the use of supercomputers or distributed computing platforms is often required. Includes material in ACM Subject Classes J.2, J.3, and J.4 (economics).
涵盖了计算机科学在科学、工程和金融领域复杂系统的数学建模中的应用。这里的论文是跨学科和面向应用的,集中在技术和工具,使挑战性的计算模拟能够执行,其中往往需要使用超级计算机或分布式计算平台。包括ACM学科课程J.2、J.3和J.4(经济学)中的材料。
--
一级分类:Computer Science        计算机科学
二级分类:Neural and Evolutionary Computing        神经与进化计算
分类描述:Covers neural networks, connectionism, genetic algorithms, artificial life, adaptive behavior. Roughly includes some material in ACM Subject Class C.1.3, I.2.6, I.5.
涵盖神经网络,连接主义,遗传算法,人工生命,自适应行为。大致包括ACM学科类C.1.3、I.2.6、I.5中的一些材料。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
--> CNNPred:_CNN-based_stock_market_prediction_using_several_data_sources.pdf (1.47 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Pred 股市预测 CNN 数据源 NNP

沙发
可人4 在职认证  发表于 2022-6-23 19:18:50 |只看作者 |坛友微信交流群
CNNPred:基于CNN的股市预测使用多个数据源Sehsan Hoseinzadea,Saman HaratizadehaaFaculty of New Sciences and Technologies,University of Tehran,North Kargar Street,1439957131 Tehran,IranAbstractFeature从金融数据中提取特征是市场预测领域中最重要的问题之一,对此提出了许多方法。在其他现代工具中,卷积神经网络(CNN)最近被应用于自动特征选择和市场预测。然而,在迄今为止报道的实验中,对不同市场之间的相关性作为提取特征的可能信息来源的关注较少。在本文中,我们提出了一个基于CNN的框架,该框架带有专门设计的CNN,可以应用于来自各种来源的数据集合,包括不同的市场,以便提取预测这些市场未来的特征。所建议的框架已被应用于预测标准普尔500指数、纳斯达克指数、道琼斯指数、纽约证券交易所指数和罗素市场指数未来几天的走势,这些指数基于不同的初始特征集。评估表明,与最先进的基线算法相比,预测性能有了显著改善。关键词:股市预测、深度学习、卷积神经网络、CNN、特征提取邮件地址:hoseinzadeehsan@ut.ac.ir(Ehsan Hoseinzade),haratizadeh@ut.ac.ir(Saman Haratizadeh)1。金融市场被认为是世界经济的核心,每天交易数十亿美元。很明显,对市场未来行为的良好预测对交易者来说是极其有价值的。

使用道具

藤椅
大多数88 在职认证  发表于 2022-6-23 19:18:53 |只看作者 |坛友微信交流群
然而,由于这些市场的动态和嘈杂行为,做出这样的预测也是一项非常具有挑战性的任务,多年来一直是研究的主题。除了股市指数预测之外,预测货币汇率、商品价格和比特币等加密货币也是该领域预测问题的一个例子(Shah&Zhang,2014;Zhao et al.,2017;Nassirtoussi et al.,2015;Lee et al.,2017)。现有的金融市场分析方法分为基本分析和技术分析两大类。在技术分析中,目标市场的历史数据和其他一些技术指标被视为预测的重要因素。根据有效市场假说,股票价格反映了有关股票的所有信息(Fama,1970),而技术分析师认为,通过分析之前的价格数据,可以预测市场价格的未来行为。另一方面,基本面分析师检查证券的内在投资价值。他们查看资产负债表、损益表、现金流量表等,以了解公司的未来。除了金融市场专家外,机器学习技术也被证明有助于做出此类预测。

使用道具

板凳
可人4 在职认证  发表于 2022-6-23 19:18:56 |只看作者 |坛友微信交流群
人工神经网络和支持向量机是用于此目的的最常用算法(Guresen et al.,2011;Kara et al.,2011;Wang&Wang,2015)。统计方法,随机森林(Khaidem et al.,2016),线性判别分析,二次判别分析,逻辑回归和进化计算算法,特别是遗传算法,(Hu等人,2015b;Brownet等人,2013;Hu等人,2015a;Atsalakis&Valavanis,2009)是应用于从原始财务数据中提取特征和/或基于一组特征进行预测的其他工具和技术(Ou&Wang,2009;Ballings等人,2015)。深度学习(DL)是一类适用于自动特征提取和预测的现代工具(LeCun et al.,2015)。在机器视觉和自然语言处理等许多领域,DL方法已经能够从原始数据或简单特征中逐步构建有用的复杂特征(He等人,2016;LeCun等人,2015)。由于股票市场的行为是复杂的、非线性的和有噪音的,因此提取信息量足以进行预测的特征似乎是一个核心挑战,而数据挖掘似乎是一种很有希望的方法。诸如深层多层感知器(MLP)(Yong等人,2017年)、受限玻耳兹曼机器(RBM)(Cai等人,2012年;Zhu等人,2014年)、长-短期记忆(LSTM)等算法(Chen等人,2015年;Fischer&Krauss,2018年),自动编码器(AE)(Bao等人,2017)和卷积神经网络(CNN)(Gunduz等人,2017;Di Persio&Honchar,2016)是用于预测股市的著名深度学习算法。重要的是要注意可用于预测的特征的多样性。

使用道具

报纸
大多数88 在职认证  发表于 2022-6-23 19:18:59 |只看作者 |坛友微信交流群
原始价格数据、来自历史数据的技术指标、与目标市场相关的其他市场、货币汇率、油价和许多其他信息源可用于市场预测任务。不幸的是,以一种自动市场预测算法可以使用的方式来聚合如此多样的信息集通常不是一项前瞻性的任务。因此,该领域的大多数现有工作仅限于一组代表单一市场近期历史的技术指标(Kim,2003;Zhang&Wu,2009)。该领域的另一个重要主题是自动特征提取。由于初始特征被定义为供人类专家使用,因此它们很简单,即使是由在该领域拥有足够知识和经验的金融专家选择的,它们也可能不是机器进行预测的最佳选择。换句话说,理想情况下,股市预测的自动方法是从对市场预测有益的不同信息源中提取有用的特征,根据这些提取的特征训练预测模型,并最终使用生成的模型进行预测。本文的重点是该过程的第一阶段,即设计一个模型,用于从包含相关市场历史记录信息的多个数据源中提取特征。该数据包括初始基本特征,如原始历史价格、技术指标或过去几天这些特征的变化。

使用道具

地板
可人4 在职认证  发表于 2022-6-23 19:19:02 |只看作者 |坛友微信交流群
考虑到输入空间的多样性和可能需要良好预测的特征空间的复杂性,像CNN这样的深度学习算法似乎是解决此类特征提取问题的一种有前途的方法。据我们所知,卷积神经网络(CNN)已应用于一些股市预测研究中(Gunduz et al.,2017;Di Persio&Honchar,2016)。Periso&Honchar(Di Persio&Honchar,2016)利用美国有线电视新闻网(CNN),仅根据收盘价历史进行预测,而忽略了其他可能的信息来源,如技术指标。Gunduz等人(Gunduz等人,2017年)利用了CNN,该CNN能够为每个样本使用技术指标。然而,它无法将股票市场之间可能存在的相关性视为另一种可能的信息来源。此外,所用CNN的结构受到了计算机视觉领域先前工作的启发,而计算机视觉和股市预测之间存在着根本的差异。由于股市预测特征之间的相互作用与像素之间的相互作用截然不同,因此在卷积层中使用3×3或5×5滤波器可能不是最佳选择。基于财务事实而不是计算机视觉中的论文来设计CNN过滤器似乎更聪明。我们基于CNN开发了我们的框架,因为它在其他领域具有成熟的能力,并且提到了过去在市场预测领域报告的成功实验。作为一个测试案例,我们将展示如何将CNN应用到我们建议的框架中,我们称之为CNNpred,以捕获不同信息源之间的可能相关性,从而从美国五大主要城市的不同输入数据集中提取组合特征。

使用道具

7
能者818 在职认证  发表于 2022-6-23 19:19:05 |只看作者 |坛友微信交流群
股票市场指数:标准普尔500指数、纳斯达克指数、道琼斯工业平均指数、纽约证券交易所和罗素指数,以及其他信息来源,包括经济数据、货币汇率、期货合约、商品价格、全球重要市场指数和美国市场主要公司的价格。此外,过滤器的设计符合特征的财务特征。这项工作的主要贡献可以总结如下:o在基于CNN的框架中聚合多个信息源,用于特征提取和市场预测。由于金融市场行为受到许多因素的影响,因此尽可能多地收集相关信息非常重要。我们的初始功能集很好地涵盖了与股票相关的数据源的不同方面,基本上,它可以很容易地扩展到涵盖其他可能的信息源据我们所知,这是第一个提出CNN的工作,该CNN采用三维张量聚合和对齐一组不同的特征作为输入,并经过训练以提取有助于随后预测每个股票市场的特征。本文的其余部分组织如下:第2节介绍了相关的工作和研究。然后,在第3节中,我们简要介绍了该领域相关技术的背景。在第4节中,详细介绍了提议的方法,然后在第5节中介绍了各种使用的特性。第6节报告了我们的实验设置和结果。在第7节中,我们讨论了结果,并在第8.2节中得出了结论。相关工作股票预测领域的不同方法可分为两类。

使用道具

8
能者818 在职认证  发表于 2022-6-23 19:19:09 |只看作者 |坛友微信交流群
第一类包括试图通过增强预测模型来提高预测性能的算法,而第二类则侧重于改进预测所基于的特征。在第一类侧重于预测模型的算法中,使用了各种工具,包括人工神经网络(ANN)、朴素贝叶斯、支持向量机和随机森林。最流行的财务预测工具似乎是ANN(Krollner等人,2010)。在(Kara et al.,2011)中,对ANN和SVM的性能进行了比较。为了预测伊斯坦布尔证券交易所(ISE)国家100指数的方向变动,向这两个分类机构传递了十个技术指标。作者发现ANN的预测能力明显优于SVM。前馈神经网络是一种流行的神经网络类型,能够预测价格运动方向和价格价值。通常浅层人工神经网络通过反向传播算法进行训练(Hecht-Nielsen,1992;Hagan&Menhaj,1994)。虽然股市的噪声行为和特征空间的复杂性等障碍使ANN学习过程收敛到次优解,但有时GA或SA等局部搜索算法负责为神经网络找到初始或最终的最优权重,然后用于预测(Kim&Han,2000;Qiu et al.,2016;Qiu&Song,2016)。在(Qiu等人,2016年)中,作者使用遗传算法和模拟退火来确定神经网络的初始权重,然后使用反向传播算法来训练网络。这种混合方法在预测日经225指数回报方面优于标准的基于人工神经网络的方法。

使用道具

9
nandehutu2022 在职认证  发表于 2022-6-23 19:19:12 |只看作者 |坛友微信交流群
在(Qiu&Song,2016)中稍作修改后,遗传算法成功地用于确定人工神经网络的优化权重,其中利用技术指标预测日经225指数的走势。(Zhong&Enke,2017)的作者应用了PCA和它的两种变体,以提取更好的特征。一组不同的特征被用作输入数据,而人工神经网络被用于预测标准普尔500指数。结果表明,使用PCA生成的特征与其他两种变化相比,预测效果有所改善。对于不同数量的inPCA使用的组件,报告的预测精度从56%到59%不等。关于特征对预测模型性能影响的另一项研究已在(Patel et al.,2015)中报告。本研究使用神经网络、支持向量机、随机森林和朴素贝叶斯等常用工具预测印度股市著名指数和股票的方向性变动。这项研究表明,将数据从一个包含十个技术特征的空间映射到另一个代表这些特征趋势的特征空间,可以提高预测性能。根据上述研究和类似工作,当使用浅层模型进行预测时,表示输入数据的特征的质量对预测的性能有着至关重要的作用。浅层模型的简单性可以避免它们实现从输入空间到成功预测的有效映射。因此,关于大量数据的可用性和新兴的用于训练深度模型的有效学习方法,研究人员最近已将这些方法用于市场预测。深度模型的一个重要方面是,它们通常能够从原始数据中提取丰富的特征集,并在此基础上进行预测。

使用道具

10
能者818 在职认证  发表于 2022-6-23 19:19:16 |只看作者 |坛友微信交流群
因此,从这个角度来看,深度模型通常将特征提取和预测的两个阶段结合在一个阶段。深层人工神经网络(Deep ANN)基本上是具有多个隐藏层的神经网络,是该领域最早使用的深层方法之一。在(Moghadametal.,2016)中,作者根据四天前和九天前的历史价格预测了纳斯达克价格。研究了具有不同结构(包括深层和浅层结构)的神经网络,以找到其中适当数量的隐藏层和神经元。实验证明了深、浅层人工神经网络的优越性。在(Ar\'evalo等人,2016年)中,作者使用了具有五个隐藏层的深层人工神经网络来预测金融危机期间苹果公司的股价。在交易的每一分钟,从该时间段内的价格波动中提取三个特征。输出显示了大约65%的方向精度。年(Yong等人,2017年),利用具有三个隐藏层的人工神经网络预测新加坡股市的指数价格。将过去十天的历史价格输入深度人工神经网络,以预测未来一到五天的价格。该实验表明,在MAPE为0.75的情况下,提前一天预测的性能最高。在(Chong等人,2017年)中,作者对不同的数据表示方法进行了类比,包括RBM、自动编码器和PCA,这些方法应用于380个特征的原始数据。然后将得到的表示结果反馈给deepANN进行预测。结果表明,在所有测试实验中,没有一种数据表示方法优于其他方法。递归神经网络是一种特殊设计的具有内部记忆的神经网络,它能够提取历史特征并基于这些特征进行预测。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-22 13:59