楼主: 何人来此
1026 14

[量化金融] 基于深度学习的金融趋势预测特征约简研究 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.8012
学术水平
1 点
热心指数
6 点
信用等级
0 点
经验
24593 点
帖子
4128
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
何人来此 在职认证  发表于 2022-5-31 08:25:14 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《On Feature Reduction using Deep Learning for Trend Prediction in Finance》
---
作者:
Luigi Troiano and Elena Mejuto and Pravesh Kriplani
---
最新提交年份:
2017
---
英文摘要:
  One of the major advantages in using Deep Learning for Finance is to embed a large collection of information into investment decisions. A way to do that is by means of compression, that lead us to consider a smaller feature space. Several studies are proving that non-linear feature reduction performed by Deep Learning tools is effective in price trend prediction. The focus has been put mainly on Restricted Boltzmann Machines (RBM) and on output obtained by them. Few attention has been payed to Auto-Encoders (AE) as an alternative means to perform a feature reduction. In this paper we investigate the application of both RBM and AE in more general terms, attempting to outline how architectural and input space characteristics can affect the quality of prediction.
---
中文摘要:
使用金融深度学习的一个主要优势是将大量信息嵌入到投资决策中。一种方法是通过压缩,这使我们考虑更小的特征空间。多项研究证明,深度学习工具进行的非线性特征约简在价格趋势预测中是有效的。重点主要放在受限玻耳兹曼机器(RBM)及其获得的输出上。很少有人关注自动编码器(AE)作为执行特征缩减的替代方法。在本文中,我们从更一般的角度研究了RBM和AE的应用,试图概述建筑和输入空间特征如何影响预测质量。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--

---
PDF下载:
--> On_Feature_Reduction_using_Deep_Learning_for_Trend_Prediction_in_Finance.pdf (193.9 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:深度学习 趋势预测 学习的 Quantitative Applications

沙发
大多数88 在职认证  发表于 2022-5-31 08:25:18
在FinanceLuigi TroianoDept中使用深度学习进行趋势预测的特征约简。SannioI-82100 Benevento工程大学,意大利电子邮件:troiano@unisannio.itElenaMejutoDept公司。SannioI-82100 Benevento工程大学,意大利电子邮件:mejutovilla@unisannio.itPraveshKriplaniCISELabUniversity of SannioI-82100 Benevento,意大利电子邮件:pravesh。kriplani@ciselab.orgAbstract-将深度学习用于金融的一个主要优势是将大量信息嵌入到投资决策中。一种方法是通过压缩,这使我们考虑更小的特征空间。一些研究证明,由深度学习工具执行的非线性特征约简在价格趋势预测中是有效的。焦点主要放在受限玻耳兹曼机器(RBM)及其获得的输出上。很少有人关注自动编码器(AE)作为执行特征缩减的替代方法。在本文中,我们从更一般的角度研究了RBM和AE的应用,试图概述建筑和输入空间特征如何影响预测质量。一、 简介深度学习(DL)揭示了自动化复杂决策的新可能性,而金融是可以从中受益更多的领域之一。由于新体系结构能够探索信息源组内的关系或资源之间的关系,以及决策的质量,因此需要投资决策来查看更广泛的信息范围,这促使人们对DL在金融领域的实验产生了兴趣。然而,信息来源的大量性和多样性要求将成分的数量减少到一组独立/不相关的资源,以表达丰富的可用信息。

藤椅
何人来此 在职认证  发表于 2022-5-31 08:25:23
这属于机器学习中更一般的特征约简任务。特征约简依赖于通过函数ρ:X将数据点从高维输入空间X映射到低维特征空间Y的可能性→ Y当X中的数据点投影到Y中的数据点时,可以从数据中学习函数ρ,以尽量减少信息损失。在许多情况下,输入数据点是实的,即X Rn以及特征数据点,即Y Rm,带n>> m、 函数ρ可以是线性的。PCA和其他相关技术的情况就是如此【1】。但最有效的技术依赖于由Hinton和Salak hutdinov提出的ρ的非线性a r结构[2]。深度学习提供了一类新的方法,专门设计用于执行非线性特征缩减。金融领域特别关注受限玻尔兹曼并购(RBM)(如[3])。然而,m中的自动编码器(AE)也有其他可能性。通常,当前文献如图所示。1、财务中用于趋势预测的方案侧重于趋势预测性能,而很少关注与特征缩减步骤有关的问题,尽管它发挥着核心作用。在这里,我们研究了在趋势检测和预测问题中,影响红色诱导质量的不同组织的问题。因此,我们考虑了图1所示的处理管道。作为输入,我们假设收集了大量的指标。在执行featurereduction任务之前,数据会进行缩放。之后,数据被压缩并作为输入传递给分类器,以执行预测。我们的兴趣不在于ClassificationTask的性能。因此,我们将假设只有一个标准的SVM用于预测[4]。

板凳
可人4 在职认证  发表于 2022-5-31 08:25:27
相反,我们感兴趣的是更好地了解特征缩减对预测质量的影响,这是由AE与RBM形成的,并确定应该在数据源选择和预处理方面解决哪些问题,以提高性能。本文的其余部分遵循以下组织:第二节提供了有关RBM和AE的一些预备知识;第三节讨论了实验结果,第四节概述了结论和未来方向。二、预备在本节中,我们将提供本文感兴趣的受限Bo-ltzmann机器(RBM)和自动编码器(AE)的基础知识。A、 受限Boltzmann机器受限Boltzmann机器(RBM)是由两层构成的网络,如图2所示。图2:。受限玻耳兹曼机器输入-输出层包含n个可见单位V=(V,…,Vn),用于表示可观测数据,m个隐藏单位H=(H,…,Hm)用于捕捉服务变量之间的依赖关系。RBM设计用于处理{0,1}中的二进制值。在关系V×H上定义的加权矩阵用于量化NV和H之间的关系。RBM是双向的。实际上,给定t输入和隐藏单位的值由hj=σbj+mXi=1wi,jvi!j=1。。m(1)和vi=σai+nXj=1wi,jhji=1。。n(2)其中σ是逻辑S形,Ai和Bj是偏差。RBM属于基于能量的模型(EBM)。实际上,RBM可以被视为一个马尔科夫随机场,与一个二部无向图相关联。因此,可见和隐藏单位的值可以用条件概率来解释,即isP(Hj=1 | V)=hjj=1。。m(3)和P(Vi=1 | H)=vii=1。。n(4)作为基于二部图的RBM,给定可见变量,隐藏变量相互独立,反之亦然。

报纸
mingdashike22 在职认证  发表于 2022-5-31 08:25:31
因此,条件概率给定为asP(V | H)=nYi=1P(Vi | H)(5)P(H | V)=mYj=1P(Hj | V)(6)。它们都可以用联合概率(V,H)及其边际概率P(V)=PHP(V,H)和P(H)=PVP(V,H)表示。由于RBM使用逻辑S形,联合概率分布由G ibbs分布P(V,H)=ZeE(V,H)(7)给出,其中E(V,H)命名为能量函数,定义为asE(V,H)=-nXi=1aivi-mXj=1bjhj-nXi=1mXj=1viwi,jhj(8),其中Z称为配分函数,它是一个规范化常数,用于确保概率总和为1。RBM可以通过将输入数据缩放到单位区间来处理实值可见变量,从而将输入值解释为先验概率pi∈ [0,1]vi=1。RBM可以训练为复制输入v。给定矩阵Wwi,jlog(P(v))=vihj- v′ih′j(9),其中hj由式(1)获得,v′iis由式(1)获得。(1) 。在每一步中,该过程都利用吉布斯采样顺序来获得向量h′,而v=v。因此,假设有一个相对的后代规则,则给出了加权更新,如下所示:wi,j=(vihj- v′ih′j)(10)式中,是学习率。此外,使用规则更新偏差a=(v- v′),b=(h- h′)。在训练结束时,隐藏单元h提供可视输入压缩v.B。自动编码器AN Auto-Encod e r(AE)是一个DL网络,它被训练为自行重建或近似输入。因此,AEs也利用无监督培训。AEstructure由一个n输入层、一个输出层和一个或多个连接它们的隐藏层组成。为了重建输入,输出层具有与输入层相同的维度,形成了图1所示的瓶状结构。

地板
nandehutu2022 在职认证  发表于 2022-5-31 08:25:35
AE由两部分组成:一部分将输入映射到低维表示(编码);othe r将潜在表示映射回同一图形的重构,作为输入(解码)。在最简单的结构中,只有一个隐藏层。AE获取输入x∈ Rd=X并将其映射到y∈ Rp:y=σ(Wx+b)(11),其中σ是一个元素激活函数,如Asigomoid函数或直接线性单位。之后,将最新表示法y(通常称为代码)映射回同一形状a s x的重建z=x′:z=σ(W′y+b′)(12)。由于我们试图建立复制输入的模型,因此对参数(W、W′、b和b′)进行了优化,以使IG。3、自动编码行程重建误差最小化。这种误差可以用不同的方法测量。其中平方误差:L(x,z)=kx- zk=kx- σ(W′(σ(Wx+b))+b′)k(13),如果输入被解释为任一位向量,即xi∈ {0,1}或比特概率向量,即xi∈ [0,1],重构的交叉熵是一个合适的解:L(x,z)=-dXk=1[xklog zk+(1- xk)日志(1- zk)](14)为了迫使隐藏层提取更健壮的特征,我们通过丢弃一些值来训练AE从损坏的版本重建输入。这是通过将一些输入随机设置为零来实现的[5]。这种AE称为去噪自动编码器。三、 实验结果a。输入特征和数据标签历史数据包括2007年1月1日至2017年1月1日标准普尔500指数的价格系列。输入由在价格系列上计算的多个技术指标组成。

7
可人4 在职认证  发表于 2022-5-31 08:25:39
表I提供了我们实验中使用的指标列表(详细描述见[6]–[8])。通过在每个时间t分配值y(t),对数据进行趋势标记∈ {+1;-1} 分别为上升趋势和下降趋势。允许分配标签的规则利用了使用滚动窗口时索引的居中移动平均值(cMA- 3,t+3]。

8
大多数88 在职认证  发表于 2022-5-31 08:25:43
之后采用以下标记标准:y(t)=+1,如果cMA(t)>close(t)和cMA(t+3)>cMA(t+1)INDI-Cator表ILIST Indicator name Indicator类型溶质价格振荡器(APO)Indicator类型Roon Momentumaroun振荡器MomentumMESA Adaptive Moving Average(MAMA)重叠研究平均方向运动指数(ADX)MomentumAverage方向运动指数评级动量平均真实范围(ATR)波动性功率平衡(BOP)动量波林格带(BBANDS)重叠研究波林格带宽重叠研究%B指标重叠研究柴金A/D振荡器体积和动量振荡器(CMO)动量商品通道指数(CCI)动量方向移动指数动量双指数移动平均(DEMA)重叠研究指数移动平均值(EMA)重叠研究考夫曼自适应移动平均值(KAMA)重叠研究周期内最小值和最大值移动平均值(MA)动量移动平均收敛/发散(MACD)动量动量动量动量动量动量动量动量动量动量动量动量动量动量动量动量动量动量动量动量动量动量动量流量指数(MFI)动量动量动量平衡量体积百分比价格振荡器(PPO)动量动量动量动量动量方向指示器动量动量动量动量方向运动MomuntumRelative Strength Index(RSI)MomuntumRelative Energy Index(RVI)MomuntumRate of change ratio(ROC)MomuntumParabolic SAR重叠研究随机振荡矩三指数移动平均(TEMA)重叠研究三角移动平均(TRIMA)重叠研究三平滑EMA(TRIX)矩最终振荡矩三指数移动平均(WMA)重叠的1天ROCstudiesWilliams的百分比范围(%W)最大值(t)=-1如果cMA(t)<闭合(t)且cMA(t+3)<cMA(t+1),则在时间t,我们保留之前的标签,即y(t)=y(t-1) 。在图中。

9
大多数88 在职认证  发表于 2022-5-31 08:25:47
4是拥有成交价格系列和标签价值。为了提高训练集的质量,从而提高模型的可预测性,我们将重点放在足够大的时间段上,以超越趋势(至少10天),并与价值变动相关联,这意味着上升趋势应在该时间段内带来积极的价值增加,而我们应增加下降趋势的增量。不符合这些特征的时段将从训练集中讨论。所有可用数据都已用于标识可压缩输入数据的结构。相反,SVM已经使用90%的可用数据进行了训练,并在剩余的10%上进行了测试。使用最近10%的测试数据进行了比较。为了避免由于选择最近时期而导致的结果差异,使用10倍交叉验证对RBM和AE进行了最终比较。01-01-2008 01-01-2010 01-01-2012 01-01-2014 01-01-2016日期0.10.20.30.40.50.60.70.80.9图。标普500指数带趋势标签(标准化值;灰色带表示上升趋势,白色带表示下降趋势)。B、 实验设置所有实验均在配备Intel X eon处理器E5 v3系列、3.5GHzx8、16GB RAM和GPU GeForce GTX 980 Ti的工作站上进行,该处理器上有6GB RAM。该框架是用Python开发的。AE和RBM的实现基于Theano【9】,而VM基于scikit学习库,用于机器学习【10】。所有指标均使用技术分析库TA Lib计算。C、 模型拟合为了适应特征约简,我们使用AE和RBM作为用于预测的SVM分类器的预备。

10
何人来此 在职认证  发表于 2022-5-31 08:25:50
AE和RBM在预测精度和训练网络所需时间方面进行了比较。AE的训练基于反向投影算法,随机下降梯度更新权重,交叉熵作为损失函数。权重矩阵由区间内均匀采样的值初始化[-4p6/(nvisible+nhidden),+4p6/(nvisible+nhidden)],偏差初始化为0,如[12]中关于类乙状体激活函数的建议。用于训练RBM的alg算法是基于g半径的持续对比发散学习过程[13]。在这种情况下,权重的初始值从零均值高斯中选择,标准偏差为0.01,如Hinton在【14】中所建议的那样。隐藏和可见偏差初始化为0。在这两种情况下,我们将训练集划分为小批量,以加速计算。此外,我们还引入了一种自适应学习率,该学习率通过恒定的衰减率呈指数递减,以期提高培训过程的准确性和效率。我们使用一种形式的正规化进行早期存储,以避免过度匹配问题。D、 性能结果通过预测精度(即正确标签的数量与标签的总数)来比较替代者。首先,我们考虑输入数据的两个重要方面:多样性和缩放。差异我们考虑的第一个问题是,使用不同的信息源有多重要,其中“多样化”主要指独立或不相关的信息源。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-15 05:47