楼主: 何人来此
791 14

[量化金融] 深度股票表征学习:从烛台图到 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.8012
学术水平
1 点
热心指数
6 点
信用等级
0 点
经验
24593 点
帖子
4128
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
何人来此 在职认证  发表于 2022-6-1 08:11:54 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Deep Stock Representation Learning: From Candlestick Charts to
  Investment Decisions》
---
作者:
Guosheng Hu and Yuxin Hu and Kai Yang and Zehao Yu and Flood Sung and
  Zhihong Zhang and Fei Xie and Jianguo Liu and Neil Robertson and Timothy
  Hospedales and Qiangwei Miemie
---
最新提交年份:
2018
---
英文摘要:
  We propose a novel investment decision strategy (IDS) based on deep learning. The performance of many IDSs is affected by stock similarity. Most existing stock similarity measurements have the problems: (a) The linear nature of many measurements cannot capture nonlinear stock dynamics; (b) The estimation of many similarity metrics (e.g. covariance) needs very long period historic data (e.g. 3K days) which cannot represent current market effectively; (c) They cannot capture translation-invariance. To solve these problems, we apply Convolutional AutoEncoder to learn a stock representation, based on which we propose a novel portfolio construction strategy by: (i) using the deeply learned representation and modularity optimisation to cluster stocks and identify diverse sectors, (ii) picking stocks within each cluster according to their Sharpe ratio (Sharpe 1994). Overall this strategy provides low-risk high-return portfolios. We use the Financial Times Stock Exchange 100 Index (FTSE 100) data for evaluation. Results show our portfolio outperforms FTSE 100 index and many well known funds in terms of total return in 2000 trading days.
---
中文摘要:
提出了一种基于深度学习的投资决策策略。许多智能决策支持系统的性能都受到股票相似性的影响。现有的大多数股票相似性度量都存在以下问题:(a)许多度量的线性性质无法捕捉非线性股票动态;(b) 许多相似性度量(如协方差)的估计需要很长的历史数据(如3K天),不能有效地代表当前市场;(c) 它们无法捕获平移不变性。为了解决这些问题,我们应用卷积自动编码器学习股票表示,在此基础上,我们提出了一种新的投资组合构建策略:(i)使用深入学习的表示和模块化优化对股票进行聚类并识别不同的部门,(ii)根据夏普比率在每个集群内挑选股票(夏普1994)。总体而言,该策略提供低风险高回报投资组合。我们使用英国《金融时报》股票交易所100指数(FTSE 100)数据进行评估。结果显示,我们的投资组合在2000个交易日的总回报率方面优于富时100指数和许多知名基金。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--

---
PDF下载:
--> Deep_Stock_Representation_Learning:_From_Candlestick_Charts_to_Investment_Decisions.pdf (751.42 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Presentation Measurements Optimisation Quantitative Applications

沙发
能者818 在职认证  发表于 2022-6-1 08:11:59
深度股票表征学习:从烛台图到投资决策国盛湖5,*宇新湖1号,*凯杨泽浩于洪孙志宏张飞谢1,建国刘尼尔罗伯逊·蒂莫西软管6,强威Miemie6,7,8,上海财经大学上海科技大学西安大学独立研究中心贝尔法斯特皇后大学爱丁堡大学会计咨询公司LtdArrayStream Technologies LTDABStracts我们提出了一种基于深度学习的新型投资决策策略(IDS)。许多智能决策支持系统的性能都受到股票相似性的影响。现有的大多数股票相似性测度都存在以下问题:(a)许多测度的线性性质无法捕捉非线性股票动态;(b) 许多相似性度量(如协方差)的估计需要很长的历史数据(如3K天),不能有效地代表当前市场;(c) 它们无法捕获平移不变性。为了解决这些问题,我们应用卷积自动编码器学习股票表示,在此基础上,我们提出了一种新的组合构建策略:(i)使用深入学习的表示和模块化优化对股票进行聚类,并确定不同的部门,(ii)根据夏普比率在每个集群内挑选股票(Sharpe 1994)。总体而言,该策略提供低风险高回报投资组合。我们使用《金融时报》股票交易所100指数(FTSE 100)数据进行评估。结果显示,我们的投资组合在2000个交易日的总回报率方面优于FTSE100指数和许多知名基金。1简介投资决策是定量和行为金融领域的经典研究领域。最重要的决策问题之一是投资组合构建和优化[1,2],它解决了投资组合中待持有资产的选择和权重问题。

藤椅
nandehutu2022 在职认证  发表于 2022-6-1 08:12:03
金融机构试图构建和优化投资组合,以最大限度地提高投资者回报,同时最大限度地降低投资者风险。股票相似性对于许多投资决策策略都很重要。例如,经典的投资策略,均值-方差理论[1],使用方差来衡量股票的相似性。大多数相似性度量都有以下问题:(a)通常,将时间序列(线性信号)反馈给线性度量(例如协方差,Pearson)以获得相似性。大多数相似性的线性性质无法捕捉股票的非线性动态。(b) 在[4]中,它声称n(一个市场中的股票数量,例如伦敦证券交易所的2033只可交易股票)具有历史意义*这些作者对这项工作作出了同样的贡献通讯作者:xiefei@mail.shufe.edu.cn电子邮件:t。hospedales@ed.ac.uk,永新。yang@arraystream.comdays/需要周数据来估计准确的协方差。然而,过去n天/周的数据不能有效地代表当前市场。(c) 大多数相似性度量不考虑平移(时间)不变性,这对于股票相似性很重要。例如,苹果存货的价格在某一天上涨,然而,苹果供应商的存货价格可能在3天后上涨。为了解决上述问题,我们建议使用深度学习(DL)特征代替原始时间序列进行股票相似性度量。卷积DL方法,如卷积自动编码器(CAE,无监督)[5]和卷积神经网络(CNN,监督)[6],在分析视觉图像方面取得了令人印象深刻的性能。这促使研究人员将其他模式的原始输入信号转换为图像,由CNN或CAE进行处理。这样,在各种应用中都取得了良好的效果。

板凳
可人4 在职认证  发表于 2022-6-1 08:12:06
例如,传统的语音识别方法使用一维信号向量,例如原始输入波形[7,8]。相反,另一种方法是将一维信号转换为光谱图,即图像,以便利用CNN的强度来实现有希望的识别性能[9]。另一个众所周知的例子是,AlphaGo【10】将电路板的位置表示为19×19的图像,该图像被输入CNN用于featurelearning。此外,计算机视觉技术也被应用于判断纸张的质量,并仅从外观计算矩阵的数量。基于相似的动机,我们探索通过合成技术将4通道股票时间序列(当日最低、最高、开盘和收盘价)转换为烛台图,以图像形式呈现价格历史。为了避免昂贵的注释,我们使用合成烛台图像选择无监督CAE进行库存特征学习。因此,本研究的第一个新颖之处是利用深度学习(即CAE)对股票时间序列进行编码。与原始时间序列相比,深入学习的特征可以有效地捕捉(i)非线性股票动力学和语义;(ii)翻译不变性。基于DEP特征的相似性度量可以克服大多数现有度量的上述缺点。此外,我们为投资决策协会(investment decisionsociety)提供了一个新的有价值的信号,即深度特征,其中新的有效信号对于风险对冲非常重要。

报纸
可人4 在职认证  发表于 2022-6-1 08:12:08
虽然一些深度学习模型,如LSTM【13】和RNN【14】已被用于优化投资组合,但它们使用原始时间序列而不是图表作为输入。其次,受动量效应[15]的激励,我们构建了一个新的投资组合生成管道,包括:(1)通过视觉解释价格历史进行深度特征学习,(2)基于对EP特征计算的相似度对股票进行聚类,以提供数据驱动的市场细分,(3)实际投资组合构建。对于视觉表征学习,我们生成数百万个训练图像(合成烛台图),这些图像被馈送到一个用于特征学习的深层Caefo。在下一个集群步骤中,我们的目标是以数据驱动的方式将市场分为不同的部门。这对于通过选择多样化的投资组合来降低风险非常重要【16,17】。利用深度特征计算相似度嵌入包含方法。K-means等流行聚类方法不适用于这里,因为它们是不确定的和/或需要预先确定数量的聚类才能找到。特别是,非确定性方法不为实际金融用户所接受。为了解决这一问题,我们将模块化优化方法(最初为网络社区结构而设计)应用于股票集群。最后,我们通过简单而有效的方法进行投资组合构建,即根据夏普比率在每个集群中选择最佳股票【19】。正如我们将在评估中看到的,这种投资组合选择策略将高回报与低风险相结合。2方法学您的总体投资决策流程包括三个主要模块:深度特征学习、聚类和投资组合构建。对于深度特征学习,将描述股票价格历史的原始4通道时间序列数据转换为标准烛台图。这些图表被输入到深层CAES中,用于视觉特征学习。

地板
mingdashike22 在职认证  发表于 2022-6-1 08:12:11
这些学习到的特征提供了avector嵌入的历史时间序列,该时间序列捕获关键的定量和语义信息。接下来,我们对这些特征进行聚类,以提供数据驱动的市场细分,从而为随后选择多样化投资组合提供支持。许多常见的聚类方法不适用于此,因为它们是不确定的或需要预先定义聚类的数量。因此,我们为此采用模块化优化。请注意,我们的聚类方法中嵌入的股票相似度是使用非线性深度特征计算的。最后,我们通过从每个集群中选择以夏普比率衡量的表现最好的股票来构建投资组合。整个管道如图1所示。以下各节将更详细地讨论每个组件。2.1 CAEsChart编码的深度特征学习为了实现基于股票图表视觉解释的算法组合构建方法,我们需要将原始价格历史数据转换为图像表示。我们每个股票的原始数据是一个4通道。。。3.12, 3.37, ...          7,56, 7.63, ...          ............ClusteringCaecaedrawDraw512D512时间序列。。。最佳组合。1、我方投资决策渠道示意图。CAE的体系结构如图2所示。fvgg1651211222456784512141286433224112562814764643216128avgpoolingour特性图。2、CAE概述。编码器(顶部)-解码器(底部)框架。平均池之后的512D特性为集群和组合构建提供了表示。20天时间序列中的时间序列(当天的最低、最高、开盘和收盘价)。我们使用计算机图形学技术将其转换为烛台图,如图1和图2所示,烛台图表示为RGB图像。

7
能者818 在职认证  发表于 2022-6-1 08:12:15
晶须图描述了四个原始通道,颜色编码描述了股票收盘价是高于开盘价(绿色)还是低于开盘价(红色)。编码的烛台图表图像在20天的窗口内提供一只股票的视觉表示,以便通过我们的深度学习方法进行后续的视觉解释。卷积自动编码器我们的CAE架构如图2所示。它基于地标VGGnetwork【20】,特别是VGG16。VGG网络是最初为视觉识别提出的一种非常成功的架构。为了将其用作CAE编码器,我们从VGG-16中移除了最终的4096D FC层,并将其替换为平均池层,以生成一个512D特征。解码器是一个7层反褶积网络,从784D层开始,该层与512D嵌入层完全连接。接下来的6个采样反褶积层最终根据我们的512Dfeature重建输入。当使用重建目标进行训练时,CAE网络学习以尽可能保留信息的方式将输入图像压缩到512D瓶颈,以便能够重建输入。因此,这个单一的512D向量对股票的20天4通道价格历史进行编码,并将为进一步处理(聚类和组合构建)提供表示。2.2聚类我们下一步的目标是提供一种聚类方法,用于多样化的投资组合选择,从而降低风险。如前所述,许多现有的聚类方法都是不确定的,或者需要指定聚类的数量,这使得它们不适合我们的应用。为了解决这些问题,我们引入网络模块化方法[18]来确定股票的集群结构,其中每个股票被设置为一个节点,每对股票之间的链接被设置为通过我们学习的CAE特征计算的余弦相似性。

8
nandehutu2022 在职认证  发表于 2022-6-1 08:12:17
模块化是指给定组中的链接分数减去链接随机分布时的预期分数。模块化优化[18]最初用于检测网络中的社区结构,最终可以生成集群。具体而言,优化操作在图表上进行(在我们的案例中,整个市场的一个20天历史),并将图表更新为集团股票,以便最终在终止之前实现最大模块化。Thusit不需要特定数量的集群,并且不受初始节点选择的影响。2.3投资组合构建和回溯测试根据所学的股票聚类(市场细分),我们通过挑选多样化但高回报的股票来构建一个完整的投资组合,并对结果进行评估。股票绩效回报(投资收益)定义为rt=(Vf- Vi)/Vi,其中vf和via分别为最终值和初始值。例如,要计算每日股票回报率,VF和Viare分别为今天和昨天的收盘价。我们使用夏普比率(Sharpe ratio)[19]s=r/σr来衡量一只特定股票在一段时期内的表现,其中r是该时期的平均回报,σris是该时期的标准偏差。因此,夏普比率s编码了回报和稳定性的权衡。最大提款(MDD)是衡量特定投资期内从峰值下降的指标:MDD=(Vt- Vp)/Vp,其中Vt和Vp分别表示粗糙值和峰值。每20个交易日进行一次培训和测试,我们将所有股票集中在一起。为了实际构建一个投资组合,我们在每个集群中选择夏普比率最高的股票。然后,我们持有选定的投资组合10天。在接下来的10天里,我们通过计算每个选定股票的“复合回报”来评估投资组合。一个投资组合的总回报是所有选定股票的平均复合回报。

9
mingdashike22 在职认证  发表于 2022-6-1 08:12:21
我们使用10的步幅。投资组合选择和回报计算的过程分别类似于机器学习中的培训和测试过程。由于我们的聚类方法以数据驱动的方式发现股票数量,因此在不同的交易期间,我们可能会有不同数量的聚类。假设我们在一个时期内获得Kclusters,并将选择Kstocks构建一个投资组合。然后,让Q和R分别表示商和余数,在[Q,R]=K/K中:K股票通过(i)从每个kcluster中选取Q个股票,以及(ii)剩余的R个表现最好的股票穿过所有kcluster来挑选。然后,我们将基金的1/K平均分配给每个选定的股票。3个实验首先介绍我们的数据集和实验设置。分析特征学习的输出。最后,我们将整个投资策略(特征提取、聚类、投资组合优化)与备选方案进行了比较。3.1数据集和设置为了进行评估,我们使用了英国《金融时报》证券交易所100指数(FTSE 100)的股票数据,该指数是伦敦证券交易所上市的100家市值最高的公司的股票指数。我们使用2000年1月4日至2017年5月14日期间的所有库存inFTSE 100。股票价格因股票分割、股息和分配而调整。每20天4通道时间序列生成一个标准烛台图。我们总共生成了40万张FTSE100图表。我们CAE的训练图像是烛台图,呈现为224×224图像,以适合我们的VGG16架构【20】。在训练期间,批大小为64,学习率设置为0.001,一旦网络收敛,学习率将以0.1的系数降低。3.2定性结果可视化和理解深层特征将给定股票的一年(2012年)特征串联起来,形成一个新特征。

10
kedemingshi 在职认证  发表于 2022-6-1 08:12:24
图3使用t-分布随机邻域嵌入(t-SNE)[21]方法显示了所有股票的这些特征。一种颜色表示彭博社从图3中定义的一个工业部门,我们可以看到语义相似的股票(工业部门)在所学的特征空间中彼此接近。例如,与材料相关的库存将进行聚类。这说明了我们的CAE和学习功能在捕获股票语义信息方面的有效性。3.3定量结果对于定量评估,我们采用7种评估指标:总回报率、日夏普比率、最大提取率、日/月/年平均回报率和获胜年份。获胜年份表示获胜年份的百分比。“投资组合构建和回溯测试”一节中定义了其他衡量指标。我们选择K=5个股票来构建所有被比较的投资组合。与富时100指数的比较我们执行回溯测试,将我们的完整投资组合优化策略与市场基准(富时100指数)进行比较。在图4中,我们与富时100指数进行了比较。图4(a)显示了长期交易期(4K交易日,2000年1月31日至2016年10月6日)的比较,显示了我们策略的整体有效性。请注意,基金很难在很长一段时间内持续跑赢大盘指数。FTSE 100 CAE特征的t-SNE可视化。一种颜色表示一个工业部门。右边的股票都来自行业材料:RRS。L(Randgold资源有限公司),FRES。L(Fresnillo PLC),安托邦。L(安托法加斯塔股份有限公司),BLT。L(必和必拓有限公司),AAL。L(英美资源集团),里约。L(力拓集团),KAZ。L(KAZ Minerals),EVR。L(EVRAZ PLC)图4。我们的投资组合与富时100指数相比,反映了市场变化的复杂性和多样性。在图中。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-30 08:03