楼主: mingdashike22
843 19

[量化金融] 评估机器学习算法在金融领域的性能 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
73.8216
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24862 点
帖子
4109
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
mingdashike22 在职认证  发表于 2022-6-24 05:02:29 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Evaluating the Performance of Machine Learning Algorithms in Financial
  Market Forecasting: A Comprehensive Survey》
---
作者:
Lukas Ryll and Sebastian Seidens
---
最新提交年份:
2019
---
英文摘要:
  With increasing competition and pace in the financial markets, robust forecasting methods are becoming more and more valuable to investors. While machine learning algorithms offer a proven way of modeling non-linearities in time series, their advantages against common stochastic models in the domain of financial market prediction are largely based on limited empirical results. The same holds true for determining advantages of certain machine learning architectures against others. This study surveys more than 150 related articles on applying machine learning to financial market forecasting. Based on a comprehensive literature review, we build a table across seven main parameters describing the experiments conducted in these studies. Through listing and classifying different algorithms, we also introduce a simple, standardized syntax for textually representing machine learning algorithms. Based on performance metrics gathered from papers included in the survey, we further conduct rank analyses to assess the comparative performance of different algorithm classes. Our analysis shows that machine learning algorithms tend to outperform most traditional stochastic methods in financial market forecasting. We further find evidence that, on average, recurrent neural networks outperform feed forward neural networks as well as support vector machines which implies the existence of exploitable temporal dependencies in financial time series across multiple asset classes and geographies.
---
中文摘要:
随着金融市场竞争的加剧和步伐的加快,稳健的预测方法对投资者来说越来越有价值。虽然机器学习算法为时间序列中的非线性建模提供了一种行之有效的方法,但它们在金融市场预测领域相对于常见随机模型的优势主要基于有限的经验结果。确定某些机器学习体系结构相对于其他体系结构的优势也是如此。本研究调查了150多篇将机器学习应用于金融市场预测的相关文章。在综合文献回顾的基础上,我们构建了一个包含七个主要参数的表格,描述了这些研究中进行的实验。通过列出和分类不同的算法,我们还介绍了一种简单、标准的语法,用于以文本形式表示机器学习算法。基于从调查中包含的论文中收集的性能指标,我们进一步进行排名分析,以评估不同算法类的比较性能。我们的分析表明,在金融市场预测中,机器学习算法往往优于大多数传统的随机方法。我们进一步发现,平均而言,递归神经网络的表现优于前馈神经网络和支持向量机,这意味着跨多个资产类别和地理位置的金融时间序列中存在可利用的时间依赖性。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--

---
PDF下载:
--> Evaluating_the_Performance_of_Machine_Learning_Algorithms_in_Financial_Market_Fo.pdf (379.17 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习算法 学习算法 金融领域 机器学习 Architecture

沙发
kedemingshi 在职认证  发表于 2022-6-24 05:02:34
评估机器学习算法在金融市场预测中的性能:剑桥大学替代金融中心,UKlr487@cam.ac.ukSebastian塞登·萨利安兹(SeidensAllianz)捐赠了德国瓦伦达(Vallendar)奥托·贝希姆管理学院(FinanceWHU-OttoBeisheim School of Managements)财务主席塞巴斯蒂安(Germanysebastian)。seidens@whu.eduAbstract-随着金融市场竞争的加剧和步伐的加快,稳健的预测方法对投资者来说越来越有价值。虽然机器学习算法提供了一种行之有效的时间序列非线性建模方法,但它们在金融市场预测领域相对于常见随机模型的优势主要基于有限的经验结果。确定某些机器学习体系结构相对于其他体系结构的优势也是如此。本研究调查了150多篇将机器学习应用于金融市场预测的相关文章。在综合文献回顾的基础上,我们构建了一个包含七个主要参数的表格,描述了这些研究中进行的实验。通过列出不同的算法并对其进行分类,我们还介绍了一种简单、标准化的语法来表示机器学习算法。根据从调查论文中收集的性能指标,我们进一步进行排名分析,以评估不同算法类的比较性能。我们的分析表明,在金融市场预测中,机器学习算法往往优于大多数传统的随机方法。

藤椅
何人来此 在职认证  发表于 2022-6-24 05:02:37
我们进一步发现,平均而言,递归神经网络优于前馈神经网络和支持向量机,这意味着跨多个资产类别和地理位置的金融时间序列中存在可扩展的时间依赖性。指数术语机器学习、时间序列预测、金融工程、人工神经网络、金融技术、金融市场、文献综述、排名分析。简介自资本市场诞生之初,投资者就试图获得相对于其他市场参与者的竞争优势,能够准确预测时间序列无疑是市场参与者一直感兴趣的话题。鉴于可用数据源的增长和投资者之间的互联性不断增强,快速高效的决策变得比以往任何时候都更加重要。

板凳
kedemingshi 在职认证  发表于 2022-6-24 05:02:40
机器学习算法提供了逼近非线性函数、处理噪声、非平稳数据和发现数据集中潜在模式的能力。随着机器学习在过去十年中取得的进步,最显著的是解决了梯度流所产生的问题,梯度流使递归网络不切实际[40],[67],以及在GPU上使用张量运算进行高效计算的显著进步,机器学习算法为金融时间序列预测提供了一个极具吸引力的选择。然而,尽管机器学习在金融业中的重要性快速增长,但该领域的学术整合和标准化程度仍然相对较低。尽管在20世纪末和21世纪初这一研究领域内发表的论文数量不断增加,但目前的文献未能对不同的算法及其各自的发现进行令人信服的分析。因此,我们的研究对现有交易算法的研究进行了全面、系统的回顾,以结束这一当代研究的空白。除了概述机器学习在金融市场中应用的研究进展外,本文还提出并证实了基于秩分析的某些类别算法性能的稳健假设。为了通过directapplication对不同的机器学习模型进行比较,必须从不同交易所汇编大量数据,并实施各种不同的交易策略。

报纸
可人4 在职认证  发表于 2022-6-24 05:02:42
通过从不同的实验方法中收集大量样本,我们的研究避免了作者使用不同的财务接口和数据集所产生的偏见,因此,我们的研究收敛到了真实的算法类之间的差异。在秩分析方面,我们的主要研究假设是,机器学习算法能够捕获时间序列中重复出现的非线性模式,因此能够提供比随机模型更好的预测性能。由于大多数现代有监督机器学习算法都是使用交叉验证进行训练的,因此产生的预测结果保持平滑,即具有足够的泛化性,以避免过度拟合训练数据集,同时仍考虑到非线性。考虑到递归机器学习算法在时间序列预测中对时间动力学(即时间序列中的长期依赖性)建模的潜力,我们进一步期望其在时间序列预测中的系统性能优于纯前馈模型。本文的其余部分组织如下。第二节简要介绍了金融市场预测中的机器学习,第三节回顾了该领域调查和元研究的现有文献。第四节概述了研究方法,并提供了数据集的汇总统计数据。第五节介绍了我们在衡量标准、市场和时间方面的分析结果。最后,第二节总结并提出了未来研究的一些挑战,然后是研究表。二、《金融时报》系列预测中的机器学习虽然在当代文献中机器学习这个术语在某种程度上仍不明确,但它可以被广泛地称为一个系统与其环境交互的过程,系统的结构会发生变化,而这个交互过程本身也会随着结构的变化而发生变化。

地板
大多数88 在职认证  发表于 2022-6-24 05:02:45
这是对【119】提出的定义的简化修改,该定义被【66】应用于神经网络的概念。在这个高级定理中,有三个主要的学习范式,每个范式在金融时间序列预测中有不同的应用领域。监督学习用于具有输入和标记目标的adataset可用的预测任务。例如,这可能需要使用技术市场指标来预测第二天的股价是上涨(1)还是下跌(0)(二元分类)。除了分类之外,监督学习算法还可以执行回归任务,即预测连续值而不是类标签。以上面的股价为例,这将转化为预测实际股价或回报,而不是给投资者和输家贴标签。根据预测或分类的结果,有几种财务接口选择,包括在多资产分类/预测任务中构建投资组合【155】、系统计时策略【157】或简单的单资产购买和持有策略(可在我们调查的大多数研究中找到)。无监督学习算法通常是为在监督学习之前的任务而设计的,例如聚类或降维。例如,无监督学习算法可以根据股票输入特征的相似性对股票进行聚类。由此产生的聚类可以进一步用于监督分类[70]。强化学习与前面提到的两种范式截然不同,因为它基于动作反应模型。强化学习算法学习某些能够最大化预期回报的行动策略。因此,它们非常适用于明确规定了行动和奖励的环境,如棋盘游戏。

7
何人来此 在职认证  发表于 2022-6-24 05:02:49
强化学习过程通常基于一个价值函数,该函数表示在系统当前状态下采取的行动的预期回报。在股市预测中,找到一个合适的价值函数是一个重大挑战,这就是为什么提出了其他方法,例如使用差分度量优化目标进行直接强化[122]。在过去二十年中,机器学习算法在金融时间序列中的应用已被众多作者所涵盖。基于最简单的多层感知器,最先进的深度学习算法已经进化为通过三种当前的神经结构捕捉时间动态,特别是门控神经元设计,允许捕捉时间序列中的长期依赖性(例如,长-短期记忆(LSTM)[67])。然而,尽管机器学习技术非常适合各种近似任务,但它们代表了所谓的“黑箱”模型,这意味着它们的输出行为无法得到充分的解释。在在线学习环境中,这一特性意味着缺乏决策透明度,这对于解释单个模型输出至关重要。这一特征在异常市场波动的情况下尤为重要,因为异常事件的预测误差可能会急剧增加。因此,金融机器学习研究的标准化和透明性对于说明资产和算法类之间的变化行为至关重要。三、 文献如上所述,虽然现有研究涵盖各种不同的算法、输入和概念,但很少有研究尝试系统地回顾和比较现有作品。[7] 提供一个软计算方法列表(包括机器学习、进化计算和模糊逻辑),这些方法在各种贸易算法研究论文中使用。

8
kedemingshi 在职认证  发表于 2022-6-24 05:02:51
由于分析范围有限,他们的研究在很大程度上是一种被动参考。虽然他们认为软计算算法代表了一种可行的股票预测方法,但他们也指出“[…]定义模型结构时会出现差异(隐藏层、神经元等)。就目前而言,模型的结构是一个反复试验的过程。”。[19]提供了一个高度全面的视角,简要概述了计算智能在2009-2015年金融数据研究中的应用。除了调查之外,本文还建立了构建这些算法的标准化框架。[9] 给出了类似的结果,得出的结论是,人工智能算法通常比可比较的统计方法具有更高的准确性。尽管如此,他的研究否认了绝对规模上表现优异的证据。我们的研究通过等级分析解决了这一疑问,并找到了机器学习优于传统随机模型的重要证据。机器学习交易算法的实用方法研究偶尔会在其特定参数范围内提供比较数据(例如,在[79]的情况下,这是由带有新闻情感输入的文本挖掘算法给出的)。四、 研究方法学。荟萃分析我们使用荟萃分析技术进行调查。【58】将荟萃分析定义为对个体研究的大量结果进行统计分析,以整合研究结果。【145】提出了类似的定义,他指出,元分析是一组定量技术,用于评估和组合不同研究的实证结果。

9
大多数88 在职认证  发表于 2022-6-24 05:02:55
该技术最初设计用于健康科学、营销或教育领域【43】,现在越来越多地应用于经济学和金融领域,其中元分析通常被称为元回归分析【75】、【153】、【154】。由于我们样本中各亚组的异质性(即通过研究进行的个别实验),基于亚组参数比较做出假设的参数方法是不可行的。对于试图找到影响绩效的因素也是如此:缺乏标准化测试指标、标准测试数据集以及优化算法和权重初始化的研究特定信息,使得无法形成有意义的元回归分析。下一小节将进一步详细介绍这些方面。相反,我们追求的是一种基于子组实验中算法类的相对排名来评估算法类的方法。虽然这种方法在总体水平上仍然缺乏详尽的解释力,但基于相同评分系统的成对秩分析揭示了算法类之间有意义的性能差异。B、 Meta Statistics我们的数据收集程序包括260篇论文的初始未过滤收集。这些论文最初来自谷歌学者和SciVerse Science Direct。对于这些来源,我们选择了前50篇最相关的论文,这些论文列在“人工智能+金融预测”、“机器学习+交易”和“市场预测+人工智能”等关键术语下。随后,我们从这些结果中收集相关参考文献,将其添加到收集中并删除重复项,这一过程于2018年8月完成。

10
mingdashike22 在职认证  发表于 2022-6-24 05:02:58
之后我们筛选了不符合我们自定指导原则的超科学论文:1)论文/报告展示了机器学习算法在预测或支持基于公开交易资产价格的时间序列的交易决策方面的应用2)论文/报告提供了足够的数值性能结果3)论文/报告已在同行评议或在同行评议会议上,这一程序留给我们总共170篇论文要纳入我们的分析。从这些论文中,我们从225个单独的实验中提取了总共2085个性能值(每个不同的资产有一个实验,其中有多个算法测试),我们将其用于后续的排名分析。C、 数据集1)资产:我们数据集中的研究共包括11种不同的资产类别(股票、指数、外汇、ETF、共同基金、商品、期货、期权、加密、债券、货币市场工具)。在研究表中,资产类别在所用特定资产后的括号中表示。Ifa研究显示了多个资产,它们用avertical bar分隔。此外,如果distinctgroup的资产数量(例如,“股票”)超过3,则不会按名称逐项列出。2) 市场地理:本节分析了本文所用资产类别的市场地理。对于FXrates,我们分别指出与这两种货币相关的地理位置。为清楚起见,我们没有列出超过三个不同国家的地理项目。表一:按地理位置和国家/地区分析频率最高的市场国家/地区美国75台湾19印度12日本10韩国10中国9巴西6土耳其6德国5新加坡53)时段:输入数据代表个别研究中使用的数据时段(包括培训/测试数据集),时间步长频率在括号中表示。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-22 01:30