楼主: 大多数88
332 19

[量化金融] 电子商务中数据驱动学习的特点与挑战 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

68%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
63.2098
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23514 点
帖子
3880
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Idiosyncrasies and challenges of data driven learning in electronic
  trading》
---
作者:
Vangelis Bacoyannis, Vacslav Glukhov, Tom Jin, Jonathan Kochems, Doo
  Re Song
---
最新提交年份:
2018
---
英文摘要:
  We outline the idiosyncrasies of neural information processing and machine learning in quantitative finance. We also present some of the approaches we take towards solving the fundamental challenges we face.
---
中文摘要:
我们概述了定量金融中神经信息处理和机器学习的特点。我们还介绍了我们为解决我们面临的根本挑战而采取的一些方法。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--
一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--

---
PDF下载:
--> Idiosyncrasies_and_challenges_of_data_driven_learning_in_electronic_trading.pdf (363.71 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:电子商务 学习的 Quantitative Applications QUANTITATIV

沙发
可人4 在职认证  发表于 2022-6-11 04:48:41 |只看作者 |坛友微信交流群
电子交易中数据驱动学习的特点和挑战。bacoyannis@jpmorgan.com瓦茨拉夫。glukhov@jpmorgan.comTomJin Jonathan Kochemstom。jin@jpmorgan.com乔纳森。一kochems@jpmorgan.comDoo关于Songdoore。song@jpmorgan.comAbstracting在定量融资方面。我们还介绍了为解决我们面临的根本挑战而采取的一些方法。1简介养老基金和其他资产管理公司持有的金融工具投资组合经历了周期性的平衡,有时甚至是激进的平衡。代理电子交易,一种由经纪人提供的服务,如大型投资组合转换,将传回给客户,并反过来传递给这些投资组合的最终利益——教师、医生、拳击手、政府雇员、工人、对冲基金运营商等。资产交易的全球化,超快信息技术和lightningfast通信的出现,使得人类无法在常规的低水平决策过程中进行有效竞争。如今,大多数股票和电子期货合约的微观交易决策都是通过算法做出的:它们定义了在哪里交易、以什么价格和数量。图1中是正在运行的算法的一个示例。鉴于其总体投资和执行目标,客户通常会向执行经纪人发送带有约束和偏好的特定指令。仅举几个例子,客户可能希望在其投资组合转换中保持货币中立,以便沙特的金额大致等于购买的金额。客户还可以表达其风险偏好,并指定已执行的一篮子证券以受控方式暴露于某些部门、国家或行业。

使用道具

藤椅
能者818 在职认证  发表于 2022-6-11 04:48:44 |只看作者 |坛友微信交流群
对于单笔订单执行,客户可能希望控制订单执行如何影响市场价格(控制市场影响),或控制订单如何面临市场波动(控制风险),或指定紧急程度以最佳平衡市场影响和风险。本材料由摩根大通的EMEA电子阅读定量解决方案团队编制。意见和估计构成我们截至本材料日期的判断,仅供参考,如有更改,恕不另行通知。摩根大通证券有限公司及其附属公司和/或子公司(统称摩根大通)均不保证其完整性或准确性。本材料并非摩根大通研究部门的产品,因此,未按照促进研究独立性的法律要求编制,包括但不限于禁止交易和传播投资研究。这不是一份研究报告,也不打算这样做。本材料不作为购买或销售任何金融产品或服务的研究、建议、建议、要约或招揽,也不以任何方式用于评估参与任何交易的优点。请咨询您自己的顾问,了解法律、税务、会计或任何其他方面,包括您特定情况下的适用性影响。J、 P.Morgandisclaims对此处信息的质量、准确性或完整性,以及对本材料的任何依赖或以任何方式使用,承担任何责任或义务。重要信息披露请访问:www.jpmorgan。com/披露。c2018 JPMorgan Chase&Co.保留所有权利。NIPS 2018金融服务业人工智能挑战与机遇研讨会:公平、可解释性、准确性和隐私的影响,加拿大蒙特勒尔。

使用道具

板凳
大多数88 在职认证  发表于 2022-6-11 04:48:47 |只看作者 |坛友微信交流群
这是一份非档案出版物-作者可以将本文的修订和扩展提交给其他出版物。arXiv:1811.09549v2【q-fin.TR】2018年11月30日橙色:买入和卖出市场价格,圆圈-订单,以满足这些多方面且有时会冲突的目标电子交易算法在多个粒度级别上运行。市场分析和定量模型为各级决策提供了信息。传统上,电子交易算法是一种启发式算法和启发式算法的混合体,它们表达了实际经验、观察结果和人类交易者的偏好,并遭受“特征爬行”的折磨,最终积累了多层逻辑、参数和调整来处理特殊情况。金融服务业受到严格监管。在一些地区有非常特殊的要求,如欧洲、中东和非洲地区的“最佳执行”概念【欧洲证券和市场管理局,2014年】,是电子交易业务应用的效率。金融业。我们提出了电子交易中出现的实际挑战和特质,希望能对学术研究人员有所启发。2定量金融中以数据为中心的应用的三种文化在本节中,我们首先遵循Peter Norvig在Norvig研究人员领域中提出的论点,然后进一步阐述。2.1数据建模文化这种文化的特点是相信自然(和金融市场)可以被描述为定量金融的一项任务,即为生成的数据找到一个合理的函数近似值,必然捕获环境的所有基本属性。有人可能会说,简单的modelsofte会给人一种错误的确定感,因此很容易失败。2.2机器学习文化金融市场很简单。

使用道具

报纸
可人4 在职认证  发表于 2022-6-11 04:48:50 |只看作者 |坛友微信交流群
我们有充分的理由怀疑事实并非如此:从经验上看,金融世界看起来更像达尔文式而非牛顿式:它在不断演变,观察到的过程输出被反馈到决策过程中。复杂的模型也容易失败:模型失败的风险随着其复杂性的增加而增加。2.3算法决策文化我们的重点是决策,而不是模型构建。我们绕过了学习“世界如何运转”的阶段,直接开始培训电子代理,以区分好决策和坏决策。这种方法带来的挑战在于我们理解和解释算法代理所做决策的能力,理解其策略的意义,以及能够形成算法决策文化。代理了解到某些行为是不好的,因为它们会导致负面结果(se中的malum)。但我们仍然必须注入价值观、规则和约束,引导代理人远离我们认为被禁止的行为(malum prohibitum),但代理人无法从其环境和历史中学习这些行为。在本文中,我们在一个强化学习的实际应用中展示了agent的约束和奖励之间的相互作用。我们还将概述特定的挑战,以及我们如何使用计算资源和跨多个行业和学术界的其他AI团队的许多成就来应对这些挑战。3从低到高维度再回到3.1高层次决策从非常高的层次来看,很明显,对于每个订单,都有一个最佳的执行率或执行时间表,即订单执行的速度,或其在市场上的执行时间。而且在正常情况下可能会非常昂贵。

使用道具

地板
能者818 在职认证  发表于 2022-6-11 04:48:53 |只看作者 |坛友微信交流群
这种执行很可能会影响市场价格。另一方面,如果以非常缓慢的速度执行子订单,则母订单几乎不会对市场施加压力。这样的执行也是不合理的,因为没有一个客户对未受干扰的市场价格违背订单的可能性不敏感(买入订单上涨,卖出订单下跌)。执行时间越长,市场价格违背客户最佳利益的可能性越高,即风险越高。通过对这两种极限情况的简单考虑,很容易看出,必须有一个最优执行率或最优执行时间表。也很容易看出客户的偏好和容忍度是如何发挥作用的:效率取决于客户对市场影响的容忍度和风险偏好。这是一个在不确定性条件下由高级分析和定量模型进行高级决策的例子。这也说明了我们在电子交易和定量金融中经常发现和重新发现的一个重要事实:没有解决方案,只有权衡。3.2低层决策一旦找到粗略的最优速率或进度,下一层决策将处理进度的实施。为了按时完成任务,经纪人通常会尝试与市场的其他人融为一体:作为一个局外人会受到惩罚,因为这揭示了经纪人的意图。代理创建的市场订单在规模和价格上都模仿其他参与者的订单。正是在这里,我们发现了维度爆炸。描述限价指令簿的市场状态是一个变维高维问题。每个价格水平是来自不同市场参与者的不同规模订单的队列。更深层次的订单和遥远的投机水平。

使用道具

7
kedemingshi 在职认证  发表于 2022-6-11 04:48:56 |只看作者 |坛友微信交流群
随着交易的发生,订单的接收和撤回,订单簿不断变化。每一个观察到的市场状态都可能演变为几乎无限数量的其他市场状态。在这种环境下,即使是在最基本的层面上考虑可行的决策集,以及下多少订单,如果需要,以不同的价格下多个订单,或者在我们已经有订单的情况下,以其他价格下订单。如果订单价格与市场价格不符,则订单将不确定地保留在账面上,直到价格达到该点为止,如果价格达到该点。这一行动空间必然是动态和复杂的,因为深入下订单对于实现价格提升是必要的,并且订单逐渐被订单簿中的价格-时间优先级填满。根据可用的执行场所,最后一个复杂的问题是可能有多个合适的交易场所和订单类型。一盘棋大约有40步长。围棋大约有200步长。如果国际象棋或围棋的频率为中等,则在合格棋子中移动一个棋子,并按棋子移动。对于电子交易,动作是子订单的集合:它由多个具有不同特征的并发订单组成:价格、大小、订单类型等。例如,一个动作可以同时提交被动购买订单和主动购买订单。被动的儿童秩序将停留在一个行动中。由此产生的动作空间非常大,并且随着我们希望在某一时刻使用的特征组合的数量呈指数增长。目前还不完全清楚如何确定每个行动的效率。可以说,电子交易代理的决策效率和最佳性可以体现在发现和捕捉机会(“好”交易)以及避免陷阱(“坏”交易)方面。

使用道具

8
kedemingshi 在职认证  发表于 2022-6-11 04:48:59 |只看作者 |坛友微信交流群
这种细粒度定义的问题不仅在于许多机会都是短暂的,而且可能只存在于微秒级。更重要的是,只有在交易执行(或避免)很久之后,才能确定交易的好坏。现在可能被认为是一笔糟糕的交易,但最终可能会成为一笔出色的交易。从这个意义上说,我们对探索和重新定义什么是机会感兴趣,就像我们对如何行动感兴趣一样。我们将电子交易的这一独特方面称为非本地最优。代理商的一个可能(但不一定是唯一的或最好的)全球目标是其与其他市场融合的能力。如果是这种情况,可以使用奖励函数来实现相对于批量加权平均价格的最佳执行价格。该策略必须在交易速度过快和价格变动带来的市场影响与市场风险之间找到平衡,这一问题的根源在于以适合于t模型的方式封装状态信息和行动空间,并使用机器学习方法。这涉及到总结模型输入未完成子订单的市场状态。然后选择响应中数量可变的操作之一。3.3前期工作这一领域的现有工作有一个有趣的广度,通常涉及该问题的各个方面。一些工作包括在小维度环境中进行强化学习的先前设置,而其他工作则考虑用简洁固定的维度Manner表示数据。Akbarzadeh等人【2018年】着眼于这一问题,以执行在线学习来驱动算法。然而,业绩受到仅下达市场订单的限制。Nevmyvaka等人。

使用道具

9
大多数88 在职认证  发表于 2022-6-11 04:49:02 |只看作者 |坛友微信交流群
【2006年】定义了一个完整的强化学习问题,但这受到了一个行动空间的严重限制,该空间允许单一订单,其中新订单取消旧订单。Zhang等人【2018年】将限额订单汇总为40维向量,包含价差两侧10个价格水平的价格和数量信息。该信息基于前一天的交易进行正常化处理,并用于预测市场走势。Doering等人【2017】进一步设计了4个矩阵,其中包含订单簿、交易、新订单和订单取消,代价是维度翻两番,并使用了特别稀疏的数据。未来的研究方向主要是继续研究和开发tradingencapsulate,尽可能多地收集有关当前市场和现有订单状态的信息,这两者都需要高度可变维度数据的固定维度表示。现有方法简化订单管理流程,假设有固定数量的未完成子订单,价格独特,与人类交易员可用的操作相比,限制过度。3.4我们的方法的纳米描述我们现在正在运行第二代基于RL的限价订单投放引擎。我们成功地训练了行动空间有界的策略。为了解决我们刚才描述的问题,我们使用分层学习和多代理培训,利用领域知识。我们针对奖励、步骤和时间范围特征不同的本地短期目标,培训本地政策(例如,如何下积极订单与如何下被动订单)。

使用道具

10
何人来此 在职认证  发表于 2022-6-11 04:49:05 |只看作者 |坛友微信交流群
然后将这些地方政策结合起来,然后再学习如何将地方政策结合起来。我们还认为,反向强化学习非常有前景:利用金融市场上人力和algo政策的巨大历史,以建立本地奖励是一个活跃的研究领域。4电子交易人工智能开发中的政策学习之外4.1政策学习算法RL的核心目标是最大化接近真实业务目标的总回报。针对这一目标优化参数化行动策略的策略学习算法一直是RL研究的主要焦点。最近的研究将著名的政策学习算法应用于电子交易业务【Akbarzadeh等人,2018年】【Nevmyvaka等人,2006年】。我们想介绍RL的其他方面,这些方面超出了策略学习算法的能力。4.2分层决策人工智能在电子交易中的实际应用通常具有时间跨度长的特点。客户订单需要几分钟甚至几小时(有时几天),而代理商需要做出的决策远远低于充分整合所有可用的市场动态信息所需的决策。此外,agent的决策是时间不均匀的。它不是由时钟驱动,而是对自身行为的影响以及环境的重大变化作出反应。因此,RL中的时间抽象成为处理长时间视界和时间不均匀性的关键问题。跳帧的比喻——每几个时间步只做一次决策——可能在这里不适用。Semi-MDP(sMDP)是发现RL代理的时间抽象行为的一个重要方法【Sutton等人,1999年】。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-29 11:21