楼主: 能者818
567 24

[量化金融] 在线参数修正的最优交易 [推广有奖]

  • 0关注
  • 6粉丝

会员

学术权威

79%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
34.6088
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24952 点
帖子
4198
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Optimal trading with online parameters revisions》
---
作者:
N Baradel (CEREMADE, CREST), B Bouchard (CEREMADE), Ngoc Minh Dang
---
最新提交年份:
2016
---
英文摘要:
  The aim of this paper is to explain how parameters adjustments can be integrated in the design or the control of automates of trading. Typically, we are interested by the online estimation of the market impacts generated by robots or single orders, and how they/the controller should react in an optimal way to the informations generated by the observation of the realized impacts. This can be formulated as an optimal impulse control problem with unknown parameters, on which a prior is given. We explain how a mix of the classical Bayesian updating rule and of optimal control techniques allows one to derive the dynamic programming equation satisfied by the corresponding value function, from which the optimal policy can be inferred. We provide an example of convergent finite difference scheme and consider typical examples of applications.
---
中文摘要:
本文的目的是解释如何将参数调整整合到交易自动化的设计或控制中。通常,我们对机器人或单个订单产生的市场影响的在线估计感兴趣,以及机器人/控制器应如何以最佳方式对观察到的影响产生的信息作出反应。这可以表述为一个具有未知参数的最优脉冲控制问题,在此问题上给出了先验知识。我们解释了如何将经典的贝叶斯更新规则和最优控制技术相结合,推导出相应的值函数所满足的动态规划方程,从中可以推断出最优策略。我们提供了一个收敛有限差分格式的例子,并考虑了典型的应用实例。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Computational Finance        计算金融学
分类描述:Computational methods, including Monte Carlo, PDE, lattice and other numerical methods with applications to financial modeling
计算方法,包括蒙特卡罗,偏微分方程,格子和其他数值方法,并应用于金融建模
--
一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--

---
PDF下载:
--> Optimal_trading_with_online_parameters_revisions.pdf (2.85 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Quantitative Applications Application Computation QUANTITATIV

沙发
kedemingshi 在职认证  发表于 2022-5-11 05:59:20 |只看作者 |坛友微信交流群
在线参数修正的最优交易。巴拉代尔*, B.Bouchard+,N.M.Dang2018年10月8日摘要本文旨在解释如何将参数调整整合到交易自动化的设计或控制中。通常,我们对机器人或单个订单产生的市场影响的在线估计感兴趣,以及机器人/控制器应如何以最佳方式对观察到的影响产生的信息作出反应。这可以表述为一个具有未知参数的最优脉冲控制问题,在该问题上给出了先验知识。我们解释了经典贝叶斯更新规则和最优控制技术的结合如何使我们能够导出由相应的值函数满足的动态规划方程,从中可以推断出最优策略。我们提供了一个收敛有限差分方案的示例,并考虑了典型的应用示例。关键词:最优交易,市场影响,不确定性,贝叶斯滤波。1简介交易算法的设计基于两个基石:首先需要估计模型,其次必须根据规定的标准计算最佳交易策略。与传统的投资组合管理一样,波动性或相关性的概念起着重要作用,需要进行估计。在订单簿的层面上,人们还可能对订单的到达/取消速度等感兴趣。这些指的是外生动力的概念,可以从中推断,参考文献请参见例[3,13,22],并可能通过使用传统过滤技术进行调整,参见例。

使用道具

藤椅
kedemingshi 在职认证  发表于 2022-5-11 05:59:22 |只看作者 |坛友微信交流群
[7, 14].更重要的是,交易机器人对交易资产的动态有自己的影响,要么是因为高频水平的市场微观结构效应,要么是因为相对于所谓的市场交易量而言,交易量是不可忽视的,参见[9,21]*ENSAE ParisTech,CREST,巴黎多芬大学,巴黎理工研究大学,CNRS,UMR[7534],Ceremake,75016巴黎,法国。+巴黎多芬大学(UniversitéParis Dauphine),巴黎理工大学(PSL Research University),CNRS,UMR【7534】,Ceremede,75016 Paris,France。这项研究得到了“贸易和投资战略”研究计划、开普勒·切夫勒和法国学院的支持法国巴黎开普勒-切夫勒大道112号,邮编75116。调查以及[10]最近的参考文献。了解这种影响至关重要。然而,与其他市场参数不同,它只能在算法实际运行时观察到,无法进行o形线估计。事实上,控制者面临着一个典型的两难境地:他是应该推动系统(传递订单)立即获得更多信息,以避免可能的即时损失,还是应该尝试最大化他当前的预期回报,冒着不为未来学习的风险?在任何情况下,最优交易政策都必须考虑到这样一个事实:随着机器人对系统的影响被揭示出来,对影响参数的了解将随着时间的推移而发展,并且其价值的不确定性是风险的来源。分析这种情况的一种方法是使用[19,20]的多臂bandit递归学习方法。通过向系统发送连续的脉冲,人们增加了对响应函数真实分布的了解。它提供渐近最优策略。它的主要优点是不需要模型。

使用道具

板凳
kedemingshi 在职认证  发表于 2022-5-11 05:59:26 |只看作者 |坛友微信交流群
另一方面,它需要(弱)遍历类型条件,如果价格/账面订单实际受到影响,则几乎不可能满足这些条件。此外,订单的全球流动不是最优的,它只在长期内开始最优。在本文中,我们建议使用经典的贝叶斯方法,参见例[15]中的一般参考文献。[1]在最优交易的背景下,在不同且非常特殊的框架(趋势估计)中已经提出了类似的想法。在这种方法中,我们根据参数的真实值确定先验分布。当一个新的交易后信息到达时,该分布将根据贝叶斯规则进行更新,以提供一个后验分布,该分布将被用作下一(一组)交易的新先验。从理论上讲,这可以解决相当普遍的无模型最优控制问题,即未知参数可以是响应函数的整个分布。尽管如此,后验分布仍将由前验分布主导。如果真实分布不是,估计序列就不能收敛到它。此外,在实践中,计算时间限制将迫使人们限制为一类参数化分布,从而将空间缩减为小维空间。因此,需要选择一组可能的模型。我们的程序只会揭示在给定的框架下,参数最有可能的值。在实践中,从业者已经使用了不同类别的模型,但参数很难以自动的方式进行大规模估计,并根据时间和市场条件进行演变。从这个角度来看,我们相信我们的方法能够有效地解决他们的评估问题。有两种方法可以考虑这种更新机制。

使用道具

报纸
大多数88 在职认证  发表于 2022-5-11 05:59:29 |只看作者 |坛友微信交流群
一个是,它允许人们在以最佳方式行事的同时估计参数的真实值。这是在[15]中提出的观点,他为离散时间有限视界模型提供了条件,以确保后验法则在真实参数值下收敛于狄拉克质量。显然,这需要识别条件,因为我们只能沿着最优策略以及一些遍历条件观察对系统的影响。另一种观点是,在解决与初始先验知识相关的最优控制问题时,它实际上自动脱离了动态规划的考虑。我们在这里关注第二个观点:给定一个关于真实参数的先验知识,我们应该如何以最佳方式行事?毕竟,我们希望在给定先验知识的情况下是最优的,而不是在系统上采取行动,只是为了重新定义先验知识,如果这不是最优的。显然,如果该算法必须在同一市场上重复使用,且市场条件稳定,则运行该算法后获得的后验概率分布可作为下一次推出该算法时使用的新的、更精确的先验概率。dirac分布的收敛性问题留待以后研究。同样,这更符合学术兴趣。这里我们考虑[4]中介绍的一般抽象形式主义,其目的是适用于实践中使用的大多数模型。特别是,我们可以在元指令级(智能例程的控制)或单指令级(智能例程的设计或调度)工作。在第一种情况下,我们对已经给出的机器人的最优控制感兴趣,这类似于[8]。我们只观察机器人停止后的全球影响。第二种情况涉及机器人本身的设计,例如[2,16,19,20]。一个典型的问题是,一个命令应该是被动的还是主动的。

使用道具

地板
何人来此 在职认证  发表于 2022-5-11 05:59:33 |只看作者 |坛友微信交流群
当一个激进的订单被发布时,我们可能会立即观察到影响(除非是小规模的)。对于(一组)限价单,如果它们在被取消之前,我们推断它们的执行速度。交易平台的选择可以用类似的方法来解决,等等。本文的其余部分组织如下。在介绍了[4]的一般框架之后,我们给出了它们的主要特征:价值函数是一个拟变分偏微分方程的解,从中可以推断出最优交易策略。然后我们解释如何用数值方法求解这个方程。这一点可以通过从文献中提取的玩具模型加以说明,并在此基础上提供了基于模拟的优化策略。2抽象框架在考虑典型的应用示例之前,我们在这里介绍了配套论文[4]中提出的抽象框架。我们认为,它足够灵活,适用于实践中遇到的大多数问题。我们通过d维布朗运动W(定义在具有维纳测度P的正则空间C([0,T],Rd)上)对驱动噪声进行建模。我们也可以考虑跳跃型过程,比如复合泊松过程,同样的分析也适用。未知参数Γ由(波兰)空间(U,B(U))支持,并且我们的初始prioronΓ被假定属于U上的Borel概率测度集(具有弱收敛拓扑)的局部紧子集M。在第4节的应用中,可以将可能的先验集合识别为有限维空间的子集(例如高斯分布的参数、具有有限支持度的定律权重等)。

使用道具

7
大多数88 在职认证  发表于 2022-5-11 05:59:36 |只看作者 |坛友微信交流群
那么,M可以简单地看作是一个有限维空间。为了在衡量交易对系统的影响时考虑额外的随机性,我们考虑另一个(波兰)空间e,其上定义了一个族(i) 我≥0个i.i.d.随机变量的公共度量值P关于E.关于产品空间Ohm := C([0,T],Rd)×U×EN,我们考虑测度族{P×m×PN: M∈ M} 用这个家族的Pman元素来表示∈ M是固定的。运算符Emis是与toPm关联的期望值。注意,W,Γ和(i) 我≥0在每个Pm下都是独立的。为了我∈ 给定M,我们让Fm=(Fmt)t≥0表示过滤F=(Ft)t的Pm增大≥0定义为Ft=σ((Ws)s≤t、 ν(i) 我≥0)对于t≥ 0.此后,所有随机变量均考虑概率空间(Ohm, FmT)与m∈ M由上下文给出,其中T是固定的时间范围。2.1受控系统 [0,T]×Rdbe是一个(非空)紧集。这将是我们进行控制(交易政策)的场所。给定N∈ N和m∈ M、 我们用Φ表示o,mn随机变量序列φ=(τi,αi)i的集合≥1on(Ohm, FmT)的值为R+×A,使得(τi)i≥1是满足τj>T Pm的Fm停止时间的非递减序列- a、 s.forj>N.我们设定了Φo,m:=[N≥1Φo,明尼苏达州。元素φ=(τi,αi)1≤我≤N∈ Φo,M将是我们的脉冲控制,我们用αi=(`i,βi)和`i的形式来写αiI∈ [0,T]和βi∈ RdPm- a、 s.更准确地说,τi’s将是系统上产生脉冲的时间(例如启动自动售货机),βi将模拟在τi时间发送的订单的性质(例如用于交易机器人的参数),并且“i”将代表无法对系统进行新干预的最长时间长度(例如。

使用道具

8
kedemingshi 在职认证  发表于 2022-5-11 05:59:40 |只看作者 |坛友微信交流群
规定机器人在市场上发送订单的时间)。从现在起,我们将始终使用符号(τφi,αφi)i≥1用αφi=(`φi,βφi)表示控制φ∈ Φo,m、 我们允许在随机时间θφi:=$(τφi,Xφτφi)之前,不观察系统,也不能对系统进行操作-, αφi,γ,i) 其中Xφ是受控状态过程(股票价格、市场交易量、财富等),将在下文中描述,以及$:R+×Rd×A×U×E→ [0,T]是可测量的,因此$(T,·)≥ t代表一切t≥ 0.(2.1)如果动作包括在一定时间内在τφi处启动交易机器人,我们自然可以取θφi=τφi+`φi。如果动作包括在最大持续时间`φi期间下限价单,则θφi是限价单执行的时间,如果它小于τφi+`φi,且τφi+`φi。我们这么说∈ Φo,mbelongs至Φmifθφi≤ τφi+1和τφi<τφi+1Pm-a.s.对于所有i≥ 1和definenφ:=h∪我≥1[τφi,θφi)ic.(2.2)现在让我们描述我们的受控状态过程。给定一些初始数据z:=(t,x)∈ Z:=[0,T]×Rd和φ∈ Φm,设Xz,φ为x=x的[t,2T]上的唯一强解+Z·tNφ(s)u(s,Xs)ds+Z·tNφ(s)σ(s,Xs)dWs+xi≥1{t≤θφi≤·}[F(τφi,Xτφi-, αφi,γ,(一)- Xτφi-]. (2.3)根据模型的选择,X的不同组成部分可以是算法的累积、持有股份的数量、中间价、第一次出价和询问队列的大小和位置、交易员在不同队列中的限价单位置、驱动系统的因素、专家提供的外部信息流、,当前的市场容量等。如果你想拥有与时间相关的动态,这也可以是时间本身。

使用道具

9
大多数88 在职认证  发表于 2022-5-11 05:59:43 |只看作者 |坛友微信交流群
这是非常灵活的,我们将在第4节中举例说明。在上面,函数(u,σ,F):R+×Rd×A×U×e7→ Rd×Rd×d×rdi是可测量的。映射(u,σ)是连续的,第二个参数的Lipschitz线性增长,在第一个参数中是一致的。(2.4)这种动态意味着:。当当前没有对系统采取任何行动时,即在Nφ的区间上,系统根据布朗运动W:dXs=u(s,Xs)ds+σ(s,Xs)dWson Nφ驱动的随机微分方程演化。当在τφi发送命令时,我们将动力学冻结到时间θφi的动作(机器人、命令的执行/取消)结束。这相当于说,我们没有观察到直到θφi的当前演变,或者等效地说,在θφi已经启动的操作结束之前,不会采取任何纠正措施。在动作结束时,状态过程取一个新值Xθφi=F(τφi,Xτφi)-, αφi,γ,i) ,我≥ 1.F依赖于未知参数Γ和附加噪声我认为,正确的模型是不确定的,而未知参数Γ的精确值(可能)不能仅仅通过观察(θφi)来精确测量-τφi,Xθφi- Xτφi-).为了简化符号,我们现在写:z:=($,F)。(2.5)从现在起,我们用Fz,m,φ=(Fz,m,φs)t表示≤s≤2tpm对(Xz,φ,Pi)产生的过滤的增强≥1[θφi,∞)) 在[t,2T]上。我们这么说∈ Φmbelongs到Φz,mif(τφi)i≥1是Fz,m,φ-停止时间和αφiis Fz,m,φτφi-可测量的序列,对于每个i≥ 1.在容许控制将成为Φz的一个元素后,m.2.2贝叶斯更新如前所述,作用于系统会揭示一些关于真实参数值的信息:先验分布随时间演化。

使用道具

10
何人来此 在职认证  发表于 2022-5-11 05:59:47 |只看作者 |坛友微信交流群
因此,应将其视为状态变量,以保持时间一致性,并能够导出动态规划方程。还要注意的是,它的演变本身可能很有趣。例如,在控制期结束时,人们可能会对我们(更新的)先验知识的精度感兴趣,因为它可以作为另一个控制问题的新先验知识。在本节中,我们将描述它是如何根据通常的贝叶斯过程随时间更新的。给定z=(t,x)∈ Z、 u∈ U和a∈ A、 我们写z[z,A,u,], 回想一下(2.5),在形式q(·| z,a,u)dQ(·| z,a)中,q(·|·)是Borel可测图,q(·| z,a)是z foreach(z,a)上的主要度量∈ Z×A.这个量可以从zand定律的知识中推断出来, 有关示例,请参见第4节。给定初始条件z=(t,x)∈ Z、 最初的优先权∈ 并购与交易策略∈ Φz,m,时间s的条件律≥ t由mz,m,φs[C]:=Pm[ν)给出∈ C | Fz,m,φs],C∈ B(U)。(2.6)由于在订单结束和下一个订单开始之间没有新的信息显示,在这些时间间隔内,优先信息应保持不变:Mz,m,φ=Mz,m,φφφ离子[θφi,τφi+1),i≥ 0,(2.7)使用约定θφ=0和Mz,m,φ=m。但是,Mz,m,φ在每次θφiat显示上一次发送的订单的影响时都会跳转,从而带来关于未知参数Γ的新信息。之前的更新遵循经典的贝叶斯规则:Mz,m,φφφi=m(Mz,m,φτφi)-; Zz,φθφi,Zz,φτφi-, aφi),i≥ 1,(2.8)其中(mo;zo,zo,ao)[C]:=RCq(zo | zo,ao,u)dmo(u)RUq(zo | zo,ao,u)dmo(u),(2.9)表示(zo,zo,ao,mo)∈ Z×A×M和C∈ B(U)。我们参考[4]以获得这一直观事实的正式证明。为了确保Mz,m,φ在m∈ M、 我们假设M(M;·) M.备注2.1。同样,参数未知,但我们可以知道哪些值更可能是正确的。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-24 08:32