楼主: 大多数88
1476 36

[量化金融] 统计验证的超前-滞后网络和库存预测 [推广有奖]

21
kedemingshi 在职认证  发表于 2022-5-25 16:01:07
offf-货架机器学习方法由于其更非线性的性质而优于逻辑回归;因此,我们将重点讨论这些方法。我们没有尝试和比较许多机器学习方法,也没有调整它们的参数,直到找到可预测性为止,而是选择了一种因其鲁棒性和性能而闻名的方法:普通随机森林(RF)[7,22],它在这方面有许多有用的特征:首先,它们避免了样本中的过度拟合,它们是鲁棒的,非线性,在不调整任何参数的情况下具有很好的整体预测能力(至少在许多“标准”数据集上是如此[11])。另一个好处是每个预测值的相对重要性的可用性。因此,我们将能够检查组状态,即超前滞后,平均而言比一天中的时间更重要。为了计算速度,校准是每天进行的,而不是每小时。因此,给定一天的预测取决于使用前一天数据的校准。我们选择了10个校准窗口长度,用Tin表示,范围从45到90周(9到18周),常见差异为5天(1周)。尽管RFsoutput分类概率,即下一个订单流的符号将为+1的概率,例如,我们将最可能的预测状态作为2018年7月27日0:50 WSPC/指令文件手稿14 CHALLET、CHICHEPORTICHE、LALLOUACHE、Kassibrakis的预测。除了计算每个校准长度的各自性能外,我们还对来自每个时间尺度的预测进行了多数投票。如果+1和-1获得相同票数时,预测设置为零。最后,我们使用了软件包RandomForestSRC[22],没有调整射频校准功能的任何参数。4.1.1。

22
何人来此 在职认证  发表于 2022-5-25 16:01:10
结果我们在SQ 2014-6数据集中交易量最大的三对数据集和EURUSD LB数据集上运行了该程序。图8至图9显示了我们方法的样本外性能。虽然我们对RFs进行了订单流动迹象的培训,但我们也以货币单位绘制了累计绩效。本质上,如果在最活跃的时期成功预测了订单流量迹象,那么它也平均预测了实际流量本身。这是SQ客户端的情况,但不是LB:最精确的符号预测是在午餐时间,即当活动达到本地最小值时。一种可能的解释是SQ和LB客户之间的明显差异:SQ客户的累计净失衡主要是均值回复,而ofLB客户的净失衡则在不断增加。这意味着SQ客户大多是投机者,而LB客户通常将外汇市场用于其他目的,而不仅仅是投机。现在,让我们对样本外的货币单位表现进行统计检验:对于经纪人和所有对来说,样本外表现都很明显。然而,真正的问题是我们的方法对于下一个订单流的预测能力。Chou和Chu方法包括测试A是否预测B,其中A和B是二项式变量,考虑到自相关,无效假设是A不预测B。当应用于SQ数据时,这项测试明确地表明,我们的方法可以得到预测性的答案,而对于LB数据则没有用处。这可能意味着,对于英镑交易员来说,每小时的时间尺度可能不是一个明智的选择。查看这些结果的不同方法是分析一天中某个小时的绩效。在图11中,我们报告了以一天中的小时为条件的样本外性能的p值。

23
何人来此 在职认证  发表于 2022-5-25 16:01:13
我们注意到,SQ客户在高活动期表现良好的趋势,而不是LB客户。将收益添加到功能集中并没有改善预测,可能是2018年7月27日0:50 WSPC/指令文件手稿经统计验证的外汇市场超前滞后网络和库存预测15,因为收益效应已经嵌入到群体行动中,符合[32]的因子分析。值得注意的是,该过程的多次运行表明,不需要每天更新模型:每5天更新一次可能会得到相同的结果,这与超前-滞后网络的大持久性(平均)是一致的。4.1.2。预测值的重要性为了检查订单流量不平衡是否取决于团队状态,我们检查了相反的情况,即一天中的小时在大多数时间不是最重要的预测值。预测因子和未来顺序失衡迹象之间的非线性关系有时取决于一天中的小时数,这并不奇怪,因为一些群体可能在一天中的某些时间更活跃。然而,考虑到超前-滞后网络的存在,我们并不期望一天中的某个小时经常排在可变重要性列表的首位。有几种方法可以测量随机森林中的变量重要性;我们使用了标准的Breiman-Cutler度量,该度量(粗略地说)由预测矩阵给定列的元素组成,并确定样本内预测误差的变化方式(有关更多详细信息,请参见[7])。我们将关注一天中小时相对于所有其他列的排名。由于我们使用无监督的方法对交易者进行聚类,因此组数随时间而变化。

24
可人4 在职认证  发表于 2022-5-25 16:01:17
因此,我们将列h的秩比定义为h的重要性的秩与P的列数之比,前者用秩(h)表示,1是最重要的,后者用Kt表示。由于rankof 1对应于1/Kt,是一个时变量,因此可能不必要地难以比较两个秩比,因此我们定义了调整后的rankratio,即h asrh=秩(h)- 1吨- 根据此约定,如果rh=0,则小时列是最重要的预测值,如果rh=1,则小时列是最不重要的预测值。图12的左图描绘了欧元GBP的时间函数。结果表明,H的相对重要性的分布是相当双峰的(见同一图表中间的直方图)且持续存在。rhis的双峰性质对于其他Tinand货币对来说不太明显。无论如何,人们可能想知道,在低rhor或高RHO或同等的时期,预测是否更成功,如何预测rhis的成功。在我们处理分类问题时,我们选择的工具是接收器工作特性(ROC)曲线及其相关曲线下面积(AUC),简而言之,它量化了当预测正确和失败时RHI分布的差异。根据定义,AUC为0.5表示相对湿度缺乏预测能力,而AUC为1表示相对湿度完全决定预测的成功。同一图的右图清楚地表明,2018年7月27日,约有0:50 WSPC/指令文件手稿16 CHALLET、CHICHEPORTICHE、LALLOUACHE、Kassibrakispedictability与rh相关,并且在最活跃的时间内,它再次变大。由于每天只有一个Rh值,并且每小时有一个Rh值进行一次预测,因此我们计算了每天小时的平均AUC。最后,我们计算了交易者-交易者超前-滞后持续性β的小时平均AUC。

25
mingdashike22 在职认证  发表于 2022-5-25 16:01:20
图13报告了三个SQ货币对的AUC,作为校准窗口周数的函数,仅限于相同的样本外周期。这类措施的预测能力再一次很弱。4.2。VWAP预测管理一个人的不平衡需要的不仅仅是预测订单流量的迹象。事实上,成功预测下一个时期的平均交易方向也是必要的。我们没有单独预测下一次价格回报的迹象,而是将重点放在经纪人客户在每个时间段的交易VWAP上,因为它结合了交易量和价格。如果经纪人能够在下一个时间段预测其VWAP的演变,那么它将能够更有效地管理其库存。该设置与订单流量预测非常相似,只是vectorvt+1预测现在包含经纪人VWAP变化的迹象。换言之,我们仍然面临分类问题,但此次签署的VWAP有所不同。我们保持与以前相同的参数。图14显示了欧元兑美元和平方米的结果:可预测性明显显著,甚至优于订单流量的设计。图15显示,VWAP变化标志的可预测性在所有货币对的最活跃时间尤为显著。对于手头的SQ LB客户,再次显示了完全相反的行为:在最活跃的时间,预测能力最差:如果订单流量标志不存在,VWAP变化是不可预测的。结论与展望我们的目标是首先引入一种无监督的超前-滞后网络推理方法,并证明财务数据中存在持续的代理超前-滞后网络。非常显著的是,这些隐藏的因果网络为在最不可预测的复杂系统之一的一小时内进行有用的预测开辟了道路。

26
mingdashike22 在职认证  发表于 2022-5-25 16:01:23
诚然,我们使用了比大多数市场参与者所能获得的更详细(和私人)的信息:关键是这种信息使预测性的起源变得明确。反过来,人们就会明白,当超前-滞后网络过于稀疏时,为什么可预测性并不重要,或者是因为交易者活动7月27日,2018年0:50 WSPC/指令文件手稿外汇市场中经统计验证的超前滞后网络和库存预测17相似性太小,或因为所选的时间尺度与代理的自然活动率不对应。能够预测库存的演变在实践中对于改进内部订单匹配和库存管理非常有用,尤其是在风险约束方面。这意味着必须对库存管理的理论结果进行概括,以包括订单流量和VWAP的可预测性(例如[15])。避免过度拟合是本文应用部分的重点之一。然而,可以很容易地对学习方法进行实质性改进。首先,可以向预测值添加更多相关信息,例如多次标记的组状态。如果一些交易者的典型持有期大于时间片的持续时间,这将很有帮助。此外,我们还没有充分利用随机森林的潜力,随机森林不输出二元预测,而是预测给定状态的树的分形。最后,简单的学习方案(如跟随领导者)可以大大改善每个时间窗口校准长度的预测聚合,从而提高整体预测性能。

27
mingdashike22 在职认证  发表于 2022-5-25 16:01:27
这类简单的方法可能会更好地利用可用信息,而不会增加过度拟合的来源。我们还通过使用单一机器学习方法避免了方法过度拟合,而无需改变其任何参数。对随机林的改进,如斜向随机林(33),或增强树(14),可能会产生更好的性能。这也将为集成学习开辟道路。最后,当我们疲惫不堪地选择一个小时的时间片时,我们应该同时研究不同时间尺度上的超前-滞后网络。从更具哲理的角度来看,我们的工作是了解投资者活动的触发因素的第一步,这是当前金融领域的一个谜团。我们还不能解释为什么一群交易者在时间t时行动。然而,他们的活动取决于其他一些群体或他们自己过去的活动,这是意料之中的,因为大多数交易活动在金融市场中都是自我参照的。VWAP变化是可预测的这一事实表明,交易员的反应至少部分是为了预测过去价格变化的方向。对于一个基本问题的这种递归(因此是间接的)回答也值得进一步研究,特别是使用多时间尺度方法。最后,回到复杂系统,这项工作展示了一旦简化并准备好代理解析的数据,使超前-滞后网络变得可学习,不可预测的复杂系统如何变得可预测,这有望改进动态管理风险的工具。未来的工作将评估agentbehavior在通信网络和在线购物等其他环境中的可预测性。参考文献【1】Avellanda,M。

28
可人4 在职认证  发表于 2022-5-25 16:01:30
和Stoikov,S.,《限额指令簿中的高频交易》,量化金融8(2008)217–224。2018年7月27日0:50 WSPC/指令文件手稿18 CHALLET、CHICHEPORTICHE、LALLOUACHE、KASSIBRAKIS【2】Barber,B.、Lee,Y.、Liu,Y.和Odean,T.,个人投资者通过交易损失了多少?,金融研究回顾22(2009)609–632。[3] Benjamini,Y.和Hochberg,Y.,《控制错误发现率:多重测试的实用而有力的方法》,皇家统计学会杂志。系列B(方法学)57(1995)289–300。[4] Bouchaud,J.-P.和Challet,D.,《为什么资产价格属性在2000年内变化如此之小》,载于《经济物理学和社会物理学:近期进展和未来方向》(Springer,2017),第3-17页。[5] Bouchaud,J.-P.、Farmer,J.D.和Lillo,F.,《市场如何慢慢消化供求变化》,载于《金融市场手册:动力学和进化》,Hens,T.和Schenk Hoppè,K.编辑(Elsevier,2009),第57-160页。[6] Boudoukh,J.、Richardson,M.P.和Whitelaw,R.,《三大流派的故事:短期股票收益率自相关的见解》,《金融研究评论》7(1994)539–573。[7] Breiman,L.,随机森林,机器学习45(2001)5–32。[8] Chou,C.和Chu,C.-S.J.,测试两个自相关二进制时间序列的独立性,统计与概率字母80(2010)69–75。[9] Clauset,A.、Shalizi,C.R.和Newman,M.E.,《经验数据中的幂律分布》,暹罗评论51(2009)661-703。[10] Curme,C.,Tumminello,M.,Mantegna,R.N.,Stanley,H.E.,和Kenett,D。

29
何人来此 在职认证  发表于 2022-5-25 16:01:34
Y、 ,经统计验证的金融日内超前-滞后关系的出现,量化金融(2015)1–12。[11] Fernández Delgado,M.、Cernadas,E.、Barro,S.和Amorim,D.,“我们是否需要数百名分类师来解决现实世界的分类问题?”?,《机器学习研究杂志》15(2014)3133–3181。[12] Filimonov,V.和Sornette,D.,《量化金融市场的流动性:金融崩溃预测》,物理评论E 85(2012)056108。[13] Fraley,C.、Raftery,A.E.、Murphy,T.B.和Scrucca,L.、mclust第4版forR:基于模型的聚类、分类和密度估计的正态混合建模(2012)。[14] Friedman,J.、Hastie,T.、Tibshirani,R.等人,《加性逻辑回归:促进的统计观点》(作者进行了讨论和反驳),《统计年鉴》28(2000)337–407。[15] Gallien,F.、Kassibrakis,S.、Malamud,S.和Passerini,F.,《按比例交易成本管理库存》,见SSRN 2788593(2016)。[16] Gillespie,C.S.,《拟合重尾分布:poweRlaw软件包》,Journalof Statistical Software 64(2015)1–16。[17] Grinblatt,M.和Keloharju,M.,《不同投资者类型的投资行为和表现:芬兰独特数据集的研究》,金融经济学杂志55(2000)43-67。[18] Grinblatt,M.和Keloharju,M.,《追求轰动、过度自信和交易活动》,金融杂志64(2009)549-578。[19] Hardiman,S.J.、Bercot,N.和Bouchaud,J.-P.,《金融市场的关键反应:霍克斯过程分析》,欧洲物理杂志B 86(2013)442。[20] Harris,L.,《交易与交易所:从业者的市场微观结构》(牛津大学出版社,2002年)。[21]Huth,N.和Abergel,F.,《高频超前/滞后关系——经验事实》,经验金融杂志26(2014)41–58。[22]Ishwaran,H。

30
kedemingshi 在职认证  发表于 2022-5-25 16:01:37
和Kogalur,U.,生存、回归和分类的随机森林(RF-SRC)(2016),https://cran.r-project.org/package=randomForestSRC2018年7月27日,0:50 WSPC/指令文件手稿外汇市场中统计验证的超前滞后网络和库存预测19r包版本2.4.1。[23]Jackson,A.,个人投资者的总体行为(2004年)。【24】Jegadeesh,N.和Titman,S.,《过度反应、延迟反应和反向投资》,金融研究回顾8(1995)973–993。【25】Kaniel,R.、Saar,G.和Titman,S.,《个人投资者交易和股票回报》,金融杂志63(2008)273-310。[26]Kelley,E.K.和Tetlock,P.C.,“人群有多聪明?”?《零售订单和股票回报洞察》,金融杂志68(2013)1229–1265。【27】Kullmann,L.、Kertész,J.和Kaski,K.,《不同股票回报之间的时间依赖性互相关:直接影响网络》,物理评论E 66(2002)026125。【28】Lallouache,M.和Abergel,F.,《外汇订单中的交易量缩减和价格聚类》,Physica a:统计力学及其应用416(2014)488–498。[29]Lamper,D.、Howison,S.D.和Johnson,N.F.,《竞争性进化人口中未来巨大变化的可预测性》,《物理评论快报》88(2001)017902。【30】Lanchichinetti,A.和Fortunato,S.,《社区检测算法:比较分析》,Phys。修订版。E 80(2009)56117。[31]Lillo,F.和Farmer,J.D.,《高效市场的长期记忆》,Non-lin.Dyn。andEconometric 8(2004)。[32]Lillo,F.、Moro,E.、Vaglica,G.和Mantegna,R.N.,《金融市场中交易公司的专业化和羊群行为》,新物理杂志10(2008)43019。【33】Menze,B.、Kelm,B.、Splitthoff,D.、Koethe,U.和Hamprecht,F.,《关于义务随机森林的机器学习和数据库知识发现》,SE-29版。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 07:38