楼主: 能者818
938 21

[量化金融] 订单流数据中的规则性和不规则性 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-5-31 04:22:57
股票被重新排列,使得集群结构可见,集群表示为C1、C2、C3和C4。[29],我们发现四个集群中的一些最适合使用。聚类大小如下:33%的股票属于聚类C1,21%、26%和20%的数据集分别属于聚类C2、C3和C4。同一集群中的股票具有相似的相对价格分布。在图3中,我们展示了三个集群中代表性股票的分布情况。由于在即将限额订单放入价差之前的时间条件,观察到的最小价差大小为两个刻度,尽管价差大小在每天的大多数时间可能仅等于一个刻度。如上所述,图3(a)中所示的分布基本上是尖峰0.5。在图3(d)中,我们看到,在新的限额指令到达价差内部之前,价差通常只有两个刻度宽。我们将箱子大小调整为1美分的刻度大小。通过将密度与料仓宽度相乘,我们发现两个蜱虫扩散的概率为97%。在这种情况下,相对价格只能为▄p=0.5。第一类股票的价差通常很小。此类股票也被称为大型股票[12、30、31],因为与流动性提供者愿意提供的利差规模相比,这些股票的利差很大。相反,报价单上有一大队限额订单等待执行,而执行顺序(根据到达时间)对投资策略很重要【12】。这在多大程度上反映了这里发现的不同集群中订单到达范围之外的情况,将在第节中进行分析。III C.C4组也有明确的解释,参见图3(C)中的相对价格分布。

12
大多数88 在职认证  发表于 2022-5-31 04:23:01
它在相对价格上有一个最大值,对应于第二个最小侵略性价格。密度正朝着较高的相对价格下降。选择比离散化更大的箱子大小。价差大小的相应分布图3(f)表明,价差通常很大,相对价格几乎不受价差大小的限制。倾向于具有较小攻击性的订单放置。一个原因可能是交易者希望对他们的限价指令有执行优先权,但他们希望保持接近当前报价,因为低价交易有利于流动性接受者。第四类股票的行为更接近于旧市场研究的市场状况[32,33]。有趣的是,2016年,这两种市场动态同时存在于同一个市场。根据我们分析的数据,小股票只占所有股票的1/5左右。集群C2和C3可以理解为起源于中间和不同的排列大小。中间类股的价差位于C1类股的小幅价差和C4类股的准连续价差之间,具有较强的离散化效应。我们以集群C2为例。这里所考虑的CERN数据集是集群C2的一部分,见图3(b)。如果价差仅为两个基点,则相对价格为0.5。然而,考虑到其他相对价格,有时价差更大。事实上,我们大多观察到相对价格较小或等于0.5,这表明通常不太激进的limitorder安排比更激进的安排更受青睐。在文献中,价差中的相对价格分布由一些分析概率密度确定【33】。虽然分布拟合可能适用于集群C4,但其他三个集群的分布可能无法用这种方式很好地描述。

13
mingdashike22 在职认证  发表于 2022-5-31 04:23:04
最终,不仅交易者行为,而且由展布大小设定的条件决定了相对价格的分布,这使得统一的特征难以确定。●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲0 20 40 60 800.000.020.040.060.080.100.12订单计数【104】相关。频率MOFIG。每个数据集的每日订单计数散点图。所有订单中市场订单的相对频率。颜色和符号表示四个集群C1(蓝色圆圈)、C2(黄色方块)、C3(绿色钻石)或C4(红色三角形)中的一个集群的关联。在讨论差价限额指令之前,我们先研究不同特征在多大程度上与股票的整体市场活动相关。图5显示了根据散点图中每个数据集的每日订单计数绘制的所有订单中市场订单的相对频率。颜色和符号对应不同的簇。出现以下规律:在典型价差较小的C1类(蓝色圆圈)中,订单总数往往较高,而所有订单中市场订单的相对频率相对较小。

14
nandehutu2022 在职认证  发表于 2022-5-31 04:23:07
这暗示着这些数据集中存在大量算法交易,因为算法通常意味着限额订单的高吞吐量[34,35]。相比之下,C4组(红色三角形)的股票规模较大,订单数量较少,市场订单相对频率相对较高。这可能是因为算法阅读器的存在较弱。C、 OFF-价差限额订单●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲▲0.0 0.2 0.4 0.6 0.8 1.00.00.20.40.60.81.0 ask侧的相对频率bid侧的相对频率图。6、报价中有限订单的相对买入和卖出频率散点图。这些颜色表示分配了相应数据集的相对价格分布的聚类。符号和颜色编码为inFig。5、我们通过分析每个股票的所有差价限制订单报价上的限制订单的相对频率,概述了差价限制订单的不同特征。据了解,至少20年来一直有报道称,这是大多数收到的限额订单到达的地方【9,36】。我们分别计算480个数据集中每个数据集的买卖订单的相对频率,见图6。所有数据点沿等分线分散,表示该数量的买卖对称。

15
nandehutu2022 在职认证  发表于 2022-5-31 04:23:11
虽然聚类是针对价差内限额订单进行的,但也反映在价差内限额订单的相对频率中。簇C1(蓝色圆圈)的相对频率最高。因此,特别是当价差较窄时,报价单上很有可能下达限价订单。对于这些股票,订单流动动态基本上与报价周围的价格水平有关。在相对频率较低的情况下,C4类股票的价格偏差为0.0 0.1 0.2 0.3 0.4 0.50.0010.0100.100110100 pdf[1/$](a)AAPL0.0 0 0.1 0.2 0.3 0.4 0.50.0010.0100.100110100价格偏差[$]pdf[1/$](b)CERN0.0 0.1 0.2 0.3 0.4 0.50.0010.0100.100110100价格偏差[$]pdf[1/$](c)AMGN0.0 0 0.1 0.2 0.3 0.4 0.50.0010.0100.100110100价格偏差[$]pdf[1/$](d)GOOGFIG。价差限制订单中的绝对偏差分布。(a)至(d)中所示的数据集属于clustersC1至C4。找到(红色三角形)。显然,当价差很宽时,限额订单并不是那么主要地放在报价上。以秒计。III D,我们展示了这与市场订单影响的关系。同样,两个中间聚类C2(黄色方块)和C3(绿色方块)包含相对频率处于中间水平的股票。由于我们也对报价的极限订单分布感兴趣,因此我们必须选择正确的可观测值。我们采用绝对偏差▄d=▄p- pq |,但也可以使用通过额外除以报价获得的相对偏差。在文献中,有时考虑绝对偏差[27],有时考虑相对偏差[33]。这两种观测值各有优缺点。特别是接近引号的地方,不同数据集之间的比较最适合于绝对偏差d。

16
大多数88 在职认证  发表于 2022-5-31 04:23:14
之所以如此,是因为所有正在调查的数据集的刻度大小都是常量。另一方面,由于报价的划分,相对偏差的(伪)离散化对于每只股票是不同的,报价沿我们的数据集变化两个数量级,并且在一个数据集中本身也不是常数。由于我们之前的结果表明,限价订单主要放置在报价上,并且可能接近报价,因此我们倾向于使用▄d。图7显示了四个数据集的绝对价格偏差▄d的分布。其中三个是相同的,我们展示了展销限制订单中的相对价格。我们主要讨论NAAPL和GOOG之间的差异。已经讨论了第一个箱子的作用。它等于(标准化因子高达100)在引号中放置限制订单的相对频率,对于AAPL大约为56%,对于较高的集群数,则会降低。对于簇C4的GOOG,相对频率约为6%。报价单旁边的右一级包含大约14%的APL限额订单和大约2%的GOOG限额订单。对于APL,75%的订单位于前三个级别,而对于GOOG,不到9%的订单位于这三个级别。对于后者,绝对价格偏差的分布下降非常缓慢。因此,对于C1类股票,接近报价的极限订单到达率占主导地位,而订单簿的深度似乎对C4类股票更为重要。集群C2和C3再次体现了两种极端情景之间的过渡。在之前的研究中,幂律行为在不同的市场和研究时间中得到了一致的报告【9,11】。对于价差较大的股票,尤其是C4类股票,情况可能仍然如此。

17
mingdashike22 在职认证  发表于 2022-5-31 04:23:17
将功率定律与我们的数据进行拟合并不能提供令人信服的结果,可能是因为五天的时间窗口很短。对于价差较小的股票,尤其是C1类股票,报价及其前几个相邻水平都是共同主导的,离散化效应对于普遍的幂律行为来说可能过于主导。包括更长时间窗口的数据超出了本研究的范围。因此,具有适当拟合函数的有效价差限额订单价格的特征将留给未来的工作。D、 市场订单0.0 0.5 1.0 1.5 2.001020340相对容量图。8、20160307年AAPLWe的相对市场订单量分布如【32】所示,订单账簿中的缺口产生了较高的中点回报。其机制如下:市场订单到达后中点的移动取决于该市场订单从订单簿中删除的订单。如果市场订单量至少与相应报价单上的数量一样大,则会发生价格变动。由于市场订单量的选择通常只执行报价单上的交易量,因此价格变动和回报取决于报价单与报价单后面的下一个占用水平之间的距离。我们称之为订单缺口中占用价格水平之间的距离。报价背后的差距越大,市场秩序的影响就越大。缺口结构与回报率之间的对应关系不仅在经验上找到,而且还通过基于代理的模型再现出来[37]。我们将测试这些机制如何应用于我们的数据。我们确定市场订单的影响asr=pa- pppp,(1)其中PPP是市场订单之前的中点价格,PAI是市场订单之后的中点价格。

18
何人来此 在职认证  发表于 2022-5-31 04:23:21
[32]的作者研究了1999年至2002年伦敦证券交易所的数据,发现市场订单量和相应报价量的相关系数为0.86。然而,只有将那些改变中点的市场订单考虑在内,这才是正确的。否则,相关系数降至0.01以下。这是因为大多数市场订单的数量低于报价量。考虑到所有市场订单,无论是否具有非零影响,我们发现每个数据集的平均相关性为0.36。我们认为,与[32]相比,市场订单数量增加导致的结果是调整后的数量等于报价量。为了详细了解这种相关性,我们分析了市场订单相对数量的分布。这些定义为市场订单量除以报价量,随着市场订单的执行,流动性被移除。因此,小于1的相对成交量对应于不改变中间点的市场指令,等于1的相对成交量对应于导致由报价后的差距确定的回报的市场指令,大于1的相对成交量对应于大于或等于报价后差距的影响。图8显示了数据集20160307 AAPL的这种分布。大约40.5%的情况下,市场订单量与报价量相符。小于1的相对值有53.1%的概率。因此,相对体积大于1的概率为6.4%。在我们的数据中,其他股票的这些结果没有显著变化。这对单一市场订单产生的回报有两个重要影响:首先,我们预计约53.1%的市场订单很可能导致零回报。

19
大多数88 在职认证  发表于 2022-5-31 04:23:24
第二,我们注意到,大多数非零回报确实来自于报价的差距。票据交易量和市场订单交易量之间的密切对应关系表明,我们的市场订单重建工作相当准确。图9显示了我们的数据集根据公式(1)得出的经验回报分布。首先,我们观察所有四个数据集的伪离散化。merediscretization是0.01美元刻度大小的影响。伪离散化是由于变化的中点,我们在计算收益时用它来划分。文献[38]的作者详细论述了这一现象。我们选择我们的箱子大小,这样离散化就不会模糊。显示的退货级别数反映了订单簿的稀疏性。我们再次发现了与我们在第二节中确定的集群有关的质量差异。III B.对于AAPL,订单集中在报价周围,从而防止价格大幅上涨超过几点。显然,我们假设C4类股票(如GOOG)的价格水平占有率越低,收益分布就越广。这种分布如此广泛,以至于蜱虫大小效应所起的作用较小。定性上,这符合[32]中的结果。由于密集层的占用,因此-3-2-1 0 1 2 30.0010.0100.1001返回[10-4]pdf(a)AAPL-6-4-2 0 2 4 60.0010.0050.0100.0500.1000.5001返回[10-4]pdf(b)CERN-6-4-2 0 2 4 60.0010.0100.1001返回[10-4]pdf(c)AMGN-4-2 0 2 40.010.10110返回[10-4]pdf(d)GOOGFIG。九、四只股票之个别市场指令所产生之收益分配。(a)至(d)中所示的数据集属于类别C1至C4。随着我们转移到较小的集群数量,个体影响往往会缩小。四、

20
mingdashike22 在职认证  发表于 2022-5-31 04:23:27
总结与展望我们分析了2016年初96只纳斯达克股票的订单流量数据,发现不同股票之间的订单流量存在显著的质量差异。我们将重点放在订单簿中的订单位置,订单有三种不同的放置位置:插入、分散或交叉分散。后者被视为有效的市场订单。我们发现,限价订单的提交频率远高于市场订单,而有效价差限价订单的提交频率远高于价差限价订单。然而,大多数限额订单被删除,而不是交易。对于一些股票,由于价差通常与刻度大小相等,因此价差限制指令的相对频率较小,从而排除了价差限制指令。此外,我们还发现,当价差趋于狭窄时,有效价差限制订单往往放在报价附近或报价上。当价差趋于扩大时,报价附近的价差限额订单减少。市场订单量通常根据报价量进行调整。因此,单个市场订单的影响取决于theorderbook结构,即单一市场订单的影响是由价差背后的缺口造成的。当职业密度较高时,个人对市场秩序的影响通常会减小到蜱虫大小(如果有任何影响),而当职业密度较小时,影响往往更大。借助关系k-均值聚类算法,并基于价差限制订单中的相对价格分布,我们能够掌握不同股票订单流量的多样性。价差内限价指令相对价格分布的多样性可以追溯到展区设定的条件。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-13 07:01