请选择 进入手机版 | 继续访问电脑版
楼主: 何人来此
403 20

[量化金融] 使用聚合数据重建订单流 [推广有奖]

能者818 在职认证  发表于 2022-5-14 23:48:33 |显示全部楼层 |坛友微信交流群
在分析表4中“报价”文件的摘录后,我们将得到以下时间戳价格数量32472。252 27.32 267时间戳侧面价格数量32472。7.292525247.247 7.247.247.247.247.247.247.247.247.247 7.086 B 4 4.287.285232327.247.247 7.287 7.287 7.287 7.287.287.287.287.247.247.247.247.247.247.247.287 7.287.287.287.287.287 7.287 7 7.287 7.287 7.287 7.287.287.287 7 7 7.287 7 7 7 7 7.287.287 7 7.287 7 7 7 7 7 7 7 7 7.32327.327.327 7 7 7 7 7.287 7 7 7 7.287 7 7 7 7 7 7 7 7 7.287.287 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7.2832472.252 B7 27.155 20032472.252 B 8 27.15 175032472.252 B 9 27.1 22332472.252 B 10 27.095 598表4:“交易”和“报价”文件之间的完美匹配。“交易”摘录(toptable)的行与“报价”摘录(bottomtable)的相同时间戳完全匹配。股票拉加。2010年1月28日,宾夕法尼亚州。订单流量:32472.086限额B 2 27.31 21032472.252取消B 1 27.32 267但在分析“交易”文件后,我们得出结论,32472.252时间的更新不是取消,而是市场订单的结果。因此,我们将订单流量更改为:32472.086 LIMIT B 2 27.31 21032472.252 MARKET B 1 27.32 2673.4交易匹配的基本方法在一般情况下,上述完美情况极为罕见。在我们的7种股票1天说明性样本中,完美案例发生的频率低于0.001(但应避免泛化此图,因为第4节将显示匹配结果具有强烈的互换性和时间依赖性)。造成这种情况的原因是,用于标记“交易”和“报价”文件时间的时钟不同步。因此,很难将“交易”文件中读取的对应市场订单与“报价”文件中读取的取消订单完全匹配。

使用道具

能者818 在职认证  发表于 2022-5-14 23:48:37 |显示全部楼层 |坛友微信交流群
大多数情况下,交易记录在“交易”文件中,更新发布在“报价”文件中,延迟几毫秒。因此,在交易匹配的第一种方法中,当我们解析“交易”文件,并在根据“报价”文件构建的订单流中寻找匹配取消时,我们不仅要查看准确的交易时间戳,还要查看-这个事务时间戳周围的δ和+δ秒。如果可能有多个匹配项,我们会选择一个使时间戳差异最小化的匹配项。从现在起,这个过程将被称为“匹配1”。图1显示了对样本应用匹配1程序后未匹配的交易比例。似乎所有股票的匹配表现都是相似的。正如所料,当δ增加时,匹配性能提高,但出乎意料的是,δ的所有股票都达到了一个平台≈ 150- 200 ms。超过该值,增加δ对性能没有影响,匹配1程序在大约5之间不匹配-在本示例中,交易文件中报告的交易占20%。为了更准确地了解这种现象,我们在图2中绘制了测量时间滞后的经验分布τ=τq-τt这里τ是“交易”文件中交易的时间戳,τt是“报价”文件中匹配修改的时间戳。这一分布主要有积极的支持,表明“报价”文件的更新大部分时间是在“交易”文件中的交易报告之后。此外,所有的经验密度在150毫秒左右下降到0,这表明在“引号”文件中很少匹配超过150毫秒的顺序。3.5增强的交易匹配方法之前的匹配程序留下了大量不匹配的交易。

使用道具

大多数88 在职认证  发表于 2022-5-14 23:48:40 |显示全部楼层 |坛友微信交流群
“交易”文件中的连续行经常导致0中只有一次更新。0.1 0.2 0.3 0.40.0 0.2 0.4 0.6 0.8 1.0匹配1未匹配交易的deltafaction性能●●●●●●●● ●●●●●●●● ● ●●●●●●●●● ●●●●●●●●● ●●●●●●●● ● ●●●●●●●● ● ●●●●●●● ● ● ●飞机。还有。PABNPP。帕布伊。帕卡尔。帕耶夫。帕拉加。图1:匹配1未匹配的交易比例。数据库中2011年1月17日09:05至17:20之间报告的所有交易均被视为匹配交易。-0.05 0.00 0.05 0.10 0.15 0.20 0.250 5 10 15 20 25匹配1时间戳差异(引号文件更新延迟)密度的时间戳滞后分布● ● ●●● ●●●●● ●●●●●●●●●●●●●●●●●●●●●● ● ●●● ● ● ● ●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●● ● ● ● ●●● ● ● ●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●● ● ●●●●● ● ●●●●● ●●●●●●●●●●●●●●●●●●● ●● ● ●●●●● ●●● ●●●●●●● ●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●● ● ● ● ● ● ● ● ● ● ●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●飞机。还有。PABNPP。帕布伊。帕卡尔。帕耶夫。帕拉加。图2:时滞的经验密度τ记录在“交易”中的交易与其在“报价”文件中的匹配取消之间,采用δ=0.4的“匹配1”程序引用“文件”。对这种现象的常见解释是,交易所为每个(部分)与传入市场指令匹配的未决限额指令发布一条消息。在这种情况下,必须以相同的价格汇总“交易”文件的连续行,才能在“报价”文件中找到相应的取消。如表5所示。

使用道具

何人来此 在职认证  发表于 2022-5-14 23:48:44 |显示全部楼层 |坛友微信交流群
时间戳价格数量32951的结果。412 27.45 30032951.412 27.45 182时间戳侧面价格数量32951。419 A 1 27.45 48232951.419 A 2 27.455 73032951.419 A 3 27.465 20032951.419 A 4 27.47 20032951.419 A 5 27.475 20032951.419 A 6 27.48 27932951.419 A 7 27.485 181332951.419 A 8 27.495 52932951.419 A 9 9 27.5 303032951.419 A 10 27.505 20032951.419 A 1.455 7305表5:将两行“交易”汇总在一起,以匹配下表“更新”(上表“交易”的报价(上表“下表”的更新(下表)。股票拉加。2010年1月28日,PA对表5中“报价”文件的摘录进行解析,即取消订单(cancel,32951.419,A,1,27.45482)。在分析“报价”文件后,我们得出结论,事实上,在“交易”文件中记录为两笔交易的市场订单记录延迟了700万秒。困难在于,没有简单的规则使该过程自动化,因为在同一时间戳上的所有市场订单不一定要汇总以匹配“报价”文件。为了解决这些困难,我们增强了匹配过程:在解析“交易”文件时,我们将具有相同价格和相同时间戳(目前,请参见下文)的连续行(交易)分组为一批。然后,对于每个构建的批次,我们测试所有可能的视图到连续行分区的匹配,并将匹配原始“交易”文件中最高行数的匹配作为我们的解决方案。

使用道具

可人4 在职认证  发表于 2022-5-14 23:48:48 |显示全部楼层 |坛友微信交流群
例如,在分析“交易”文件时,如果我们在同一时间戳中发现三笔交易,如下所示(合成示例,而非真实数据):时间戳价格数量36000。000 20.00 10036000.000 20.00 5036000.000 20.00 200然后,除了连续匹配这三条线外,我们还将测试匹配2 4 6 8 100.00 0.05 0.10 0.15 0.20未匹配交易的匹配性能●●●●●● ●●●●●●●●●● ● ● ● ●●●●●●●●●● ●●●●●●● ● ●●●●●●●●● ● ●● ●●●●●●● ●● ●●●●●● ● ● ● ● ● ●飞机。还有。PABNPP。帕布伊。帕卡尔。帕耶夫。帕拉加。图3:匹配2未匹配的交易比例。数据库中2011年1月17日09:05至17:20之间报告的所有交易均被视为匹配交易。在这个例子中,δ=0.4。交易安排如下:时间戳价格数量36000。000 20.00 15036000.000 20.00 200时间戳价格数量36000。000 20.00 10036000.000 20.00 250时间戳价格数量36000。000 20.00 350为了说明由于这一增强而带来的性能提升,图3绘制了这一匹配2程序未匹配的交易的细分,作为Nb的函数,Nb是单个批次降低的最大规模。当Nb=1(左侧第一个点)时,匹配与匹配1程序相同(在绘制的示例中δ=0.4)。正如预期的那样,当NBP增加时,匹配性得到了改善:在我们的样本中,以前不匹配的交易中,至少有12%(LAGA.PA)和高达33%(BNPP.PA)的交易现在与BNPP的限额订单簿匹配。帕·奥拉普。PA占总交易量的4%以上。

使用道具

nandehutu2022 在职认证  发表于 2022-5-14 23:48:51 |显示全部楼层 |坛友微信交流群
然而,请注意,在该样本中,将批次大小增加到5或6行以上不会对性能产生任何显著影响。在仍然没有匹配2的订单中,另一个困难是通过仔细观察数据文件来确定的:时间不完全相同的市场订单有时必须汇总以匹配“报价”文件。如表6所示。Intimestamp价格数量33095。296 27.51 10033095.296 27.51 20233095.296 27.51 30333095.296 27.51 48633095.296 27.51 33433095.296 27.535 21033095.299 27.535 140时间戳侧面价格数量33046。84 A 127.535 3951[…]33085.836 B 1 27.51 226433095.297 B 1 27.51 83933095.31 A 1 27.535 3601表6:具有不同时间戳的“交易”文件行的汇总(上表),以匹配“报价”文件(下表)的更新。股票拉加。2010年1月28日,宾夕法尼亚州。表6,“交易”文件摘录的第五行必须进行汇总,以匹配订单(33095.297,CANCEL,B,1,27.51,1425),滞后1毫秒。但最后两个订单,尽管有两个不同的时间戳,间隔为3毫秒,必须进行聚合以匹配订单(CANCEL,A,A,27.535,350),报告一个订单延迟11毫秒,另一个订单延迟14毫秒。为了跟踪这些特殊情况,我们将上述匹配2程序分组到相同的批处理行中,这些批处理行的时间戳接近于第一次读取的时间戳,但不一定相等。测量单个批次的最大允许时滞的参数将表示为δb。为了说明由于这种增强而导致的性能提高,图4绘制了此匹配3程序未匹配的交易的比例,作为δb的函数。

使用道具

可人4 在职认证  发表于 2022-5-14 23:48:54 |显示全部楼层 |坛友微信交流群
在这个样本中,待聚合的事务似乎有一个非常接近的时间戳,需要考虑的典型时间延迟为2-3毫秒。对于δbno的更高值,可以观察到匹配改进。匹配3的改进允许匹配3%(也包括.PA、BOUY.PA、EDF.PA)到之前不匹配交易(CARR.PA、BNPP.PA)的10%以上,LAGA除外。性能没有改善的PA。然而,在任何情况下,这种改进都不到观察到的总交易量的1%。0.000 0.005 0.010 0.0150.00 0.05 0.10 0.15匹配的绩效3不匹配交易的delta_b分割●●●●●●●●● ●●●●●●●●●● ●●●● ●●●●●●●● ● ● ● ●飞机。还有。PABNPP。帕布伊。帕卡尔。帕耶夫。帕拉加。图4:匹配3未匹配的交易比例。数据库中2011年1月17日09:05至17:20之间报告的所有交易均被视为匹配交易。在这个例子中,δ=0.4,Nb=9。表7总结了上述匹配程序的性能。简而言之,匹配1匹配2匹配3AIRP。PA 83.11%,87.63%,88.75%。PA 88.21%89.78%90.15%BNPP。PA 87.81%91.85%92.67%BOUY。PA 85.07%87.90%88.22%CARR。PA 89.15%92.11%93.03%EDF。PA 90.99%92.14%92.41%拉加。PA 96.89%97.30%97.30%表7:文本中描述的不同匹配程序匹配的“交易”文件中的交易百分比在这7种股票样本中,我们的详细算法平均允许匹配“交易”文件中报告的大约92%的交易,这比标准匹配程序平均提高了总交易的3%。这听起来可能不多,但请记住,这一小部分1天样本仅用于说明匹配过程。

使用道具

能者818 在职认证  发表于 2022-5-14 23:48:58 |显示全部楼层 |坛友微信交流群
下一节将提供更详细的结果,表明对于某些股票和日期,增强匹配(匹配3)至关重要。3.6不匹配交易的来源其他一些困难可能会通过进一步加强上述匹配程序来解决,但成本可能很高,且只需略微加强。对这些文件的手动观察表明,一些仍然不匹配的订单确实“超出范围”,其数量或价格在限额订单簿中根本没有观察到。然而,对于许多不匹配的订单,只有很小的数量差异才能阻止匹配:即使价格等于最佳出价,并且我们观察到以最佳出价取消订单,我们也无法准确地将它们的数量相等,无论信息多么贫乏。在这种情况下,无法获得精确匹配。我们只能推测这些平均约10%的不匹配交易的来源。最明显的解释是,报告的交易是针对隐藏的流动性执行的,许多交易所都允许这种流动性,而巴黎泛欧交易所则采取“冰山”订单的形式。订单簿上只显示冰山订单大小的一小部分(例如,假设在1000个完整大小的股票中,以最佳报价单独显示100股)。当amarket订单出现并消耗部分流动性(比如50股)时,报价会被更新(我们观察到减少了50股,这很容易匹配)。但是,如果市场订单的数量超过了显示的数量(比如125股),那么它将针对最初的100股执行,这些股票立即被之前隐藏的100股所取代,最后的25股将针对新显示的数量执行。

使用道具

大多数88 在职认证  发表于 2022-5-14 23:49:02 |显示全部楼层 |坛友微信交流群
如果这个单一市场有一个更新●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●500 1000 2000 5000 10000 200001e-08 1e-06 1e-04订单尺寸密度体积密度●●●●●●●●●●●●●●●●● ● ●●相配的●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●10:00 12:00 14:00 16:002e-08 3e-08 4e-08 5e-08TS的密度有序分布的时间密度●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●MatchedUnmatchedFigure 5:与匹配交易相比,未匹配交易的规模(左,对数刻度)和时间戳(右)的经验密度分布。在本例中,匹配3用于股票BNPP。在2011年1月的整个月份。订单,那么最终观察结果是减少了25股。这就解释了一个事实,即尽管观察到交易和以相同价格取消相应的交易,但精确度却不匹配。另一种解释是,有些行报告的交易发生在限额订单簿之外,因此它们对“报价”文件没有影响。不准确的地方将出现在“交易”文件中,因为此类交易应被定义为“付账”。为了完整起见,图5绘制了规模的经验密度分布和不匹配交易的时间戳,这是我们关于这些交易的仅有两个信息。在这些数据上,我们观察到,非匹配交易整天都在发生,其时间戳的密度与非匹配交易的密度相似,遵循一个众所周知的表示每日季节性的努形模式。因此,我们不能将不匹配的交易与一天中的特定时段联系起来。然而,我们观察到,不匹配订单的大小明显大于匹配订单的大小(科尔莫戈罗夫-斯米尔诺夫检验证实了这一观察)。这可能与之前的两个假设一致。

使用道具

kedemingshi 在职认证  发表于 2022-5-14 23:49:05 |显示全部楼层 |坛友微信交流群
至于隐藏的流动性,大型市场订单更有可能完全吃掉冰山订单中显示的部分,因此触发流动性,从而阻止精确的规模匹配。这也与“书外交易”一致,因为书外交易的一个原因可能是交易量更大。最后,关于规模的这一发现可能表明,这些订单最终可以通过几个报价修改的汇总来匹配。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-18 20:37