楼主: mingdashike22
451 15

[量化金融] 使用聚合数据重建订单流 [推广有奖]

11
大多数88 在职认证  发表于 2022-5-15 16:01:05
在分析表4中“报价”文件的摘录后,我们将得到以下时间戳价格数量32472。252 27.32 267时间戳侧面价格数量32472。7.292525247.247 7.247.247.247.247.247.247.247.247.247 7.086 B 4 4.287.285232327.247.247 7.287 7.287 7.287 7.287.287.287.287.247.247.247.247.247.247.247.287 7.287.287.287.287.287 7.287 7 7.287 7.287 7.287 7.287.287.287 7 7 7.287 7 7 7 7 7.287.287 7 7.287 7 7 7 7 7 7 7 7 7.32327.327.327 7 7 7 7 7.287 7 7 7 7.287 7 7 7 7 7 7 7 7 7.287.287 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7.2832472.252 B7 27.155 20032472.252 B 8 27.15 175032472.252 B 9 27.1 22332472.252 B 10 27.095 598表4:“交易”和“报价”文件之间的完美匹配。“交易”摘录(toptable)的行与“报价”摘录(bottomtable)的相同时间戳完全匹配。股票拉加。2010年1月28日,宾夕法尼亚州。订单流量:32472.086限额B 2 27.31 21032472.252取消B 1 27.32 267但在分析“交易”文件后,我们得出结论,32472.252时间的更新不是取消,而是市场订单的结果。因此,我们将订单流量更改为:32472.086 LIMIT B 2 27.31 21032472.252 MARKET B 1 27.32 2673.4交易匹配的基本方法在一般情况下,上述完美情况极为罕见。在我们的7种股票1天说明性样本中,完美案例发生的频率低于0.001(但应避免泛化此图,因为第4节将显示匹配结果具有强烈的互换性和时间依赖性)。造成这种情况的原因是,用于标记“交易”和“报价”文件时间的时钟不同步。因此,很难将“交易”文件中读取的对应市场订单与“报价”文件中读取的取消订单完全匹配。

12
大多数88 在职认证  发表于 2022-5-15 16:01:08
大多数情况下,交易记录在“交易”文件中,更新发布在“报价”文件中,延迟几毫秒。因此,在交易匹配的第一种方法中,当我们解析“交易”文件,并在根据“报价”文件构建的订单流中寻找匹配取消时,我们不仅要查看准确的交易时间戳,还要查看-这个事务时间戳周围的δ和+δ秒。如果可能有多个匹配项,我们会选择一个使时间戳差异最小化的匹配项。从现在起,这个过程将被称为“匹配1”。图1显示了对样本应用匹配1程序后未匹配的交易比例。似乎所有股票的匹配表现都是相似的。正如所料,当δ增加时,匹配性能提高,但出乎意料的是,δ的所有股票都达到了一个平台≈ 150- 200 ms。超过该值,增加δ对性能没有影响,匹配1程序在大约5之间不匹配-在本示例中,交易文件中报告的交易占20%。为了更准确地了解这种现象,我们在图2中绘制了测量时间滞后的经验分布τ=τq-τt这里τ是“交易”文件中交易的时间戳,τt是“报价”文件中匹配修改的时间戳。这一分布主要有积极的支持,表明“报价”文件的更新大部分时间是在“交易”文件中的交易报告之后。此外,所有的经验密度在150毫秒左右下降到0,这表明在“引号”文件中很少匹配超过150毫秒的顺序。3.5增强的交易匹配方法之前的匹配程序留下了大量不匹配的交易。

13
何人来此 在职认证  发表于 2022-5-15 16:01:12
“交易”文件中的连续行经常导致0中只有一次更新。0.1 0.2 0.3 0.40.0 0.2 0.4 0.6 0.8 1.0匹配1未匹配交易的deltafaction性能●●●●●●●● ●●●●●●●● ● ●●●●●●●●● ●●●●●●●●● ●●●●●●●● ● ●●●●●●●● ● ●●●●●●● ● ● ●飞机。还有。PABNPP。帕布伊。帕卡尔。帕耶夫。帕拉加。图1:匹配1未匹配的交易比例。数据库中2011年1月17日09:05至17:20之间报告的所有交易均被视为匹配交易。-0.05 0.00 0.05 0.10 0.15 0.20 0.250 5 10 15 20 25匹配1时间戳差异(引号文件更新延迟)密度的时间戳滞后分布● ● ●●● ●●●●● ●●●●●●●●●●●●●●●●●●●●●● ● ●●● ● ● ● ●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●● ● ● ● ●●● ● ● ●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●● ● ●●●●● ● ●●●●● ●●●●●●●●●●●●●●●●●●● ●● ● ●●●●● ●●● ●●●●●●● ●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●● ● ● ● ● ● ● ● ● ● ●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●飞机。还有。PABNPP。帕布伊。帕卡尔。帕耶夫。帕拉加。图2:时滞的经验密度τ记录在“交易”中的交易与其在“报价”文件中的匹配取消之间,采用δ=0.4的“匹配1”程序引用“文件”。对这种现象的常见解释是,交易所为每个(部分)与传入市场指令匹配的未决限额指令发布一条消息。在这种情况下,必须以相同的价格汇总“交易”文件的连续行,才能在“报价”文件中找到相应的取消。如表5所示。

14
mingdashike22 在职认证  发表于 2022-5-15 16:01:15
时间戳价格数量32951的结果。412 27.45 30032951.412 27.45 182时间戳侧面价格数量32951。419 A 1 27.45 48232951.419 A 2 27.455 73032951.419 A 3 27.465 20032951.419 A 4 27.47 20032951.419 A 5 27.475 20032951.419 A 6 27.48 27932951.419 A 7 27.485 181332951.419 A 8 27.495 52932951.419 A 9 9 27.5 303032951.419 A 10 27.505 20032951.419 A 1.455 7305表5:将两行“交易”汇总在一起,以匹配下表“更新”(上表“交易”的报价(上表“下表”的更新(下表)。股票拉加。2010年1月28日,PA对表5中“报价”文件的摘录进行解析,即取消订单(cancel,32951.419,A,1,27.45482)。在分析“报价”文件后,我们得出结论,事实上,在“交易”文件中记录为两笔交易的市场订单记录延迟了700万秒。困难在于,没有简单的规则使该过程自动化,因为在同一时间戳上的所有市场订单不一定要汇总以匹配“报价”文件。为了解决这些困难,我们增强了匹配过程:在解析“交易”文件时,我们将具有相同价格和相同时间戳(目前,请参见下文)的连续行(交易)分组为一批。然后,对于每个构建的批次,我们测试所有可能的视图到连续行分区的匹配,并将匹配原始“交易”文件中最高行数的匹配作为我们的解决方案。

15
大多数88 在职认证  发表于 2022-5-15 16:01:18
例如,在分析“交易”文件时,如果我们在同一时间戳中发现三笔交易,如下所示(合成示例,而非真实数据):时间戳价格数量36000。000 20.00 10036000.000 20.00 5036000.000 20.00 200然后,除了连续匹配这三条线外,我们还将测试匹配2 4 6 8 100.00 0.05 0.10 0.15 0.20未匹配交易的匹配性能●●●●●● ●●●●●●●●●● ● ● ● ●●●●●●●●●● ●●●●●●● ● ●●●●●●●●● ● ●● ●●●●●●● ●● ●●●●●● ● ● ● ● ● ●飞机。还有。PABNPP。帕布伊。帕卡尔。帕耶夫。帕拉加。图3:匹配2未匹配的交易比例。数据库中2011年1月17日09:05至17:20之间报告的所有交易均被视为匹配交易。在这个例子中,δ=0.4。交易安排如下:时间戳价格数量36000。000 20.00 15036000.000 20.00 200时间戳价格数量36000。000 20.00 10036000.000 20.00 250时间戳价格数量36000。000 20.00 350为了说明由于这一增强而带来的性能提升,图3绘制了这一匹配2程序未匹配的交易的细分,作为Nb的函数,Nb是单个批次降低的最大规模。当Nb=1(左侧第一个点)时,匹配与匹配1程序相同(在绘制的示例中δ=0.4)。正如预期的那样,当NBP增加时,匹配性得到了改善:在我们的样本中,以前不匹配的交易中,至少有12%(LAGA.PA)和高达33%(BNPP.PA)的交易现在与BNPP的限额订单簿匹配。帕·奥拉普。PA占总交易量的4%以上。

16
可人4 在职认证  发表于 2022-5-15 16:01:22
然而,请注意,在该样本中,将批次大小增加到5或6行以上不会对性能产生任何显著影响。在仍然没有匹配2的订单中,另一个困难是通过仔细观察数据文件来确定的:时间不完全相同的市场订单有时必须汇总以匹配“报价”文件。如表6所示。Intimestamp价格数量33095。296 27.51 10033095.296 27.51 20233095.296 27.51 30333095.296 27.51 48633095.296 27.51 33433095.296 27.535 21033095.299 27.535 140时间戳侧面价格数量33046。84 A 127.535 3951[…]33085.836 B 1 27.51 226433095.297 B 1 27.51 83933095.31 A 1 27.535 3601表6:具有不同时间戳的“交易”文件行的汇总(上表),以匹配“报价”文件(下表)的更新。股票拉加。2010年1月28日,宾夕法尼亚州。表6,“交易”文件摘录的第五行必须进行汇总,以匹配订单(33095.297,CANCEL,B,1,27.51,1425),滞后1毫秒。但最后两个订单,尽管有两个不同的时间戳,间隔为3毫秒,必须进行聚合以匹配订单(CANCEL,A,A,27.535,350),报告一个订单延迟11毫秒,另一个订单延迟14毫秒。为了跟踪这些特殊情况,我们将上述匹配2程序分组到相同的批处理行中,这些批处理行的时间戳接近于第一次读取的时间戳,但不一定相等。测量单个批次的最大允许时滞的参数将表示为δb。为了说明由于这种增强而导致的性能提高,图4绘制了此匹配3程序未匹配的交易的比例,作为δb的函数。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-31 07:09