楼主: nandehutu2022
538 19

[量化金融] 使用聚合数据重建订单流 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

74%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
67.0366
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24315 点
帖子
4027
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-20

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Reconstruction of Order Flows using Aggregated Data》
---
作者:
Ioane Muni Toke
---
最新提交年份:
2016
---
英文摘要:
  In this work we investigate tick-by-tick data provided by the TRTH database for several stocks on three different exchanges (Paris - Euronext, London and Frankfurt - Deutsche B\\\"orse) and on a 5-year span. We use a simple algorithm that helps the synchronization of the trades and quotes data sources, providing enhancements to the basic procedure that, depending on the time period and the exchange, are shown to be significant. We show that the analysis of the performance of this algorithm turns out to be a a forensic tool assessing the quality of the aggregated database: we are able to track through the data some significant technical changes that occurred on the studied exchanges. We also illustrate the fact that the choices made when reconstructing order flows have consequences on the quantitative models that are calibrated afterwards on such data. Our study also provides elements on the trade signature, and we are able to give a more refined look at the standard Lee-Ready procedure, giving new elements on the way optimal lags should be chosen when using this method. The findings are in line with both financial reasoning and the analysis of an illustrative Poisson model of the order flow.
---
中文摘要:
在这项工作中,我们调查了TRTH数据库为三个不同交易所(巴黎-泛欧交易所、伦敦和法兰克福-德意志交易所)的几只股票提供的逐笔数据5年的跨度。我们使用一个简单的算法来帮助交易和报价数据源的同步,为基本过程提供了增强功能,根据时间段和交换情况,这些增强功能显示出重要的意义。我们表明,对该算法性能的分析是一种评估聚合数据库质量的法医工具:我们能够通过数据跟踪所研究交易所发生的一些重大技术变化。我们还说明了这样一个事实,即重建订单流时所做的选择会对随后根据此类数据校准的定量模型产生影响。我们的研究还提供了有关商业签名的要素,我们能够更精确地查看标准Lee Ready程序,并提供了使用此方法时应选择最佳滞后的新要素。研究结果与财务推理和订单流的说明性泊松模型分析一致。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--

---
PDF下载:
--> Reconstruction_of_Order_Flows_using_Aggregated_Data.pdf (761.6 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Quantitative Constructing Construction Illustrative Consequences

沙发
大多数88 在职认证  发表于 2022-6-26 15:02:18 |只看作者 |坛友微信交流群
法国CentraleSupelec定量金融主席,使用聚合数据重建订单流。ERIM,新喀里多尼亚新喀里多尼亚大学。CREST,日本科技厅,日本。2016年4月12日摘要在这项工作中,我们调查了TRTH数据库为三个不同交易所(巴黎-泛欧交易所、伦敦和法兰克福-德意志交易所)的几个股票提供的5年期逐笔数据。我们使用一个简单的算法来帮助交易和报价数据源的同步,并根据时间段和交换情况对基本过程进行了增强,这显示出重要的意义。我们表明,对该算法性能的分析是一种评估综合数据库质量的法医工具:我们能够通过数据跟踪所研究交易所发生的一些重大技术变化。我们还说明了这样一个事实,即在构建订单流时所做的选择会对根据此类数据校准的定量模型产生影响。我们的研究还提供了有关商业签名的要素,我们能够对标准Lee Ready程序进行更详细的了解,并给出了使用此方法时应选择最佳滞后的新要素。

使用道具

藤椅
mingdashike22 在职认证  发表于 2022-6-26 15:02:21 |只看作者 |坛友微信交流群
这些发现与财务推理和订单流量的说明性泊松模型分析一致。1简介高频金融市场的发展每天产生大量数据。在对20世纪上半叶羊毛月度价格的研究(Mandelbrot(1963)报道)之后,每日指标(开放、高、低、闭……)20世纪80年代和90年代常用的日内数据甚至(非常)高频数据现在是学者和从业者定量金融建模的共同研究对象。然而,目前交易所对完整和透明数据的公开程度不高,据我们所知,没有此类数据共享计划。由于交易所希望保护市场参与者的身份,因此不愿发布非常详细的数据。即使是匿名版本的此类数据也可能不容易找到,而且,在任何情况下,学术界都可以以不可忽视的价格获得更为详细/粗糙/聚合的数据。因此,大多数研究人员可用的基本数据库是逐笔“交易和报价”数据库,该数据库报告交易日内出现的匿名交易和汇总报价的更新。这些是(据说是详尽的)有限订单状态快照,但它们没有详细说明触发从一种状态到另一种状态转换的消息。因此,研究人员设计了一些程序和算法来推断这些消息的某些特征,例如通过解决签名问题来推断,签名问题的目的是确定交易是由买方还是卖方发起的。在这方面,Lee&Ready(1991)的开创性工作仍然是当前的研究对象(参见e.g.Easley et al。

使用道具

板凳
可人4 在职认证  发表于 2022-6-26 15:02:24 |只看作者 |坛友微信交流群
(2016)avery最近的贡献)。然而,市场微观结构的最新发展侧重于更详细的观点,其中需要研究每个订单的特征,以便更好地掌握限价订单簿的动态。此类工作的两个示例包括限额订单簿建模(例如,见Cont et al.(2010)、Muni Toke(2015)、Huang et al.(2015)等)或Hawkes流程的订单流量建模(见第6节中的参考资料)。这项工作涉及从标准的“交易”和“报价”数据库重建详细的订单流。如果数据库是完美的,也就是说,如果它们从未错过更新,如果它们的时间戳精确到一个不确定的精度,如果它们的所有源都完全同步,那么这项练习将是非常简单和直接的。由于情况显然并非如此,因此订单流的构建需要一些适应的算法。在第2节中,我们描述了可用的数据库,在第3节中,我们详细介绍了在尝试同步“交易”和“报价”来源时遇到的困难,以及匹配过程的后果。我们提出了一个匹配程序,显著改善了基本原因。为了便于说明,本节介绍了2010年和2011年巴黎交易的股票结果,但第4节提供了更广泛的结果,其中在5年的时间窗口内对三个不同交易所(巴黎-泛欧交易所、伦敦和法兰克福-德意志交易所)的匹配程序进行了测试。结果表明,所提出的匹配显著提高了有序流重建的性能。

使用道具

报纸
何人来此 在职认证  发表于 2022-6-26 15:02:27 |只看作者 |坛友微信交流群
非常有趣的是,这些测试表明,在这些时期影响这些交易所的技术变化在逐点数据上留下了深刻的印记,即使在交易所和数据供应商进行了几步转换和格式化之后也是如此。在第5节中,我们使用订单流重建来帮助评估Lee Ready贸易签名算法。因为我们在订单簿中准确地将交易与其顺序进行了匹配,所以我们知道它们的“真实”标志,并且可以评估LeeReady程序的性能。我们表明,不应建议Lee Readyprocedure使用绝对滞后值,因为最佳滞后是时间相关的。此外,对算法性能的研究提供了一些影响交易所的事件的信息,甚至是对聚合数据的商业签名等高级操作,揭示了影响数据生产的技术变化。最后,第6节说明了重建订单流时所做的选择如何可能影响重建样本上定量模型的校准,强调了拟定程序的重要性。2数据描述我们使用汤森路透Tick History(TRTH)数据库,其格式可在法国巴黎CentraleSup\'elec定量金融主席处获得。该数据库提供了大量股票和期货的所有报告交易和限额指令簿报价的所有更新,最多可提供给定数量的限额(通常为5或10,取决于所研究的日期和股票)。第四个数据库通过其(唯一的)路透社工具代码(RIC)识别金融产品。

使用道具

地板
nandehutu2022 在职认证  发表于 2022-6-26 15:02:30 |只看作者 |坛友微信交流群
为了举例说明,“拉加。“PA”表示在巴黎交易的股票Lagard,“BARC”。巴克莱在伦敦交易的标准,“FEIZ9”是2009年12月3个月欧元银行同业拆借利率等的期货。CentraleSup’elec托管的版本涵盖了2008年至2013年大约五年的数据,有几个缺口。数据库中的基本提取为我们提供了任何给定产品和交易日两个文件。第一个文件称为“交易”文件,列出了所有记录的交易(价格和交易量),时间戳以毫秒为单位。因此,“交易”文件有三个领域:“时间戳”、“价格”和“数量”。第二个文件将被称为“报价”文件,列出了排列在五个或十个最佳限制下的订单簿中股票数量的所有更新(价格和数量)。因此,“报价”文件有五个字段:“时间戳”、“侧面”、“水平”、“价格”和“数量”。表1显示了股票数据库实际摘录的“交易”文件的结构。2010年1月28日,宾夕法尼亚州。表1中所示的“交易”文件直接涉及时间戳价格数量35977.101 27.54 18035987.244 27.545 20035987.244 27.55 4735987.244 27.55 12935987.247 27.55 100表1:股票LAGA的“交易”文件摘录。PA于2015年1月28日宣读。表1的第一行表示在时间35977.101(以秒为单位,即上午9:59:37.101)时,以27.54欧元的价格进行了180股的交易。换言之,“交易”基本提取的每一行都是由法国巴黎银行开发的脚本完成的,我们并不控制该脚本。一些文件可根据要求提供给学术研究人员。文件可以转化为触发交易的市场秩序。

使用道具

7
kedemingshi 在职认证  发表于 2022-6-26 15:02:33 |只看作者 |坛友微信交流群
然而,“交易”明确规定了给定市场订单的价格和数量,但没有说明这是买入还是卖出市场订单:我们不知道微观结构方面的侵略者,即最后一方达成交易并因此触发交易。这将在第5节中讨论。表2显示了股票LAGA数据库实际摘录的“报价”文件的结构。2010年1月28日,宾夕法尼亚州。表2倒数第二行表示,通过比较时间戳侧面价格数量36003.97 A 3 27.585 69736003.97 A 3 27.585 17736004.067 A 3 27.59 39136004.067 A 4 27.595 31136004.067 A 5 27.6 42736004.067 A 6 27.605 168836004.067 A 7 27.61 58636004.067 A 8 27.615 67736004.067 A 9 27.62 199936004.067 A 10 27.625 56836004.613 A 6 27.605 231536005.314 B 1 27.55 6829表2:股票LAGA“报价”文件摘录。PA于2015年1月28日发布了从顶部开始的第六行,即在时间10:00:04.613,价格27.605欧元,尺寸2315-1688=627的订单量(新limitorder)有所增加。表2的第二行表示,与提取物的第一行相比,10:00:03.97时的有效量(取消长期限额订单)有所减少,价格为27.585欧元,size697-177=520。简言之,我们的数据是逐条记录的数据,因为所有修改订单簿的事件都被单独报告,而我们无法访问消息/订单的粒度,只能访问限额订单簿中订单大小的聚合量。3订单流量的重建我们的目标是重建精确的订单流量,即市场订单、限价订单和取消的完整序列,以及导致生成给定“交易”和“报价”文件的价格和数量。

使用道具

8
可人4 在职认证  发表于 2022-6-26 15:02:36 |只看作者 |坛友微信交流群
如果数据库完全一致,确定订单流量的一般算法将很简单,但存在不一致,主要是因为交易和报价的时间戳不同步,可能是因为数据构建过程中可能存在不准确。3.1样本描述为了说明算法的构造,我们在数据库中从CAC 40中随机选择了七种流动股票(液化空气公司AIRP.PA、阿尔斯通公司Alstom ALSO.PA、法国巴黎银行BNPP.PA、布伊格银行BOUY.PA、家乐福银行家乐福分行、法国电力公司EDF.PA、Lagard\'ere LAGA.PA)。对于每只股票,我们从数据库中提取上述2011年1月17日起的“报价”和“交易”信息。请注意,此示例仅用于说明,第4节将提供更多库存和广泛日期范围的更详细结果。3.2分析“报价”我们从2N对“价格”-“数量”的空结构开始,表示订单的状态,即N个最佳出价和要价的可用股份数量及其价格。(N=5或10个限额通常可用,具体取决于风险核保和交易日)。我们逐行扫描“报价”文件。读取第一行可以初始化订单簿的状态。下面的每一行都是对给定数量和价格的更新:在第一种方法中,每一行都是一个新的限额订单(增加以给定价格提供的股票数量),或取消现有的限额订单(减少以给定价格提供的股票数量),如表2所示。在分析“引号”文件时,必须小心“移位”。

使用道具

9
可人4 在职认证  发表于 2022-6-26 15:02:39 |只看作者 |坛友微信交流群
例如,如果在价差内提交限额订单,或以当前N个最佳报价内的价格提交,而之前没有限额订单,则会创建一个新级别,并对所有后续级别重新编号。这会在“报价”文件中提供多条非实际订单的更新消息。表3提供了一个示例。前十行描述订单簿的当前状态。eleventhline显示,在价差内以27.52欧元的价格提交了尺寸为66的新ask限额订单。接下来的九行不描述任何限制顺序,只更新级别编号(新的级别2是级别1,依此类推)。分析这些行时,要将leveln处的可用卷与leveln处的前一个卷进行比较- 1,以跟踪潜在的变化。由于我们观察到一个固定数量的价格N(通常等于10),变动可能会使一些信息消失:例如,在表3中,由于本书这一侧的左移,更新时失去了1638股股票在ask一侧的价格为27.59的事实。通过互惠机制,提问方右移(或出价方左移)可能会带来新的信息,这不能解释为新的秩序。

使用道具

10
nandehutu2022 在职认证  发表于 2022-6-26 15:02:42 |只看作者 |坛友微信交流群
例如,在下面的表4中,最后一行表明598股股票在投标的第十个限额上以27.095的价格可用,这不是一个新的限额指令,尽管这是一个新的信息,因为之前没有对该价格进行监控。当解析整个“报价”文件时,我们有一系列的限价订单和取消订单——目前还没有市场订单——其时间戳为毫秒、边长、级别、价格和数量。时间戳侧面价格数量34819.37 A 1 27.54 326344819.37 A 2 27.545 53034819.37 A 3 27.55 98934819.37 A 4 27.555 31834819.37 A 5 27.56 7934819.37 A 6 27.565 27534819.37 A 7 27.57 46834819.37 A 8 27.58 10034819.37 A 9 27.585 61234819.37 A 10 27.59 16384819.37 A 1 27.52 6634819.37 A 2 27.54 32634819.37 A 3 27.545 53034819.37 A 4 27.55 98934819.37 A 5 27.555 31834819.37 A 6 27.567934819.37 A 7 27.565 27534819.37 A 8 27.57 46834819.37 A 9 27.58 10034819.37 A 10 27.585 612表3:在本例价差内,由于以之前没有限额指令的价格提交的限额而导致的报价“变动”。摘自LAGA的“报价”文件。PA于2010年1月28日发布。3.3在完美情况下解析“交易”文件订单流量重建的第二步处理“交易”文件的解析。如果一切都被完美记录,那么“交易”文件的每一行都应该代表一个市场订单,在完全相同的时间戳,我们应该在“报价”文件中看到相同价格和相同数量的数量减少。换言之,“交易”文件的每一行都应与相同数量、相同价格和时间戳的订单流中的取消订单相匹配,该订单流由“报价”文件的解析产生。表4中记录了这一完美案例的一个例子。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 22:38