请选择 进入手机版 | 继续访问电脑版
楼主: 何人来此
162 20

[量化金融] 使用聚合数据重建订单流 [推广有奖]

  • 0关注
  • 1粉丝

会员

学术权威

79%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
50.7504
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24857 点
帖子
4216
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

何人来此 在职认证  发表于 2022-5-14 23:47:57 |显示全部楼层

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Reconstruction of Order Flows using Aggregated Data》
---
作者:
Ioane Muni Toke
---
最新提交年份:
2016
---
英文摘要:
  In this work we investigate tick-by-tick data provided by the TRTH database for several stocks on three different exchanges (Paris - Euronext, London and Frankfurt - Deutsche B\\\"orse) and on a 5-year span. We use a simple algorithm that helps the synchronization of the trades and quotes data sources, providing enhancements to the basic procedure that, depending on the time period and the exchange, are shown to be significant. We show that the analysis of the performance of this algorithm turns out to be a a forensic tool assessing the quality of the aggregated database: we are able to track through the data some significant technical changes that occurred on the studied exchanges. We also illustrate the fact that the choices made when reconstructing order flows have consequences on the quantitative models that are calibrated afterwards on such data. Our study also provides elements on the trade signature, and we are able to give a more refined look at the standard Lee-Ready procedure, giving new elements on the way optimal lags should be chosen when using this method. The findings are in line with both financial reasoning and the analysis of an illustrative Poisson model of the order flow.
---
中文摘要:
在这项工作中,我们调查了TRTH数据库为三个不同交易所(巴黎-泛欧交易所、伦敦和法兰克福-德意志B\\“orse)的几只股票提供的逐点数据在5年的时间里。我们使用一个简单的算法来帮助交易和报价数据源的同步,为基本过程提供了增强功能,根据时间段和交换情况,这些增强功能被证明是重要的。我们表明,对该算法性能的分析是一种评估聚合数据库质量的法医工具:我们能够通过数据跟踪所研究的交换上发生的一些重大技术变化。我们还说明了这样一个事实,即重建订单流时所做的选择会对定量模型产生影响,这些模型随后会根据此类数据进行校准。我们的研究还提供了有关商业签名的元素,我们能够更精确地查看标准Lee Ready程序,提供了使用此方法时应选择最佳滞后的新元素。研究结果与金融推理和订单流的说明性泊松模型分析一致。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Trading and Market Microstructure        交易与市场微观结构
分类描述:Market microstructure, liquidity, exchange and auction design, automated trading, agent-based modeling and market-making
市场微观结构,流动性,交易和拍卖设计,自动化交易,基于代理的建模和做市
--

---
PDF下载:
--> Reconstruction_of_Order_Flows_using_Aggregated_Data.pdf (761.6 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Quantitative Constructing Construction Illustrative Consequences

能者818 在职认证  发表于 2022-5-14 23:48:02 |显示全部楼层
使用聚合数据重建订单流Ioane Muni TokeMICS实验室,法国CentraleSupelec定量金融主席。埃里姆,新喀里多尼亚大学,新喀里多尼亚。佳洁士,日本科学技术厅,日本。2016年4月12日在这项工作中,我们对TRTH数据库提供的三个不同交易所(巴黎-泛欧交易所、伦敦和法兰克福-德意志交易所)的几个股票的逐点数据进行了调查,为期5年。我们使用了一个简单的算法来帮助交易和报价数据源的同步,为基本过程提供了增强,这取决于时间段和交换,被证明是重要的。我们证明,对该算法性能的分析是一种评估聚合数据库质量的法医工具:我们能够通过数据跟踪研究交易所发生的一些重大技术变化。我们还说明了一个事实,即在构建订单流时所做的选择会对基于此类数据校准的定量模型产生影响。我们的研究还提供了关于贸易签名的要素,我们能够对标准Lee Ready程序进行更详细的介绍,并给出了在使用该方法时选择最佳滞后的新要素。

使用道具

nandehutu2022 在职认证  发表于 2022-5-14 23:48:05 |显示全部楼层
这些发现与财务推理和订单流量的说明性泊松模型分析一致。1简介高频金融市场的发展每天产生大量数据。在对20世纪上半叶羊毛月度价格的研究(Mandelbrot(1963)报道)之后,每日指标(开盘、高点、低点、收盘等)在20世纪80年代和90年代,日内数据甚至(非常)高频数据都被广泛使用,如今已成为学者和从业者定量金融建模的共同研究对象。然而,目前交易所对完整和透明的数据没有太大的公开分歧,据我们所知,没有此类数据共享计划。由于交易所希望保护市场参与者的身份,因此不愿公布非常详细的数据。即使是匿名版本的此类数据也可能不容易找到,而且,在任何情况下,学者都可以以不可忽略的价格获得更不详细/粗略/聚合的数据。因此,大多数研究人员可以使用的基本数据库是“逐笔交易和报价”数据库,该数据库报告交易日出现的匿名交易和汇总报价的更新。这些是(据推测是详尽的)限制订单簿状态的快照,但它们没有详细说明触发从一种状态到另一种状态转换的消息。因此,研究人员设计了一些程序和算法来推断这些信息的一些特征,例如通过解决签名问题,该问题旨在确定交易是由买方还是卖方发起的。在这个问题上,Lee&Ready(1991)的开创性工作仍然是当前的研究对象(参见e.g.Easley et al。

使用道具

kedemingshi 在职认证  发表于 2022-5-14 23:48:08 |显示全部楼层
(2016年)为avery最近的贡献)。然而,市场微观结构的最新发展侧重于更详细的观点,即为了更好地掌握限价订单账簿的动态,需要研究每个订单的特征。这类工作的两个例子包括限制订单簿建模(例如,见Cont等人(2010年)、Muni Toke(2015年)、Huang等人(2015年)等)或带有Hawkes流程的订单流建模(见第6节中的参考文献)。这项工作涉及从标准的“交易”和“报价”数据库重建详细的订单流。如果数据库是完美的,也就是说,如果它们从未错过更新,如果它们的时间戳精确到一个单位精度,如果它们的所有来源都完全同步,那么这个练习将非常简单和直接。由于情况显然并非如此,因此订单流的构建需要一些适应的算法。在第2节中,我们描述了可用的数据库,在第3节中,我们详细介绍了在尝试同步“交易”和“报价”来源时遇到的困难,以及匹配过程的后果。我们提出了一个匹配程序,显著改善了基本原因。为了便于说明,本节给出了2010年和2011年在巴黎交易的股票的结果,但第4节提供了更广泛的结果,其中在三个不同交易所(巴黎-泛欧交易所、伦敦和法兰克福-德意志银行)的5年时间窗口中测试了匹配程序。结果表明,所提出的匹配显著提高了有序流重建的性能。

使用道具

何人来此 在职认证  发表于 2022-5-14 23:48:11 |显示全部楼层
非常有趣的是,这些测试表明,在这些时期影响这些交换的技术变化在逐点数据上留下了深刻的印记,即使在交换和数据供应商进行了几步转换和格式化之后也是如此。在第5节中,我们使用订单流重建来评估Lee Ready算法的商业签名。因为我们在订单簿中精确匹配了交易顺序,所以我们知道它们的“真”符号,并可以评估LeeReady程序的性能。我们表明,对于Lee Ready程序,不应推荐绝对滞后值,因为最佳滞后是时间相关的。此外,对算法性能的研究为影响交易所的某些事件提供了信息,甚至对聚合数据的贸易签名等高级操作也提供了信息,揭示了影响数据生产的技术变化。最后,第6节说明了重建顺序流时所做的选择如何可能影响重建样本上定量模型的校准,强调了所建议程序的重要性。2数据说明我们使用汤森路透滴答历史(TRTH)数据库,其形式可在法国巴黎CentraleSup’elec的定量金融主席处获得。该数据库为大量股票和期货提供了所有报告的交易和限额指令簿报价的所有更新,最多可提供给定数量的限额(通常为5或10,取决于研究的日期和股票)。第四个数据库通过其(唯一的)路透社仪器代码(RIC)识别金融产品。

使用道具

可人4 在职认证  发表于 2022-5-14 23:48:15 |显示全部楼层
为了说明,拉加。“PA”表示在巴黎交易的Lagard股票。对于在伦敦交易的巴克莱银行,“FEIZ9”是2009年12月3个月欧元银行同业拆借利率的期货,等等。CentraleSup’elec托管的版本涵盖了2008年至2013年大约五年的数据,有几个空白。从数据库中提取的基本信息为我们提供了任何给定产品和交易日的两个文件。第一个文件称为“交易”文件,列出了所有记录的交易(价格和交易量),时间戳以毫秒为单位。因此,“交易”文件有三个字段:“时间戳”、“价格”和“数量”。第二个将被称为“报价”文件,列出了在价差周围的五个或十个最佳限制下,订单簿中股票数量的所有更新(价格和数量)。因此,“报价”文件有五个字段:“时间戳”、“侧面”、“水平”、“价格”和“数量”。表1显示了stockLAGA数据库实际摘录的“交易”文件结构。2010年1月28日,宾夕法尼亚州。表1中所示的“交易”文件直接反映了时间戳价格数量35977。101 27.54 18035987.244 27.545 20035987.244 27.55 4735987.244 27.55 12935987.247 27.55 100表1:股票LAGA的“交易”文件摘录。PA于2015年1月28日宣读。表1的第一行表示,在时间35977.101(以秒为单位,即上午9:59:37.101)时,有180股股票以27.54欧元的价格进行了交易。换句话说,“交易”基本提取的每一行都是由法国巴黎银行开发的脚本完成的,我们不控制该脚本。一些文件可根据要求提供给学术研究人员。文件可以转化为触发交易的市场秩序。

使用道具

mingdashike22 在职认证  发表于 2022-5-14 23:48:19 |显示全部楼层
然而,“交易”明确规定了给定市场订单的价格和数量,但没有说明这是买入还是卖出市场订单:我们不知道微观结构方面的侵略者,即最后一方达成交易并因此触发交易。这将在第5节中讨论。表2显示了Stock LAGA数据库实际摘录的“quotes”文件的结构。2010年1月28日,宾夕法尼亚州。表2倒数第二行的意思是,通过比较TimeStamp侧面的价格数量36003。97 A 3 27.585 69736003.97 A 3 27.585 17736004.067 A 3 27.59 39136004.067 A 4 27.595 311360004.067 A 5 27.6 42736004.067 A 6 27.605 168836004.067 A 7 27.61 58636004.067 A 8 27.615 67736004.067 A 9 27.62 199936004.067 A 10 27.625 56836004.613 A 6 A 6 27.605 231536005.314 B 1 27.55 6829表2:股票报价摘录。PA于2015年1月28日发布了从顶部到第六行的消息,即在时间10:00:04.613,价格为27.605欧元,尺寸2315-1688=627,供应量(新订单)有所增加。表2的第二行表示,与提取物的第一行相比,在10:00:03.97时,价格为27.585欧元(size697-177=520)的有效量(取消长期限制订单)有所减少。简言之,我们的数据是逐笔数据,即所有修改订单簿的事件都被单独报告,而我们无法访问消息/订单的粒度,只能访问限制订单簿中订单大小的聚合量。3订单流量的重建我们的目标是重建精确的订单流量,即市场订单、限价订单和取消订单的完整序列,以及它们的价格和数量,从而生成给定的“交易”和“报价”文件。

使用道具

kedemingshi 在职认证  发表于 2022-5-14 23:48:22 |显示全部楼层
如果数据库完全一致,确定订单流量的通用算法将非常简单,但存在不一致,主要是因为交易和报价的时间戳不同步,可能是因为数据构建过程中可能存在不准确。3.1样本描述为了说明算法的构造,我们在数据库中从CAC 40中随机选择了七种流动股票(液化空气航空公司、阿尔斯通公司、法国巴黎银行、布伊格银行、家乐福银行、法国电力公司、法国电力公司)。对于每只股票,我们从数据库中提取上述2011年1月17日起的“报价”和“交易”信息。请注意,本样本仅用于说明,第4节将提供更多股票和广泛日期范围的更详细结果。3.2解析“报价”我们从一个2N对“价格”-“数量”的空结构开始,代表订单的状态,即N个最佳出价和出价的可用股份数量及其价格。(N=5或10个限额通常可用,具体取决于风险、理赔代收和交易日)。我们逐行扫描“报价”文件。第一行的读取允许我们初始化订单簿的状态。下面的每一行都是对给定数量和价格的更新:在第一种方法中,每一行都是一个新的限价单(以给定价格增加可用股份的数量),或取消现有的限价单(以给定价格减少可用股份的数量),如表2所示。解析“引号”文件时,必须小心“移位”。

使用道具

能者818 在职认证  发表于 2022-5-14 23:48:26 |显示全部楼层
例如,如果限额指令在价差内提交,或以当前N个最佳报价内的价格提交,而之前没有限额指令,则它将创建一个新级别,并重新编号所有后续级别。这会在“报价”文件中提供多条非实际订单的更新消息。表3给出了一个例子。前十行描述订单簿的当前状态。eleventhline显示,在价差内以27.52欧元的价格提交了一份尺寸为66的新限价订单。接下来的九行不描述任何限制顺序,只更新级别编号(新的级别2是级别1,依此类推)。在分析这些行时,要将leveln处的可用卷与leveln处的前一个卷进行比较- 1.为了跟踪潜在的变化。由于我们观察到一个固定数量的价格N(通常等于10),变动可能会使一些信息消失:例如,在表3中,由于本书这一侧的左移,1638股股票在询价方以27.59的价格出售的事实在更新时丢失。通过互惠机制,提问方右移(或出价方左移)可能会带来新的信息,而不是被解释为新的秩序。

使用道具

nandehutu2022 在职认证  发表于 2022-5-14 23:48:29 |显示全部楼层
例如,在下面的表4中,最后一行表明598股股票在投标的第十个限价27.095时可用,这不是一个新的限价指令——尽管是一个新信息——因为这个价格以前没有被监控过。当整个“报价”文件被解析时,我们有一系列的限价订单和取消订单——目前还没有市场订单——它们的时间戳为毫秒、侧面、水平、价格和数量。时间戳侧水平价格数量34819。7.55 9893484819.37,4 7.55555 318 3434819 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 7 5 5 5 318 3434819 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 7 7 7 7 7 7 7 7 7 5 5 5 5 5 5 5 5 5 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 5 5 5 5 5 318 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 27534819.37 A 8 27.5746834819.37 A 9 27.58 10034819.37 A 10 27.585 612表3:在本例的价差内,由于以之前没有限价指令的价格提交的限价而导致的报价“变动”。摘自LAGA的“报价”文件。PA于2010年1月28日发布。3.3在完美情况下解析“交易”文件订单流量重建的第二步处理“交易”文件的解析。如果一切都被完美记录,那么“交易”文件的每一行都应该代表一个市场订单,在完全相同的时间戳,我们应该在“报价”文件中看到相同价格和相同数量的数量减少。换言之,“交易”文件的每一行都应与相同数量、相同价格和时间戳的取消订单相匹配,该取消订单在分析“报价”文件后的订单流中产生。这个完美案例的一个例子记录在表4中。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2022-5-21 08:19