楼主: 可人4
931 39

[量化金融] 日内流动性的内生动力学 [推广有奖]

11
能者818 在职认证  发表于 2022-6-11 03:15:34
由于隐性交易成本可以通过缓慢的交易来降低,其他衡量标准是指所考虑的市场的节奏或速度。参考时间间隔内的交易价值和波动率是这类典型的衡量指标。因此,我们选择了四个似乎是流动性最重要特征的量化指标:o买卖价差(ψ),也称为订单簿的紧密度,是限额订单簿中最佳可用买卖价格之间的差异。它描述了立即完成不超过相应第一个非空价格限制深度的股票订单的成本。当我们考虑5分钟仓位时,每个仓位开始处的买卖价差被视为变量的值交易价值/营业额(V)可以定义为特定时期内进行的交易的总价值。交易量大通常意味着交易速度快,以及执行大额订单的成本低。设B(d,τ)表示d天的τ-第5分钟时间段。交易值为nbyv(d,τ)=Xtk∈B(d,τ)q(tk)p(tk),(1)其中(tk)是所有连续交易时间(日期时间)的序列,而q(t)和p(t)分别是时间t记录的交易量和交易价格。o波动率(σ)。根据这一主要特征的许多不同估计量,我们决定使用Garman-Klass波动率,也称为OHLC波动率。请注意,5分钟时间尺度内的微观结构噪声对价格变化有相当大的影响,因此naive估计器不可避免地会有偏差(有关微观结构噪声对挥发性估计的影响的详细信息,请参见[42])。设h=max{p(tk):tk∈ B} ,l=最小值{p(tk):tk∈ B} 是binB=B(d,τ)中的高交易价格和低交易价格,让o=p(inf B),c=p(sup B)表示B的开盘和收盘中间价。

12
mingdashike22 在职认证  发表于 2022-6-11 03:15:37
bin B的Garman-Klass波动率估值器由^σ(d,τ)=log给出hl公司- (2日志(2)- 1) 日志有限公司. (2) o账面规模(B)是在最佳出价和最佳出价水平下可用的股份数量。第一级队列的深度大致显示了等待新的限额指令执行所需的时间,从而使交易员能够评估价格与交易即时性之间的权衡。Italso还显示了如何以最佳可用价格执行大型市场订单,而无需在较高/较低价格水平上消耗流动性的额外成本。其他利息量包括自由流通价值,即公共投资者所持有的股票份额,以及以ticksψ为单位的平均买卖价差*, i、 e.买卖价差和勾号大小的比率。后者很重要,因为它让我们能够区分小股票(ψ*& 2) 和大型股票(ψ*. 1.3). 小型股票和大型股票的资产收益分布之间的差异是众所周知的(例如[15]),因此我们将对上述变量之间在利差/利差关系背景下的潜在差异和依赖性感兴趣。2.2数据集描述本工作中使用的数据集来自资本基金管理公司(CFM)出于研究目的对市场数据的记录。原始数据由连接到每个交易场所的实时数据馈送中的逐条记录组成,以二进制格式存储,然后在需要时根据每个交易场所提供的时间戳进行合并,记录数据出现的时间。在本文中,我们将不涉及明确的交易成本;它们包括费用、税收和融资或借款成本。即

13
大多数88 在职认证  发表于 2022-6-11 03:15:41
B(d,τ)=[t,t+τ) ,t=d·d+t+τ·τ,其中d=24小时,τ=5min,开放时间,取决于市场。为了方便起见,我们把p(t)=p(max{tk:tk≤ t} )。开高关低;事实上,Garman-Klass波动率是基于这四个变量的最佳无偏分析尺度不变估计量,并且相对于naive波动率估计量(就估计方差而言)具有7.4更高的效率。有关更多信息,请参见【17】。由场馆排放。使用这些原始数据,我们在五分钟内重新排列它们,以计算我们的四个流动性变量。仅使用了来自连续拍卖阶段的数据。这意味着我们排除了在拍卖前阶段(在所有这些阶段的开盘和收盘时,以及在我们两个亚洲市场的午休前后(东京证券交易所的午休前后和香港交易所的午休开始时),进行的大型集合竞价交易和公布的不一致的出价和询价。我们也没有使用亚洲市场午休时间的任何数据。作为一个序列,我们每天在美国大约有80个箱子,在英国有100个箱子,在亚洲市场有60个箱子(有关每个市场的详细信息,请参见[32])。数据库中不包括半天的交易(如圣诞节),但包括晚开盘日。当出现交易暂停时,不考虑重新开放的看涨期权拍卖,不包括没有交易的仓位(等待重新开放),但我们可以有只开放几秒钟或几分钟的仓位。我们无法明确确定断路器,因此我们无法提供其激活的任何统计数据。对于每种股票,每个仓位都标有日期和时间;它可以制作图1的日内中位数,并研究日内季节性。

14
mingdashike22 在职认证  发表于 2022-6-11 03:15:44
我们的数据集涵盖2011年1月至2016年3月期间;注:这是在美国和欧洲实施Reg NMS(以及随后的十进制,请参见[23])和MIFID(以及相关的分段,请参见[32])之后。表1提供了按国家分列的描述性统计数据;主要的评论是,尽管基点上的买卖价差范围很大,但不同地区的买入卖出价差差异较小,香港股市主要是“大型股票”。此外,我们的美国股票(202支)比英国股票(98支)多,香港和日本股票(51支)更少。为了说明微观结构和监管多样性,我们通常会按国家提供细分。对于第4.1节,我们需要上市公司的资本化。我们使用的数据集是交易所提供的数据集,已由资本基金管理公司记录。地点香港日本英国库存总量11 40 98 202avg。天数966 934 1101 1241avg。最大5分钟存储箱(数据点)总数63730 55890 110400 96780。每天的垃圾箱数量平均66 60 102 78个。每天垃圾箱数量平均65.94 59.81 100.3 77.96。买卖价差(bp)17.48 19.30 6.76 3.55平均值。买卖价差(ticks)1.10 1.44 1.54 1.71平均值。GK波动率(bp/bin)9.45 12.44 8.63 11.46(大型股票)9.45 12.47 7.57 12.39(小型股票)-平均12.17 9.27 10.93。账面规模(百万美元)5.16 89.32 5.95 0.09(大型股票)5.16 167.30 10.51 0.12(小型股票)-28.42 2.02。054平均值。账面规模(平均交易规模)52.3 89.7 18.7 21.3(大型股票)52.3 192.0 28.3 31.9(小型股票)-17.3 13.2 4.7平均。营业额(百万美元)9.73 186.62 38.99 1.20(大型股票)9.73 193.10 44.05 0.89(小型股票)-93.61 23.01 2.48表1:每个位置的数据集统计数据。

15
kedemingshi 在职认证  发表于 2022-6-11 03:15:47
除第一行外,其他所有行中的值均为每个国家所有股票的平均值。请注意,香港所有可用股票均为大型股票。2.3预处理数据清理。在预处理阶段,在5分钟内对所有四个变量进行估计后,进行数据归一化。首先,对于每只股票,其交易日少于断路器被激活且市场已重新开放并准备在abin结束前几秒钟进行交易的交易日。阿斯利康(英国)3M20 40 60 80 100012345交易量40 60 80 1000123456波动性GK20 40 60 80 1000123456Avg BA-spread20 60 60 80 1000.00.51.01.52.02.5第一限制的平均规模10 20 30 40 50 60 700.00.51.01.52.02.53.03.54.0交易量10 20 30 50 60 700.00.51.02.53.03.5波动性GK10 30 50 60 7001234Avg BA-spread10 20 40 50 50 60 700.00.51.01.52.52 02.5初始平均尺寸limitFUJIFILM(英国)国泰航空10 20 30 40 50 600 12345678交易量10 20 30 40 50 600 1234波动性GK10 20 30 40 50 600.00.51.01.52.02.5Avg BA-spread10 20 30 40 50 600.00.51.01.52.02.53.0First limit10 20 30 40 600.00.51.01.52.03.54.0交易量10 20 30 50 600 1234567波动性GK10 20 30 50 50 50 50 600.00.51.01.52.03.53.03 5平均BA-spread10 20 30 40 50600.00.51.01.52.02.5First Limit的平均规模图1:AstraZenaca(英国股票)、3M(美国股票)、FUJIFILM(日本股票)、国泰航空(香港上市股票)四个流动性变量的中值、25%和75%分位数。垂直单位的选择应确保一天的平均值为1;在横轴上,我们使用“料仓编号”(非空5分钟料仓的连续编号);这意味着在东京或香港午休期间,我们不计算任何“bin”,但我们使用一条空白的垂直线来定位午休时间。80%的垃圾箱可用,并且完全移除。

16
大多数88 在职认证  发表于 2022-6-11 03:15:50
其次,波动率的零值(即当5分钟内没有交易时,波动率定义为零)已被高于阈值的最小值替代 = 10-6在同一天或前一天观察(每只股票单独观察)。这确保了所有变量都是正值。平稳化。众所周知,流动性变量具有日内季节性(例如参见[32]或图1):开盘后波动率和交易量立即较高,而在盘中波动较大。当天结束时,交易量增加,形成“U形”;波动也是如此,但幅度较小。对欧洲股市而言,美国股市的开盘引发了波动性和成交量的飙升。在美国市场开放前一小时,美国市场宏观经济新闻(如非农就业人数)的披露也会影响交易量和波动性。基本原因支持买卖价差与波动性之间的关系:市场参与者作为做市商(或至少提供流动性,即促成买卖价差)害怕市场风险(参见【25】中的经济解释和【20】中的应用数学解释);Thutheory预测,当波动率较高时,买卖价差较大。在交易结束之前,情况并非如此,因为在一天结束时以流动性库存为目标的流动性提供商有一个激励箱,可能由于交易暂停或技术原因而无法使用。收紧买卖价差,试图获得限价订单的费用回扣,而不是通过可销售订单的消费流动性,支付费用。此外,买卖价差还受勾号大小的限制(即允许的最小价格上涨,有关勾号大小对买卖价差的影响的讨论,请参见[27])。

17
kedemingshi 在职认证  发表于 2022-6-11 03:15:53
由于当价差值为一个刻度时,流动性提供商不可能在买卖价差内发布限额订单(并因此收紧限额),因此他们倾向于在现有的第一个限额下发布更多数量(在买卖双方)。因此,第一限额的平均规模(即我们的账面规模变量)增加。因此,账面规模和买卖价差通常以相反的方式变化:当买卖价差较大时,账面规模较小,反之亦然。这些影响引入了典型的日内季节性;需要消除它们,以关注围绕这一平均行为的动态。因为所有变量都是正的,所以我们将它们的对数取为symmetrizethem,然后去掉季节性。使用符号x(d,τ)表示binτ(即小时为τ+Δτ·τ,其中τ为开放小时,Δτ为我们的bin大小–5分钟),预处理为y(d,τ):=f(x(d,τ))=log x(d,τ)-DDXd=1log x(d,τ)|{z}log'x(τ),在数据集的所有可用天数d内计算得出。图2显示了平稳化程序对达哈纳公司股票(美国上市股票)的影响。原始变量olatilityspreadturnoverbook size 15 10 5 0 5 10 15 20 250.00.51.01.52.02.5log-变量olatilityspreadturnoverbook size 2.0 1.5 1.0 0 0.5 0.5 1.0 1.5 1.0 1.5 2.00.00.51.01.52.02.5去季节化日志-变量olatilityspreadturnoverbook size图2:原始变量分布的估计密度函数(左),达哈纳公司采用对数(中间)和去季节化(右)后,原始变量具有高度偏斜的分布,取值的数量级非常不同,因此左图中的密度不会按比例缩放。2.4指标和方法我们旨在评估上述四个市场特征范围内的内生信息。

18
nandehutu2022 在职认证  发表于 2022-6-11 03:15:56
为了了解信息是如何在市场中传播的,我们将使用单变量(AR)和多变量(VAR)线性自回归模型。虽然这类模型是基本的,其能力反映了变量之间的关系可能有限,但它们得到了很好的研究,通常用于财务建模。最终,他们让我们为内生信息建立基准较低的估计值,如上一节所述。性能指标和模型选择。由于预处理的数据是时间序列形式,因此自回归模型的估计需要选择滞后(模型的顺序),这通常使用Akaike或贝叶斯信息标准进行。然而,我们的目标是衡量使用过去的数据可以预测什么,而不是找到统计上最合理的模型。因此,我们将模型参数的数量视为次要因素,并比较所有滞后到40的模型的性能。对于每个股票和变量,根据变量预测的样本外统计选择最佳模型。请注意,VAR模型通常会对其包含的每个变量实现不同的RFR。参见【1】和【39】。估算程序。在单变量方法中,我们分别对每个变量使用AR模型的标准最大似然估计。在多变量情况下,VAR模型使用所有可能的变量子集进行估计。对于每个预测任务,选择最佳(子集,滞后)pairwas。图14显示了每个输入变量子集获得最佳结果的频率,而图15显示了最频繁选择的滞后。为了减少估计量的方差,规范不同长度时间序列的估计程序,分别对20个部分重叠批次的模型进行训练和验证。

19
能者818 在职认证  发表于 2022-6-11 03:15:59
每个批次包含150个连续的培训日(即9000到15000个连续的箱子),以及随后用于验证的150天。批次的起始点分布均匀,因此第一批包含可用期的开始,而最后一批包含可用期的结束。3程式化事实和基准结果线性自回归模型形成了标准且经过充分研究的预测模型,能够捕捉变量之间的线性依赖关系。其简单而强大的形式使其成为时间序列数据建模基准解决方案的常见条件。图3:Welltower股份有限公司每个变量的自相关(蓝色菱形)和偏自相关(红色圆圈)函数。经过消除季节性并将正值变量转换为实值变量的预处理后,数据具有自回归建模的适当形式。为了使这种方法有意义,时间序列需要表现出非零自相关结构。尽管这些变化很大,但所有股票和变量都可以观察到正自相关;图3.3.1中给出了一个示例,单变量自回归模型得出的统计数据在变量和股票之间变化;表2显示了不同市场的平均预测结果。一般来说,内生信息随着市场规模的扩大而增加。通常可以最准确地预测每个考虑的流动性变量,因为单个预测任务由股票和变量指定。请注意,对于VAR模型,变量的每个组合将作为一个预测任务。在机器学习命名之后,每一对将被视为我们模型的超参数。Rof AR模型美国英国日本香港平均波动率0.448(0.045)0.208(0.099)0.143(0.047)0.102(0.026)。

20
nandehutu2022 在职认证  发表于 2022-6-11 03:16:02
买卖价差0.523(0.129)0.380(0.159)0.195(0.098)0.096(0.054)账面规模0.640(0.173)0.535(0.104)0.440(0.154)0.659(0.075)交易价值0.408(0.090)0.205(0.084)0.130(0.076)0.116(0.056)表2:不同市场和变量的单变量预测结果。给出的值是各市场股票样本外验证集上最佳模型的平均R值和R的标准偏差(括号内)。英国股市紧随其后,亚洲股市收市。香港股市的账面规模是一个例外,可以预测其Rof为65.9%,与美国股市非常接近(R≈ 64%).波动率似乎是每个市场上股票的可实现预测能力(即R)最稳定的变量。然而,市场各不相同,平均可预测性处于不同的水平。值得注意的是,英国股市的内生信息更为多变,其RSPAN介于0%到40%之间。更多详情将在第4.3节中介绍。另一个区别波动性与其他变量的因素是市场记忆。由于我们的方法涉及在不同的超参数设置中对性能最佳的模型进行网格搜索,模型的滞后表明过去可以找到多少重要信息。与其他变量相比,美国和英国的股票模型需要更少的滞后值才能实现波动性的最佳表现。限制订单簿动态取决于特定股票的刻度大小。这对价差预测本身以及账面规模都有直接影响。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 02:37