楼主: nandehutu2022
699 22

[量化金融] 五重奏音量投影 [推广有奖]

11
能者818 在职认证  发表于 2022-6-14 09:50:13
从数学上讲,对于许多数字的分布,有一个本地平均值;平均值的计算取决于分布。正态随机变量的算术平均值为正态,对数正态随机变量的几何平均值为对数正态,而Cauchy随机变量是闭合的,采用调和平均值。由于高估量比低估量的风险更大,因此几何Caverage在ALE度量中的性能优于算术平均值。此外,对数正态随机变量的几何平均数等于其中值,表示典型的交易量,不受异常值的影响。作为总日交通量对数的简单先验估计值,取最大N=20对数日交通量观测值的平均值(Xi=log(Vi))u=NPN+1i=1Xt-i、 在物理空间中,先验是Vprior=eu,由体积的几何平均数(GM)给出:GM[V]=eu=eNPNi=1Xi=(V·V·…·VN)1/N(9)。我们注意到,给定参数为u和σ的对数正态分布,算术平均值由以下公式给出:E[V]=N(V+V+…+VN)=GM[V]·Eσ/2(10)。根据一个关于任何一组正数的算术和几何平均值的著名不等式,算术平均值总是大于或等于几何平均值。ARMA分量自回归-移动平均(ARMA)模型的调整先验用两个多项式描述平稳随机过程,一个用于自回归,另一个用于移动平均。符号ARMA(1,1)是指具有一个自回归项和一个移动平均项的模型:yt=Дyt-1+εt+θεt-此处为1(11),yt=Xt- ut,Xt=log(Vt)-第t天总日交易量的对数,utis N=20天移动平均值:ut=NPNi=1Xt-i。

12
mingdashike22 在职认证  发表于 2022-6-14 09:50:18
在本节中,子指数t指历史日期的指数。为了使体积序列(准)平稳,我们从对数体积观测值Xt中减去运行平均ut:yt=Xt- ut。通过最小化已实现量和估计量之间的ALE指标,估计每种库存的系数Д和θ。标准普尔500指数的拟合参数几乎是通用的,仅因股票的不同而略有不同,典型值如下所示≈ 0.7和θ≈ -0.3. 与ARMA(1,1)相比,ARIMA(n,p,q)类更复杂的模型并没有给出显著的风险度量改进。该模型包括AR(1)和MA(1)模型;将MA(1)和AR(1)过程分开来看,可以更好地理解它们所描述的动力学,这是很有启发性的。对于AR(1)过程xt=Дxt-1+εtwith |Д|<1,Д对x的影响为:ε:0 1 0。。。x:0 1ДИ。。。(12) AR(1)模型描述了自回归行为,在这种行为中,下一期的值应被预测为与前一期值的平均值相差的^1倍。对于MA(1)过程,xt=εt+θεt-θ对x的影响为:ε:0 1 0 0 0x:0 1θ0(13)。预测误差的滞后值称为移动平均(MA)项。在abig体积日后,预测误差yt>0为正,MA分量因θ的负号而将前一天的数据转储到第二天。本质上,MA部分模拟了市场对外部冲击的反应,例如盈利公告或重大企业新闻;用AR分量模拟体积的内生趋势。图2显示了ARMA预测与20天算术平均和20天几何平均预测的对比示例。在特殊日期之前进行调整-如盈利公告、期权到期、指数再平衡、隔夜价格差距较大等-可能会提供信息,通常会导致更高的交易量。

13
大多数88 在职认证  发表于 2022-6-14 09:50:20
考虑到这一点,可以使用ALE误差度量进行线性回归:yt=mXk=1βkxk,t+εt,εt~ 此处N(0,σε)(14),yt=Xt- ut,Xt=对数(Vt),utis N=20天移动平均值ut=NPN+1i=1Xt-i、 m是自变量的个数。因变量yt=Xt的选择- ut很容易将回归系数β解释为之前的乘数。如果回归中唯一的自变量x1,tin是隔夜价差gt,那么今天成交量的价差乘数ηgap=exp(βgt)由以下公式得出:Vt=exp(ut)×ηgap(15)。图3显示了标准普尔500指数代表性样本的过度对数成交量与右侧价差波动率的横截面回归(14)。图2:IBM USEquityMar 13 2016apar 03 2016apar 24 2016May 15 2016Jun 05 2016Jun 26 2016Jul 17 2016Date0.00.20.40.60.81.01.21.4卷的算术平均值、几何平均值和ARMA预测,股票1e7Actual volumearithm avg predictiongeom avg PredictionarAMA predictionFigure 3:标准普尔500指数样本隔夜价差波动率上超额对数成交量的横截面回归(14)5.2日内成交量比例:U曲线将总日成交量水平与其日内形状(U曲线)分开建模,提高了模型的稳定性和可解释性。此外,当VWAP型算法使用u曲线时,它有自己的值。我们将日内交易量u(t)(u曲线)定义为在时间t的第i个bin期间交易的当日交易量的分数。u曲线c(t)(c曲线)的累积总和是从市场开放到时间t的当日交易量的分数:c(t)=V(t)V(t),u(t)=c(t)- c(t- 1) (16)这里,V(T)是每日总交易量,V(T)是截至T时的总交易量。在本节中,子指数T是指日内bin的指数。

14
何人来此 在职认证  发表于 2022-6-14 09:50:23
体积曲线c(t)和u(t)只有在收盘后才知道,因此必须使用估计的^c(t)和^u(t)进行预测。日内交易量趋于稳定,平均不会随时间发生显著变化。获得u型曲线估计器的一种简单方法是采用在较长历史时期内(例如,过去180天)估计的平均u型曲线。U曲线的函数回归。功能数据分析(FDA)处理以函数形式存在的数据的分析和理论。在函数回归中,响应或协变量是函数或向量数据。在本节中,我们对累积u型曲线c(t)与隔夜价差和日成交量分位数水平的依赖关系进行建模:ci(t)=β(t)+mXk=1βk(t)xk,i+εi(t),εi(t)~ N(0,σε)(17)这里i=1。。。,n—n个可用历史天数中的第i天;t=t。。。,T—当日的第T个bin;m为自变量数;xk,i–第i天的第k个独立scalarpredictor;βk(t)-预测因子xkon对时间t的反应的部分影响。为了可视化,我们进行了两个单独的函数回归:夜间价格差距和总日交易量百分比。在第一次回归中,我们使用隔夜价差作为一个独立的外部参数xk。差距被定义为当前开盘价与前一天收盘价在20天价格波动期间的相对差异。根据对绝大多数证券的回归分析(17),在隔夜价差与价格波动率的比率较高的情况下,日内成交量在一天开始时的值较高。这意味着,对于隔夜价差较大的日子,日内交易量从U形变为更接近倒J形。

15
mingdashike22 在职认证  发表于 2022-6-14 09:50:27
图4显示了标普500指数、标普中盘400指数和罗素2000指数代表性样本隔夜价差与价格波动率不同值的平均累积日内成交量。图4:S&P500、S&P Midcap 400、,和Russell 2000指数样本0 5 10 15 20 25 30 35 40自开市以来的10分钟仓位数量0.00.20.40.60.81.0累积u型曲线值间隙/vlt=0间隙/vlt=1间隙/vlt=2间隙/vlt=3间隙/vlt=4(a)标准普尔5000 5 10 15 20 25 30 35 40自开市以来的10分钟仓位数量0.00.20.40.60.81.01.2累积u型曲线值间隙/vlt=0间隙/vlt=1间隙/vlt=2间隙/vlt=3间隙/vlt=3间隙/vlt=4(b)标准普尔Midcap 4000 5 10 15 20 25 30 35 40个10分钟仓位自开盘以来0.00.20.40.60.81.0累积u型曲线值差距/vlt=0差距/vlt=1差距/vlt=2差距/vlt=3差距/vlt=4(c)罗素2000在图5中,S&P500指数代表性样本在单个独立变量上的函数回归平均系数(17)-隔夜价格差距:ci(t)=β(t)+β(t)giεi(t),εi(t)~ N(0,σε),(18)这里的GI是第i天隔夜价格与波动率的差距。交易日开始时β值越高,意味着隔夜价格差距越大,交易日第一个仓位的波动率上升幅度就越大。图5:标准普尔500指数函数回归的平均系数0.0000.0050.0100.0150.0200.0250.0300.035b1b10.00.20.40.60.81.0B0B0B0与隔夜价差回归类似,对总日交易量百分比(总日交易量低于当日的历史天数百分比)的回归表明,对于高交易量天数,日内交易量百分比从U形变为更接近倒J形。

16
nandehutu2022 在职认证  发表于 2022-6-14 09:50:30
图6显示了标普500指数、标普Midcap 400指数和罗素2000指数代表性样本的日均交易量百分比不同值的平均累积日内交易量。图6:标普500指数、标普中盘指数400指数、标普500指数和标普500指数的累计成交量百分比,和Russell 2000指数05 10 15 20 25 30 35 40自开市以来的10分钟仓位数量0.00.20.40.60.81.01.2累积u曲线值0%20%40%60%80%100%(a)标准普尔5000 05 10 15 20 25 30 35 40自开市以来的10分钟仓位数量0.00.20.40.60.81.01.2累积u曲线值0%20%40%60%80%100%(b)标准普尔Midcap 4000 5 10 15 20 25 30 35 40自开市以来的10分钟仓位数量open0.00.20.40.60.81.01.2累积u型曲线值0%20%40%60%80%100%(c)Russell 2000可以使用u型曲线形状对总日交通量的依赖性来根据总日交通量预测更新日内u型曲线的形状。虽然我们仅绘制聚合结果,但回归(17)系数通常依赖于股票。5.3流动性证券的交易量模型:日内仓位模型对于流动性证券,基于观察仓位j v(j)中交易量得出的日内交易量x(j)预测为:x(j)=logv(j)^u(j)(19) 请注意,我们使用的是估计的u曲线^u,而不是只有在当天结束后才知道的真实曲线。它显示了上一节中讨论的u型曲线建模的价值。在一天开始时,日内观察值的方差未知,使用公式(6):u(n)=uκ+n'xκ+n,(20)估计n个箱子后的对数日体积,其中κ参数是之前样本的有效大小。kis bin大小、市值和国家的最佳值取决于。k范围内kare的自然值∈ [0.3 - 0.8]Nprior。例如,对于美国的液体名称和10分钟桶,我们使用k=0.5。

17
kedemingshi 在职认证  发表于 2022-6-14 09:50:33
在有足够的观测值来估计日内观测值x的方差∑后,使用公式(4),估计的对数日体积由以下公式给出:u(n)=n'x∑+uσn∑+σ(21),其中u和σ是对数先验值的均值和方差,而'x和∑是由公式(19)定义的n个当日估计值x(n)的均值和方差。5.4非流动性证券的成交量模型:历史累积模型根据每个特定仓位计算每日总成交量估计值时,可能会出现不理想的情况(例如,当数据稀疏、不太稳定等时)。非流动性股票通常具有零成交量的条形,使得u曲线不稳定。在这种情况下,使用累积曲线形成日内观测值看起来更有希望。根据估计的累积u曲线^c(i)和截至时间i的累积日内交通量V(i)z(i)=log,我们将日交通量的对数定义为z(i)V(i)^c(i)(22)历史累积模型中n个箱子后的对数日体积估计值由以下公式得出:u(n)=uσ+z(n)\'Ohm(n) σ+“”Ohm(n) (23)此处Ohm(n) 是过去M天内使用z(n)对时间n的每日预测的离散度:Ohm(n) =MMXI=1(z(I)(n)- X(一)- (z(I)(n)- X(I))(24)此处X(I)是第I.5.5天拍卖量预测的总日交易量收盘拍卖交易量是日交易量的重要组成部分。绝对拍卖量和收盘时的交易量占当天总交易量的比例都非常不稳定,很难预测。收盘拍卖价格由交叉股票数量最大化的价格确定。考虑到交易者提交的订单规模相对于典型的交易量较小(这将影响收盘价的风险降至最低),且剩余的订单流量是随机的,拍卖价格很可能会接近连续交易日的收盘价。

18
kedemingshi 在职认证  发表于 2022-6-14 09:50:36
许多交易员以收盘价为标志,任何偏离收盘价的行为都会给他们带来风险。必须提前决定封闭式拍卖分配,因此最简单(也是最稳健)的策略是提交预测量的固定百分比。Stone,G.、T.Kingsley,G.Kan【2015年】建议遵循一条特殊的“经验法则”,以最大限度地减少闭市拍卖期间的价格影响:以预测的闭市拍卖量的12%和订单的12%中的较小者为准,并将该份额分配给闭市拍卖。ALE指标提供了合理预测质量和高估风险之间的权衡,这与执行百分比战略的目标相匹配。作为闭市拍卖量的基本预测,我们采用20天的几何平均数。在某些情况下,ARMAmodel可以略微改善ALE误差(在5%以内)。不幸的是,ARMA信号很弱,不能证明模型的不完全性增加。总的来说,围绕主要期权和未来到期以及滚动和指数再平衡,收盘拍卖量会增加。在美国,最引人注目的拍卖量高峰出现在三个交易日。三巫节是每年三月、六月、九月和十二月的第三个星期五。在那些日子里,市场经历了股票市场指数期货、股票市场指数期权和股票期权的同时到期。图7给出了成交拍卖量的典型示例。图7:IBM US Equity的收盘拍卖量为了考虑季节性,我们进行了线性回归:yt=βdt+εt,εt~ N(0,σε)(25)此处yt=Xt- ut超过平均水平的原木拍卖量;Xt=原木(Vat)原木拍卖量;ut——过去20天的平均原木拍卖量;和dtdummy变量,用于季度期权到期日。

19
何人来此 在职认证  发表于 2022-6-14 09:50:39
它允许我们计算今天拍卖量的期权到期日乘数ηa=exp(βdt):Vat=exp(uat)×ηa(26)对于正常天数,收盘拍卖量的行为不稳定,在收盘前30分钟几乎与交易活动无关。对于上述特殊日期,连续交易日的总日交易量与收盘拍卖量之间存在相关性。在图8中,我们绘制了标普500指数代表性样本在特殊日期的日成交量与其几何平均数之比的闭市拍卖量与几何平均数之比的回归图:图8:标普500指数子样本在特殊日期的闭市拍卖量与日成交量之比使用实时拍卖不平衡信息可以获得更好的拍卖量准确性。该信息仅在关闭前几分钟可用,并可使用上述贝叶斯技术与几何平均值相结合。6形成最终预测剩余日交易量VDrem是估计日交易量VDrem与迄今为止交易量V(t):VDrem(t)=VDrem的差值- V(t)。主要关注点如下:VDrem(t)=eu(t)[1- ^c(t)](27)预计在时间和时间之间交易的估计交易量:V(t,t)=(VDrem(t)+V(t))[^c(t)- ^c(t)](28)人类交易者需要知道一些实际数字来设置执行算法的参数,例如预期的紧急程度或订单的结束时间。了解tand tV(t,t)之间的预期成交量可以帮助交易者选择成交量算法参与的预期参与率:<ρ>t,t=SV(t,t)(29)这里S是订单大小。

20
mingdashike22 在职认证  发表于 2022-6-14 09:50:42
或者,在给定参与率ρ:t=inf{t:S=ρV(t,t)}(30)的情况下,预测器允许我们估计执行的结束时间。可以向对u曲线分析(应严格遵守VWAP计划)和紧急建议感兴趣的VWAP交易员提供类似的分析。当对给定股票使用VWAP时,可以显示关于u曲线的分散信息,以提高可靠性。7结论我们提出了一套预测股票日内交易量的相关模型。我们没有建立单一的复杂模型,而是提出了一种方法,即分别校准历史日交易量和日内u曲线的多个简单模型,并通过贝叶斯公式将其合并在一起,贝叶斯公式自动考虑模型输入组件的不确定性。使用不对称误差度量(ALE)对模型进行校准,该度量赋予高估误差更大的权重。致谢我们感谢Andrei Iogansen捍卫我们研究的科学严谨性,感谢ArunVerma在整个项目中的深刻反馈。我们感谢Arthur Umanski和Russell Langton的敏捷实施和持续支持。数学附录我们的主要假设是,日交易量和日内仓位遵循对数正态分布。如果V的对数为正态分布,则随机正变量V为对数正态分布:X=对数(V)~ N(u,σ)。对于参数θ=(u,σ)的正态变量X,大小为n的样本的可能性由以下公式给出:p(X |θ)=nYi=1fθ(xi)=(2π)-n/2σ-nexp公司-2σnXi=1(xi- u)!(31)让我们表示∑和'x-样本的经验方差和平均值。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 13:19