楼主: mingdashike22
1649 52

[量化金融] 高频交易的随机游走 [推广有奖]

21
nandehutu2022 在职认证  发表于 2022-5-6 16:14:54
也就是说,贸易持续时间di的分布由方程di=εiλi(8a)εi控制~ Exp(1)(8b)λi=λ′kYk=1Mk,i(8c)Mk,i=M和概率γkMk,i-1其他(8d)γk=1- (1 - γ′k)bk-\'k(8e)M=M概率为1/22-母性智慧。(8f)因此,MSMD可以用五个参数简洁地描述:∈ N、 λ>0,γ′k∈ (0,1),b∈ (1, ∞) 还有m∈ (0,2)。直觉是,在知道潜在状态变量的值的条件下,交易持续时间以指数形式分布,强度参数λi。然而,随着时间的发展,潜在状态Mk,i,具有不同持续度的切换值γk。这导致交易持续时间的无条件分布是指数的混合,这与第4.4节中描述的观测数据的过度分散性。潜在状态可以解释为在不同的时间尺度上具有不同影响的冲击,一些具有短期影响,而另一些具有长期影响。值b控制着持久性参数γk之间的紧密关系,并对模型的简约性负责:即使有大量的潜态k,模型也总是以总共五个参数为特征。b的选择决定了持久性参数值的异质性程度。有关MSMD模型的更多信息,请参见Chen等人(2013)和Calvetand Fisher(2008)。图6类似于Chen等人(2013)的图5。它显示了对MSMDdurations的模拟(使用表2中的“k=7”参数值)和潜在状态的相关时间路径,以及复合强度参数λi。图的倒数第二个面板描述了随机强度参数(在对数尺度上),该参数由以不同频率切换的最近状态驱动。

22
mingdashike22 在职认证  发表于 2022-5-6 16:15:02
这与贸易持续时间的简单指数模型形成对比,该模型定义了一个恒定的强度参数。结果表明,MSMD持续时间比恒定强度指数的持续时间表现出更大的异质性。Chen等人(2013年)将持续时间模型中的随机强度比作收益模型中的随机波动:“正如随机波动‘增加’高斯条件收益分布,MSMD‘过度分散’指数条件持续时间分布也是如此。”(第9页)。事实上,如下文所述,我们发现随机强度在离散时间和尾部育肥回报中起着双重作用。正如贸易持续时间的指数模型与贸易到达的泊松模型相关联,MSMD模型也与贸易到达模型相关联。和泊松一样,指定概率P(Nm(τ)=k),对于k=0,1,2。,与MSMDmodel相对应也会导致无法以封闭形式获得的时钟时间返回分布。然而,与复合泊松过程不同的是,对于高斯混合模型中用作混合权重的计数分布本身,我们无法获得封闭形式的解。幸运的是,我们可以通过蒙特卡罗模拟来近似计数分布。我们在第4.4节中展示了这种近似的一个例子。在MSMD模型下,rτ(t)的分布保持其层次结构,单位时间内的交易数量来自第一阶段的混合泊松分布。当高斯混合权重对应于与MSMD持续时间相关的计数概率时,我们将rτ(t)称为复合多重分形过程。

23
大多数88 在职认证  发表于 2022-5-6 16:15:05
复合多重分形过程的优势在于基础计数过程的可变性:相对于图6:k=7的MSMD交易间持续时间模拟,概率在更大种类的计数上的分散。上面板描述了潜伏期和MSMD强度参数的时间路径,下面板描述了自身的持续时间。该图的布局与Chen等人(2013)的图5所示相同。简单的泊松模型会在高斯混合中产生更大的不均匀性,从而为rτ(t)产生更厚的尾部。直观地说,随机变量rτ(t)以更高的概率在各种不同的高斯和之间切换。此外,复合多重分形模型通过马尔可夫切换潜在状态,在交易持续时间分布中产生自相关,从而明确产生波动持续性。4.3复合截断多重分形过程我们通过对MSMD模型的修改来扩充上述持续时间模型。具体而言,我们将MSMD模型与指数模型混合,使其预期最大值等于数据中观察到的最大持续时间,从而截断MSMD模型。我们将在第5节中提供有关安装程序的更多细节。数学上,di=min{dMSMD,dExp}(9a)dMSMD~ MSMD(`k,λ,γ`k,b,m)(9b)dExp~ Exp(νmax),(9c),其中等式(9b)表示DMSMD遵循系统(8)中概述的MSMD过程,选择νmax使Emax{dExp}等于数据中观察到的最大持续时间。截断过程可以被概念化为两种类型的交易者的结合,这两种交易者的特点是不同的统计过程。

24
nandehutu2022 在职认证  发表于 2022-5-6 16:15:10
一种类型的订单遵循与MSMD模型相关的计数过程,并构成交易所的大部分交易。第二类订单遵循一个简单的泊松事件时钟,只有当第一类订单之间的持续时间足够长时,才会产生交易。直观地说,这些类型可以被视为算法交易者(遵循MSMD计数过程),它们以较低的延迟竞争订单执行,以及人类交易者(遵循指数),它们相对于大部分交易独立地和外源性地行动,其订单发送的频率要低得多(持续时间更长)。与MSMD模型一样,截断的MSMD模型与只能通过蒙特卡罗近似获得的计数过程相关联。同样地,使用方程(5)中的关联截断MSMD计数过程产生rτ(t)的过程,我们称之为复合截断多重分形过程。我们将在第4.4节和第5节中展示,后一种模型可以更好地描述观测到的高频回波数据。4.4持续时间模型的比较我们现在对估计的持续时间模型进行简要比较,然后在第5节详细描述估计结果。这有助于激发以后的讨论,并强调模型组件的优缺点。图7显示了三个模型各500000个模拟持续时间的直方图,使用表1中报告的估计参数(第5节中描述)。每个面板描绘了一个模型的模拟持续时间直方图,并与被动期E-mini数据中观察到的持续时间直方图叠加。我们在200ms处截断直方图,将注意力集中在最大概率质量的区域。

25
大多数88 在职认证  发表于 2022-5-6 16:15:13
此外,为了突出分布尾部的差异,我们在对数刻度上显示了垂直轴。从图中可以明显看出,指数持续时间模型相对于MSMD和截断MSMD(TMSMD)模型提供的数据分布非常差。事实上,后两种模型所表现出的一个重要特征(如数据中所示)是过度分散:贸易持续时间的方差超过了它们的预期值。在指数模型下,E[di]=Var(di)。然而,数据分布的不对称性和长右尾产生了E[di]<Var(di)的实证结果。Chen等人(2013年)详细讨论了这一特征。图8显示了被动周期观测持续时间、模拟MSMD和TMSMD持续时间与模拟指数持续时间的Q-Q图。第二个面板是第一个面板的复制品,但纵轴上的比例有所缩小。从图中值得注意的最重要的是,数据的经验分布比指数分布的尾部要重得多。这一特性是上述过度分散的原因。此外,MSMD和TMSMD模型都会产生带有重尾的持续时间分布,但MSMD分布的细尾病相对于数据中观察到的情况来说是过度的。另一方面,TMSMD分布提供了一个更为接近的函数。贸易持续时间模型的另一个重要特征是自相关结构。图9显示了为每个模型模拟以及被动周期E-mini数据计算的100个滞后的样本自相关。正如Chen等人所指出的。

26
nandehutu2022 在职认证  发表于 2022-5-6 16:15:17
(2013),观察到的交易间持续时间在其自相关结构中表现出缓慢衰减,这表明图7:指数、MSMD和TMSMD模型下的模拟持续时间直方图,以及被动期E-mini回报数据中观察到的交易间持续时间。正在刷新长内存属性。相比之下,指数模型没有表现出自相关性,因为持续时间是以该模型的i.i.d.方式绘制的。另一方面,SMD和TMSMD模型对数据的样本自相关函数提供了更好的拟合,TMSMD与样本自相关函数非常接近。匹配持续时间的密度函数和自相关函数对于生成观测到的股票时间收益动态至关重要。最后,图10显示了与图7的持续时间密度和时钟时间间隔τ=10000 ms相关的计数密度。也就是说,使用每个模型的数据和模拟,我们在图8:分位数-分位数图中获得了贸易到达的各自频率计数。纵轴显示了SMD和TMSMD模型下模拟持续时间的分位数,以及被动期E-minireturns数据中观察到的交易间持续时间。横轴显示指数模型下模拟持续时间的分位数。所有模型参数取自表1。连续10000毫秒的时间间隔。为了突出尾部差异,我们再次在对数刻度上显示垂直轴。这些是方程式(5)中使用的实际密度的近似值,用于获得第4.1-4.3节中时钟时间返回的各种复合分布。每个面板将与持续时间模型相关的密度与数据的密度叠加。

27
可人4 在职认证  发表于 2022-5-6 16:15:20
正如我们在第4.1节中提到的,与指数持续时间模型相关的计数过程是一个泊松过程,如图10的第一个面板所示。显然,泊松分布对数据的拟合度很差,尤其是在与低计数和高计数相关的区域。在这种特殊情况下,τ的值比λ大得多,密度接近高斯分布(回想一下,纵轴以对数单位表示)。因此,我们预计混合高斯和泊松密度的复合泊松过程将无法很好地拟合数据,在这种特殊情况下,它们将非常符合高斯分布。相比之下,与MSMD和TMSMD持续时间相关的计数过程提供了更好的fit,尽管它们的右尾相对于数据衰减得太快。MSMD模型再一次为数据的经验密度提供了更好的拟合。图9:指数、MSMD和TMSMD模型下模拟持续时间的样本自相关函数,以及被动期E-mini returnsdata中观察到的交易间持续时间。5估计和结果利用第2节和第3节中描述的静态市场E-mini回报数据,我们估计了方程(5)中的成分分布参数,并从混合模型进行了模拟。特别是,我们首先估计了第4节中描述的持续时间模型,然后将其与交易时间收益的估计高斯分布合成为时钟时间收益的综合分布。

28
大多数88 在职认证  发表于 2022-5-6 16:15:24
我们使用蒙特卡罗近似法计算时钟时间收益的分布,并使用好几项指标和分布距离来评估候选模型。我们估计组成部分分布参数的贸易时间尺度m的选择不是模型固有的先验条件——理论上,我们可以估计m的各种值的组成部分分布。相反,我们只关注最可能的贸易时间尺度m=1,因为这最接近于基本的交易图10:τ=10000 ms的计数过程分布。每个面板显示了与本节描述的其中一个模拟(指数、MSMD和TMSMD)相关的计数分布,并覆盖了被动期E-mini回报的经验计数密度。使用表1中报告的参数估计值进行模拟。过程在这样一个精确的时间尺度上估计模型后,我们就可以从任何持续时间较长的时钟时间间隔的时钟时间回报分布中获得模拟。如果我们估计了largerm的交易时间成分,这是不可能的:我们将无法模拟分辨率低于所选m的时钟时间标度的时钟时间回报。尽管我们没有在这里报告结果,我们对m>1的模型进行了估计,并将其与具有可比分辨率的时钟时间模拟进行了比较——我们下面报告的结果对m.5.1泊松/指数估计的选择是稳健的。泊松分布的平均γ贸易到达的假设对应于平均v=γ呈指数分布的持续时间。证明指数平均值的最大似然估计是^ν=^γ=nnXi=1di,(10)其中di,i=1,2。

29
mingdashike22 在职认证  发表于 2022-5-6 16:15:27
n是给定交易时间标度的观察持续时间,m。表1第1列和第2列报告了m=1时η和γ的估计值,以及它们的标准误差的参数自举估计值。虽然这些参数(以及第5.4节中的高斯分布参数)的渐近标准误差估计值很容易获得,但我们报告了bootstrap估计值,以与下面的SMD结果保持一致。报告的标准误差几乎与估计的交感神经误差相同。指数/泊松TMSMD滴答时间高斯νγνmaxuσ300.7 3.326e-03 5866-7.103e-05 0.1196(2.405e-03)(2.642e-08)NA(2.928e-04)(2.072e-04)表1:指数、高斯和TMSMD参数的估计。对于TMSMD模型,k=7,剩余的MSMD估计值与表2中给出的值相对应。正确解释表1中的强度参数非常重要。由于我们现在回归到一个假设,即在特定时间间隔内到达的交易数量τ以泊松分布,因此Nm(τ)遵循强度参数γτ:Nm(τ)的泊松过程~ P oisson(γτ)。(11) 等式(11)表示,在一个区间内到达的mth交易数量τ为P oisson(γτ)。在我们的例子中,我们通过m=1和单位时间间隔τ=1毫秒来估计泊松参数。由此得出的估计值^γ=0.003326告诉我们,我们大致预期为0。每毫秒到达003326次交易,或大约每秒三次交易。然而,考虑到泊松率参数是如何随时间单位变化的,这也意味着我们预计大约15笔交易在5秒钟内,30笔交易在10秒钟内,依此类推。5.2继Chen等人之后的MSMD估计。

30
可人4 在职认证  发表于 2022-5-6 16:15:30
(2013)中,我们使用汉密尔顿(1989)的非线性滤波方法评估了与方程(8a)-(8f)相关的MSMD模型的可能性,并使用标准爬山算法最大化了可能性。为了估计MSMD模型的所有参数,我们迭代了候选值\'k,并估计了剩余的四个参数λ、γ\'k、b和m。表2报告了这些估计值以及在最大似然估计中\'k={0,1,…,9}的对数似然值。我们得出结论,k=3时,可能性最大,k值较高时,可能性下降非常缓慢。在我们随后对模型进行的测试中(见第5.5节),我们发现k=7的MSMD模型对数据的影响略有改善。这是因为“k”值越高,持续时间过程的持续性越强,从而导致τ>5000 ms时时钟时间返回的波动性具有更大的自相关性。否则,“k”的模型结果和统计测试非常相似∈ {3, 4, 5, 6, 7}. 为了简洁起见,我们在本节的其余部分采用了“k=7”。表2的最后一行报告了“k=7”估计值的参数引导标准误差(使用1000次迭代)。图11描述了表2中报告的“k=7”参数估计值坐标方向上的对数似然性。结果表明,对数似然在估计值附近平滑且表现良好。我们注意到的一个有趣的特征是对数似然相对于m的对称性——这是随机变量m取值mand 2的直接结果- 以同样的概率。正如Chen等人(2013年)所指出的,当m=1时,参数γ和b未被识别,这在对数似然曲线中表现为渐近行为。因此,两个值达到最大值,我们选择哪个值无关紧要。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-30 15:23