楼主: nandehutu2022
1065 34

[量化金融] 订单流量对价格影响的线性模型2。混合物 [推广有奖]

11
mingdashike22 在职认证  发表于 2022-5-11 06:08:19
10要求模型的独立参数数量必须等于独立方程的数量。对于订单流量和价格影响,我们考虑交易时间t内订单流量和价格变化的联合动态∈ N.每个事件都是一个有积极迹象的交易(t=+1)如果是买方发起的或负面的(t=-1) 如果是卖方发起的。对于价格,我们区分了两种可能性,即贸易改变价格(πt=C)或不改变价格(πt=nc)。请注意,如果即时价格发生变化,我们不考虑幅度。对于大型股票,这是一个小问题,因为价格变化几乎总是±1滴答,而对于小型股票,这是不正确的,我们失去了关于价格变化大小的信息。在本文中,我们使用MTDg模型来描述有符号事件的序列{(t、 πt)}t∈N→ {Xt}t∈N、 因此,模型的状态数为m=4。通过任意映射,得到模型状态与有符号事件之间的关系t=-1,πt=C→ Xt=1,t=-1,πt=NC→ Xt=2,t=+1,πt=NC→ Xt=3,t=+1,πt=C→ Xt=4。主要关注的是[15,16,1]中介绍的交叉函数和自相关函数Cπ,π(`)。因为η=P(Xt)≡ P(t、 πt)B(`)=P(Xt;Xt+`)≡ P(t、 πt;这些关系式cπ,π(`)=E[tI(πt=π)·t+`I(πt+`=π)]P(π)P(π)=XTt+`Xπtπt+`tI(πt=π)t+`I(πt+`=π)P(t、 πt;t+`,πt+`)P(π)P(π),其中I(πt=π)是指示函数,可以用η和B(`)表示。例如,对于πt=NC和πt+`=NC,以下关系保持p(NC)=η+η,CNC,NC(`)=b2,2(`)- b2,3(`)- b3,2(`)+b3,3(`)(η+η)。在接下来的两小节中,我们将根据美国市场的真实金融数据估算MTDg模型。我们将考虑两种不同的参数化和估计方法。

12
nandehutu2022 在职认证  发表于 2022-5-11 06:08:22
Firstone作为一个基准案例,基于最大似然估计(MLE),并使用一个参数化,该参数化保留了混合物的概率解释,即它假设参数(λg,Qg)为1≤G≤在0和1之间。此外,为了能够应用极大似然估计,我们将施加(λg,Qg)1的非常强的结构≤G≤p、 减少p(m)中的参数数量- m) +p- 1.~ 300P=100到11。在第二种情况下,我们放松了(λg,Qg)1的约束≤G≤在0和1之间进行比较,我们使用GMM。我们证明了一个合适的参数化可以将估计简化为一个约束线性系统的解,我们证明了它是一个凸问题。该模型约束较弱,我们能够可靠地估计500个参数,显著提高了模型相对于基准案例的性能。3.1到目前为止,文献中提出的MTDg模型的强约束MTDg模型估计方法涉及低阶模型。不幸的是,我们的案例需要对模型的高阶版本进行估计,以捕获贸易标志流量的长期相关性。等式8的对数似然函数是高度非线性的,对于较大的p参数化值,很难找到优化问题的解决方案。为了减少参数数量并避免非线性约束,我们对参数施加了一种函数形式,该函数形式自动满足所有约束。对于λgit,假设幂律标度是很自然的,λg=Nβg-β、 N在哪里-1β=Ppi=1g-β. 这种选择背后的原因是λgin的值会影响大滞后的相关性,而大滞后在经验上会随着滞后慢慢衰减。通过假设买卖对称,可以实现问题的另一个重要简化,从而定义中心对称矩阵Qg。

13
何人来此 在职认证  发表于 2022-5-11 06:08:25
这个假设导致qgij=qgm-i+1,m-j+1,对于i,j=1,对于过程的一阶平稳分布,i=m-i+1,对于i=1,M例如,qg=qg,因为在时间t发生了销售订单价格变化事件- g.在时间t,卖出订单非价格变化事件的概率等于在时间t,卖出订单价格变化事件的影响-g关于在时间t时,购买订单不改变价格事件的概率。如上所述(见定理2.1),我们考虑矩阵QG与特征值1共享相同的左特征向量。写下Qg=Q+~Qg,我们使以下强参数化dansatz:Q=巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴巴,~Qg=-ue-αg-νe-αgνe-αgue-αgue-αgνe-αg-νe-αg-ue-αg-ue-αg-νe-αgνe-αgue-αgue-αgνe-αg-νe-αg-ue-αg,(11) αij在哪里≥ 0、施加A=1/2- B、 A=1/2- B、 0≤B≤ 1/2, 0 ≤B≤ 1/2 ,-B≤u≤ B-B≤u≤ B、 B- 1/2 ≤ν≤ 1/2 - B、 B- 1/2 ≤ν≤ 1/2 - B、 (12)我们自动满足模型的所有约束。此外,根据需要,可以立即看到^ηQg=0,其中^η=地下一层-2B+2B,1-2B2-4B+4B,1-2B2-4B+4B,B1-2B+2B,最后,等式11中的参数化和等式12的线性约束保证了矩阵在行上具有正确的规范化,Pjqgij=1,g、 i和0<qgij<1,g、 我们的选择背后的直觉是,参数qgij决定了时间t的事件i和时间t的事件j之间的相关性-g、 在[1]中图4的左面板中,我们报告了微软大型股票的经验相关性,我们看到了一个相当不同的行为,这取决于调节事件。例如,非价格变化事件之间的订单流量相关性非常持久。这促使人们选择幂律衰减前因子λg。

14
可人4 在职认证  发表于 2022-5-11 06:08:29
然而,由于λg乘以矩阵的所有条目Qgwe需要在qg矩阵中包含不同的衰减,以便重现涉及价格变化事件的经验相关的更快衰减,因此我们引入了四指数衰减率αij(i,j=1,2)。该模型的参数可以通过极大似然估计得到。由于似然函数是高度非线性的,所以优化问题是非平凡的。然而,由于参数化,问题的维数很低,并且约束是线性不等式。参数总数为11,θ={β,Bi,ui,νi,αij},其中i,j=1,2。后果在图1和图2中,我们绘制了根据MTDg(100)模型的蒙特卡罗模拟计算出的相关函数,以及从微软(MSFT)和苹果(AAPL)数据的MLE中获得的参数值(有关数据集的详细信息,请参见论文[1]第4.1节)。更准确地说,我们比较了价格变化和非价格变化事件与经验事件的自相关和互相关Cπ,π(`)。可以注意到,对于小蜱类股票,该模型可以在短时间尺度上重现相关性的结构,但不能重现其持续性。对于大型股票,经验相关性的持续性也没有得到很好的再现,MTD预测的小滞后相关结构也不足以满足经验数据。模拟相关性的持久性不足可以解释为优化指数β太高。同样对于largetick股票的情况,我们得出结论,矩阵Qgis假设的函数形式不足以重现经验关联的不同衰减速度。尽管如此,这种建模假设的优点是,即使对于高阶模型,估计过程也非常快。

15
nandehutu2022 在职认证  发表于 2022-5-11 06:08:32
在下一小节中,我们将探索更好的替代方案。3.2弱约束MTDg模型定义。在这里,我们介绍了本文的主要方法创新,即MTDg模型的参数化,即使参数数量非常大,也可以用GMM进行估计。为了激发它,让我们考虑具有m个状态的DAR(p)过程(例如在[14]中用作订单流的模型)。该模型可视为MTD(p)模型的特例,其中所有g,Qg的转移矩阵都相同≡ Q=1T^η+η(I- 1T^η),其中1是一行m个,参数^的范围在0到1之间。与特征值1对应的Q的左特征向量是^η,因为它属于I的核- 1T^η。遵循同样的想法,我们引入了MTD(p)模型,其中Qg=1T^η+Qg(13)和^ηQg=0。此外,qgM的标准化使得每一行的qgSum为零,因此这些矩阵将具有负元素。如定理2.1所示,所有的Qg都有相同的左边。参考文献[1]中考虑的m=2的情况对应于一个MTD(p)模型,其转移矩阵对于所有的g,Qg都是相同的≡ Q和Q=ρ 1 - ρ1 - ρ ρ.在平稳条件下,这两种状态是等概率的,通过求解左特征值问题^ηQ=^η100101102可以验证这一点`-100-10-1.-10-2010-210-1100Cπ1,π2(`)MSFTCNC,NCCC,CCC,NCCNC,C图1:强约束MTDg的MLE校准。根据MSFT数据(实线)和经验曲线(三角形)估计的MTDg(100)模型模拟的有符号事件的自相关函数和互相关函数Cπ,π(`)之间的比较。误差响应于一个标准偏差。估计参数值为β=2.38、B=0.018、B=0.40、u=0.018、α=0.0、ν=0.48、α=0.47、u=0.04、α=0.003、ν=0.42和α=0.0。

16
大多数88 在职认证  发表于 2022-5-11 06:08:35
接近零且以水平实线为界的值的刻度是线性的,而在该区域之外,刻度是对数的。100101102`010-210-1100101Cπ1,π2(`)AAPLCNC,NCCC,CCC,NCCNC,C图2:强约束MTDg的MLE校准。根据AAPL数据(实线)和经验曲线(三角形)估计的MTDg(100)模型模拟的有符号事件的自相关函数和互相关函数Cπ,π(`)之间的比较。误差响应于一个标准偏差。估计参数值为β=2.21,B=0.38,B=0.01,u=-0.22, α= 0.0, ν= -0.07,α=0.0,u=0.27,α=0.043,ν=0.21,α=0.0。接近零且以水平实线为界的值的刻度是线性的,而在该区域之外,刻度是对数的。特征向量^η与特征值1。很容易证明这个模型的条件概率可以写成asP(Xt=i | Xt)-1=我,Xt-p=ip)=ηi+pXg=1agig,i,(14)式中agig,i≡ λg(~Qg)ig,i.因此矩阵Ag≡ λgqgd描述p的偏差-由^η给出的平稳值的有序转移概率。最后,如附录C所示,该模型的定理2.1方程组为B(k)- ηTη=pXg=1B(k- g) Ag。(15) 该线性系统可用于根据平稳概率η和二元分布B(k)的知识估计模型,即矩阵Ag。然而,存在两个技术问题:o估计模型可能没有概率解释,即估计模型可能产生大于1或小于0的转移概率;o等式15的解给出了矩阵Ag,而人们可能需要分别使用λgand(~Qg),因此识别问题必须通过任意选取一个参数来解决。

17
何人来此 在职认证  发表于 2022-5-11 06:08:38
然而,请注意,模型的动力学与此选择无关。下面我们将讨论这些问题。为了有一个定义良好的概率模型,并且能够使用定理2.1来保证解的存在性和唯一性,它还必须保持0<ηi+pXg=1agig,i<1,(i,i,…,ip)∈ Xp+1,对应于2mp+1约束。显然,在实际应用中,不可能处理之前的许多条件,但我们可以通过施加必要且有效的条件^ηi+pXg=1maxig来满足所有这些条件阿吉,我< 1.我∈ X(16)^ηi+pXg=1minig阿吉,我> 0, 我∈ X(17),这是仅有的2m不等式约束。在这些条件下,过程得到了很好的定义,并且具有唯一的平稳解(定理2.1),可以通过求解优化程序^q=argminq来进行模型的估计∈Rp(m)-2m+1)kd- K·qks。t、 ^ηi+pXg=1maxig阿吉,我< 1.我∈ X^ηi+pXg=1最小阿吉,我> 0, 我∈ X(18),其中p(m)的元素- 2m+1)-维度向量d对应于EQ的左侧。15,namelyd=(b1,1,…,b1,m)-1.bm-1,1, . . . , bm-1米-1.bp1,1,bp1,m-1.bpm-1,1, . . . , bpm-1米-1) 用bki,j=bki,j- ^ηi^ηj,向量q对应于模型的参数λgqgi,jq=(a1,1,…,a1,m)-1.是-1,1, . . . , 是-1米-1.ap1,1,ap1,m-1.apm-1,1, . . . , apm-1米-1) 根据公式15,矩阵K的元素是bki,j的线性组合(我们不报告矩阵,因为它的形式是不透明的)。选择公式18中的约束条件的原因是,我们在附录D中证明了以下命题:命题3.1如果K不是单数,则公式(18)的优化程序是严格凸的Rp(m-2m+1)。因此,如果存在一个局部极小值,那么它就是一个全局极小值。

18
可人4 在职认证  发表于 2022-5-11 06:08:41
凸性特性解决了问题的高维性问题,模型也可用于大阶p。应用于阶流和冲击。我们现在考虑将上述MTDg模型应用于m=4过程,共同描述订单流量和价格变化。如前一节所述,我们通过利用买卖对称性来降低系统的维数,这导致了中心对称^η和B(k)。事实上,对于m=4,我们得到了bki,j=bkm-i+1,m-j+1,对于平稳分布,i=m-i+1,对于i=1,M买卖对称性和矩阵B(k)的标准化将B(k)中的自变量数量减少到5p,每个滞后k有5个。因此,我们得到了B(k)=bk1,1bk1,2^η- bk1,2- bk2,2- bk3,2^η- η+bk2,2+bk3,2- bk1,1bk2,1bk2,2bk3,2^η- bk2,1- bk2,2- bk3,2^η- bk2,1- bk2,2- bk3,2bk3,2bk2,2bk2,1^η- η+bk2,2+bk3,2- bk1,1^η- bk1,2- bk2,2- bk3,2bk1,2bk1,1.为了找到等式18问题的解决方案,我们假设B(k)和^η的中心对称性不会改变矩阵k的秩。在这种情况下,解决方案是唯一的,并且很容易证明∧Qg也必须是中心对称的,如∧Qg=~qg1,1~qg1,2-qg1,2- c(~qg2,2+~qg2,3)-~qg1,1+c(~qg2,2+qg2,3)~qg2,1~qg2,2~qg2,3)-qg2,1- qg2,2- qg2,3-qg2,1- qg2,2- ~qg2,3~qg2,3~qg2,2~qg2,1-~qg1,1+c(~qg2,2+qg2,3)-qg1,2- c(~qg2,2+~qg2,3)~qg1,2~qg1,1, (19) 式中c=^η/^η。有了这个定义,Qgis中的独立参数的数量也相当于每个g的5个。我们现在可以求解方程18的系统,其未知数是矩阵g的组成部分。这样我们就得到了乘积λgqgi,j的值,而不是分量λgandqgi,j的值。出于这个原因,我们规定qg1,1、~qg1,2、~qg2,1、~qg2,2和qg2,3之间的五个分量之一与滞后g无关。

19
何人来此 在职认证  发表于 2022-5-11 06:08:45
我们任意fixqg2,1≡ q2,1。我们的左边是从Qg(每个g有4个)得到的4p自由参数,p- 1.λgq的参数。我们总共有5p自由参数,这与独立分量bki,j的数量完全相同。产品λgqgi,jd的值定义了MTDg模型。qgi、j=~qi、j的不同选择导致不同的因子分解,但导致相同的高阶马尔可夫链。选择的任意性证明了所有混合模型都存在众所周知的可识别性问题。文献中存在许多迭代求解等式18约束优化问题的算法。一个广泛使用的类属于序列二次规划(SQP)家族[27]。然而,我们优化的一个问题是约束是非光滑函数,这是通常的SQP算法所需的一个必要条件。在最近的一篇论文中,Curtis和合著者[28]提出了序列二次规划梯度采样算法(SQP-GS),该算法可应用于非光滑、非线性目标和约束函数。为了解决优化问题,我们实现了这个算法。后果我们在MSFT和AAPL上估算了上述MTDg(100)模型。在展示结果之前,我们提到,我们也使用公式(15)估算了模型,没有公式的附加约束。16岁和17岁。我们发现了负转移概率,这表明施加约束以进行有意义的模型估计(并保证解的存在性和唯一性)的重要性。现在我们转向正确约束的模型。图3和图5显示了MSFT和AAPL的λqqgi、jj的估计。尽管估计的参数很多,但结果表明它们只是中等噪音。

20
何人来此 在职认证  发表于 2022-5-11 06:08:49
此外,值得注意的是,λqqgi,jarepresent的负值,即使通过构造,模型的转移概率在[0,1]中得到了很好的定义。显然,估计表明,开始讨论的概率混合可能有意义地不适用于目前的数据。图4和图6显示了根据校准模型的蒙特卡罗模拟计算并与实际数据进行比较的有符号事件的相关函数Cπ、π(`)。可以注意到,对于小型股票,我们显著改善了图2的结果。与基准相比,新的估计方法再现了独立于条件事件的有序符号相关性的高持久性。对于大型股票,其相关性呈现高度非平凡的结构,GMM方法极大地改进了图1的结果。特别是,非价格变动事件的高度持续性得到了很好的再现。此外,与之前的估计方法相比,CNC,C(`)曲线衰减更快,因此更接近数据。3.3大盘股票签名图评估MTDg模型质量的另一种方法是分析它对价格波动的描述程度。如上文和[1]所述,价格变化事件的影响对大型股票几乎是价格独立的(在TIM2模型内)。这意味着signatureplot由以下公式给出:DTIM2(`)≈ DLF+GC(1)P(C)+2GC(1)`X0≤n<m<`P(C)CC,C(m)- n) ,(20)完全由相关函数CC,C(`)确定(一旦估算了GC(1)的值)。如上所述,该相关函数仅由MTDg模型近似再现,尽管它经过校准以最小化到所有Cπ,π(`)的距离。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 10:52