楼主: nandehutu2022
1067 34

[量化金融] 订单流量对价格影响的线性模型2。混合物 [推广有奖]

21
大多数88 在职认证  发表于 2022-5-11 06:08:52
因此,在金融应用的背景下,有趣的是,根据特征图DTIM2(`),回答TDG CC,C(`)和经验数据之间的差异,这涉及相关函数的积分。在图7中,我们展示了与上述MTDg模型的强约束和弱约束版本的等式20对应的曲线,其中额外的拟合参数DLFI使用OLS进行优化,以最小化10010102G的经验曲线和理论曲线之间的距离-100-10-1.-10-2.-10-3010-310-210-图3:弱约束MTDg的GMM校准。根据MSFTdata估算的p=100阶MTDg模型的等式18优化问题的参数agi、JS解图。接近零且以水平实线为界的值的刻度是线性的,而在该区域之外的刻度是对数的。100101102`-100-10-1.-10-2010-210-1100Cπ1,π2(`)MSFTCNC,NCCC,CCC,NCCNC,C图4:弱约束MTDg的GMM校准。根据MSFT数据(三角形)和经验曲线(实线)估计的MTDg(100)模型模拟的有符号事件的自相关函数和互相关函数Cπ,π(`)之间的比较。误差条对应一个标准偏差。接近零且以水平实线为界的值的刻度是线性的,而在该区域之外的刻度是对数的。100101102g-10-1.-10-2.-10-3010-310-210-图5:弱约束MTDg的GMM校准。根据AAPLdata估算的p=100阶MTDg模型的等式18优化问题的参数agi、J解图。

22
可人4 在职认证  发表于 2022-5-11 06:08:56
接近零且以水平实线为界的值的刻度是线性的,而在该区域之外的刻度是对数的。100101102`10-210-1100101Cπ1,π2(`)AAPLCNC,NCCC,CCC,NCCNC,C图6:弱约束MTDg的GMM校准。根据AAPL数据(三角形)和经验曲线(实线)估计的MTDg(100)模型模拟的有符号事件的自相关函数和互相关函数Cπ,π(`)之间的比较。误差响应于一个标准偏差。100101102103`1.11.21.31.41.51.6D(`)(bp2)MSFTTIM2强约束弱约束数据图7:MSFT数据的特征图:经验数据(交叉)、DLF=0.41(虚线)的弱约束(GMM)MTDg(100)模型、DLF=0.43(虚线)的强约束(MLE)MTDg(100)模型以及校准的TIM2模型的理论预测[1]。模型。我们看到,从模型的特征图来看,弱约束和强约束MTDg的表现几乎相同。我们还展示了使用经验CC,C(`)的TIM2模型的预测;在这种情况下,近乎完美的fit是GC(`)的结果≈ GC(1)适用于大型股票。请注意,只有当数量DTIM2(`+1)(`+1)时,TIM2价格过程才严格区分- DTIM2(`)是一个独立于`的常数。事实上,我们有这个DTIM2(`+1)(`+1)- DTIM2(`)`=DLF+GC(1)P(C)+2GC(1)P(C)X0<n≤`CC,C(n),这意味着价格过程对`>`*仅当CC,C(`>`*) = 0.图1和图7表明,这确实是`*≈ 10.4样本外分析在前面的章节中,我们介绍了两种MTDg模型——强约束和弱约束——并讨论了基于MLE和GMM的两种替代估计方法。

23
可人4 在职认证  发表于 2022-5-11 06:09:00
由于它们在参数数量和估计效率上都有所不同,因此在样本外分析中测试模型的预测能力时,比较它们的性能非常重要。我们将预期预测误差(EPE)定义为E(θ)=E[L(Xt,^Xθt)],其中Xt是观察到的过程,^Xθ是基于参数集θ的模型的Xt预测值,以及过程Xt的p过去观察值,作为性能的一种度量。在分类数据的文献中,我们通常使用对数似然L(Xt,^Xθt)=-2Pmi=1I(Xt=i)log(^χt)i=-2 log(^χt)Xt,也称交叉熵。我们要提醒的是,^χ是描述模型预测的m-概率向量,在前面的公式中,我们取Xt-th分量。模型A模型B模型CMSFStepe1.928 1.1.199 1.181se0.003 0.004 0.004 0.000 0.004巴塞1.744 0.799 0.799 0.785 SE0.0 0.003 0.004 0.0 0 0 0.004 0.0 0 0.004 0.0 0 0.004 0.0 0.000.000.000.005巴塞1.1.1.1.1.744巴塞1.744 1.744 0.744 0.799 0.799 0.799 0.799 0.0.789 0.789 0.785 SE0.0.0.0.0.0 0 0 0.785 SE0.0.0.0.0 0 0 0 0 0.0 0.0 0 0 0 0.785 SE0.0 0 0 0.0.0 0 0 0.0 0 0 0 0 0 0 0.785 SE0 0.0 0。模型A:无条件概率作为预测因子。模型B:根据公式11,通过MLE估计的强约束TDG(100)。参数总数:11。模型C:通过GMM估计的弱约束MTDg(100)模型,矩阵如公式19所示。参数总数:500。MTDg(p)模型该概率向量为^χt=pXg=1χt-gλgQg(21),其中,与前面一样,χt-除实现的分量Xt外,零的m向量-g、 一旦模型被校准,这个量就可以很容易地计算出来,因为它取决于跃迁概率。

24
kedemingshi 在职认证  发表于 2022-5-11 06:09:04
EPE值在[0+∞), 如果样本的所有概率(^χt)Xt等于一(完美预测),则为零;如果样本的所有概率(^χt)Xt为零(预测不可能的事件),则为零。我们将表现最好的模型作为EPE最低的模型进行评估,并将MTDg作为无条件概率作为未来信号事件预测的模型进行基准测试。表1列出了SFT、美国银行花旗集团(BAC)、通用电气(GE)、思科(CSCO)、AAPL和安达马松(AMZN)数据的不同预测模型的所有EPE值。样本外分析的方案如下:在10天的时间段内对模型进行训练,然后使用MLE(强约束)或GMM(弱约束)提供的参数集计算下一个交易日的损失函数。我们通过将估计值提前一个交易日来重复这个过程。最后,我们通过平均所有测量的损失函数来计算整体损失。在大成交量股票的情况下,EPE值的财务解释是明确的,因为价格变化事件以几乎1的概率将价格移动一个成交量,因此MTDg模型的状态与价格回报之间存在直接关系。因此,对于largetick股票,EPE值可以作为高频时间尺度下收益可预测性的代理。从表1中我们可以看出,两种MTDg模型的性能都超过了基准。

25
mingdashike22 在职认证  发表于 2022-5-11 06:09:07
更重要的是,有明确的证据表明,对于所有考虑的股票,具有最高参数数的弱约束模型(模型C)优于强约束MTDg。这些结果排除了过度拟合假设,并支持了弱约束TDG模型是捕捉有符号事件高频动态的良好候选模型的说法。5讨论和结论配套文件[1]已经确定,在相同的基础上处理所有市场订单会导致对负滞后的“响应函数”(平均滞后影响)和特征图的错误预测。单一传播者模型和历史相关影响模型的设计目的不是为了捕捉过去价格回报和未来订单流量之间的反馈效应。通过引入线性影响模型(TIM和HDIM)的扩展版本,这些严重差异已显著减少,该模型考虑了一组更丰富的已签名事件(见[15,16])。促使我们推广影响模型的论点是,价格变化和非价格变化事件必须不同地处理。这一点对于大型股票尤其明显,在这些股票中,价格变动事件极为罕见,但信息量却非常丰富。这种看似微小的修改导致了一类扩展的传播者模型,这些模型以惊人的真实感描述了价格和订单流动的交织高频动态。尽管如此,第一部分[1]中对市场动态的线性描述仍然过于僵化:这些模型旨在描述市场在异源特定订单流下的演变。

26
可人4 在职认证  发表于 2022-5-11 06:09:10
这一事实严重限制了线性影响模型的预测能力。混合过渡分布模型通过引入订单流的显式随机模型部分解决了上述问题,该模型被视为动力学的内生成分。它是专门为内在离散的变量设计的,这是大型股票价格回报率的一个显著特点。在本文中,我们提出了一类所谓的DMTDG模型,作为离散自回归DAR(p)在多事件上下文中的自然扩展。我们的目标是测试一个经过校准的MTDg模型能够很好地解释订单流量的统计数据,即四个事件的字符串:买入/卖出–价格变动/不变动事件。我们工作中最有趣的一个方面是方法论性质,涉及“大型”模型的实践校准。第3.2节和附录C中介绍的一类弱约束MTDg模型代表了一系列丰富的离散模型,其中自由参数的数量等于独立可观测相关函数的数量。这一事实允许引入一个数值程序,以非常稳健的方式解决模型参数的估计问题。这个结果建立在证明优化问题在参数空间是凸的基础上。从财务角度来看,我们已经证明——或许令人惊讶的是——MTDg模型的弱约束版本比其他更简洁的版本更真实地捕捉到了有符号事件的动态。

27
大多数88 在职认证  发表于 2022-5-11 06:09:13
尽管参数数量较多,但样本外分析证实,在不过度拟合数据的情况下实现了如此良好的性能。MTDg模型和新估计方法带来的改进是显著的,但在将模型预测与经验相关函数进行比较时,仍然存在一些差异。这些偏差可能有几个原因。Raftery在[20]中已经指出了第一个问题,他在[20]中指出,存在MTDg模型无法复制的相关性区域。第二个原因是,尽管MTDg模型是正确的数据生成过程,但仅涉及来自二阶条件的信息的估计方法可能会降低MLE方法的效率。最后,MTDg模型代表了p阶全马尔可夫链的简约近似。这种简约可能以牺牲模型的现实性为代价。从微观结构的角度来看,我们可以假设过去的一连串事件-1.Xt-pis的信息量不足以预测Xt的值。特别是,对于largetick股票,价格变化事件π=C比非价格变化事件π=NC少得多。因此,π=C事件很难用过去的信息仅基于已实现的迹象和交易进行预测。因此,我们观察到的行为可能归因于缺少解释变量的问题。在这方面,一个自然的候选者可能是在执行交易指令之前,限制指令簿另一侧的未完成订单量,即。

28
mingdashike22 在职认证  发表于 2022-5-11 06:09:16
当地订单不平衡。从更基本的角度来看,我们还应该指出,必须谨慎地解释MTDg CalibredKernel,它给出了时间t=0时的事件在时间t=g后触发类似或相反事件的概率。事实上,该内核从订单拆分(这增加了代理在未来下相同符号的订单的可能性)和市场其他部分对该事件的真实反应[10,9]中获得了贡献。这些反应可能是羊群效应(抄袭猫交易),或者相反,是其他方向的交易(例如来自流动性提供者)。因此,订单流量对单个孤立交易的响应预计与通过将MTDg模型校准为全订单流量而获得的脉冲函数有很大不同,因为订单拆分贡献在前者中不存在,但对后者有贡献。这两种影响之间的区别需要解决贸易识别问题。我们希望在未来的四年内回到这个问题上来[11]。致谢我们要感谢Z.艾斯勒、J.多尼尔和I.马斯特罗马特奥进行了非常有益的讨论。D.E.塔兰托感谢CFM支持他在CFM的长期访问,在那里进行了部分研究。MTDg模型平稳分布的存在唯一性定理A.1假设随机变量序列{Xt}t∈单位集X={1,…,m}中的包含值由p(Xt=i | Xt)定义-1=我,Xt-p=ip)=pXg=1λgqgig,i,其中Qg=hqgi,jii,j∈具有归一化行的Xare矩阵,Pjqgi,j=1,Ppg=1λg=1,并假设^ηQg=^η,g、 如果向量^η为^ηi>0,则i∈ X和πηi=1,和0<pXg=1λgqgig,i<1,(i,i,…,ip)∈ Xp+1,(22)thenlim`→∞P(Xt+`=i|Xt-1=我,Xt-p=ip)=ηi.证明。

29
能者818 在职认证  发表于 2022-5-11 06:09:19
设T是mppossiblevalues为(Xt)的马尔可夫链的mp×mptransition矩阵-1.Xt-p) 正如美国所说。T areP(Xt=i,Xt)的元素-1=我,Xt-p+1=ip-1 | Xt-1=j,Xt-p=jp),=(Ppg=1λgqgjg,iif ig=jg,对于g=1,2,…,p- 1,否则为0。T的每一列表示p向量(i,…,ip)-1) 到达状态的顺序,我变化最慢,等秒最慢,以此类推。类似地,tre的行表示(j,…,jp)的值,jj变化最慢,以此类推。公式22的假设保证了T的所有状态都是相互通信的,所以T是不可约的。在T的对角线元素中,m是非周期的,那么,由于T是不可约的,所有状态都是非周期的。因此,T是有限的,它指定了一个遍历马尔可夫链,并且具有满足元素ξj,…,的ξT=ξ的非平衡分布ξ,。。。,jp=limt→∞P(Xt)-1=j,Xt-p=jp),其中p向量(j,…,jp)的排序方式与矩阵T相同。我们称ω=(ω,…,ωm)为相应的一维边际平衡分布。也让Rbe表示[29]中定义的T的“折叠形式”,即T的非零元素的mp×m矩阵。显然,一般来说ξR=ω。(23)我们为模型(14)R=pXg=1λgUg编写了相同的矩阵,其中Ug=Ag,1 · · ·  Ag,pwhereAg,k=(Qgif g=kTif g 6=kand 是Kronecker积,1是1的m×1向量。现在我们用另一种方法计算ξR。ξUgismXi的第k列,。。。,ipqgig,kξi,。。。,ip=mXigqgig,kmXih,h6=gξi,。。。,ip=mXigqgig,kωigg,也是ωQg的第k列。因此ξR=pXg=1λgωQg。(24)等式。23和24,我们有ω=η,通过ω和η的唯一性,g、 假设一个随机变量序列{Xt}t∈有限集合X={1,…,m}中的包含值由公式1定义,并且是静止的。

30
大多数88 在职认证  发表于 2022-5-11 06:09:23
设B(k)是一个m×m矩阵,其元素为sbki,j=P(Xt=i,Xt+k=j),i,j∈ 十、K∈ Zand B(0)=diag(η,…,ηm)。然后b(k)=pXg=1λgB(k- g) Qg。证据首先考虑k=1的情况,p、 LetYkt={Xt+k-g:g=1,Pg6=k},thenbki,j=P(Xt=i,Xt+k=j)=XYktP(Xt=i,Xt+k=j|Ykt)P(Ykt)=XYktP(Xt+k=j | Xt=i,Ykt)P(Xt=i|Ykt)P(Ykt)=XYktpXg=1,g6=kλgqgXt+k-g、 jP(Xt=i | Ykt)P(Ykt)+XYktλkqki,jP(Xt=i | Ykt)P(Ykt)=pXg=1,g6=kλgXXt+k-gqgXt+k-g、 jP(Xt=i | Xt+k-g) P(Xt+k)-g) +λk^ηiqki,j=pXg=1,g6=kλgmXh=1bk-gi,hqgh,j+λk^ηiqki,jxg=1λgB(k)的第(i,j)个元素- g) 需要Qgas。C一类一般的MTDg模型let B(k)是一个m×m矩阵,其元素为bki,j=P(Xt=i,Xt+k=j),i,j=1,m、 k∈ Z、 其中B(0)=diag(η,…,ηm)。矩阵B(k)代表随机变量Xt的二元分布。然后,我们得到了b(k)=bk1,1··bk1,m-1^η-下午-1i=1bk1,i。。。。。。。。。。。。bkm-1,1··bkm-1米-1^ηm-1.-下午-1i=1bkm-1,i^η-下午-1i=1bki,1·^ηm-1.-下午-1i=1bki,m-12^ηm- 下午1点多-1i,j=1bki,j,其中,独立元素的总数为m- 每k为2m+1。p阶MTD模型的参数由向量λ=(λ,…,λp)和矩阵Qg组成,例如Qg=1T^η+~Qg,~Qg=qg1,1····qg1,m-1.-下午-1i=1qg1,i。。。。。。。。。。。。~qgm-1,1··qgm-1米-1.-下午-1i=1qgm-1.我-下午-1i=1ci~qgi,1··-下午-1i=1ciqgi,m-下午1点-1i,j=1ciqgi,j,式中,ηQg=0,g和ci=^ηi/^ηm。与这些定义一致,p阶马尔可夫链readP(Xt=i | Xt)的条件概率-1=我,Xt-p=ip)=ηi+pXg=1agig,i,其中agig,i≡ λgqgig,i.在此框架内,二元分布和矩阵qg满足以下矩阵方程组b(k)- ηTη=pXg=1B(k- g) Ag,Ag在哪里≡ λgQg。利用经验二元分布,可以对上述线性系统进行反演,以确定模型的参数。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 11:28