楼主: 能者818
1611 42

[量化金融] 一种分数驱动的噪声和异步条件相关模型 [推广有奖]

11
可人4 在职认证  发表于 2022-6-9 18:29:59
Bollerslev(1986)的GARCH模型、Nelson(1991)的EGARCH模型以及Engle和Russell(1998)的ACD模型都是可以在这个一般框架中恢复的模型的例子。此外,分数驱动模型具有信息论最优特性,如Blaskes等人(2015)所示。基于分数驱动模型的灵活性,我们选择基于条件密度的分数对HTA和QT的动态进行建模。协方差矩阵Qt可以分解为:Qt=DtRtDt(7),其中Dt=diag[Qt]1/2是标准偏差的对角矩阵,rti是相关矩阵。这种分解在计量经济学文献中很常见,例如在恩格尔(2002)的DCC模型中使用。对于parsimo-ny,我们认为噪声的协方差矩阵是对角的。可以放松这一假设,但代价是在考虑时变参数数量的情况下增加c。然而,Corsi等人(2015)指出,在静态情况下,HTO的OFF-对角线元素接近于零。因此,他们假设噪声为对角协方差矩阵。Shephard和Xiu(2017)做出了相同的假设。设Ft表示时变参数的向量。我们写:ft=log(diag[Ht])log(diag[Dt])φt(8) 其中φ是一个q×1向量,取决于相关矩阵Rt的参数化。后者将在第2.4节中讨论。因此,ftis的组分数量k=2n+q。

12
能者818 在职认证  发表于 2022-6-9 18:30:02
分数驱动模型中的更新规则是:ft+1=ω+Ast+Bft(9),其中sti是缩放分数向量:st=(It | t-1)-1.t,t型=对数p(Yt | ft,ft-1, Θ)f′t′, It | t-1=E[t型′t] (10)待估计静态参数的向量Θ中包括k×1向量ω和k×k矩阵A、B。条件对数似然由:log p(Yt | ft,ft)给出-1,Θ)=常数-对数| Ft |+v′tF-1tvt(11) 其中,vt和fta是卡尔曼滤波预测误差及其协方差矩阵,如附录A所示。如Delle Monache et al.(2016)所示,分数tand Fisher信息矩阵It | t-1可计算为:t=-h˙F′t(Int F-1t)vec(Int- vtv′tF-1t)+2˙v′tF-1tvti(12)It | t-1=h˙F′t(F-1吨 F-1t)˙Ft+2˙v′tF-1t˙vti(13),其中Nt表示时间t的可用观测值数量。与vt和Ft一起,计算坦迪特| t-1requires˙vt和˙Ft,表示vt和ftr esp e ct对时变参数向量Ft的导数。如Delle Monache et al.(2016)所述,它们可以通过附录A中报告的递归进行计算。通过在eq.(9)中并行运行卡尔曼滤波器和滤波器,可以更新等式(11)中的参数并计算条件对数似然。静态参数Θ通过数值优化log-likeliho od函数来估计:^Θ=argmaxΘTXt=1log p(Yt | ft,ft-1,Θ)(14)在第4.2.4节RTP参数化的实证应用中讨论了对A、B结构的限制。要获得完整的模型规格,我们需要对相关矩阵Rt进行参数化。我们将注意力限制在保证正定义相关矩阵的参数化上。一种可能性是使用超球坐标,如Creal等人(2011)所述。Engle和Kelly(2012)的等相关参数化给出了另一种可能性。在第一种情况下,我们将c相关矩阵写成Rt=Z′tZt。

13
mingdashike22 在职认证  发表于 2022-6-9 18:30:05
矩阵Zt的形式为:Zt=1毫升。c1n0 scs。c2ns1n0不锈钢。c3ns2ns1n。。。。。。。。。。。。0 0 0 . . .Qn公司-1k=1skn(15) 其中cij=cosθij和sij=sinθij。请注意,为了便于记法,时间索引已被省略。ZT的第i列包含单位范数向量在Rn的第i维子空间中的超球坐标,该坐标由i参数化- 1角度。因此,我们有n(n- 1) /2个角,等于Rt中的相关数。Wesetφt=[θ12,t,θ13,t,…,θn-式(8)中的1n,t]\',因此q=n(n- 1)/2. 时变参数的数量为thusk=2n+n(n- 1)/2.在等相关参数化中,相关矩阵RTI写为:Rt=(1- ρt)In+ρtJn(16),其中jn表示1的n×n矩阵。当且仅当参数ρtsatis为约束时,相关矩阵RTI为正定义-1/(n)- 1) ≤ ρt≤ 保证该约束的一种可能性是写入:ρt=1.-n- 1.+1+n- 1.tanh(θt)(17) 正如Koopman等人(2018年)所述。我们设置φt=θt,使q=1。时变参数的数量为thusk=2 n+1。等相关性参数化非常简单,因为它假设所有资产对都具有相同的相关性。尽管如此,它已被证明对几个实证问题有效(参见Engle和Kelly 2012年的讨论)。3蒙特卡罗分析3.1有限样本性质我们首先通过蒙特卡罗模拟研究最大似然估计的有限样本性质。我们设置n=10,与第4节中的经验应用中使用的SSET数量相同。因此,时变参数的数量为k=2n+n(n- 1) /2=65,在超球坐标参数化中,k=2n+1=21,在等相关参数化中。

14
nandehutu2022 在职认证  发表于 2022-6-9 18:30:08
在第一个实验中,我们假设静态参数ω、A、B具有以下结构:ω=ωhωdωr, A=诊断阿哈达尔, B=诊断BhBdBr(18) 其中ωh,Ah,Bhare n×1矢量驱动噪声方差,ωd,Ad,bd是n×1矢量驱动有效收益方差,ωr,Ar,Brare q×1矢量驱动相关性。我们进一步限制每个向量中的元素彼此相等。因此,静态参数的数量等于9。特别是,我们设定:ωh=-0.0461ιn,ωd=-0.0322ιn,ωr=0.0185ιq,Ah=Ad=0.02ιn,Ar=0.02ιq,Bh=Bd=0.98ιn,Br=0.98ιq。ωh,ω的值的选择方式应确保信噪比(定义为效率回报的无条件变量与测量误差的无条件方差之间的比率)与经验数据上的值相似,其平均值等于1(cf.表5)。在模拟了原木价格之后,我们对观察结果进行了大量的审查,以模拟异步交易。移除一个观测值的概率由λ表示,并假设n个时间序列的概率相同。为了设置时变参数s的初始值,我们估计了一个局部水平模型,该模型在子样本中具有常数参数,包括前100个观测值。正如Corsi等人(2015)所述,这可以通过EM算法完成。然后,我们根据公式(8)选择fB,其中Ht、Dt、R等于通过EM算法获得的值。我们模拟N=1000个T=2000个观测值的时间序列,并考虑λ=0、0.3、0.5、0.8的情况。表1超球坐标参数化中最大似然估计的统计摘要。

15
何人来此 在职认证  发表于 2022-6-9 18:30:11
表2报告了通过等相关参数化获得的类似统计数据。λMean Std Mean Std Mean Stdωh=-0.0461ιnωd=-0.0322ιnωr=0.0185ιq0.0-0.0460 0.0005-0.0322 0.0012 0.0186 0.00040.3-0.0482 0.0140-0.0330 0.0073 0.0200 0 0.00290.5-0.0497 0.0161-0.0349 0.0117 0.0204 0.00390.8-0.0510 0.0170-0.0351 0.0122 0.0209 0.0045Ah=0.02ιnAd=0.02ιnAr=0.02ιq0.00.0200 0.0001 0.0200 0 0.0004 0.0200 0 0.00020.30.0214 0.0047 0.0200 0 0.0031 0.0193 0.00160.50.0231 0.0075 0.0201 0.0039 0.0203 0.00210.80.0234 0.0080 0 0 0 0 0.02050.0042 0.0211 0.0032Bh=0.98ιnBd=0.98ιnBr=0.98ιq0.00.9800 0.0002 0.9799 0.0008 0.9800 0.00030.9790 0.0061 0.9797 0.0045 0.9790 0.00310.50.9784 0.0070 0.9785 0.0072 0.9788 0.00400.80.9780 0.0075 0.9779 0.0080 0 0.9785 0.0045表1:平均值和标准具有分数驱动方差的局部水平模型的极大似然估计的AR d偏差超球面坐标。结果表明,在这两种参数化中,最大似然估计都集中在trueparameters附近。毫不奇怪,缺失值会导致最大似然估计量的变量增加。然而,即使在λ=0.8的高度异步情况下,所有参数inA、B和截距ω中几乎所有参数的相对误差仍然很小。对于参数ωrin的等效相关参数,发现了较大的相对误差。

16
可人4 在职认证  发表于 2022-6-9 18:30:14
然后我们假设参数ω、A、B具有以下结构:ω=..., A=诊断阿哈达尔, B=诊断...(19) λMean Std Mean Std Mean Stdωh=-0.0461ιnωd=-0.0322ιnωr=0.0185ιq0.0-0.0489 0.0111-0.0338 0.0096 0.0201 0.00980.3-0.0507 0.0128-0.0339 0.0121 0.0209 0.01110.5-0.0525 0.0137-0.0402 0.0188 0.0211 0.01300.8-0.0560 0.0145-0.0422 0.0198 0.0215 0.0134Ah=0.02ιnAd=0.02ιnAr=0.02ιq0.00.0200 0.0043 0.0205 0.0034 0.0205 0.00540.30.0186 0.0049 0.0184 0.0037 0.0198 0.00530.50.0171 0.0060 0 0.0185 0.0042 0.0196 0.00650.80.0170 0.0080 0 0.01780.0050 0.0194 0.0070Bh=0.98ιnBd=0.98ιnBr=0.98ιq0.00.9788 0.0070 0.9790 0.0059 0.9746 0.01420.30.9780 0.0077 0.9789 0.0074 0.9749 0.01400.50.9772 0.0090 0.9749 0.0118 0.9719 0.01910 0.80.9770 0.0110.9732 0.0132 0.9702 0.0201表2:平均值和具有分数驱动方差的局部水平模型的极大似然估计的标准偏差等相关矩阵。在这些约束条件下,时变参数具有非平稳随机游动动力学。如第4.2节所示,该规范提供了对日内高频价格的更好描述,并将用于根据经验数据估计当地水平模型。我们将Ah=Ad=0.02ιn,Ar=0.02ιQ和报告设置在表3最大似然估计的汇总统计中。与前面的模拟一样,参数估计了真实值的浓度,方差随缺失值的数量略有增加。

17
nandehutu2022 在职认证  发表于 2022-6-9 18:30:18
总的来说,在所有考虑的情况下,最大可能性提供了令人满意的参数估计。λMean Std Mean Std Mean StdhypersphericalAh=0.02ιnAd=0.02ιnAr=0.02ιq0.00.0200 0.0003 0.0200 0 0.0004 0.0203 0.00080.0201 0.0019 0.0194 0.0012 0.0199 0.00100.50.0204 0.0030 0 0.0190 0.0022 0.0197 0.80.0202 0.0030.0192 0.0029 0.0199 0.0015equicorrelationAh=0.02ιnAd=0.02ιnAr=0.02ιq0.00.0200.0005 0.0203 0.0006 0.0200 0 0.00030.0191 0.0020 0 0.0198 0.0022 0.0199 0.00120.50.01810.0039 0.0189 0.0032 0.0196 0.00220.80.0179 0.0045 0.0185 0.0038 0.0196 0.0025表3:静态参数的得分驱动方差和随机游走类型限制的局部水平模型最大最大似然估计的平均值和标准偏差。0 1000 2000 3000 4000-0.4-0.20.20.40.6LLDCCEWMA0 1000 2000 3000 4000-0.4-0.20.40.6LLDCCEWMA0 1000 2000 3000 4000-0.20.20.4LLDCCEWMA0 1000 2000 3000 40000.10.20.30.40.50.6LLCCEWMAFigure 1:场景δ=2中所有模拟平均的局部水平、DCC和EWMA估计值,λ=0.5.3.2评估噪声和异步性的影响在本节中,我们旨在评估无ise和异步观测对常用动态相关模型的影响,并展示拟议建模策略提供的优势。高频率价格通常在使用标准动态模型进行分析之前同步。最流行的同步方案是前一个tick插值,包括用以前的可用价格更新缺失的值。该程序(和其他类似方案)导致相关性向下偏向零。在有关已实现协方差估计的文献中,后者被称为“Epps效应”(Epps 1979)。

18
nandehutu2022 在职认证  发表于 2022-6-9 18:30:21
Epps效应的解释很直观:同步导致大量的零回程,这反过来又与矿山相关(参见Hayashi和Yoshida 2005以及中的参考文献)。正如本文所示,在估计动态相关性时,也会出现类似的问题。测量误差的存在是相关性偏差的另一个来源。这并不奇怪,因为计量误差导致的衰减偏差出现在一些计量经济学和统计学问题中,例如变量模型中的误差。为简单起见,我们考虑如下生成的二元模型:Yt=Xt+t,t~ N(0,H)(20)Xt+1=Xt+ηt,ηt~ N(0,DRtD)(21),其中H=hI,D=dIand:Rt=1ρtρt(22)相关系数ρt遵循以下动态模式:1。正弦ρt=bssin(csπt)2。快正弦ρt=bfsin(cfπt)3。阶跃ρt=αs- βs(t<t/4+t/2<t<3T/4)4。斜坡ρt=brmod(t+ar,cr)5。模型ρt=exp(ht)/[1+exp(ht)],其中,ht是AR(1)过程:ht+1=cm+bmht+amφt,φt~ N(0,1),T是观测值的数量。控制ρtar动力学的参数选择为:bs=bf=0.4,cs=4/T,cf=8/T,αs=0.25,βs=0.5,br=T,ar=br/4,cr=br/2,bm=0.99,cm=-0.4(1 - bm),am=0.01。对于所有模拟模式,潜在过程的方差均为常数,等于0.1。噪声方差h根据信噪比δ=d/h计算。我们考虑δ=0.5(低信号)、1(中等信号)、2(高信号)的不同情况。如第4节所示,这些值接近真实数据的估计值。一旦观察结果生成,我们将应用类似于前面分析中使用的审查方案。我们考虑λ=0,0的三种情况。3,0.5,其中λ表示移除观测值的概率。我们为每个动态模式和每个sc e nario生成N=250个模拟,T=4000个观测值。

19
能者818 在职认证  发表于 2022-6-9 18:30:25
作为基准,我们考虑Engle(2002)的DCC模型和由以下公式给出的E WMA方案:^Qt+1=γ^Qt+(1- γ) rtr′t(23),其中γ设置为0.96。DCC和EWMA都是在通过前面的tickinterpolation同步数据之后应用的。取决于λ的值,这将导致大量的零反馈。为了减弱噪声和零回报对这两个模型的影响,我们以较低的频率对观测值进行采样。此程序仅在计算时使用,例如。实现的协方差。事实上,在较低的频率下,微观结构效应和缺乏交易导致的滞销对回报的影响较小。一个自然的结果是忽略了数据的重要部分。然而,子采样大大提高了DCC和EWMA的相关估计。在每种情况下,在n=20次模拟的预模拟研究中,选择新的采样频率作为最小化MSE的频率。所选值的范围在3到6个时间单位之间。我们计算了局部水平模型和DCC的样本内和样本外损失。为此,将样本分为两个子样本,其中包含观察值的数量。后者相当于局部水平模型中的Tsub=2000,而在DCC的情况下,它取决于采样频率。本地水平模型和DCC在Firs t子样本中进行估计,其中计算样本内损失。第二个s ubs ampleis用于计算样本外损失。局部模型中使用的参数化是基于超球坐标的参数化。

20
kedemingshi 在职认证  发表于 2022-6-9 18:30:28
图1显示了在δ=2,λ=0.5的情况下,三个0 1000 2000 3000 4000-0.4-0.20.20.40.6LLDCCEWMA0 1000 2000 3000 4000-0.4-0.20.20.40.6LLDCCEWMA0 1000 2000 3000 4000-0.20.20.4LLDCCEWMA0 1000 2000 3000 40000.10.20.30.40.50.6LLCCEWMAFigure 2:在δ=0.5,λ=0的情况下,所有模拟中平均的当地水平、DCC和EWMA的估计值。所有模拟的模型平均值。即使在低频采样后,DCC和EWMA es tima tes也偏向于零。这主要是异步性的结果,在这种情况下异步性很高。图2显示了在δ=0.5,λ=0的情况下,三个模型的平均估计值。DCC和EWMA具有类似的向下偏差。与前一种情况相比,bia现在完全是由于测量误差造成的,因为异步性被取消。相反,很明显,地方层面的模式受这两种影响的影响要小得多。因此,使用标准动态协变量模型可以减少数据量,这是在较低频率下采样的结果,并且低估了相关性(绝对值)。表4在所有模拟场景中,三个模型的样本内和样本外均方误差响应。本地级别的信号在所有场景中的性能均优于DCC。与DCC相比,EWMAI在“正弦”、“快速正弦”、“s步”模式下的性能更接近本地水平。然而,只有一个例外(在λ=0.5,δ=2的情况下,“fa st sine”的out-o fsample MSE),局部水平的MSE低于EWMA的MSE。对于以频繁变化和随机性为特征的“r amp”和“model”模式,本地级别的性能基本上优于EWMA。3.3与厚尾回归模型的比较高频率数据可能在火山爆发期间或在宏观新闻公告的对应关系中表现出极端的运动。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 04:16