楼主: 何人来此
1587 27

[量化金融] 多元Hawkes过程的统计意义 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-5-11 05:02:28
(4.1)此分支比率对应于父事件预期的子事件数。分支比大于1(超临界)会随着事件迅速爆发,分支比等于1(临界)是一种特例,只要u=0,家族将不确定地生活而不会爆发,分支比小于1(次临界)指的是每个ClusteredEvent家族最终会消亡的过程。为了计算给定强度效应αi的半衰期,我们求解=e-tiτi==> ti=τiln(2),(4.2),总半衰期由t=MXi=1τiln(2)给出。(4.3)因此,指数核之和产生以下强度函数:λM(t)=u+ZtMXi=1αie-T-uτidN(u)。特别是,我们正在考虑四变量的情况,因为我们对关键的积极流动性需求和补货事件感兴趣,以量化弹性2016年4月14日23:16预印本˙002多元Hawkes过程的统计意义适用于限制订单数据9(见下文第2节)。r=1,2,3,4指的是感兴趣的事件类型˙r,并假设与时间相关的基线强度u,我们得到λ˙r,M(t)=u˙r(t)+ZtXr=1MXi=1αr,即-T-uτr,idN˙r(u)。

12
能者818 在职认证  发表于 2022-5-11 05:02:31
(4.4)我们参考了具有指数或幂律核的Hawkes过程的已知对数似然函数Ozaki(1979):ln LTtnθ= -ZTλ(t |θ)dt+ZTlnλ(t |θ)dN(t),注意zth(s)dN(s)=Xti<th(ti)。因此,我们推导了对数似然asln L˙r(θ)=-ZTu˙r(t)dt-Xr=1MXi=1αr,iτr,iXtj<T1.- E-T-tjτr,i+Xtj<Tlnur(tj)+Xr=1MXi=1αr,iXtj<tje-tj-tjτr,i.使用以下递归关系Ozaki(1979),假设˙r=1:R1,i(j)=e-tj-tj-1τ1,i1+R1,i(j)- 1)对于相互事件类型r=2,3,4,让k=sup[k | tk<tj]:Rr,i(j)=e-tj-tj-1τr,iRr,i(j)- 1) +X[k | tj-1.≤tk<tj]e-tj-tkτr,iThus,代入对数似然函数,我们得到L˙r(θ)=-ZTu˙r(t)dt-Xr=1MXi=1αr,iτr,iXtj<T1.- E-T-tjτr,i+Xtj<Tln“u˙r(tj)+Xr=1MXi=1αr,iRr,i(j)#(4.5)方程4.5中的对数似然函数将用于参数校准。2016年4月14日23:16预印本˙00210 R.Martins,D.Hendricks5。校准模型参数为了量化LOB弹性,我们需要校准方程式4.5中的u、α和τ参数。我们使用MATLAB开发了一个非线性约束优化例程,以找到最大化不等式4.5规定的似然函数的参数。特别是,我们使用序列二次规划算法迭代调整候选参数值,直到在给定容差内找到最大似然估计的最佳近似值。为了提高算法结果的全局解和稳定性,我们使用了一种以方程4.5为目标函数的遗传算法,以找到可行的参数值来初始化优化程序。

13
能者818 在职认证  发表于 2022-5-11 05:02:35
这允许我们在使用优化重新定义校准之前缩小搜索空间。虽然单变量霍克斯过程可以利用对数似然计算的递归关系,将计算复杂度从O(N)降低到O(N)(Ozaki(1979)、Lallouache和Challet(2016)),但这一优势并不转化为多变量情况。如图4所示,我们使用了大量矢量化增强来提高所实现算法的计算效率。这表明,与naive for loop实现相比,我们的实现可以很好地扩展,并且是所选内核中事件数和指数数的函数。Martins(2015)的一项研究提供了全面实施的细节。(a) 事件数(b)指数图。4.计算时间(分钟):矢量化与for循环。将平均计算时间显示为每种事件类型的数量以及内核中指数的数量的函数。一旦根据事件数据校准了参数,我们就可以获得分支比(方程式4.1)和半衰期(方程式4.3)的值,以及方程式4.4中定义霍克斯过程强度的特定表达式,这反过来可以用来计算测试的残差。2016年4月14日23:16预印本˙002多元霍克斯过程的统计意义适用于限制订单数据11在从校准参数值进行任何推断之前,我们验证了我们实施的校准方案的准确性。为此,我们使用Lewis和Shedler(1979)、Dassios和Zhao(2013)提出的基于强度的方法,对具有已知诱导参数的多元Hawkes过程进行了广泛的模拟,生成了一组事件数据。然后使用校准方案恢复诱导参数。

14
可人4 在职认证  发表于 2022-5-11 05:02:38
从模拟数据中成功恢复诱导参数验证了校准方案。Mazibuko(2014)的一项研究提供了这方面的详细信息。在选择M(指数数)时,为了确定内核中适当的指数数,我们在对事件数据集进行校准后,对M=1、2和3进行了大量的拟合优度测试。我们利用定理6.1中的结果将校准的霍克斯过程转换为时间变形补偿器函数,即。平均值为1的指数分布残差序列。定理6.1(多元随机时间变化)。考虑广义残差的R序列{eri(θ)},R=1。。。,R、 式中,i(θ):=Zt(R)i+1t(R)iλR(s,θ)ds,(6.1)被积函数是R型事件的强度,(t(R)i,t(R)i+1]是相邻R型事件之间的间隔。当θ是真参数集时,每个序列eri(θ)是一个平均值为1的独立分布指数随机变量。证据有关详细的讨论和证明,请参见Bowsher(2005)。然后,我们可以使用统计测试来确定残差是否是事实独立的,是否以平均值1呈指数分布,其中,将在接下来的分析中使用最佳函数的核函数。我们使用四个候选测试来评估残差的分布和平稳性(Large(2007)、Hardimanet al(2013)、Lallouache和Challet(2016)):(1)Kolmogorov-Smirnov(KS)测试(Kolmogorov(1933)、Smirnov(1948)):该测试将残差的经验分布与平均值为1的指数累积分布进行比较。

15
可人4 在职认证  发表于 2022-5-11 05:02:41
对无效假设的接受阻碍了经验残差在指定的显著水平上呈指数分布。(2) 过度分散(ED)测试(Engle和Russell(1998)):该测试验证了残差是否具有单位方差,如果它们遵循平均值为1的指数分布,这是意料之中的。对无效假设的接受阻碍了经验残差的方差在指定的显著水平为1。2016年4月14日23:16预印本˙00212 R.Martins,D.Hendricks(3)Ljung-Box Q(LBQ)检验(Ljung and Box(1978)):这种平稳性检验证实了增量的独立性,在这种情况下,接受零假设会阻碍残差的平稳性。(4) Kwiatkowski-Phillips-Schmidt-Shin(KPSS)检验(Kwiatowski et al.(1992)):这是一种用于确认LBQ结果的平稳性二次检验,其中接受零假设会妨碍残差的平稳性。KS、ED和LBQ统计测试的显著性水平为1%,而KPSS测试的显著性水平为5%。7.数据和结果7。1.数据我们分析的数据包括约翰内斯堡证券交易所(JSE)上市的两支股票的交易和市场深度报价,来源于汤森路透交易历史(TRTH)。第2节中描述的方法用于提取模型校准的事件点过程。2012年3月5日至2012年3月9日,对标准银行数据进行了标准银行(SBK)稳定性测试。对于四个感兴趣的事件,该数据集在五天内总共包含13213个事件。

16
kedemingshi 在职认证  发表于 2022-5-11 05:02:44
下表列出了与数据集有关的其他统计数据,回顾了所有事件类型都是积极的:事件类型集合中的总日平均SD/日购买(类型1)1583316.6 35.3808Sell(类型2)1511302.2 53.7513Bid(类型3)51731034.6 226.9324Ask(类型4)4946989.2 368.6227表1。标准银行,2012年3月5日至2012年3月9日Growthpoint Properties Limited(GRT)对两组Growthpoint数据进行了每日校准;其中一个从2013年9月1日至2013年9月27日,19天内总共发生39347起事件;另一个从2013年9月30日至2013年10月31日,24天内发生31090起事件。2016年4月14日23:16预印本˙002多元Hawkes过程的统计意义适用于限制订单数据13事件类型每天的集合平均值SD购买(类型1)5332280.6316102.3139Sell(类型2)4962261.1579115.2380Bid(类型3)13237696.6842248.6008Ask(类型4)15816832.4211483.2089表2。Growthpoint Properties Limited,2013年9月1日至2013年9月27日事件类型总计每日平均SD每日购买量(类型1)4019167.458365.5054Sell(类型2)4489187.041756.3417Bid(类型3)10431434.6250140.3644Ask(类型4)12151506.2917200.0264表3。Growthboint Properties Limited,2013年9月30日至2010年10月31日37.2。结果考虑到繁重的校准程序和大量的模型参数,我们首先进行了稳定性测试,以评估我们实施的一致性。这是在一个相对较小的SBK点过程数据集上进行的(表1),其中校准和后续统计测试在相同的数据上进行了100次。

17
能者818 在职认证  发表于 2022-5-11 05:02:48
在确认校准程序的稳定性后,我们接着进行了优度检验,在该检验中,我们评估了3个候选核下的模型,并检查了应用于GRT点过程时的残差(表2和表3)。在这里,每天都被视为多元点过程的独立实现,因此每天都会对模型进行校准,并显示总结结果。我们将分析分为两个日历月(2013年9月1日至2013年9月27日和2013年9月30日至2013年10月31日),因为2013年9月30日JSE的费用结构发生了重大变化(Harvey et al.(2016)),这可能会影响当前的动态。7.2.1. 稳定性测试Stable 4和图5总结了稳定性测试的结果。他们指出,除了单指数平稳性测试外,这三种内核的测试性能都是积极的,与其他两种内核相比,LBQ和KPSS测试失败的频率更高。我们观察到,随着指数数的增加,更多的测试通过,三个指数之和通过了大部分测试。奇怪的是,我们发现KS测试的平均p值随着这组特定结果中指数的数量而减少,但测试通过率在2016年4月14日23:16预印本˙00214 R.Martins,D.HendricksM KS HKS p ED HED p LBQ HLBQ KPSS HKPSS p1 0.9750 0.1660 0.950 0.3685 0.5200 0.4359 0.5000 0.06782 0.9825 0.0839 0.990 0 0.5571 0.8818 0.4437 0.8900 0.09273 0.9975 0.0671 0.995 0.6258 0.9460 0.4538 0.9600.0972表4。内核稳定性测试统计。

18
mingdashike22 在职认证  发表于 2022-5-11 05:02:50
H列表示接受的空假设的百分比,p列表示给定核的所有测试的平均p值。指数测试通过率为100的人数。10.20.30.40.50.60.70.80.91Kolmogorov-SmirnovExcess DistributionJung BoxKwiatkowski Phillips Schmidt ShinFig。5.稳定性测试通过率(通过内核堆叠条)表示通过每个统计测试的百分比,通过感兴趣内核中求和的指数数实现。对同一SBK数据集的100次校准进行了测试。折痕。图6显示,尽管某些事件的p值较高,但在事件1中,单一指数的p值最低,失败最多,从而降低了整体通过率。7.2.2. 拟合优度测试Stable 5和6以及图7显示了在M=1、2和3的两个不同时期,候选股票(GRT)的经验事件过程的拟合优度结果。我们使用第2节中的定义,从LOB数据中提取关键的积极流动性需求和补充流程。每天被视为多元点过程的独立实现,因此对数据集中与每天相关的一组事件执行单独的校准。这使我们能够为每个测试和每个M构建零假设接受度和p值的分布。例如,“KS H”列表示KS测试的比例,其中确认的残差以单位平均数呈指数分布,而“KS p值”列显示这些测试的平均p值。我们从2016年4月14日23:16预印本˙002中看到,多元Hawkes过程的统计意义适用于限制订单数据15样本成员10 20 30 50 60 70 90 100p-value00。0050.010.0150.020.0250.03M=1M=2M=3图。6.

19
能者818 在职认证  发表于 2022-5-11 05:02:54
稳定性测试Kolmogorov-Smirnov p值在100次校准中,核与M指数获得的KS测试p值的比较。这些结果表明,与1和2指数核相比,3指数核对经验数据的拟合更好。这一点通过所有统计测试中最高的假设接受率和最高的p值得到证实。我们将在LOB弹性的研究中使用三指数核。M KS HKS p ED HED p LBQ HLBQ p KPSS HKPSS p1 0.3421 0.0332 0.2500 0.0628 0.7000 0.2484 0.5658 0.06192 0.5658 0.0978 0.4342 0.1311 0.7184 0.2902 0.5395 0.05893 0.6184 0.1384 0.5789 0.1720 0.7326 0.2945 0.5526 0.0604表5。2013年9月1日至2010年9月27日,按内核划分的每日优度检验统计数据3M KS HKS p ED HED p LBQ HLBQ KPSS HKPSS p1 0.5000 0.0884 0.3958 0.0928 0.7475 0.2733 0.5729 0.062720.6771 0.1712 0.5938 0.1784 0.7783 0.2790.6146 0.06433 0.7917 0.2599 0.7292 0.2658 0.8133 0.2996 0.6250.0669表6。2013年9月30日至2016年10月31日23:16预印本˙00216 R.Martins,D.HendricksNumber of Indonentials 1 2测试通过率00。10.20.30.40.50.60.70.80.91Kolmogorov-SmirnovExcess DistributionJung BoxKwiatkowski Phillips Schmidt ShinFig。7.每天对GRT数据集的校准进行核测试的每日测试通过率。该图结合了两个时期的考试通过率分布。7.2.3.

20
能者818 在职认证  发表于 2022-5-11 05:02:57
校准参数的讨论除了建立模型精度的统计测试外,该分析还包括对校准参数的解释,以及校准参数是否存在合理值的讨论。激励使用依赖时间的基线强度为了激励我们在等式4.4中的规定中使用依赖时间的基线强度,我们检查了我们测量的经验事件过程的平均每小时强度。图8显示了交易日每小时候选股票(GRT)所有事件的平均强度,在各个数据集中的所有天中取平均值。这两个数据集都表明,平均强度呈明显的U形,而恒定的基线强度将无法捕捉到这一点。图9显示了假设3周期分段线性基线强度时,不同核的影响。我们可以看到,一个简单的上午、中午和下午的照射产生的校准强度与图8中的经验数据中显示的预期U形相匹配。这些曲线的形状在所有三个核上都是相似的,尽管我们注意到,随着指数数的增加,我们看到外生性的平均值和变异都在下降。这表明,指数的数量越大,就越能解释事件的交叉刺激效应,而不是将这些效应吸收到基线强度中。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-3 20:42