楼主: mingdashike22
2128 46

[量化金融] Hawkes过程的二阶统计特征及其应用 [推广有奖]

21
mingdashike22 在职认证  发表于 2022-5-5 08:39:38
与如此获得的M的最小值相对应的横坐标*(h) 曲线给出了最佳带宽h的估计值*H*= 阿格明姆*(h) 。B.总体误差——正交点数量的选择Qi如果假设g(t)估计无误差,则仍需研究由于正交近似产生的误差。函数K(t,s)=g(t- s) 是Wiener-Hopf系统(18)的核心。即使φij(t)函数是正则的,这也是一个奇异核,因为它在对角线上通常是不连续的(除非维数D=1)。关于如何数值求解对角线上带有奇异核的Wiener-Hopf系统(尽管通常奇异性比“简单”不连续性强得多),已有大量文献。对所有这些方法进行比较,并试图了解哪种方法更适合我们的估值器,这超出了本文的范围。一种非常流行的方法是上面已经描述过的Nystr–om方法。它包括重写(18),就像我们将(33)重写为(34)时所做的那样,即隔离内核的奇异行为:g(t)=Φ(t)+ZΦ(s)g(t)- s) ds=Φ(t)+Z(Φ(s)- Φ(t))g(t- s) ds+Φ(t)Zg(t)- s) ds。最后一个积分项可以“直接”估计,即估计g(t)的本原函数。另一个积分项用求积法近似(我们将使用高斯求积)。让我们再次假设Φ(t)的每一个元素都是β(这里我们假设β≥ 1) 它们都是以常数φ为界的∞. 再次使用(13)和(71),我们可以很容易地证明g(t)的每个元素的边界是:g∞= Aφ∞1.-ρ(A+1)-ρ) ,其中A和A是一些常数。我们还假设导数φ′(t)的所有元素都以常数φ′为界∞. 然后是(Φ(s)中的术语- Φ(t))g(t- s) 在任何地方都属于H类β,除了对角线s=t上的导数可能是不连续的。

22
kedemingshi 在职认证  发表于 2022-5-5 08:39:41
如果求积法使用Q点,且基本上大于max(2,β),则非对角项的误差为φ级∞G∞Qβ,而对角线项的误差为φ′级∞G∞Q.总正交误差为正交误差的数量级~ G∞φ∞Q+φ′∞Qβ应用卷积算子求解维纳-霍普夫方程,其拉普拉斯变换为(见(14))(I+^g(z))-1=∑(I)-^ΦT(-z) )∑-1(I)-^Φ(z))。这个算子有一个常数乘以φ的范数∞. 因此,维纳-霍普夫反演产生的误差为正交误差的阶数:E=OQ-2+Q-β(47)因为,正如我们刚才看到的,维纳-霍普夫反演涉及一个范数由常数(由φ控制)限定的算子∞) 维纳-霍普夫核估计误差E(与g(t)估计中的误差有关)在进行反演时不改变量级。我们推断总误差的顺序(当h=h时)*) 基本上应该是两个误差之和的顺序(见(41))总体误差:E+E=OJ-β2β+1+ OQ-2+Q-β101112 1314 151617log2(J)-8.-7.-6.-5.-4log2(错误)g(t)L上的RMSE∞ φ(t)图3中的误差。g(t)和L上的均方根误差∞对于与图1相同的霍克斯过程,φ(t)作为样本量函数的误差(对数刻度)。在这两种情况下,h=h*四分之一点的数量Q保持不变(Q=30)。这两个错误都表现为J-1/3.同样,正如本节导言中所解释的,我们忽略了一个事实,即系统的反转涉及一个我们需要控制的随机内核,以便控制错误。在这方面,人们总是可以选择足够大的Q,以便与估计误差(E)相比,正交误差可以忽略不计<< E) 因此,总的误差将始终表现为asOJ-β2β+1.无花果。

23
mingdashike22 在职认证  发表于 2022-5-5 08:39:44
3.我们已经报告了∞φ(t)上的误差作为之前使用的n维Hawkes过程样本量的函数。我们设定Q=30,并为每个J选择h=h*(即最佳带宽)。可以看出∞误差表现为g(t)上的均方根误差(RMSE),即J-1/3.020060800100Q0。20.40.60.81.0Relalive L2错误(in%)0 20 40 60 80 100Q0。00.20.40.60.81.0RQ(以百分比计)0204060801020140160Q2。53.03.54.04.55.0Relalive L2错误(in%)020040601020120140160Q01234RQ(in%)图4。作为正交节点数量Q函数的估计误差依赖性。左面板:对于具有指数核(顶部)或幂律核(底部)的1D Hawkes过程(J=10个事件),相对误差显示为Q的函数。右面板:在指数情况下(顶部)和幂律情况下(底部),作为Q函数的经验相对变化RQ(等式(48))。可以看出,在这两种情况下,选择Q是足够的∈ [20,40]非常接近非常大Q的最佳估计值。选择正交点数量Q。从实际角度来看,为了选择使用的正交点数量Q,可以从相对较小的Q值开始(例如Q=20),计算估计核数,并将其与增加Q值时获得的估计核数进行比较。当两个估计值“非常接近”时,应停止增加Q。为了确定Q是否足够大,例如,可以检查相对Lvariation,RQ=| |^φQ-^φ2Q | | |^φQ | |,(48)足够小(例如RQ<1%)。这如图4所示,其中我们绘制了相对误差| |φ,作为Q的函数-^φQ | | |/| |φ| | | | | | | |和rqf分别涉及一个指数核(顶部)和幂律核(底部)的一维霍克斯过程的两个例子。

24
kedemingshi 在职认证  发表于 2022-5-5 08:39:47
我们可以看到,在这两种情况下∈ [20,40]足够大了。对于本文中给出的所有数值说明和应用,选择了该范围内的一个值。根据经验,我们观察到,对于各种各样的谷粒形状和10到10之间的样本大小,这个范围足以达到最佳结果。05101520 25t-0.020.020.060.100.14φ11(t)05101520 25t-0.020.020.060.100.14φ12(t)05101520 25t-0.050.050.150.250.35φ21(t)05101520 25t-0.050.000.050.100.150.20φ22(t)0 246 8 10m0。00.51.52.0f22(m)0 246 8 10m0123456f21(m)图5。按照第V-A节的估算程序,对第V-B节中定义的二维标记霍克斯模型进行非参数估算。估算基于组件Nt(分别为Nt)的4.5 10(分别为4 10)个事件的实现。我们使用h=0.5和Q=50。实线代表分析曲线和符号(o) 经验估计值。顶部的四个图显示了核矩阵Φ估计。底部的两个图显示了对标记函数的估计。参见图6了解算法的优度V.描述-数值说明下一节给出了算法的详细描述,下一节给出了几个数值说明。012 345678Exp。定量。012345678N1电磁脉冲。定量。012 345678Exp。定量。012345678N2电磁脉冲。定量。图6。Q-Q图显示了V-B中定义的二维标记霍克斯模型估计的拟合优度(估计结果见图5)。实线代表预期的对角线和符号(o) 经验估计值。A.

25
kedemingshi 在职认证  发表于 2022-5-5 08:39:52
算法描述在本节中,我们在第三节中介绍的markedHawkes过程的框架内精确描述了非参数估计过程的每一步。o向量∧的估计(简单地用作∧的估计,即由整体时间实现划分的实现的跳跃次数)o对于所有j∈ [1,D],我们必须先验地选择mj和区间{Ij(l)}1≤L≤Mjo全j∈ [1,D]而且我∈ [1,Mj],概率Pjl的估计由(27)定义。为此,只需计算区间Ij(l)内的已实现标记ξjs的数量即可必须使用第IV-a节中解释的经验平均值估计{Gijl(nh}n(在先验选择的支持[0,tmax])。为此,必须选择带宽h的值。第IV-A节解释了(为了清楚起见,本节仅涉及无标记霍克斯过程的简单情况,但概括是显而易见的)如何通过交叉验证获得该值固定要使用的正交点Q的数量,以及对所有核函数的支持(我们使用高斯求积)。总的来说Q 3 0是足够的,但是,在第IV-B节的末尾,我们解释了如何自适应地选择该值。然后,对于每一个我∈ [1,D],通过使用正交点对(29)中的卷积进行离散,求解QM线性系统。

26
nandehutu2022 在职认证  发表于 2022-5-5 08:39:56
这导致了对正交点上所有函数的估计使用公式φij(t)=PMjm=1pjmφijm(t)可以简单地获得核的估计(在正交点上)。Lnorm | |φij | |=R+∞φij(t)dt以及高分辨率网格上的核重采样可通过再次求积公式获得应检查如此估计的霍克斯过程的稳定性条件(即,由LNORM | |φij | |制成的D×D矩阵的光谱半径必须严格小于1)。o可通过公式fijl=| |φijl | | |/| |φij |获得标记函数fij(t)的分段值fijl的估计。B.数值说明在本节中,我们将在考虑不同情况的各种示例上说明先前估计方法的性能:标记过程、非递减滞后核、缓慢递减核和可能为负的核。为了对D维霍克斯模型进行数值模拟,人们提出了各种方法。我们选择使用细化算法(如[31]所述)。这是一个增量算法,跳跃时间一个接一个地生成。在其最简单的版本中(在内核减少的情况下),在给定的时间t,它基本上包括拾取下一个潜在的跳跃时间t+t使用指数分布的随机变量参数为λt=PDk=1λkt的t。然后在[0,λt]上画出一个均匀随机变量F。如果F<λt-PDk=1λkt+t、 跳转被拒绝。

27
nandehutu2022 在职认证  发表于 2022-5-5 08:40:00
如果未被拒绝,则将其分配给第i个组件,以使i是满足F的最大指数i≥ λt-圆周率-1k=1λkt+t、 04816T0。000.020.040.060.08φ11(t)048 12 16t0。000.020.040.060.08φ12(t)048 12 16t0。000.020.040.060.08φ13(t)048 12 16t0。000.020.040.060.09φ21(t)048 12 16t0。000.020.040.060.08φ22(t)048 12 16t0。000.020.040.060.08φ23(t)048 12 16t0。000.020.040.060.08φ31(t)048 12 16t0。000.020.040.060.08φ32(t)048 12 16t0。000.020.040.060.08φ33(t)图7。具有圆形相互作用的三维Hawkes模型的非参数估计。估计是基于每个组件大约有10个事件的实现。我们使用h=0.2和Q=50。实线代表分析内核和符号(o) 经验估计值。带指数核的二维标记霍克斯过程我们考虑的第一个例子是带指数核的二维标记霍克斯过程。该过程的矩阵Φ(t)读数为:Φ(t)=0.1e-0.2t0。1e-0.2t0。3e-0.9t0。3e-0.4tu=0.05,u=0.1。我们认为NTI带有一个标记m,该标记遵循平均值1的指数分布。我们选择标记函数:f(m)=m和f=1,也就是说,标记m只(线性)影响过程Nt的强度。在图5中,报告了估计的核函数和标记函数,这些核函数和标记函数是使用组件Nt(resp.Nt)的4.5 10(resp.4 10)事件实现的二维过程获得的。对于mark函数估计,我们假设f(m)在区间[k/2,(k+1)/2]上是分段常数,k=0,20.从四个最上面的图表中可以看出,每个指数核都得到了很好的估计(有关误差值的讨论,请参见下一节)。

28
能者818 在职认证  发表于 2022-5-5 08:40:04
在最后两个图中,我们展示了该图也恢复了标记函数。在估算过程中,我们选择了h=0.5和Q=50(关于如何选择这些值的讨论见第四节)。为了检查我们的估计,并在一组数据上测试霍克斯模型,我们可以通过简单地指出,每个点过程分量Nj(~t)是一个均匀泊松过程,被认为是“时间”~t=Rtλj(u)du的函数,来进行优度检验。在这方面,以t表示的事件间时间必须呈指数分布,即对于每个j,如果tjk表示Nj的去跳时间,那么:τjk=Ztjktjkλj(u)du(49)必须是iid指数随机变量。根据估计的核、基线强度和标记函数,可以对所有τjk进行估计。图6显示了经验分位数分布的Q-Q图(τkandτkwere Estimated0123φ(t)-10-8.-6.-4.-2024log2(t)-6.-4.-202log2[φ(t)]图8。具有幂律递减核的一维Hawkes模型的非参数估计。估计基于大约10个事件的实现。我们使用h=0.5和Q=50。左面板:估计值(o) 线性尺度下的理论(实线)核。右面板:估计值(o)以及对数尺度下的理论(实线)核。04816T-0.040.000.040.080.12φ(t)图9。具有抑制效应的霍克斯模型的非参数估计。模型的核心(实线)是第一个区间为负,另一个区间为正。如果在公式(2)中,λt<0的概率可以忽略不计,则估计方法提供了可靠的结果(o).从过去三年开始。10各成分的干预时间)与指数分位数的对比。

29
mingdashike22 在职认证  发表于 2022-5-5 08:40:09
在这两种情况下,都可以检查两条曲线是否非常接近预期的对角线。在这个例子中,我们旨在说明两个特征:第一,我们可以忠实地估计霍克斯核,这些核不一定是递增的,在t=0附近。在一个多维霍克斯过程中,我们还可以在事件发生的复杂动态中,理清这些事件之间的因果关系(在格兰杰因果关系的意义上)。为此,我们考虑一个具有“循环”相互作用的三维霍克斯过程,即过程N(t)仅由过程N(t)激发的过程N(t)本身激发,而过程N(t)的事件由N(t)的事件触发。因此,在霍克斯矩阵中,只有φ(t)、φ(t)和φ(t)项不是零。我们选择这些核的形状为不同位置的三角形函数。在图7中,我们在一个样本上报告了这种过程的估计结果,其中每个过程有大约10个事件。我们可以看到,一个显著地恢复了3个过程之间的因果关系和相互作用核的三角形形状。图8显示了一个一维霍克斯模型的估计,其幂律递减核φ(t)=α(ν+t)-β,α=ν=0.1,β=。与前面的例子不同,这个核对大t有一个代数衰减。在图8的两个面板(对应于线性和对数表示)中可以看到,对于10个事件的样本,我们的估计在大范围到时间尺度上与预期核非常接近。让我们注意到,为了估计一个在几十年的支持度上缓慢收敛的核,g(t)和φ(t)的正则抽样方案不适合,因为它需要一个指数级的大矩阵来反转。为此,参考。

30
kedemingshi 在职认证  发表于 2022-5-5 08:40:13
[32]我们提出了第三部分方法的一种变体,该方法依赖于不同的(即对数)时间采样,当g在几个数量级的时间间隔内变化时,可以估计g。非正值内核我们提供的最后一个示例涉及一个1D Hawkes进程,该进程涉及一个负值内核。事实上,根据theremark II-A,当核φ(t)取一些负值时,可以考虑具有过去事件抑制影响(而不是兴奋)的霍克斯过程。在这种情况下,如果在等式(4)中,对应于u+Rφ(t)的事件- u) dNu<0发生概率可忽略不计,模型保持线性,我们的估计方法仍然可靠。这如图9所示,其中使用实线表示的核的1D Hawkes模型的样本(10个事件)进行估计:该核要么是分段常数,要么是分段线性的,在变为正之前在整个区间为负。根据该模型,某些事件的发生始于降低进一步事件发生的可能性,而在一段时间延迟后,该事件具有相反的影响,并增加了流程活动。通过比较估计核值和实际核值,我们可以看到,即使在这种情况下,第三节的方法也提供了一个相当好的核形状估计。六、 与学术文献中的其他方法相联系,霍克斯过程的核矩阵的非参数估计非常少。在特定情况下,已知核矩阵是对称的(如果维数D=1,则始终为真),在[21]中开发的方法使用光谱方法进行反演(10),并从二阶统计量推导出估计。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 00:42