楼主: nandehutu2022
1422 25

[量化金融] Hawkes过程的统计显著性极限 [推广有奖]

11
可人4 在职认证  发表于 2022-5-6 07:52:30
因此,该测试表明,从这个角度来看,时间戳校正程序并不完全令人满意,如果没有时间戳校正程序,就无法通过科尔莫戈罗夫-斯米尔诺夫测试。然而,副作用很小,霍克斯模型很好地解释了校正时间戳的大部分自相关性。有限的时间分辨率和给定时间间隔内的时间随机性可能会导致其他不必要的副作用。特别是,人们可能会想,有限时间分辨率是否会在fits中引入一个虚假的小时间尺度。附录a报告了大量的数值模拟,评估了有限时间分辨率和时间戳压缩的影响,并首先表明,当时间戳在一段时间间隔内压缩时,情况并非如此。此外,最小的固定时间尺度受到有限时间分辨率的影响,但程度有限。0 20 40 60 80-0.1 0.0 0.1 0.2 0.3 0.4 0.5滞后(事件)自相关0 20 60 80-0.1 0.0 0.1 0.2 0.3 0.4 0.5滞后(事件)自相关图2:2012年3月3日的时间调整持续时间自相关函数。左图:带更正。右图:无需更正。四、 结果a。每小时的时间间隔足够长,可以获得可靠的校准,至少在平均发生1500起事件的工作时间内。在如此短的时间间隔内,方程式(1)中的内源活性可近似为常数。我们选择m=2和m=15作为内核的幂律类型。在小时尺度上,结果对这些参数的变化相当不敏感。1.内核比较表I总结了三次测试的8种内核的结果。单指数核φ明显比所有其他规范差得多,我们可以安全地排除它作为数据的可能描述。采用两个以上的指数只会略微改善每小时活动的效果。QQ图(图。

12
可人4 在职认证  发表于 2022-5-6 07:52:33
3) 举例说明φ的不足,并表明φ确实是一个很好的内核:对于这个时间长度,两个时间尺度足以描述外汇交易到达的整整一个小时。我们用Akaike准则来判断对数似然性和参数数量之间的权衡,Akaike准则由AICp、核i的Akaike权重和Nmax表示,Nmax是核i最好的区间数。这两个Akaike标准在所有时间间隔内取平均值。最后,wi和nmaxonvey(几乎)都有相同的信息,因为大多数时候只有一个内核的权重几乎等于一。幂律类型的核也取得了很好的结果,尤其是φPLx,但都表明比自由指数核具有更大的内生因子。Akaike权重强烈表明φ是小时尺度下的最佳模型。此外,我们注意到φn(n=1,2,3)核的拟合参数的均值和中值非常相似,而近似幂律的核的均值和中值显著不同,这表明这种类型的核容易在每小时的时间尺度上出现拟合困难。最后,φPLx的自由指数为0.06 s.φφφHBBφPLφHBBφPLφPLxu0.13 0.08 0.08 0.07 0.07 0.07 0.06n 0.41 0.64 0.64 0.67 0.67 0.77 0.75 0.72 NA NA 0.23 0.38 0.26 0.40 0.28pKS 0.16 0.69 0.68 0.56 0.52 0.56 0.52 0.56pED 0.03 0.57 0.55 0.63 0.60 0.58 0.57 0.62pLB 0.11 0.38 0.38 0.34 0.31 0.29 0.28 0.33log Lp4022。9 4069.5 4069.9 4055.6 4062.9 4045.8 4060.3 4064.2 ICP-8035.9-8122.7-8117-8098.2-8112.7-8078.5-8107.6-8105.8w 0.01 0.55 0.14 0.05 0.06 0.03 0.04 0.11Nmax21 692 84 65 70 21 116表一:比较不同内核在每小时时间窗口上对Hawkes进程的过滤能力。pKS、pED和pLB分别为Komogorov-Smirnov、过度分散和Ljung-Box试验的平均p值。

13
大多数88 在职认证  发表于 2022-5-6 07:52:37
log Lp是每个区间的对数似然点,在所有区间上取平均值,并乘以每个区间的平均点数。Akaike信息标准AICp的Idem。Akaike归一化权重w[φ]=Wexp-AIC[φ]-艾克明, 根据Kullback–Leibler差异[43],核φ是最好的概率。Nmax[φ]是核φ的Akaike权重最大的区间数。1090个非重叠窗口的平均值超过200笔交易。2.φ的详细结果鉴于φ的简单性和良好性能,进一步研究双指数方程的结果是很有趣的。我们注意到,Rambaldi等人[39]还指出,该内核是EBS数据(无符号卷)中中间报价变化建模的良好候选。我们通过平均三个月的时间来描述每小时的时间窗口。图3:指数分布时间变形持续时间零假设下的拟合优度检验。左:一个典型的QQ图(2012年2月1日,下午3-4点)显示φ。中间:φ也一样。右图:Kolmogorov-Smirnov测试平均p值。误差条设置为两个标准偏差。首先,让我们来看看结果的优劣。图3(左图)显示了特定日期和小时窗口的{θi}分位数与指数理论分位数的对比。它的视觉效果非常令人满意。所有日子的其他时间窗口都会产生类似的结果。图3(右图)显示,一天中的所有时间都在很大程度上通过了科尔莫戈罗夫-斯米尔诺夫测试。●●●●●●●●●●●●●●●●●●●●●●●●0501000150020000 5 10 15 20小时<#事件>●●●●●●●●●●●●●●●●●●●●●●●●每天平均交易量<160.040u,每天平均交易量>160.5u。误差条设置为两个标准偏差。无花果。

14
大多数88 在职认证  发表于 2022-5-6 07:52:40
4(左),交易数量显示了外汇市场众所周知的日内活动模式[17,26]。平均的外生部分hui完美地再现了这种活动模式(图4,右图)。●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0.000.250.500.751.000 5 10 15 20小时<分支比率>●●●●●●●●●nn1n2●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0.11.010.00 5 10 15 20小时<τ>●●●●τ1τ2图5:全天的平均分枝率(左);黑色符号:总比率;绿色符号:最大时间尺度的分支比率;蓝色符号:最小时间尺度的分支比率。右侧显示关联的平均时间刻度。误差条设置为两个标准偏差。值得注意的是,考虑到典型的交易活动在夜间要小10倍(图4),内生性水平n在所有时间内都相对稳定(在统计不确定性范围内)(图5)。这一点对于与最大时间尺度n相关的内生性尤为显著。与最小时间尺度n相关的内生性紧随着日平均活动,尽管相对变化要小得多,但午餐时间的平静期除外,后者来自最大时间尺度。这表明,虽然自动算法交易不会停顿,但人类交易确实有休息时间。反过来,这意味着在这个尺度上,最小时间尺度上的大多数内生性来自算法交易,而在较长时间尺度上的很大一部分内生性是由人类交易引起的。B.全天测试分支比率的相对稳定性和例如KS测试的高p值鼓励我们选择更长的时间窗口。正如我们将看到的那样,这是可能的一整天的时间。在这种情况下,u不能被视为常数摩尔(见图4)。

15
nandehutu2022 在职认证  发表于 2022-5-6 07:52:43
正如Bacry和Muzy[4]所建议的,依赖于时间的背景强度是解释活动日内变化的好方法。与传统的数据混合方法不同,FromRending具有其他方法无法比拟的优势。因此,我们通过一个分段线性函数来估算每天的ut,该函数在上午0点(序列开始时)、上午5点、上午9点、下午12点、下午4点以及序列结束时的节点数。6节的值是额外的安装参数。1.核比较结果综合在表II中。内核φφφφHBBφPLφHBB/ucstφPL/ucstφHBBφPLφPLxn 0.48 0.79 0.83 0.85 0.81 0.83 0.92 0.93 0.98 0.97 0.88pKS 7e- 13 0.09 0.13 0.16 4 × 10-62 × 10-76 × 10-96 × 10-106 × 10-44e- 6 0.04pED 0 0.10 0.31 0.45 0.61 0.51 0.6 0.54 0.52 0.49 0.66pLB 0 0.058 0.056 0.012 9e- 5 0.001 0.017 0.026 1 × 10-42e- 4 0.006对数Lp60271。0 61559.3 61596.2 61575.5 61279.6 61340.2 61181.5 61271.1 61286.3 61340.6 61468AICp-120525.4-123097.7-123167.4-123121.8-122540.4-122661.7-122354.7-122534-122553.9-122662.5-122912 NA NA NA 0.090 0.115 0.027 0.057 0.13 0.14 0.08w 0.13 0.38 0.24 0 0 0.24Nmax0 9 22 14 0 0 0 0 0 0 0 0 0 14表二:内核比较。全天59分。只有φ和φ通过Ljung-Box测试。根据Akaike权重,这一次φ是最受欢迎的模型,并且在三个测试中表现良好。我们注意到φPLx,其自由指数的时间尺度等于0。11世纪,也是一个强有力的竞争者。通过QQplot,我们可以在几天内了解全球情况。事实上,在零假设下,残差具有与所考虑的日期无关的相同分布。因此,我们合并所有每日数据的所有残差,并根据指数分布构建QQplot。图6报告了四个内核系列的性能,并对表2中的结果进行了视觉确认。

16
可人4 在职认证  发表于 2022-5-6 07:52:46
此外,它还让我们了解每个内核在哪里表现最好和最差。例如,φpli在极端尾部比在大部分分布中更好。我们还看到了这个区域中φ的问题,通过添加第四个指数(参见φ)来解决。图6:所有时间段(一天时间)合并的残差QQ图。关于φ的详细结果让我们详细研究φ的特性,φ是全天最好的内核。为了便于比较,我们还给出了φ的一些结果。图7总结了背景强度设定值,并与平均日内活动模式一致。●●●0.0000.0250.0500.0750.1000.125start5am9am4pm7pm endu图7:基线强度结值的Tukey箱线图。图8:指数分布时间变形持续时间零假设下的拟合优度检验。左图:典型的QQ图(2012年3月3日)。右图:科尔莫戈罗夫-斯米尔诺夫测试p值。连续线为0.05显著水平。图8显示了每一天的Kolmogorov-Smirnov p值。同样,指数分布{θi}的零假设,即好的fits,不能被拒绝。然而,由于额外的非平稳性,拟合没有小时拟合那么显著。在该地块和该路段的所有剩余地块上,断线将响应周末。QQ图(图左图)。

17
大多数88 在职认证  发表于 2022-5-6 07:52:49
8) 通过视觉确认测试的准确性。●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●● ●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0.000.250.500.751.000 20 40 60 80天的年分枝率●●●●nn1n2n3●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0.110.00 20 40 60年中的80天τ(秒)●●●τ1τ2τ3图9:每日分支比率(左)和相关时间尺度(右)。最短特征时间尺度非常稳定;该模型根据不同的日期捕获1到2个更长的时间尺度。虽然总的分支比在0.8左右振荡(图5),但与每个指数相关的参数表明,只有在某些天才能找到三个时间尺度。这又一次可能是因为有些日子不需要三个时间尺度,或者是因为指数和的斜率。如表III所述,最短的时间尺度hτi不取决于有效的时间尺度数,而第二个时间尺度确实如此。2个时间尺度3个时间尺度shτi 0.16 s 0.15 shτi 21.9 s 9.3 shτi NA 161稳定III:通过拟合φ到整天发现两个或三个时间尺度时的平均时间尺度。C.多天的扩展到两天需要考虑每周的季节性。首先也是最重要的一点,EBS orderbook不会在周末运行,这意味着周一和周五的动态很可能与其他日期不同。因此,我们会在周二、周三和周三、周四对所有学员进行评分,总计26分(每周2分,13周)。

18
kedemingshi 在职认证  发表于 2022-5-6 07:52:52
在继续之前,重要的是要记住,图7预先警告在一天中的不同时间活动的每日变化是充足的,尤其是在下午4点左右,也就是每天的休息时间。这也可能防止单个内核连续保存几天,交易员群体的反应时间构成可能在两天之间受到类似的影响。内核φφφHBBφPLφHBBφPLφPLxn 0.80 0.87 0.88 0.82 0.84 0.98 0.97 0.91pKS 0.02 0.04 0.06 1×10-123 × 10-151 × 10-63 × 10-100.04pED 0.04 0.46 0.54 0.50 0.35 0.59 0.44 0.58pLB 0.010 0.008 0.011 2×10-64 × 10-63 × 10-84 × 10-80.001log Lp119666。0 119819.2 119814.5 119094.1 119221.6 119086.8 119207.4 119656.4AICp-239303.5-239605.7-239592.4-238161.7-238416.7-238147.1-238388.2-239282.2 NA NA 0.08 0.11 0.13 0.15 0.10w 0.34 0.40 0 0.26Nmax0 9 10 0 0 0 7表四:两天的内核比较结果26点。表四比较了所有内核的性能。根据AICpcriterion,内核φ的性能较差,而φ、φ和φplx是最好的。没有一个内核可以同时通过这三个测试(φ可以在一对天内通过)。φ的时间尺度是稳定的,与单日fits(hτi\'0.15 s,hτi\'10.6 s,hτi\'178 s)的时间尺度相似,而φ有时能找到第四个时间尺度。为了记录在案,我们尝试使用5个指数,但从未找到第五个时间尺度。值得注意的是,φ具有可接受的平均pKS。

19
可人4 在职认证  发表于 2022-5-6 07:52:55
φplx的自由指数为0.13s。●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●0.000.250.500.751.001 3 5 7 9 11 13周牧场率●●●●nn1n2n3●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●●11001年3月5日7月11日13日τ(秒)●●●τ1τ2τ3图10:φ至连续两天的内生因子(左图)和相关时间尺度(右图)3时间尺度4时间尺度shτi 0.15 s 0.15 shτi 13.5 s 7.1 shτi 226 s 33 shτi NA 295稳定V:通过拟合φ至连续两天发现三个或四个时间尺度时的平均时间尺度。V.讨论和结论结果大多是积极的:根据对一整天数据进行的三次测试,霍克斯过程确实可以以统计显著的方式进行。这意味着它们非常精确地描述了大量事件(平均15000起)。这一点尤为显著,因为确定的时间尺度非常小。这表明,占事件总数80%左右的内生部分仅限于外汇市场的短期自我反应。这也意味着,在这些时间范围内,tradersin反应时间尺度的瞬时分布对已加工的果仁有很大影响,如内生性的午餐间歇期所示。这就是为什么在同一个内核中设置多个日期非常困难的原因之一,因为没有任何东西可以保证交易者群体的组成在连续几天内是相同的。拟合越来越长的时间周期需要越来越多的指数。用自由参数拟合指数和会产生连续的时间尺度,其比率不是常数,这与近似幂律的核假设形成对比。

20
大多数88 在职认证  发表于 2022-5-6 07:52:58
这就是为什么内核φPLx(在后者的基础上增加一个自由指数)比纯幂律近似具有更好的整体性能。更长的时间段也会导致更大的内生性因素,这是有意义的,因为通过定义测量长记忆需要较长的时间序列。正如所有表格中清楚显示的那样,使用类似幂律的核会机械地增加表观内生性因子,其中一些因子危险地接近1(例如φHBBandφPL)。这就是说,而且非常重要的是,最好的内核从来不是那些具有最大内生性因子的内核。有人可能会想,如果使用时间分辨率更好的数据,是否可以大大改善重要性。这当然会有帮助,但只是在有限的范围内。如附录A所示,只有KS测试受到有限时间分辨率的影响。由于连续两天未能通过LB测试,这不受有限时间分辨率的影响,因此可以安全地认为,这种失败有更深层次的原因。主要问题在于外生性和内生性的非平稳性所造成的困难。午餐催眠的例子是:假设一天中的所有时间都保持不变的果仁形状,虽然是一个很好的近似值,但无法在很多天内产生统计意义上的结果。在这种情况下,可以在某些权重上添加每日季节性。我们的结果很可能与外汇市场有关。特别是,与股票指数期货研究相比,内生性永远不会接近1。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 04:27