楼主: 能者818
1929 58

[量化金融] 利用Hawkes过程检测强度爆发:应用于 [推广有奖]

21
可人4 在职认证  发表于 2022-5-26 19:42:55
该方法的性能与提前知道z的正确搜索间隔的情况(与表B.14相比)相当,表明预识别算法在大多数情况下都能很好地工作。对于τ的高值和f的小值,即α的小值,发现正确检测率较低,这并不奇怪。在这些情况下,IB对强度的直接冲击较小,IB的累积效应随着时间的推移会更加稀释,这使得它更难定位。此外,我们需要探索误报率,即在这些模拟中检测到多个IB的情况。表3报告了假阳性识别的数量和百分比,作为分支比率n的函数。如图所示,然而,检测到多个IB的病例数量有限,相关系数=0.3fτ10 50 100 500 100050 76 16 4 0 075 94 65 0 0100 99 96 71 2 0250 100 100 100 72 12500 100 100 100 100 100 100 100 88750 100 100 100 100 100 100 100 100 100 100 100n=0.5fτ10 50 100 500 100050 69 4 0 075 95 30 0 0100 100 98 0 0250 100 100 100 78 16500 100 100 100 100 100 100 100 100 89750 100 100 100 100 100 100 100100 100 100 100n=0.7fτ10 50 100 500 100050 62 35 13 0 075 97 86 50 0 0100 96 98 84 4 0250 100 100 100 88 32500 100 100 100 100 89750 100 99 100 981000 98 99 99 98 100n=0.9fτ10 50 100 500 100050 9 28 18 2 075 26 64 56 5 0100 55 79 15 2250 99 100 72 39500 97 100 98 78750 100 95 97 96 901000 96 98 89 100 97表2:不同IBs的正确分类百分比真实IB参数(α,τ)的组合,用f=ατ和τ表示。结果涉及5000个事件的样本量。主要模拟n的高值,即n=0.7,尤其是n=0.9。

22
kedemingshi 在职认证  发表于 2022-5-26 19:42:58
这是意料之中的,因为在这些情况下,背景鹰派过程的强度变化非常强烈,自发生成一个可能被归类为IB的集群的概率很高。因此,这里的可靠检测需要足够长的时间序列,这确保了在高的霍克斯过程参数的有效估计。接下来,我们检查估计IB开始时间z的误差。表4中报告了均方根误差RMSE[(z- ^z)],平均事件间时间δ=T/N。与之前一样,当参数α=f/τ较大时,结果要好得多,而对于较小的α和相对较高的τ,性能恶化,尽管仍然令人满意。在我们的程序中,我们使用上面讨论的预识别算法来对IB位置zg进行初步猜测。值得将这一初步猜测与我们的程序提供的最终估计值^z进行比较。我们考虑差异:| zg- z |- |^z- z |δ,其中z代表正确分类的IB的真实IB位置。我们观察到,在91%的情况下,最终估计并不比预先估计的猜测差(即接近或接近真实值)。此外,当我们的方法改进后,样本大小=5000n=0.3 n=0。5 n=0.7 n=0.9总FP 1 12 63最坏情况发生率(%)0 2 18样本量=10000总FP 0 9 37最坏情况发生率(%)0 0 4 14表3:我们的程序应用于存在一个IB的模拟时,在最坏情况下产生的误报总数和误报百分比。给定值n的最坏情况是单个组合(f,τ),其中记录的误报最多。当我们的方法没有改进时,改进的平均值是平均误差的两倍以上。

23
大多数88 在职认证  发表于 2022-5-26 19:43:02
换句话说,位置参数z的最大可能性优化显著改善了估计,即使在外生核(6)严格衰减且具有最大值at的情况下(这导致强度的预期峰值在t=z)。在更复杂的情况下,如反应峰值延迟时,优化步骤变得至关重要。在附录C中,表C.17、C.18、C.19和C.20报告了IB参数的相对均方误差。对于可检测区域的IBs,对于所考虑的样本量,MSE通常约为10%。最后,值得一提的是,我们的程序即使在IB检测不是主要目标,但对基本Hawkes模型的参数感兴趣的情况下也是有用的,例如分支比n。众所周知,非平稳性和爆发的存在极大地影响了在平稳性假设下估计的分支比(即在模型(1)内)。Filimonov和Sornette(2015)以及Rambaldi et al.(2015)已经讨论了这个问题,在这里,我们用表B.15对其进行了说明,在表B.15中,我们比较了从基本Hawkes模型和我们的程序选择的最佳模型(当存在oneIB时)中获得的n值。事实上,在强度突发的情况下,基本模型高估了分支比,甚至对于实际分支度的较小值(n=0.3),分支比也高达1的临界水平。相反,通过扩展模型(7)正确解释此类外部事件,可以让我们在所有情况下恢复正确的值。4.5。IB检测的迭代程序为了在存在多个IB的情况下评估我们程序的性能,我们研究了八种情况,其中两个IB发生在相同的T=3600时间窗口中。

24
大多数88 在职认证  发表于 2022-5-26 19:43:05
具体而言,我们考虑两种IB,一种是我们称之为“小”(S)的参数(α=1.0,τ=350),另一种是我们称之为“大”(L)的参数(α=1.5,τ=700)。IBs之间的距离也是相关的,因此我们分别测试IBs靠近的位置(C)的配置,即z- z=350个时间间隔单位,第二个时间间隔单位是IB相距很远(F),即z- z=1400个单位。表5总结了这八种情况。n=0.3fτ10 50 100 500 100050 3.175 0.6 15.4100 0.5 5.3 21.0250 0 0.2 1.3 3.0 22.8500 0.1 0.4 1.1 9.9 26.2750 0 0.0 0 0.3 0.6 18.71000 0.0 0 0.2 0.3 4 13.0n=0.5fτ10 50 100 500 100050 1.975 0.7 12 100 0.5 5 5 5 16.1250 0 0 0 0 0 0 0 0.1 0.9 2 6.0500 0 0 0.1 0.1.2 7.8 29.8750 0.0 0.2 0.6 5.1 15.01000 0.0 0.1 0.5 2.9 7.9n=0.7fτ10 50 100 500 100050 1.675 1.2 7.1 17.1100 0.4 3.5 10.7250 0.2 1.0 2 27.95000.1 0.4 0.6 8.5 17.0750 0.0 0.3 0.5 3.6 13.71000 0.0 0.2 0.3 1.9 4.5n=0.9fτ10 50 100 500 100075 5.6 14.6100 0.5 2.9 13.4250 0 0.3 0.9 23.0500 0.1 1 0.0 0 8 9.9 20.0750 0.0 0 0 0 0 0.4 0.4 4 16.11000 0 0 0 0 0 0.4 1 1.0 8.1 10.4表4:均方根误差之间的比率关于IB位置参数z和平均事件间时间T/N。所示结果是针对大约5000个事件。只有在100次仿真中至少有50次检测到IB的情况下,才会计算误差。我们为每个场景模拟了100个实现,内生参数n的四个不同值,即n=(0.3、0.5、0.7、0.9);在其他实验中,其他内生参数被设定为τ=0.1和p=2.0,并调整参数u,以保持预期样本量等于10000个事件。表6给出了n=0.7的情况下的试验结果,而其他情况在表B.16中报告。我们的结果表明,对于中间值n,我们的程序得到了非常好的结果。

25
大多数88 在职认证  发表于 2022-5-26 19:43:08
从表6可以看出,在大多数情况下,真阳性率超过90–95%,假阳性和假阴性检测的数量相对较低。在测试中,两个以上IBs的接受率(假阳性检测)的最大值低于10%,几乎只影响n=0.9的情况。正如预期的那样,假阴性的可能性随着IB大小的减小而增加。最具挑战性的识别场景是那些小IB紧随大IB之后,从而被大IB所掩盖的场景。当IBs接近(CLS)时,这一点尤为明显:在这些情况下,当n=0.7时,真实阳性率约为50%,当小IB后接小IB(CSS)时,情况类似。此外,正如我们已经注意到的那样,分支比的大值更难处理:当n接近临界值1时,集群大小的方差变得非常大,因此很难区分内源性爆发和外源性爆发。ατzατzCSS 1.0 350 1625 1.0 350 1975CSL 1.0 350 1625 1.5 700 1975CLS 1.5 700 1625 1.0 350 1975CLL 1.5 700 1625 1.5 700 1975FSS 1.0 350 1100 1.0 350 2500FSL 1.0 350 1100 1.5 700 2500FLS 1.5 700 1100 1.0 350 2500FLL 1.5 700 1100 1.5 700 2500表5:两个IBs案例的八种测试情景总结。C代表close,F代表far,L代表large,S代表small(详见正文)。n=0.7CLL CLS CSL CSS FLL FLS FSL FSS第一次更正100 97 100 98 91第二次更正96 50 100 56 98 90两次更正96 50 97 56 98 90 91 88未检测到比两次1 0 0 1 0 0 0 0 0 0更多的电击表6:n=0.7情况下两次IBs模拟试验的结果。所有数量均以百分比表示。

26
mingdashike22 在职认证  发表于 2022-5-26 19:43:13
模拟参数如表5所示。对于n=(0.3、0.5、0.7),IB参数的相对均方误差通常在10%以下。τ上的误差往往大于α上的误差,尤其是在较小的IBS上,在较大的IBS上,τ上的误差可以超过60%。在n=0.9的情况下,误差显著增加,α值超过30%的情况并不少见。从上述测试中,我们验证了我们的程序,并确认该方法能够获得有意义的结果,前提是基础过程不太接近关键(即n=R∞φ(t)dt远远小于1)。当然,参数的检测和估计质量会随着振幅和冲击距离的增加而提高。4.6。内生核的误判最后,我们讨论了模型误差的一个重要实际方面。在现实生活中,我们无法先验地知道内核的函数依赖性是描述系统动力学的最佳方式。如上所述,关于霍克斯模型(1)的具体问题的讨论仍然悬而未决,例如,在具有近似幂律内核的金融应用中(5),考虑并提倡使用短记忆指数替代方案。选择最佳候选人的统计检验问题以及核的非参数估计问题完全超出了本文的范围。在这里,我们将通过考虑内存内核错误指定情况下的估计误差来解决这个问题。为此,我们使用不同的内生内核(即指数和双指数)模拟该过程,同时使用与之前相同的方法进行估计,即使用表(5)中的φ(t)。我们在不存在IBs和存在一个IB的情况下进行了两个实验。详细结果见附录D。

27
何人来此 在职认证  发表于 2022-5-26 19:43:16
总的来说,我们的结果与第4.2节和第4.4节的结果一致,并且表明我们的程序对于内核错误的描述是相当稳健的:只要底层霍克斯过程的精确参数不是主要关注的焦点,即使背景过程没有很好的描述,也可以可靠地识别异源IBs。高频外汇数据的应用我们应用我们的方法来研究即期外汇(FX)市场的强度爆发。货币市场是一个由交易平台和场所组成的复杂的分散系统,电子通信网络(ECN)以类似于常规证券交易所的方式运行,通过终端聊天或语音通话进行OTC交易。在市场体系的中心,有两个经销商间电子平台,如电子经纪服务(EBS)和路透社。它们被主要银行和经纪人用作银行间流动性的来源,同时也是大型HFT参与者的交易平台。这两个平台对批量大小的要求都很高,至少为一百万台。EBS是所有美元、欧元、瑞士法郎和日元交叉的主要场所,而EUTERS是所有英联邦货币和斯堪的纳维亚货币交叉交易的主要平台(Golub et al.,2013)。5.1。描述性统计我们分析来自EBS实时数据源的三种货币对的数据,即欧元兑美元、欧元兑日元和美元兑日元。根据国际清算银行三年期调查(国际清算银行,2013),欧元兑美元是迄今为止世界上流动性最强的货币对,2013年的日均交易额为12890亿美元,其次是美元兑日元,交易额为9780亿美元。

28
nandehutu2022 在职认证  发表于 2022-5-26 19:43:20
欧元兑日元也是交易量最大的合约之一,日均成交额为1470亿美元(之前只有英镑、澳元、加元和瑞士法郎)。我们的数据集涵盖2012年1月1日至2012年12月18日这段时间。外汇市场每天24小时活跃,每周7天运作。然而,周末的活动微不足道。EBS Live是一个高级订阅源,每100毫秒提供一次订单快照(与每250毫秒提供一次报价的常规订阅源不同)。我们构建了当最佳出价或最佳询问价格发生变化时事件的点过程。该过程的动力学已被用作高频波动率的代理,并已被多篇论文用霍克斯过程建模(Filimonov和Sornette(2012);Hardiman等人(2013年);兰巴迪等人(2015年))。100ms时间分辨率的限制以及这些子间隔内的记录缺失可能会导致点过程校准的偏差。在(Lallouache和Challet,2014)中讨论了这种粗时间分辨率对霍克斯过程拟合的影响。为了解决这个问题,我们使用了相同的随机化程序(Filimonov和Sornette,2012;Rambaldi等人,2015),也就是说,我们从每个时间戳中减去一个均匀分布在间隔中的随机数[0,0.1)s.#每窗口冲击次数无冲击次数最大冲击次数792 0.51 0.61 5欧元720 0.46 0.63 4美元558 0.36 0.70 3表7:每个货币对中检测到的IB总数、每个窗口的IB平均数、没有IB的窗口比例和单个窗口中检测到的IB最大数。我们提出的方法明确设计用于检测和建模本地化的“类冲击”霍克斯过程框架内的非平稳性(IBs)。然而,该方法容易受到其他形式的非平稳性的影响,例如制度变迁或基础强度的缓慢变化(例如。

29
可人4 在职认证  发表于 2022-5-26 19:43:23
日常影响或时间影响)。为了限制这种动态的副作用,我们将分析的窗口大小限制为一小时。具体而言,从最佳报价变更时间序列中,我们提取了从2012年1月1日UTC 00:20:00开始的一小时窗口。我们只保留那些存在足够数量事件的窗口,即至少有2000个事件的窗口。此外,由于我们希望比较三对的结果,因此我们只保留所有对中都存在足够事件的窗口。这给我们留下了1551个windows foreach货币对,在下文中,我们将始终参考原始数据的子集。平均而言,欧元兑美元的情况下,每个窗口有6394个事件,欧元兑日元和美元兑日元的情况下,每个窗口分别有4169个和3187个事件。我们使用κ=100和w=300应用我们的完整程序。表7总结了每个货币对检测到的IB总数。平均每个窗口约0.3-0.5磅。然而,我们注意到,即使只在一小时内选择小窗口,我们也可以检测到一定数量的IB,其衰减时间τ非常长(大于一小时)。大多数时间间隔为06:30 08:00和12:00-15:00。第一个时间间隔对应于外汇市场欧洲时段的开始(伦敦时间07:00)和欧洲股市的开放(伦敦时间08:00)。第二次是美国会议开始(伦敦时间12:00)和美国股市开盘(伦敦时间14:30)。因此,这些冲击似乎主要反映了一天中的时间效应,因此我们决定将其从分析中删除。

30
kedemingshi 在职认证  发表于 2022-5-26 19:43:26
此外,我们不考虑τ>5400s的爆发,因为衰减时间比检测时间长得多(这相当于检测到的IB的10%以下)。我们发现,估计的IB参数α和τ的分布非常广泛,反映了我们遇到的IB的多样性。我们还发现,这些分布在所有货币对中都是相似的,尤其是标准化生育率f/N在所有货币对中的分布非常接近。5.2。多个市场同时爆发。我们考虑货币对之间常见的IBs,我们定义了一个事件,其估计开始时间z位于60秒的公差窗口内。如果我们注意到欧洲和北美的夏时制时间不同步,那么美国市场在伦敦时间13:30开市的时间是一年中的几周普通%对1%对2日元/USDJPY 252 31.82 45.16EURUUSD/EURJPY 324 45.00 40.91 EURUUSD/USDJPY 161 22.36 28.85表8:两种货币对之间的普通IBs:每对的检测IBs总数和分数。考虑到所有三个市场同时发生的冲击,它们将占所有检测到的IB的15–20%。然而,如果我们只考虑表8所示的两对,这一数字会显著增加。由于我们在每个FX对上独立执行模型校准,因此大量常见IBs的检测可被视为程序的健全性检查,以及检测到的IBs是真实事件的间接证据。事实上,在我们的分析中,任何两种汇率都有一种共同的货币,因此,我们很自然地预计它们会对共同驱动因素作出反应。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-9 04:44