楼主: nandehutu2022
803 25

[量化金融] Hawkes过程的统计显著性极限 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

74%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
67.0366
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24315 点
帖子
4027
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-20

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《The limits of statistical significance of Hawkes processes fitted to
  financial data》
---
作者:
Mehdi Lallouache, Damien Challet
---
最新提交年份:
2015
---
英文摘要:
  Many fits of Hawkes processes to financial data look rather good but most of them are not statistically significant. This raises the question of what part of market dynamics this model is able to account for exactly. We document the accuracy of such processes as one varies the time interval of calibration and compare the performance of various types of kernels made up of sums of exponentials. Because of their around-the-clock opening times, FX markets are ideally suited to our aim as they allow us to avoid the complications of the long daily overnight closures of equity markets. One can achieve statistical significance according to three simultaneous tests provided that one uses kernels with two exponentials for fitting an hour at a time, and two or three exponentials for full days, while longer periods could not be fitted within statistical satisfaction because of the non-stationarity of the endogenous process. Fitted timescales are relatively short and endogeneity factor is high but sub-critical at about 0.8.
---
中文摘要:
许多霍克斯过程对金融数据的拟合看起来相当不错,但大多数都没有统计学意义。这就提出了一个问题,即这个模型能够准确解释市场动态的哪一部分。我们记录了这类过程的准确性,比如改变校准的时间间隔,并比较由指数和组成的各种类型的核的性能。由于外汇市场的开放时间是24小时不间断的,因此外汇市场非常适合我们的目标,因为外汇市场允许我们避免股票市场每天隔夜长时间关闭带来的复杂性。根据三个同时进行的测试,可以获得统计显著性,前提是一次使用两个指数的核拟合一个小时,使用两个或三个指数拟合一整天,而由于内生过程的非平稳性,较长的周期无法在统计满意度范围内拟合。拟合的时间尺度相对较短,内生性系数较高,但在0.8左右为次临界值。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Hawk Exponentials significance satisfaction Applications

沙发
mingdashike22 在职认证  发表于 2022-5-6 07:52:01 |只看作者 |坛友微信交流群
Hawkes过程的统计意义限制适用于金融数据Mehdi Lallouache和Damien Challet1、金融量化研究所、数学实验室、系统贴花、巴黎中央经济学院、查特奈马拉布里、92290、法国弗朗西塞拉德资本有限公司、洛桑B\'timent C区EPFL创新园、洛桑1015、,瑞士霍克斯处理财务数据的许多方法看起来相当不错,但大多数都不具有统计学意义。这就提出了一个问题,即这个模型能够准确解释市场动态的哪一部分。我们比较了各种时间间隔的精度,比如一个时间间隔的性能。由于外汇市场的开放时间是24小时不间断的,因此外汇市场非常适合我们的目标,因为外汇市场允许我们避免股票市场每天隔夜长时间关闭带来的复杂性。一个人可以通过三个同时进行的测试获得统计显著性,前提是一次使用两个指数的核,一个小时使用两个或三个指数,一整天使用两个或三个指数,而由于内生过程的非平稳性,更长的周期无法在统计满意度范围内完成。拟合的时间尺度相对较短,内生因子较高,但在0.8左右为次临界值。I.简介霍克斯过程是泊松过程的自然延伸,其中自激导致事件聚集[23,24]。最初应用于地震发生的建模[35,36],已被证明在许多领域都很有用(例如神经科学、犯罪学和社会网络建模[13,14,34,38,45])。这是因为它们的易处理性和不断增加的估算方法[2,5,16,31,33,40]。

使用道具

藤椅
kedemingshi 在职认证  发表于 2022-5-6 07:52:04 |只看作者 |坛友微信交流群
由于许多类型的金融市场事件(如中期报价变化、极端退货事件或订单提交)都是在时间上聚集的,因此HawkesProcess也已成为金融领域的标准工具。在市场微观结构的背景下,霍克斯过程首先由Bowsher[8]引入,他同时用多元框架分析了交易时间和中间报价的变化。另外两种开创性的方法是Bauwens和Hautsch[6]以及Hewlett[25]的Theone,他们专注于交易之间的持续时间。随后,大型[30]在一个十变量霍克斯过程中用限额订单和取消数据补充交易数据,以测量伦敦证券交易所订单簿的弹性。Bacry等人[3]最近将中间价格变化建模为两个Hawkes过程之间的差异,并表明由此产生的价格表现出宏观结构噪音和Epps效应。Jaisson和Rosenbaum[27]证明,在适当的重标度下,早期不稳定的Hawkes过程收敛到Heston模型。Bacry和Muzy[4]使用了该模型的增强版来解释市场影响。最后,Jedidi和Abergel【28】利用多变量霍克斯设置对全订单进行建模,并证明由此产生的价格差异在大时间尺度上使用。值得注意的是,霍克斯过程也适用于其他金融主题,如VaR估计[11,12]、通过建模进行交易[42]、投资组合信用风险[19]或跨地区[1]和跨资产的金融传染[7]。研究人员普遍认为,只有一小部分价格变动是由外部新闻稿直接解释的(例如Cutler等人[15],Joulin等人[29])。因此,价格动态主要由内部反馈机制驱动,这与索罗斯所说的“市场反应”相对应[41]。

使用道具

板凳
mingdashike22 在职认证  发表于 2022-5-6 07:52:07 |只看作者 |坛友微信交流群
在霍克斯过程的框架中,内生性来自自激,而基线活动率被认为是外生的(参见第二节的数学定义)。换句话说,这些过程提供了一种直接的方法来衡量内生性的重要性,例如在E-mini标准普尔期货[20,22]中。菲利莫诺夫(Filimonov)和索内特(Sornette)[20]认为,由于高频和算法交易的出现,内生性水平在过去十年中稳步上升。Hardiman等人[22]表明,只有短期内生性(与计算机能力和速度的增加有关,事实上,HFT)多年来一直在增加,而内生性因子一直非常稳定,接近1,即过程完全自我参考和不稳定的特殊值。拟合Hawkes ProcessTo财务数据需要一定的谨慎:不应使用单一指数自激核[22],而许多其他偏差可能会在长时间内影响长尾核的拟合[21]。没有人声称霍克斯过程是金融市场整体动态的准确描述。然而,在文献中,测试这些功能的重要性并不是当前的优先事项。鉴于这些数据通常令人满意,似乎很明显,在某些情况下可以获得统计意义。在这里,我们希望根据三个统计测试,评估具有几种可能类型的参数核的霍克斯过程的解释力的范围(和极限)。获得重大收益的困难之一来自交易活动的跳跃,比如市场开盘和收盘时发生的交易活动。这就是我们研究FXmarkets数据的原因,FXmarkets具有长期持续运行的优势。仍然可能存在不连续性,无论是隐式的(例如fixing time)还是显式的(例如fixing time)。

使用道具

报纸
nandehutu2022 在职认证  发表于 2022-5-6 07:52:10 |只看作者 |坛友微信交流群
但至少一天的外汇数据比一天的股市数据要长得多,因此更适合我们的目标。因此,对于minori,我们可以推断出我们在纠正Hawkes过程方面的大部分失败,都是由于其他类型的数据具有更显著的活动不连续性。另外两篇关于外汇数据和霍克斯过程的论文的关注点与我们的不同:Hewlett[25]处理的是相对缺乏流动性的欧元/兹罗提货币对,并使用单一指数核。兰巴迪等人[39]也使用EBS数据(与我们的数据具有相同的时间分辨率),研究重要新闻的最佳引用动态。由于我们的数据集由每0.1秒一次的订单快照组成(更多详细信息,请参见第三节),我们可以跟踪大多数交易,但不能跟踪中间价格的变化。这就是为什么我们采用单变量霍克斯过程来计算欧元/美元贸易额。内生性参数则是单个交易触发的平均交易数。本文的结构如下:我们首先定义了霍克斯过程、拟合方法、参数核以及我们将使用的统计检验。我们首先表明,霍克斯流程擅长处理一小时的外汇数据,在一天内相当不错,在连续两天使用时失败。二、HAWKES过程一元HAWKES过程是一个线性自激点过程,其强度由λt=ut+^tφ(t)给出- s) dNs=ut+Xti<tφ(t- ti),(1)其中u是描述外源性事件到达的基线强度,第二项是过去事件的加权总和。核φ(t)-ti)描述了ti时发生的前一事件对电流强度的影响。霍克斯过程可以被映射到(并解释为)一个分支过程,在分支过程中,强度为utca的外源性“母亲”事件可以触发一个或多个“孩子”事件。

使用道具

地板
何人来此 在职认证  发表于 2022-5-6 07:52:13 |只看作者 |坛友微信交流群
反过来,这些子事件中的每一个都可以触发多个梯次事件(或者分别触发原始事件的“孙子”),等等。数量n≡'∞φ(s)ds控制内生族的大小。实际上,n是过程的分支比率,它被定义为任何事件的平均子事件数。因此,n Quantifie以优雅的方式反映市场活力。根据分支比率值,存在三个区域:o亚临界区域(n<1),其中家庭几乎肯定会消亡,o临界区域(n=1),其中一个家庭独立生活而不会爆炸。在Hawkesprocess的语言中,这需要适当定义u=0,这相当于Brémaud和Massoulié[9]研究的没有癌症的Hawkes process,o爆炸状态(n>1),其中单个事件触发一个严格正概率的有限家族。评估n给出了一个简单的衡量市场与临界状态之间“距离”的方法。为了n≤ 1.如果ut恒定,则过程是静止的。在这种情况下,分支比率也等于所有事件中内生事件的平均比例。A.参数内核我们比较以下内核的性能,每个内核都有自己的索引指数和:φM(t)=MXi=1αie-t/τi,其中M是指数数。指数的振幅αi和时间尺度τi为估计参数。分支比由以下公式给出:n=PMi=1αiτi=PMi=1ni.o幂律近似的优点是只需要几个参数。因此,将它们转换为数据要容易得多。近似幂律核由φPLM(t)=nZM给出-1Xi=0a-(1+)ie-tai,其中i=τmi。M控制近似值的范围,M控制其精度。Z的定义如下'∞φpl(t)dt=n。

使用道具

7
能者818 在职认证  发表于 2022-5-6 07:52:16 |只看作者 |坛友微信交流群
这些参数是分支比n,尾部指数 最小的时间尺度τ具有短滞后截止的近似幂律[22]:φHBBM(t)=nZM-1Xi=0a-(1+)ie-泰- 硒-助教-1.定义与φPLM相同,对于小于τ的滞后,增加平滑指数下降。S定义为φHBBM(0)=0.o我们提出了一种新的核函数,它由一个近似的幂律φplm和一个具有自由参数的指数构成。这是为了在时间尺度的结构中允许更大的自由。然后将核定义为φPLxM(t)=nZM-1Xi=0a-(1+)ie-泰+贝-tτ!,其中指数项加上两个参数b和τ。其他变量的含义与上述相同。当一个函数的计算复杂度为1时,可以将函数的计算复杂度从1降低到37。由于N是O(10),它在单个工作站上提供了合理的计算时间。第一种形式是最灵活的,可以近似虚拟连续函数,代价是额外的参数和更多的草率[44]。第二种和第三种方法旨在重现在许多市场上观察到的长记忆,但灵活性较低;他们的有效支持可能会跨越整个融资期。最后一个尝试结合两个世界的优点。一旦确定了一种核形式,我们就使用L-BFGS-B算法[10]来估计最大化似然度的参数。对于每一个fit,我们尝试不同的起点来避免局部最大值。使用多元Hawkes过程,系统地确定买入和卖出交易的到达和相互影响。买卖交易都会产生难以区分的结果;因此,我们关注买入交易。B

使用道具

8
可人4 在职认证  发表于 2022-5-6 07:52:20 |只看作者 |坛友微信交流群
fits优度测试fits的质量根据时间变形的持续时间序列{θi}进行评估,定义为θi=^titi-1λtdt,其中λ是估计强度,{ti}是经验时间戳。如果霍克斯过程正确地描述了数据,那么θ必须是(i)独立的,并且(ii)与单位速率呈指数分布。通过构造,最大似然估计倾向于最大化θs的指数性质,但不是它们的独立性。这就解释了为什么只要内核包含一个以上的指数,得到的θs的QQ图在视觉上是非常令人满意的。对QQ情节的目视检查只是可用的标准之一,其中许多标准更加精确和严格。事实上,属性(i)可以通过Ljung-Box检验进行检验,该检验检验检验给定时间序列中不存在自相关的无效假设。我们在这里使用了Ljung和Box[32]的原始测试统计数据的轻微修改,定义为Q=N(N+2)h+1Xk=2^ρkn- k、 其中N是样本量,ρkis是滞后k处的样本自相关,h是被测试的滞后数。在空值下,Q跟随一个带有h自由度的χ。注意,我们从k=2(而不是1)开始求和。这是因为数据清理程序(第III B节)引入了系统性的小单步反相关。换言之,我们希望测试这种程序不影响的滞后是否存在自相关。房地产(ii)通过两个测试1进行评估。Kolmogorov-Smirnov检验(KS),基于经验累积分布和指数累积分布之间的最大差异。零点下的渐近分布是Kolmogorov分布。众所周知,这是一项非常(甚至过分)苛刻的测试。2.Engle和Russell[18]过度分散试验(此后编辑),该试验验证了残余物中缺乏过度分散。

使用道具

9
大多数88 在职认证  发表于 2022-5-6 07:52:22 |只看作者 |坛友微信交流群
测试统计数据显示:S=√N^σ- 1.√,式中,^σ是θ的样本方差,应等于1。在空值下,S具有极限正态分布。所有这三个测试都检查θs.III.DATAA的基本但本质的属性。描述我们研究2012年1月1日至2012年3月31日期间的欧元/美元交易商间交易。数据来自EBS,这对货币的主要电子交易平台。每0.1s记录一条消息。该消息包含交易量的最高买入交易价格和最低卖出交易价格,以及时间段内交易的总签署量。EBS上的订单数量必须是基础货币的100万倍,因此是自然数量单位。据我们所知,这是EBS在频率方面(几乎是逐点)可用的最佳数据,最重要的是,它具有包含交易量信息的宝贵优势。B.处理必须对数据进行过滤,以提高fits的准确性。粗时间分辨率引入了持续时间数据的伪离散化,如图1(左图)所示。为了克服这个问题,我们添加了一个时间偏移,均匀分布在0和0.1之间,用于交易发生时间(图1,中间图)。在92%的情况下,一个时间段内一方的事务数可以从总签名卷中确定。事实上,当总签署交易量(Vtotal)等于报告交易量(Vreport)时,只有一笔交易发生,唯一的不确定性是事件的确切时间。然而,当Vtotal>Vreport时,一个人知道发生了不止一次交易。如果全部-Vreport=1,正好发生了两次交易,一次交易量为Vreport,一次交易量为1;它们各自的事件时间在时间片中随机均匀地绘制。

使用道具

10
大多数88 在职认证  发表于 2022-5-6 07:52:27 |只看作者 |坛友微信交流群
最后,这个案例是全面的- Vreport>1(约8%的非空时间片)是不明确的,因为额外的交易量可能来自多个交易,因此可能以不同的方式分割。我们尝试了不同的方案:不增加任何交易,增加一笔交易,每增加100万增加一笔交易,在1和V之间增加一个统一的随机数- V报告和自洽修正,根据明确确定的交易量的分布,使用最可能的分区。它们都给出了所有核的相似估计拟合参数。然而,无论核心选择是什么,增加一项交易都能最好地改善统计意义。因此,我们在本文中应用该程序;因此,所有统计结果都密切依赖于这一选择。结果持续时间的分布如图1(右图)所示。05101520250.0 0.5 1.0 1.5 2.0持续时间频率(%)02460.0 0.5 1.0 1.5 2.0持续时间频率(%)024680.0 0 0.5 1.0 1.5 2.0持续时间频率(%)图1:持续时间分布。左:原始时间。中间:随机时间。右图:更正时间。三个月的数据,仅限于伦敦的工作时间(上午9点至下午5点)。这种简单的矫正过程会产生微弱的短期记忆效应。图2(左)绘制了特定日期(2012年3月3日)序列{θi}的线性自相关函数(其他日期产生类似结果)。除第一个滞后外,所有系数在统计学上几乎等于零(这就是为什么我们从第二个滞后开始应用Ljung-Box测试)。这个负值是由校正程序(见第三节B)引起的,因为在raw中执行的相同测量显示完全没有内存(图2(右))。数据的自相关(θi)然而,校正程序中的序列号无效。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-6 07:41