楼主: 能者818
1051 26

[量化金融] 用于霍克斯模型选择的信息标准的性能 [推广有奖]

  • 0关注
  • 6粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
39.5040
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24699 点
帖子
4115
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2024-12-24

楼主
能者818 在职认证  发表于 2022-5-31 04:47:17 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Performance of information criteria used for model selection of Hawkes
  process models of financial data》
---
作者:
J. M. Chen, A. G. Hawkes, E. Scalas, M. Trinh
---
最新提交年份:
2017
---
英文摘要:
  We test three common information criteria (IC) for selecting the order of a Hawkes process with an intensity kernel that can be expressed as a mixture of exponential terms. These processes find application in high-frequency financial data modelling. The information criteria are Akaike\'s information criterion (AIC), the Bayesian information criterion (BIC) and the Hannan-Quinn criterion (HQ). Since we work with simulated data, we are able to measure the performance of model selection by the success rate of the IC in selecting the model that was used to generate the data. In particular, we are interested in the relation between correct model selection and underlying sample size. The analysis includes realistic sample sizes and parameter sets from recent literature where parameters were estimated using empirical financial intra-day data. We compare our results to theoretical predictions and similar empirical findings on the asymptotic distribution of model selection for consistent and inconsistent IC.
---
中文摘要:
我们测试了三个公共信息准则(IC)来选择具有强度核的Hawkes过程的阶数,强度核可以表示为指数项的混合。这些过程可应用于高频金融数据建模。信息标准是Akaike的信息标准(AIC)、贝叶斯信息标准(BIC)和Hannan Quinn标准(HQ)。由于我们使用模拟数据,我们能够通过IC选择用于生成数据的模型的成功率来衡量模型选择的性能。特别是,我们对正确的模型选择和潜在样本量之间的关系感兴趣。该分析包括现实的样本量和最近文献中的参数集,其中参数是使用经验金融日内数据估计的。我们将我们的结果与一致和不一致IC模型选择的渐近分布的理论预测和类似经验结果进行了比较。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Mathematics        数学
二级分类:Statistics Theory        统计理论
分类描述:Applied, computational and theoretical statistics: e.g. statistical inference, regression, time series, multivariate analysis, data analysis, Markov chain Monte Carlo, design of experiments, case studies
应用统计、计算统计和理论统计:例如统计推断、回归、时间序列、多元分析、数据分析、马尔可夫链蒙特卡罗、实验设计、案例研究
--
一级分类:Statistics        统计学
二级分类:Statistics Theory        统计理论
分类描述:stat.TH is an alias for math.ST. Asymptotics, Bayesian Inference, Decision Theory, Estimation, Foundations, Inference, Testing.
Stat.Th是Math.St的别名。渐近,贝叶斯推论,决策理论,估计,基础,推论,检验。
--

---
PDF下载:
--> Performance_of_information_criteria_used_for_model_selection_of_Hawkes_process_m.pdf (234.53 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:模型选择 Quantitative distribution Applications Econophysics

沙发
可人4 在职认证  发表于 2022-5-31 04:47:21
用于金融数据霍克斯过程模型模型选择的信息标准的性能J。M、 英国卡迪夫大学陈氏数学学院。G、 英国斯旺西大学霍克斯管理学院。Scalas公司*和M.Trinh+英国苏塞克斯大学数学与物理科学学院(日期:2017年4月5日)摘要我们测试了三个公共信息标准(IC),用于选择具有强度核的霍克斯过程的顺序,强度核可以表示为指数项的混合。这些过程在高频率金融数据建模中得到了应用。信息标准为Akaike\'s信息标准(AIC)、贝叶斯信息标准(BIC)和汉南-奎因标准(HQ)。由于我们使用模拟数据,我们能够通过IC选择用于生成数据的模型的成功率来衡量模型选择的性能。特别是,我们对正确的模型选择和潜在样本量之间的关系感兴趣。该分析包括现实的样本量和最近文献中的参数集,其中的参数是使用经验金融日内数据估计的。我们将我们的结果与一致和不一致IC模型选择的渐近分布的理论预测和类似经验结果进行了比较。*EScalas@sussex.ac.uk+M。Trinh@sussex.ac.ukI.简介技术进步使得记录金融市场上所有交易的详细数据成为可能。这一发展要求建立适当的计量经济模型,将贸易持续时间的时间结构纳入其中。以前,模型的设计是这样的:由于将数据聚合到等距的时间网格中,这些信息会丢失。

藤椅
nandehutu2022 在职认证  发表于 2022-5-31 04:47:24
然而,对高频交易数据的实证研究表明,日内交易有一个典型的模式:在交易日的开始和结束时有较高的交易活动,而在交易日中间的午餐时间有较低的交易活动(参见示例[4])。Engle和Russell率先提出了一种点过程方法来模拟交易之间的持续时间([12,13],[11])。所提出的自回归条件持续时间(ACD)模型与流行的用于vola t ilityclustering的GARCH模型密切相关。它也被称为乘法错误模型(有关此主题的更多详细信息,请参见[19])。然而,自激点过程在计量经济学和金融数学家中得到了广泛的欢迎。尤其是霍克斯过程[21,22]直观地揭示了有助于(贸易)事件聚类的内生和外生成分,这有时被称为“市场反应”([14]、[18])。此外,从理论角度,[9]分析了Hawkes过程的作用点过程的谱近似和均方连续过程的自回归模型的重要性。Hawkes过程最初用于地震数据([20]、[34]),但其自激和事件聚类的特性对于模拟日内金融数据中的f行为的类似现象很有吸引力。[5] 是建立霍克斯过程和财务建模之间联系的早期工作之一。

板凳
mingdashike22 在职认证  发表于 2022-5-31 04:47:29
由于存在基于强度和基于聚类的定义,因此存在各种模拟和估计技术,它们利用了霍克斯过程的任何一种观点。值得一提的是,对于模拟,我们有细化方法【33】,时间变化方法基于随机时间变化定理【28】,并具体应用于Hawkes过程,例如【35】、精确模拟【10】和完美模拟【29】。例如,在[35]中可以找到标准的最大似然法。除此之外,[20]使用了谱估计方法,[37]提出了贝叶斯估计技术,期望最大化(EM)算法的应用可在[41]中找到。这些处理霍克斯过程的工具在数字上为各种类型的金融数据的应用铺平了道路,如中期价格变化或订单、从流动性股票、期货、指数或外汇市场收集的极端价格变动(等等)。有关详细信息,[3]g的综述文件对霍克斯金融模型的最新文献进行了很好的总结。本质上,对于参数估计,有两种在金融数据文献中广泛使用的核:经验核和幂律核。在幂律渐近性得到非参数估计文献结果(如[2]所示)的支持的情况下,指数核情况在分析上更容易处理,而ndis仍然在最近的文献中应用([18]、[36]、[26])。今天的计算能力不仅允许准确记录高频交易,而且使我们能够将几乎任意复杂的模型拟合到以前收集的数据中。最近对此类数据建模的建议包括霍克斯过程的强度,这些过程可以表示为指数和幂律核的加权和。

报纸
nandehutu2022 在职认证  发表于 2022-5-31 04:47:32
自然会产生这样一个问题:在这样一个模型中应该包含多少项才能最适合描述数据。信息标准(IC)提供了定量方法来区分(可能有许多)模型。在选择“最优”模型顺序时,有两个相互竞争的目标:一方面,我们希望尽可能准确地捕捉和描述数据中观察到的现象,但另一方面,重要的是将模型的复杂性保持在最低限度。一个复杂的模型可能会导致数值不稳定和参数过多,而这些参数并没有太大的描述力。信息标准是管理这种情况的定量工具。我们在本文中的目的是测试这种模型选择方法在使用模拟数据处理指数项加权和的Hawkesprocess强度时的效果。本文的组织结构如下:第二节讨论了指数Hawkes-P模型。在对平均强度进行了简短的定义和讨论后,我们接着讨论模拟程序和通过最大似然法的参数估计方法。在第三节中,我们简要介绍了信息标准并讨论了一致性属性。最后,我们描述了蒙特卡罗实验的设置,并在第IV.II节给出了数值结果。自激点过程(N(t))t的指数核HAWKES模型≥0,条件强度函数由λ(t | Ft)正式定义:=limt型→0P(N(t+t)- N(t)=1 |英尺)/t、 (1)其中Ft表示截至时间t的已知历史。

地板
kedemingshi 在职认证  发表于 2022-5-31 04:47:35
我们假设条件强度函数的形式为(为了简单起见,去除历史条件)λ(t)=u+Ztg(t- τ) dN(τ),(2),其中我们有响应函数g(τ)≥ 0τ∈ R+和u>0是基线强度。包含响应函数的术语可以与自激特性识别,因此被称为强度的内生部分,而基线强度是外生部分。上述强度函数定义了具有有限过去的霍克斯过程,因为我们假设计数过程(N(t))t≥0从0开始。注意,我们偏离了最初的定义,通常(2)中的积分是在(-∞, t] 。特别是,我们对响应函数可以写成指数加权和的情况感兴趣:g(t)=PXm=1αme-βmt.(3)然后,强度函数由λ(t)=u+PXm=1αmkXi=1e给出-βm(t-ti)(4)u,αm,βm>0且{t,…,tk}是N(t)到时间t的跳跃时间。简而言之,我们将此过程称为指数Hawkes-P过程,其中P是过程的顺序。我们将把这类Hawkes过程视为贸易之间持续时间的可能参数模型。a、 平均强度:平稳与非平稳【22】中,计算出具有有限过去的平稳霍克斯过程的平均强度为∧:=E【λ(t)】=u1-R∞g(ν)dν,(5),其中n:=R∞g(ν)dν称为分支比。这个结果基本上遵循(2)两边的期望。特别地,对于指数核,我们haven=PPm=1αmβ,且平稳性条件为n<1。

7
mingdashike22 在职认证  发表于 2022-5-31 04:47:38
n=1的特殊情况也允许[6]中处理的平稳过程。然而,对于具有与(4)中强度相关的有限过去的霍克斯过程,我们使用拉普拉斯变换采用不同的方法:L etД(t):=E[λ(t)]现在是非平稳霍克斯过程的平均强度函数。然后,对(2)的两个方面进行预期,得到ν(t)=u+PXm=1Ztαme-βm(t-u) ^1(u)du。(6) ν的拉普拉斯变换式由(s)=Z给出∞e-stИ(t)dt=Z∞e-studt+PXm=1αmZ∞t=0e-stZtu=0e-βm(t-u) Д(u)du dt=us+PXm=1αmZ∞u=0e-suИ(u)Z∞t=ue-(s+βm)(t-u) dt du(7)=us+PXm=1αms+βmZ∞u=0e-suД(u)du=us+PXm=1αms+βm!在(7)中,我们可以应用Fubini定理,因为被积函数是正的。最后,我们得到了一个代数方程,该方程可用于求解:(s)=us1-PPm=1αms+βm。(8)对于P>1,我们可以交替写入:(s)=usQPm=1(s+βm)QPm=1(s+βm)-PPm=1αmQk6=m(s+βk)。(9) 这给出了强度函数的拉普拉斯变换的解析表达式。从方程(8)中,我们可以看出,要求通常的平稳性条件ppm=1αmβm<1是合理的,以确保正确定义右侧项。通常,平均强度函数的计算可以通过(数值)拉普拉斯反演完成。然而,对于较低的模型或DER(P=4)而言,可以通过分析反转平面变换。我们将在下面的示例中显示第一和第二顺序。示例1(P=1时的平均强度公式)。对于P=1,表达式(8)简化为(s)=u(s+β)s(s+β- α) =μβ- αβs-αs+β- α, (10) 在最后一步中,我们使用了部分分数分解。这允许我们分析反转La-place变换:Д(t)=uβ- αβ- αe-(β-α) t型, t>0。(11) 示例2(P=2时的平均强度公式)。

8
可人4 在职认证  发表于 2022-5-31 04:47:41
对于P=2,我们有(s)=u(s+β)(s+β)s[(s+β)(s+β)- α(s+β)- α(s+β)](12)从P=2阶开始,显式公式可能相当复杂。设R和Q分别表示(12)中右侧表达式的数字或分母中的多项式。然后,假设Q只有由s、s、s表示的单重数的实值根,则部分分数分解由(s)=P(s)Q(s)=Xi=1P(si)Q′(si)(s)给出- si)=uAs+As- s+As- s, (13) 其中s=0,s=(γ- ξ) ,s=(γ+ξ)(14),其中γ=α+α- β- β和ξ=pγ- 4(ββ- αβ- αβ)。(15) 部分分数分解意味着a(s- s) (s)- s) +组件- s) +组件- s) !=(s+β)(s+β)(16)并比较方程yieldsA+A+A=1(17)两侧的s、s和1的系数-A(s+s)- 像- As=β+β(18)Ass=ββ。(19) 然后我们得到a=ββss=ββ(γ- ξ)/4=ββββ- αβ- αβ(20),通过对A和插入(14)求解(19)。现在将(17)乘以沙子加(18)得到- As+A(s)- s) =β+β+s。(21)求解Awe getA=β/s+β+β+ss- s=β+s(β+β)+ss(s- s) =4ββ- 2(ξ- γ) (β+β)+(ξ- γ) 2ξ(ξ- γ) =(ξ)- γ- 2β)(ξ- γ- 2β)2ξ(ξ- γ) =(ξ)- α- α+β- β) (ξ)- α- α- β+β)2ξ(ξ- γ) 。(22)将(17)乘以s,再加上(18)并遵循与AyieldA=(ξ+γ+2β)(ξ+γ+2β)2ξ(ξ+γ)=(ξ+α+α+β)类似的步骤- β) (ξ+α+α- β+β)2ξ(ξ+γ)。(23)Lapla-ce反演给出了ν(t)=uA+Aest+Aest. (24)注意,当条件ppm=1αmβm<1时,可以得出根s sand是实的和负的。从这两个例子中,我们可以看到,方程(11)和(24)中的指数项在很大程度上变得可以忽略,其余表达式与平稳情况下的强度函数一致。在一个小型蒙特卡罗(MC)实验中,我们用1000个事件模拟了霍克斯过程的1000条路径(另请参见empirAgg2.m)。参数为u=0.5、α=3.1、α=5.9、β=9.9和β=10。

9
大多数88 在职认证  发表于 2022-5-31 04:47:45
图1显示了经验观察到的平均事件数与理论预期事件数的对比图。绘制这样的图可能有助于验证模拟算法。回想平均强度函数Д和点过程预期事件数(N(t))t之间的关系≥0:E[N(t)]=ZtИ(τ)dτ(25)时间0 2 4 6 10 12经验理论(非平稳)理论(平稳)图1。MC模拟的平均事件数与理论值之间的比较。对于参数值u=0.5、α=3.1、α=5.9、β=9.9和β=10,我们模拟了一个P=2阶指数Hawkes过程,并绘制了事件的经验平均数(红色曲线)与e q(25)中预期事件数的理论值。在非平稳情况下,我们将平均强度函数积分到等式(24)中,该函数对应于蓝色曲线。静止情况通过绿色曲线显示。在很短的时间内,我们可以观察到瞬时指数行为,这种行为会在很长时间内消失。特别是,两个理论函数的斜率在很大程度上近似相等,表明非平稳情况下的强度函数收敛于平稳情况。此外,我们可以在模拟具有有限过去的霍克斯过程时验证边缘效应,这将在下一节中简要讨论。A、 模拟如前一节所示,模拟具有有限过去的霍克斯过程以近似具有有限过去的霍克斯过程将导致模拟过程在模拟时间开始时变为非平稳。这种现象也被称为边缘效应,因为忽略了过去可能发生的事件的影响。

10
mingdashike22 在职认证  发表于 2022-5-31 04:47:48
有关这方面的更多详细信息,请参见[29,30]。然而,与【10】类似,我们明确希望使用具有有限过去的霍克斯过程。因此,我们认为边缘效应是模型的固有特性,而不是模拟的事实。此外,尽管[10]中的精确模拟算法适用于多维指数模型,但由于缺乏对强度的外生和内生部分的识别,该算法并不直接适用于我们提出的模型。这就给我们留下了流行的细化算法,可以追溯到[27]和[33]。我们使用细化算法的实现来模拟时间间隔[0,T]上的过程(参见hawkesThinning.m),并比较高达3阶的模型。我们首先生成样本数据,作为估算和模型选择方法的技术示例。表I中给出了参数设置。a、 与金融文献中的实证结果相联系为了增强我们的实验和结果的实际相关性,我们还希望使用参数设置,允许在实证研究中也可以观察到强度。关于指数Hawkes-P模型,[18]发现使用单指数强度函数可能会产生误导性结果,这也得到了[36]的证实。然而,这并不一定适用于高阶指数Hawkes过程:[26]发现,当应用于FXdata时,P阶指数强度核大于1的Hawkes模型的性能优于单指数模型,且与幂律模型相当。这就是为什么我们在本文中加入了一个参数集,用于我们的MCExperiment(见表II)。B、 最大似然估计(MLE)和优度虽然我们主要关注模型选择的性能,但我们必须确保最大似然估计给出合理的结果。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 23:09