楼主: 能者818
1049 26

[量化金融] 用于霍克斯模型选择的信息标准的性能 [推广有奖]

11
何人来此 在职认证  发表于 2022-5-31 04:47:53
这是因为我们期望MLE的质量与随后的模型选择结果之间有密切的联系。由于数值问题或缺乏数据而导致的不良MLE可能会影响模型选择。例如,如果估计模型本身无法描述和预测我们感兴趣的数据的关键特征或数量,那么正确选择的模型顺序可能毫无意义。在以下小节中,我们简要介绍了拟合程序以及均方根误差,作为我们选择的拟合优度衡量标准。通过最大似然法拟合该算法遵循了[35]中的理论,这是一种标准的最大似然法。对于强度为λ的自激点过程,数据0<t<…<tn<T由log L(T,…,tn |θ)=-ZTλ(t |θ)dt+ZTlog(λ(t |θ))dN(t)。(26)设θ=(u,α,…,αP,β….,βP)为Hawkes-P模型的参数向量。在公式(26)中插入公式(4),给出L(t,…,tn |θ)=-uT-PXm=1“αmβmXti<T1.- e-βm(T-ti)#+Xtk<Tlogu+PXm=1αmXti<tke-βm(tk-ti)!。(27)此外,[35]表明,对数似然可以递归计算,从而将计算负担从O(n)减少到O(n):假设T=tn,即最后一个事件是观察的最后一个时间点。Thenlog L(t,…,tn |θ)=-utn-PXm=1“αmβmXti≤田纳西州1.- e-βm(tn-ti)#+Xtk公司≤tnlogu+PXm=1αmAm(k)!,(28)式中,Am(1)=0 m=1,PAm(k)=Xti<tke-βm(tk-ti)=(1+Am(k- 1) )e-βm(tk-tk公司-1) 。为了获得参数的最大似然估计,我们将对数似然函数最大化,特别是在平稳条件下的参数:arg maxu,α,。。。,αP,β,。。。,βPlog L(t,…,tn |u,α,…,αP,β,…,βP)(29)s.t.u,α,αP,β,βP>0,β<…<βPandPXm=1αmβm<1。我们假设对β参数进行排序,以避免识别问题。

12
何人来此 在职认证  发表于 2022-5-31 04:47:56
最大化(或者更确切地说是负对数似然的最小化)通常是在数字上完成的,因为估计量在闭合形式下不可用。对于约束问题,我们使用了标准MATLABTMfunction fmincon。优化路线可在补充文件拟合中找到。m、 条件。m和LogLikiter。m、 2。Hawkes过程的极大似然估计的重要渐近性质的优度已经研究并由[32]证明(见[36]附录中的简要总结)。在第三部分中,我们可以假设最大似然估计是一致的,即随着样本量趋于精确,最大似然估计收敛于参数的真实值。为了用我们的MCExperiment验证这些结果,我们使用RMSE(均方根误差)作为拟合优度的度量:θ是要估计的一般模型参数,θ是相应的估计量。给定N=1000个样本,参数估计为^θ(k),k=1,N、 对于每个样本,我们计算beRMSE的(绝对)根均方误差(θ)=VuTunnxk=1 |θ-^θ(k)|(30)和相对均方根误差rmserel(θ)=θvuutNNXk=1 |θ-^θ(k)|。(31)由于真实模型值在我们的mockdata设置中已知,因此很容易计算上述数量。三、 信息标准和模型选择在以下章节中,我们将定义我们感兴趣的IC,并简要描述相关的理论概念。在此基础上,我们给出了一个简单的MC实验的结果,以用于使用IC的ssess模型选择。我们意识到我们的实验的某些条件实际上没有给出,因此也讨论了我们可能从数值结果中得出的结论的局限性。a、 定义和理论性质本节介绍了可在[8]中找到的介绍性工作及其参考文献。定义1。

13
nandehutu2022 在职认证  发表于 2022-5-31 04:47:59
对于通过极大似然估计拟合数据的给定模型,L为最大对数似然值,k为参数数,n为数据集的样本量。然后我们定义:1。Akaike信息准则(AIC)(见[1])AIC=-2L+2k(32)2。贝叶斯信息准则(BIC)(见[38])BIC=-2L+k ln(n)(33)3。Hannan和Quinn信息标准(HQ)(见[17]和[16])HQ=-2L+2k ln(ln(n))(34)第二节中的指数Hawkes-P过程是具有1+2P参数的嵌套模型系列的一个示例,因此非常适合计算信息标准。IC的公式在函数IC中实现。m、 上述信息标准为formIC(Mk)=-2L+c(k,n)(35),其中mk是与参数数量k相关的模型,c(k,n)是一个适当选择的惩罚项,用于解释模型的复杂性,即参数数量。在一组给定的可供选择的模型中,“最佳”模型是使IC值最小化的模型。换言之,所选模型应为数据a提供最佳拟合,即具有对数似然值,同时尽可能简单,即使用较少的参数。因此,公式(35)代表了我们之前讨论过的贸易情况。备注1.1。AIC是通过估计“t r ue”模型分布与估计分布之间的Kullback-Leibler距离得出的。【23】建议对小样本的AIC进行校正:AICc=-2L+2KN- k- 1.(36)我们应遵循[7]中的建议,并在n<40kmaxasa时使用AICc经验法则,其中kmaxis是在扩展模型中使用的最大参数数。2、BIC最初是在贝叶斯估计方法中推导出来的,但在常客背景下也是有效的,并且有一种从常客角度推导BIC的替代方法(详情参见【7】3)。

14
何人来此 在职认证  发表于 2022-5-31 04:48:02
总部被设计为拥有增长最慢的处罚期限,这仍然使得ICto具有很强的一致性(有关更精确的定义,请参见下文)。这个证明利用了重对数定律。此外,总部最初的定义更为笼统,即总部‘=-2L+2ck ln(ln(n)),c>1,(37),但在随后的示例中,c被选择为1。[8] 指出cis的选择不明确,使得从业人员的信息标准不那么重要。与最大似然估计的一致性性质类似,当基础样本量增加时,让信息中心以高概率选择正确的模型顺序是一个可取的性质。更准确地说:定义2。设n为基本样本量,J为所有竞争模型中的模型集,这些模型使Kullback-Leibler距离与真实模型和letJ的距离最小 J是具有最小(参数)维数的模型的子集。然后,如果存在j,则认为IC是一致的∈ Jsuch thatlimn公司→∞Pminl公司∈J\\J(IC(Mj)- IC(Ml))>0= 1,(38)即IC选择最小维数的模型的概率,最小的Kullback-Leibler距离收敛到1。如果(38)中的断言几乎肯定成立,则IC是强一致的:Pminl公司∈J\\J(IC(Mj)- IC(Ml))>0,几乎所有n= 1(39)备注2。上述定义遵循了[8,p.101]中的符号,但一致性和强一致性的充分条件的原始证明如[40]所示(其中一致性实际上被称为弱一致性)。就f法案而言,AIC无法保持一致,因为惩罚条款不取决于样本量。自回归模型的相关模型选择的渐近分布分析如[39]。另一方面,BIC和HQ具有很强的一致性。

15
可人4 在职认证  发表于 2022-5-31 04:48:05
因此,在最简约的Kullback-Leibler极小化模型上,它们的模型选择的渐近分布必然收敛到一个delta。[42]中针对另一个回归模型分析了AIC和BIC各自的收敛速度。b、 从上一节的实际角度来看,一致性可能会得出结论,不一致的AIC不如一致的BIC和HQ。然而,情况更为复杂:我们必须记住,一致性是一种渐近性质。这意味着,在理论上,如果样本量足够大,一致IC最终将在几乎所有情况下都优于AIC。不幸的是,从业人员只有有限的可用数据,很难判断样本大小是否达到渐近区域。事实上,实证研究表明,对于各种统计模型,AIC在小样本情况下优于BIC【31】:例如,Mongression模型【23,24】在模拟数据上比较了不同的IC,特别是为了促进(仍然不一致)AIC作为小样本AIC的修正。最近,[25]将IC(AIC、BIC、HQ、AICc)应用于(非线性)G ARCH模型的MC模拟。他们的结果表明,AIC输出的是高阶GARCH过程的BIC和HQ。由于上述讨论,我们可以使我们的MC实验的想法和目标更加准确:首先,我们需要指出,MC实验的简单设置的数值结果并不能直接转化为应如何处理经验数据。IC是模型选择和交叉验证的众多工具之一。我们并不期望找到“最佳”IC,而是想验证霍克斯过程中不同IC的理论特性。

16
能者818 在职认证  发表于 2022-5-31 04:48:08
特别是,由于大多数理论结果仅针对回归模型推导,我们的工作可能有助于阐明一致IC的交感区和收敛率以及该模型类AIC f的选定阶的渐近分布。验证理论属性将是使用参数集1进行MC模拟的主要目的,而对于我们的经验参数集2,我们遵循[7]中给出的建议,并使用实际样本量。四、 数值结果使用第II A节中描述的细化算法,我们模拟了四个包含1000个样本的不同数据集。其中三个对应于表1中参数集1的每一行,一个数据集由指数型Hawkes-2模型的样本组成,参数值来自表2所示的参数集2。特别是对于参数集2,时间范围T可以假定为以秒为单位。其范围从10分钟到6小时,反映了典型的日内财务数据集。为了检查估计方法对我们的参数集的效果,我们假设正确的模型阶数P已知,并对每个数据集下的真实模型的参数进行MLE。随后,我们能够计算RMSE作为真实参数值和估计参数值之间距离的度量。参数集1的绝对和相对RMSE值分别见表III和表IV。关于参数集2,见表VIII和IX。我们观察到,RMSED随着样本量的增加而减少。这是意料之中的,因为已知MLE是一致的。最后,我们假设真实的模型阶数未知,但需要由heIC选择。因此,对于每个数据集,我们必须拟合所有可能的模型阶数P=1、2、3,并计算相关的IC值。

17
kedemingshi 在职认证  发表于 2022-5-31 04:48:11
下面我们将讨论模型选择的结果。我们首先考虑参数集1。对于模型阶数P=1的模拟数据,我们可以在表IV中看到,相对RMSE相对较低,即使是对应于时间范围T=500的最小样本。表V中的模型选择证实,最小的样本量可能已经足以保证所有IC的高成功率(超过90%)。然而,在最低阶情况下,我们可以观察到一致IC和不一致IC的不同行为。对于BIC和HQ,成功率随着平均样本量的增加而提高。特别是,这种关系似乎是单调的,在BIC的情况下,对于T=1000,成功率已经达到100%,HQ的表现略差于BIC,但对于T=5000,仍然远远超过90%,非常接近100%。然而,AIC的行为更令人担忧。即使对于大样本量,使用AIC的t血型选择也允许相对较大的概率(>6%)选择比P=1更高的顺序。由于AIC不是一致的IC,我们不能排除这些结果已经近似于AIC模型选择的渐近分布的可能性。如前所述,这种渐近分布通常不同于真实模型阶数上质量为1的delta分布。此外,数值结果表明,增加平均样本量并不一定会提高模型选择的成功率。例如,从T=500移动到T=1000,我们可以观察到AIC案例中成功率的增加。在模型阶数P=2的情况下,可能存在高估和低估。我们观察到参数α和β的RMSE非常大,尤其是对应于T=500和T=1000的较小样本。

18
何人来此 在职认证  发表于 2022-5-31 04:48:16
这可能是影响表VI中T=500模型选择的因素之一:所有IC中存在很大比例的低估,最不可能的是lmo的高低估率,约占BIC的95%。在T=500的情况下,TheAIC似乎表现最好,成功率略高于50%,但也低估了48%。对于较大的样本,BIC和HQ选择概率非常高(约90%或更大)的correctmodel顺序,BIC的成功率达到100%,t=2000。同样,我们有一个不利影响,即AIC的成功率随着平均样本量的增加而降低。即使对于T=5000的最大平均样本量,高估的概率也相对较大,超过6%。对于P=3的模拟数据,我们的行为与P=2相似。同样,在小样本情况下,表IV报告了参数α和β的较大RMSE。由于P=3是可选择的最高型号顺序,因此不包括规格过大的情况。这意味着,我们可以在AIC的模型选择中观察到与BIC和HQ相同的模式:从T=500开始,大多数情况下会出现低估,然后随着样本量的增加,成功率会提高。对于T=2000,所有IC均达到100%成功率。然而,如果我们在模型选择集中包含高阶P>3,我们很可能会观察到AIC高估的趋势。在使用参数集2时,我们选择了10分钟、15分钟、30分钟、1小时、3小时和6小时的时间范围。首先,T=600和T=900的RMSE值较大(见表VIII和表IX),这表明样本量太小,我们无法确保MLE方法的良好估计。尤其是α和β的估计具有较大的RMSE。这种情况对应于参数集1设置中t=500的情况。

19
可人4 在职认证  发表于 2022-5-31 04:48:19
当我们与表X中相应的模型选择进行比较时,我们观察到同样的现象:BIC的低估最严重,HQ的低估较少,AIC的低估最少。对于这些情况,样本非常小,可能符合Remark1第(i)点中讨论的经验法则,我们在表中包括了组合模型选择规则AICc/AIC。当n<3·40=120时,它应用AICc,反之亦然。组合AICc/AIC选择规则的数值结果与独立AIC非常相似,在T=600和T=900时甚至稍差。当我们继续从30分钟到1小时的大样本时,theRMSE值有明显的变化。更准确地说,第二个指数变量(即α和β)的RMSE值下降得更快,这导致了第一个指数项,其中α和β对总体估计误差的贡献更大。在T=3600的所有IC中,校正模型选择率显著提高,范围超过90%。最后,对于时间范围从3小时到6小时的大样本,分别代表半个交易日到整个交易日的数据。每个参数的相对RMSE小于20%,一致IC(BIC和HQ)的正确模型选择率接近100%。然而,AIC的成功率下降到约94%,高估概率为6%。五、 关于模型选择的性能,我们MC实验的结果可以总结如下。与回归模型的类似研究一致,我们可以观察到,当MLE应用于较小样本时,不一致的AIC优于其他两个IC。相比之下,一致的IC(BIC和HQ)对于足够大的样本表现优异,并且我们可以观察到,随着样本量的增加,它们的成功率单调提高。

20
可人4 在职认证  发表于 2022-5-31 04:48:23
尽管上文Remark1(iii)中提出了担忧,但数值结果表明,HQ不应被排除在良好执行IC之外。更令人关注的是,样本量和AIC模型选择成功率之间的非单调关系,而不是以往研究中常见的关系。这方面的未来研究可以是同样流行的幂律强度和进一步的模型选择方法,如聚焦信息准则和模型平均。基金会。Scalas和M.Trinh得到了苏塞克斯大学战略发展基金的支持。补充材料请联系Enrico Scalas或Mailan Trinh。强烈m计算Hawkes过程HawkeSthinning的强度函数。m模拟一个霍克斯过程,其最大时间范围为Hawkesthining2。m模拟Hawkes过程,最大样本大小为MPirag2。m根据模拟的aHawkes进程路径(称为hawkesThinning2.m)LogLikiter计算平均事件数。m评估给定参数和数据约束的Hawkes过程的对数似然函数。m参数约束传递给优化算法fminconfitting。m使用MatlabTM例程fmincon(调用LogLikiter.m和constraints.m)IC最大化对数似然函数以获得最大似然估计量。m计算AIC、BIC和HQ【1】H.Akaike的值。信息论和最大似然原理的推广。第二届信息论国际研讨会(Tsahkadsor,1971),第267-281页。阿卡德·埃米艾·基亚多,布达佩斯,1973年。[2] Emmanuel Bacry、Khalil Dayri和Jean-Fran,cois Muzy。对称hawkes过程的非参数核估计。高频财务数据的应用。《欧洲物理杂志B》,85(5):2012年1-12月。[3] Emmanuel Bacry、Iacopo Mastromatteo和Jean-Fran,cois Muzy。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 17:12