楼主: 何人来此
2720 37

[量化金融] 桥接AIC和BIC:一种新的自回归标准 [推广有奖]

21
能者818 在职认证  发表于 2022-5-8 21:54:43
(16) 另外,如果我们使用{L*N} 表示一个正整数序列,每个N达到最小CN(L),即L*N=arg min1≤L≤L(N)maxCN(L),那么对于任何可能依赖于{xn:N=1,…,N}的随机变量@L,对于任何>0,它都保持tlimN→∞公共关系k^ψL- Ψ∞kΓ/CN(L)*N)≥ 1.- = 1(Shibata 1980,定理3.2)。结果表明,估算的成本^ψ(^L)不低于CN(L)*N) 在概率上,对于任何顺序选择▄L。顺序选择▄L称为渐近有效iflimN→∞k^ψL-Ψ∞kΓCN(L)*N) 概率=1。(17) 等式(17)可以等价地写成limN→∞CN(L)/CN(L)*N) =1,在平等的可能性范围内(16)。以下结果建立了两种常见情况下BridgeCriteria的渐近有效性,即失配误差kψL- Ψ∞L中的kΓdecaysalgebraic或指数。正如我们在备注4中指出的,这两种情况涵盖了广泛的线性过程。补充材料中给出了它的证明。假设假设假设1-3成立。1.假设失配误差kψL-Ψ∞kΓsatis fieslogkψL- Ψ∞kΓ=-γlogl+logcl(18),其中γ≥ 1是常数,级数{cL:L=1,2,…}由正常数和cL+1/cL<1+γ/(L+1)下界。IfL(N)max=ON1+γ-ε(19) 对于固定常数0<ε<1/(1+γ),则b岭阶选择准则在符号上有效。2.假设不匹配误差满足等式logkψL-Ψ∞kΓ=-γL+log cL(20),其中γ>0是常数,序列{cL:L=1,2,…}由正常数和cL+1/cL下界≤ 对于某些常数q<exp(γ)。

22
kedemingshi 在职认证  发表于 2022-5-8 21:54:47
IfL(N)max≤1.-εγlogn(21)对于固定常数0<ε<1保持不变,则边阶检验准则是有效的。注4:为了提供条件(18)的直观性,根据R标记3,我们证明,如果自回归过程的顺序不是完整的,而是L(n)(随n增长),并且对于任何给定的n,如果ψL(n)均匀分布在SL(n)(1)中,则对于大L(1)≤L≤ L(N))ElogkψL- ψL(N)kΓL(N)= -对数L+对数L(N)+oL(1)。(22)补充材料l中给出了证明。此外,当数据是从有限顺序移动平均过程(Shibata 1980)生成时,已知条件(20)成立(常数系列cL)。然而,(13)中提出的桥梁标准在渐近效率方面并不完全令人满意。为了使BC t达到效率,我们的命题1要求L(N)max满足(19)或(21),这取决于潜在的失配误差。这有两个问题:第一,作为L函数的匹配误差通常是事先未知的,它可能比(18)和(20)中描述的更复杂;第二,选择的L(N)最大值不足以将所有可能的竞争模型合并到候选集中;这是因为L(N)max总是ε-away(按顺序)到所有正整数L上CN(L)的最小值∈ N.这促使我们以这样的方式扩展桥接标准:1)它放松了(18)和(20)所要求的条件;2)它从广泛的候选集合中选择最佳顺序;3)它在明确规定的情况下仍然达到一致性,或者在不明确规定的情况下仍然有效。4.3 L(N)最大值的自适应选择为了实现上述目标,我们提出了一个由两个步骤组成的总体策略。1.选择任意L(N)max=o(√N) 并申请AIC获得^Laic;2.在1,2。

23
何人来此 在职认证  发表于 2022-5-8 21:54:50
,^Laic,通过最小化修改后的BC penaltybc(N,L)=2MNNLXk=1k(23)来选择最佳顺序(用^Lbc表示),其中mn是一个要选择的数字。我们注意到MN=L(N)max是在前面的章节中选择的,但它可能不是我们两阶段方法中的理想选择,我们将在后面看到。我们定义(N)=arg minL∈NCN(L)。(24)成为“普遍最优秩序”。在大多数情况下,L(N)的上限是N1-ε对于固定的ε>0。例如,如果kψL- ψ∞kΓ遵循代数衰变cL-对于某些γ>0,则L(N)=ΘN1/(1+γ). 然而,L(N)>√N.在本节的其余部分中,我们考虑案例L(N)≤ L(N)maxin为了:1)考虑最具竞争力的模型,该模型不依赖于L(N)max的选择,如(24)所示,L(N)=arg min1≤L≤L(N)maxCN(L);2) 简化技术推导。但我们强调,这一要求并不重要。假设4在错误描述的情况下,它认为L(N)≤ L(N)max.此外,CN(L)有一个很好的分离模式,即如果limN→∞CN(LN)/CN(L(N))=1保留序列LN,然后limN→∞LN/L(L(N))=1。注5:AIC在不规范模型下的效率意味着→∞CN(^Laic)/CN(L(N))=1的概率,在假设4的情况下,进一步简化了Limn→∞^LaicL(N)=1的概率。(25)在许多常见情况下,假设4很容易满足。例如,我们考虑了两种常见的情况,这两种情况在建议1中也有描述:失配误差具有分析性衰减kψL- Ψ∞kΓ=cL-γ、 或者指数衰减kψL- Ψ∞kΓ=c exp(-γL)。我们让qN=LN/L(N)。通过简单的计算,limN→∞CN(LN)/CN(L(N))=1可以重写为limN→∞Q-在代数衰变的情况下,γN(1+γqγ+1N/(1+γ)=1,它可以重写为limN→∞经验{-γ(LN)-在指数衰减的情况下,L(N))}/(1+γL(N))+γLN/(1+γL(N))=1。

24
大多数88 在职认证  发表于 2022-5-8 21:54:54
在这两种情况下,limN→∞概率qN=1。以下定理确定了两阶段策略的一致性和有效性。定理3假设从两步策略y的第一步得到^Laicis,假设2成立。假设存在满足limn的序列MN(以N为索引)→∞MNlog log N=∞. (26)此外,假设在错误指定的模型类别下,假设1、3、4成立,并且对于所有足够大的NMN≤qL(N)log L(N),(27),其中0<q<1是一个常数,L(N)在(24)中定义。然后,使用上述两阶段策略,在(23)中修改的桥接标准在具体情况良好的情况下是一致的,在具体情况错误的情况下是有效的。此外,如果在明确规定的情况下,从不依赖于N且包含真实顺序L的有限候选集中选择^L,则^L几乎肯定会收敛到L。备注6我们注意到条件(26)和(27)相当弱。例如,L(N)分别是Θ(Nr)(0<r<1)和Θ(logn)。在命题1中描述的两种情况下,sowe可以选择MN=(logn)τ,其中任何0<τ<1。备注7我们在这里提供了一个直观的推理。在明确规定的情况下,(26)保证了定理2的一致性。在错误指定的场景中,(25)和(27)意味着MN<^Laic/log^Laic。这种惩罚增量为Jbc(L+1)-Jbc(L)比AIC轻,表示大L(回想一下,第二步中的候选集是1,…,^Laic)。鉴于此,不列颠哥伦比亚省生产的^L接近于^Laic的边界。备注8修改后的桥梁标准的另一种形式为asbc(N,L)=2MNNLXk=1k-ζ(28),其中ζ>0,ζ6=1。通过一个类似的例子,可以证明定理3可以修改为0<ζ<1的情况,需要进行以下更改:将L(N)/log L(N)替换为(27)中的(L(N))ζ,并要求q<1- ζ.

25
nandehutu2022 在职认证  发表于 2022-5-8 21:54:57
此外,定理3可以修改为ζ>1的情况,用(27)中的L(N)/a(ζ)替换L(N)/logl(N),其中a(ζ)=P∞k=1k-ζ. 作为一项可能的未来工作,比较ζ=1和ζ6=1的性能将是有趣的。备注9基于所提出的桥梁标准,我们定义了以下参数指数(PI):piN=|^Lbc-^Laic||Lbc-^Laic |+|Lbc-^Lbic |如果^Laic6=^Lbic1否则。(29)在定义之后,piN∈ [0, 1]. 从直觉上看,Pin接近于一个特定模型类别中的Pin,其中^Lbc,^Lbic差别不大,而在一个不特定模型类别中,Pin接近于零,其中^Lbc,^Laicare接近且比^Lbic大得多。PI的目标是衡量特定模型类在解释观测数据方面的充分程度,即评估所选模型可以实际视为数据生成模型的可信度。大头针越大,信心越强。在(Liu&Ya ng 2011)中也引入了类似的概念,用于估计回归函数。以下命题表明,对于具体情况,Pinconverge的概率为1。虽然我们不能证明一般情况下,对于各种错误指定的情况,Pinconverge的概率为零,但为了便于说明,我们对一些典型的错误指定情况进行了证明。第5节中对各种合成数据的实验表明,Pin的性能与我们预期的一样。命题2在与定理3相同的条件下,如果模型类是明确的,当N趋于完整时,Pinconverge的概率为1;如果模型类是mis-s指定的,我们进一步假设CN(L)+(logn- 2) Lσ/N在L(N)处达到最小值*安德林→∞L(N)*/L(N)=0,则当N进入单位时,Pinconverge的概率为零。例如,失配误差满足kψL-Ψ∞kΓ=cL-γ、 其中γ和dc是正常数。5.

26
mingdashike22 在职认证  发表于 2022-5-8 21:55:01
数值结果在这一节中,我们给出了实验结果,以证明理论结果和桥接准则在合成和真实数据集上的优势。通过实验,我们使用(23)中定义的两步电桥准则,并采用L(N)max=N1/3, 根据定理3和备注6,MN=(对数N)0.9(30),其中N是样本量。5.1合成数据实验:全维模型的一致性本实验的目的是展示BC和BIC的一致性。表2总结了BC、AIC和BIC在特定模型类别的订单选择方面的表现。在表2中,使用自回归滤波器ψ=[α,α]Tforα=0.3模拟数据,-0.3, 0.8, -0.8. 对于每个α,将AR(2)过程xn+αxn的1000个独立化的估计阶数制成表格-1+αxn-2=n,n~ N(0,1)。对于不同的样本量N=100、50、0、1000、10000,重复实验。正如预期的那样,桥接标准的性能介于AIC和BIC之间,并且在不一致的情况下是一致的。

27
nandehutu2022 在职认证  发表于 2022-5-8 21:55:04
此外,α=0.3的收敛性,-与α=0.8相比,0.3稍慢,-0.8,因为它们的信噪比较小。N=100 N=500 N=1000 N=10000α^LBC AIC BIC BC AIC BIC BC AIC BIC BC AIC BIC BIC0。31 784 5 48 851 558 213 661 298 51 405 0 0 02 151 2 92 135 372 558 333 619 677 589 949 720 9993 36 98 13 37 113 5 38 125 5 21 97 1> 329 62 1 33 116 1 45 147 1 30 1 83 0-0.3777 5 66 845 535 208 628 297 45 375 0 0 02 166 3 01 145 392 536 365 624 688 617 958 719 9973 28 64 8 32 110 6 32 112 7 22 122 3> 329 69 2 41 146 1 47 155 1 20 1 59 00.80 0 0 0 0 0 0 0 0 0 0 02 823 7 49 957 891 734 988 906 715 992 944 726 9983 102 1 48 36 44 125 11 41 118 8 24 102 2> 3 75 103 7 65 141 1 53 167 0 32 172 0-0.80 0 0 0 0 0 0 0 0 0 0 2 860 7 83 968 876 738 980 878 709 994 949 703 99982 127 29 54 112 18 55 133 5 23 1 15 1>3 58 90 3 70 150 2 67 158 1 28 1 82 0表2:AR(2)过程的选择顺序(每个α和N的1000个实现)5.2合成数据实验:在完整维度模型中的效率本实验的目的是表明建议的顺序选择标准实现了良好规格和错误规格情况下的渐近效率。表3比较了BC与AIC和BIC在失配误差方面的性能。回想一下,(15)中定义的失配误差是指当一个估计的滤波器应用于一个独立且独立生成的数据集时,预期的一步预测误差减去噪声的变化。

28
可人4 在职认证  发表于 2022-5-8 21:55:07
下面我们考虑三种不同的数据生成过程。在表3中,对于每种情况和样本量N=100、500、1000、10000,每个标准产生的表列失配误差是1000次重复独立实验的平均值。还计算了每种情况下备注9中定义的平均参数指数(用piN表示)。案例1:第一个案例是AR(1),ψ=[0.9],na mely xn+0.9xn-1=n,n~ N(0,1)。这是一个规格齐全的模型。正如我们所看到的,一旦选择了顺序,pro babilityclose为1,所得到的预测性能也是渐近最优的。在这里,我们简要地解释了如何计算(15)中任何大小为L的估计滤波器的精确失配误差,t可能等于或不等于L。如果有能力表示协方差矩阵ΓL′或其元素γ,γL′-根据已知的ψL,其中L′=max{L,L}。我们通过ρL=[γ/γ,…,γL/γ]T,PL=ΓL/γ来定义相关向量和矩阵。通过编写Yule-Walker方程PLψL=-ρL,我们得到(I+ΦL)ρL=-ψLΦL=ψL,2ψL,3··ψL,L-1ψL,LψL,3ψL,4··ψL,L0 0。。。。。。。。。。。。。。。。。。ψL,L0··0··0··0+0 0··0 0ψL,10··0 0。。。。。。。。。。。。。。。。。。ψL,L-2ψL,L-3··ψL,10 0ψL,L-1ψL,L-2··ψL,2ψL,1.因此我们得到ρL=-(I+ΦL)-1ψL,γ=σ/(1+ρTLψL),和γl= γρL,l(l =1.五十) 。每个人都有一个叫富特·赫莫尔的地方l > 五十、 γl等于-PLk=1ψL,kγl-k、 案例2:第二个案例是AR(L(N)),其中L(N)=不。4. ψL(N)=[0.7k]L(N)k=1,即xn+ψL(N),1xn-1+·ψL(N),L(N)xn-L(N)=N,N~ N(0,1)。在这种情况下,就样本量而言,真实顺序较大,因此可以将其视为有限维模型(见备注3)。请注意,每个特征多项式的所有根的模均为0.7。

29
大多数88 在职认证  发表于 2022-5-8 21:55:11
对于每个样本量N=100、500、1000、1000,生成自动退化的trueorder分别为6、12、15、39。案例3:第三个案例是第一个或第二个移动平均过程xn=n-0.8n-1,n~N(0,1)。这是一个有序的自回归。估算的滤波器∧L的精确失配误差可通过以下方式计算:k∧L- Ψ∞kΓ∞= Exn+1+[xn,…,xn-L+1]λL-σ=1.64(1+k∧Lk)-2·0.8(λL,1+PL)-1k=1∧L,k∧L,k+1)-1,其中我们使用了E(xn)=1.64,E(xnxn)-1) = -0.8和E(xnxn-k) =0表示k>1。综上所述,表2和表3显示,BC实现了我们预期的性能:当模型类被很好地指定时,它是一致的,并且在很好地指定和错误指定的情况下,它的预测性能总是接近AIC和BIC的最佳值。

30
可人4 在职认证  发表于 2022-5-8 21:55:16
在实践中,当没有关于模型规格的先验知识时,建议的方法比AIC和BIC在选择最合适尺寸方面更灵活可靠。CaseN=100 N=500BC AIC BIC piNBC AIC BIC piN19。(1.28)(1.01)(0.24)(0.24)(0.24)(0.24)(0.33)(0.014)0.24)(0.18)(0.18)(0.18)(0.26)(0.26)(0.13)(0.13)(0.13)(0.13)(0.13)(0.50)(0.50)7(76)76.7(7)(0.18)(0.18)(0.26)(0)(0.13)(0)(0.13)(0(0)(0(0)(0(0.50)(0)(0 0 0)))))))及(0 0))7)7(76)76)76)76)76.7.7(7(7)76.7(7)76.7(7)(7)(7)(0.7)(7)(0.18)(0.18)(0.18)(0.18)(0.18)(0.18)(0.18)(0.18)(0.18)(0.18)(0.18)(0 AIC BIC piN1。3.3.3.3.3.3.3 3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3 0.3 0.3 0.3 0.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3.3 0 0 0.3.3.3.3 0 0 0 0 0 0 0 0.3.3.3.3.3.3.3.3.3.3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0由BC、AIC和BIC选择的ut或回归模型(及其标准误差),5.3真实数据实验:1935年至2015年的厄尔尼诺数据作为最大的气候模式,厄尔尼诺是海洋气候影响的最主要因素。NINO3指数定义了从oS-5oN和150oW-90oW、 计算范围为1935年1月至2015年5月2日(雷纳、帕克、霍顿、福兰、亚历山大、罗威尔、肯特和卡普兰,2003年)。图4(a)显示了总得分为965分的月度数据。数据似乎高度依赖于图4(b)所示的样本偏自相关。为了评估BC、AIC和BIC的预测能力,理想情况下,我们会像同步数据实验中所做的那样,对独立且相同生成的数据集应用每个模拟过滤器。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 18:21