楼主: mingdashike22
1581 58

[量化金融] ABC中的模型规格错误:后果和诊断 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-6-1 05:21:12
(2018)和Li和Fearnhead(20 18a,b)研究>0,但允许随n变化,并设置=n。在最近的论文中,作者证明了ABC获得的关于给定θ的信息量取决于:(1)观察到的(分别模拟)总结收敛到明确极限对应物b(分别为b(θ));(2) 公差变为零的速率;(3) 带b(θ)之间的联系。何时∈ P、 存在一些θ,使得b(θ)=带Fr azier等人(2018)的结果完全描述了ABC后验分布的渐近行为。此外,即使P/∈ P、 只要存在θ∈ Θ使得b=b(θ)。因此,ABC中模型错误定义的有意义的概念是不存在任何θ∈ Θ满足b=b(θ),这正是Marin et al.(2014)定义的模型不相容性。在剩下的时间里,我们说,如果*= infθ∈Θd(b,b(θ))>0(1),注意,当kθ<kη时,这种情况更可能发生。启发性地说,ABC中的误判意味着,在η(z)到b(θ)和η(y)到b的浓度下,通过三角不等式a和定义*d(η(y),η(z))≥ d(b,b(θ))- oPθ(1)- oP(1)≥ *- op(1),对于所有的n=o(1),事件{θ∈ Θ:d(η(y),η(z))≤ n}变得极为罕见,对应于事件{θ∈ Θ:d(η(z),b(θ))>*- o(1)}。因此,对于公差序列n=o(1),一次n<*+ o(1)无论我们从π(θ)生成多少模拟样本,几乎不会选择θ的任何绘图,并且随着n的增加,ABCposterior∏[A |η(y)]将变得不正常。虽然公差序列n=o(1)最终会导致后∏[A |η(y)]表现不良,但其他选择可能会产生表现良好的后∏。

12
nandehutu2022 在职认证  发表于 2022-6-1 05:21:15
在下一节中,我们展示了满足n的(某些)容差序列→ *, 作为n→ +∞,产生表现良好的ABC后验概率,将后验质量集中在适当定义的伪真值上。2.2错误分类下的ABC后验浓度基于上一节的直觉,在本节和下一节中,我们严格描述了∏[A |η(y)]=ZAPθ[d(η(y),η(z))的渐近行为≤ n]d∏(θ)ZΘPθ[d(η(y),η(Z))≤ n]d∏(θ)当P/∈ P和*> 为此,我们首先定义以下附加符号:对于序列{an}和{bn},实值,an。BN表示≤ CBC对于某些C>0,an bn表示等效震级,an>>bn表示更大的数量级,符号oP(an)、oP(bn)具有其通常的含义。

13
何人来此 在职认证  发表于 2022-6-1 05:21:18
除非另有说明,否则所有限值均取n→ +∞.我们维持以下假设。[A0]存在一个唯一的b,即d(η(y),b)=oP(1)和一个正序v0,n→ +∞这样的信息→+∞Pd(η(y),b)≥ v-10,n= 存在一个连续的内射映射b:→ B Rkη和满足ρn(u)的函数ρn(·)→ 0作为n→ +∞ 对于所有u>0,且ρn(u)在u中单调不增加(对于任何给定的n),例如,对于所有θ∈ Θ,Pθ[d(η(z),b(θ))>u]≤ c(θ)ρn(u),ZΘc(θ)d∏(θ)<+∞,其中z~ Pθ,我们假设以下任一情况:(i)序列发展:存在一个正序列vn→ +∞ u,κ>0,使得ρn(u)=v-κnu-κ、 对于u≤ u、 (ii)指数偏差:存在hθ(·)>0,使得Pθ[d(η(z),b(θ))>u]≤ c(θ)e-hθ(uvn),存在m,C>0,使得zΘC(θ)e-hθ(uvn)d∏(θ)≤ Ce公司-m·(uvn)τ,对于u≤ u、 存在一些D>0和M,δ>0,因此,对于所有δ≥ δ>0和M≥ M、 存在Sδ {θ ∈ Θ:d(b(θ),b)- *≤ δ} 其中(i)在[A1]的(i)情况下,D<κandRSδ1.-c(θ)Md∏(θ)&δd.(ii)在[A1]的情况下,RSδ1.- c(θ)e-hθ(M)d∏(θ)和δd。上述假设与Frazier et al.(2018)中给出的假设相似,我们请读者参考该文件中的备注1和2以及示例1,以详细讨论这些假设。在上述假设下,我们得出以下结果。定理1。假设y满足度[A0]的数据生成过程和方程式(1)所适用的数量。还假设满足条件[A1]和条件[A2]↓ *带n≥ *+ 中压-1n+v-10,n,对于足够大的M。

14
大多数88 在职认证  发表于 2022-6-1 05:21:21
设mn为任意正序,取in fi和δn≥ Mn(n-*), 然后∏[d(b(θ),b)≥ *+ δn |η(y)]=oP(1),(2)只要δn≥ Mnv公司-1nu-D/κn=o(1),在(i)假设[A1]δn的情况下≥ Mnv公司-1n | log(un)| 1/τ=o(1),如果(ii)是假设[A1]。un=n时-(*+ 中压-1n+v-10,n)≥ 我们提醒读者,所有理论结果的证明都包含在附录中。备注1。定理1指出,即使模型规格错误,ABC po steriorConcentrate仍然集中在参数infθ上∈Θd(b(θ),b),假设略大于*. 在Orem 2的更精确框架下,研究后验分布的渐近形状,可以将该条件重新定义为允许略小于*. 然而,我们证明如果*-在正常数下有界,则后验分布不一定是集中度e。使用定理1中的后验集中度,我们得到以下结果。推论1。假设满足定理1的假设并定义θ*∈ Θasθ*= arg infθ∈Θd(b,b(θ)),然后,对于任何δ>0,则∏[d(θ,θ*) > δ|η(y)]=oP(1)。备注2。定理1和推论1证明,在识别条件下,ABC后∏∏[·|η(y)]集中在θ上*因此,Theorem1是Frazier et al.(2018)中定理1对错误模型的扩展。此外,我们注意到上面的定理1类似于定理4。3 Bernton等人(2019年)基于Wasserstein距离的forABC推断。每个结果的有效性都要求mapθ7→ b(θ)是内射的。如果不满足该条件,则可能存在一个连续的值,在该值下d(b(θ),b)=*. 在这种情况下,ABC后验将不再收敛于点质量,而是集中于集合{θ∈ Θ : *= d(b(θ),b)}。备注3。

15
大多数88 在职认证  发表于 2022-6-1 05:21:24
重要的是要注意伪真值θ*取决于d(·,·)的选择。这意味着基于两个不同度量d(·,·)和▄d(·,·)的ABC将产生两个不同的伪真值,除非通过偶然事件影响{θ∈ Θ:d(b(θ),b)}和inf{θ∈ Θ:~d(b(θ),b)}重合。这与Frazier et al.(20 18)中的后验浓度结果形成鲜明对比,后者表明,在正确的模型规格下,后验∏[·|η(y)]浓度在相同的真值上,无论选择d(·,·)。2.3渐近后验分布的形状在本节中,我们分析了模型误判下ABC后验分布的渐近形状。为简单起见,我们将模拟和观察总结收敛到极限对应项的速率取为相同,即取v0,n=vn,并将其视为距离(η(z),η(y))=kη(z)-η(y)k,其中k·k表示与给定标量乘积h·,·i相关的范数。用Ikη表示(kη×kη)维单位矩阵,并设Φ(B)=PrN(0,Ikη)∈ B,对于Rkη的任何可测子集B。需要以下条件来确定本节的结果。[A0′]假设[A0]满足,且*= d(b(θ*), b) >0,其中θ*= arg infθ∈Θd(b(θ),b)。[A1′]假设[A1]成立,对于某些正定义矩阵∑n(θ*), c> 0,κ>1,δ>0,对于所有kθ- θ*k≤ δ、 Pθ[k∑n(θ*){η(z)- b(θ)}k>u]≤ 铜-k表示所有0<u≤ δvn。【A3】地图θ7→ b(θ)在θ处连续可微两次*还有雅可比θb(θ*)具有全列秩kθ。

16
何人来此 在职认证  发表于 2022-6-1 05:21:26
kb的Hessian(θ)- bk在θ处评估*, 并用H表示*, 是正定矩阵。【A4】存在一系列(kη×kη)正定义矩阵∑n(θ),因此对于所有M>0的矩阵,存在u>0,其上为| x|≤Msupkθ-θ*k≤u | Pθ(hZn,ei≤ x)- Φ(x)|=o(1),其中Zn=∑n(θ)(η(z)- b(θ))和e=(b(θ*) - b) /千字节(θ*) - bk.【A5】存在Vn趋于完整且u>0,因此对于所有kθ- θ*k≤ u、 函数θ7的序列→ ∑n(θ)v-1N收敛于某个正定义矩阵A(θ),并在θ处等连续*.【A6】π(θ),先验测度∏(θ)的密度,在θ处连续且为正*.允许v0、nand和vnto差异不会极大地改变以下结果。给出的结果仍然有效,但仅适用于两种速率中较慢的速率。[A7]对于Zn=∑n(θ*){η(y)- b} 所有MN都将进入单元kZnk>Mn= o(1)。上述假设与Fr azier等人(2018年)在正确模型规格下推导ABC订单限制形状时使用的假设相似,我们将感兴趣的读者参考论文中的备注3和备注4,以详细讨论这些假设。在a boveassumptions下,我们得到以下结果。定理2。假设[A0′,[A1′](带κ)≥ kθ、[A2]和[A3]-[A7]是令人满意的。我们得到了以下结果。(i) 如果limnvn(n-*) = 2c,带c∈ R、 然后,对于k·kT V,总变化标准k∏v1/2n,-QckT V=oP(1),其中∏zn,是zn(θ)的ABC后验分布- θ*) 对于任何序列zn>0且Qchas密度qc相对于Rkθ上的Lebesgue测量与qc(x)成比例∝ Φc-hZn,A(θ*)ei*kA(θ*)ek*-x个H*x4kA(θ*)ek*(ii)如果limnvn(n- *) = +∞ un=n时- *= o(1),对于U{kxk≤M} 集合{kxk上的一致测度≤ M} ,k∏u-1n,-U{xH*x个≤2} kT V=oP(1),备注4。

17
kedemingshi 在职认证  发表于 2022-6-1 05:21:29
在模型规格正确的情况下,如果太大,这意味着(n- *) >> 1/vn,则ABC-po-sterioris的渐近分布是均匀的,半径为n阶- *. 与正确型号规格的情况相反,如果*> 0和if vn{n- *} → 2c∈ R、 那么极限分布就不再是erGaussian分布了。此外,即使c=0,该结果仍保持不变。备注5。在基于似然的贝叶斯推理中,如果模型被误判,可信集通常不是有效的密度集,但是,得到的后验值仍然是渐近正态的(参见Kleijn和van der Vaart,2012和Muller,2013)。在ABC的情况下,不仅可信集不是有效的置信集,而且ABC后验的渐近形状也不是aussian的。备注6。在实践中*未知,因此无法直接选择。然而,我们注意到,ABC的应用通常是通过在一些预先规定的(且逐渐缩小的)分位数阈值内接受θ的绘制来实现的;i、 e.一个接受模拟图θiif d(η(zi),η(y))小于模拟值d(η(zj),η(y)),j的α-次经验分位数≤ N、 然而,正如Frazier et a l.,2018年所讨论的,ABC方法的两个代表是双重的,即选择δv阶上的α值-kθn,δ小,对应于选择|n- *| . δ1/kηvn和选择αn和Mv-kθn与选择n相关- *& Mvn。我们进一步阐述了第4.1节中两种方法之间的等效性。有趣的是,定理2(附录中提供)的证明证明了如果vn(n-*) → -∞, 尤其是当n=o(1)和*> 0,无需出现∏[·|η(y)]的后验浓度。

18
大多数88 在职认证  发表于 2022-6-1 05:21:32
我们在下面的简单示例中演示了这种现象。示例2:考虑kθ=1和kη=2的情况。让▄Zy=√n(η(y)- b) 和锌=√n(η(z)-b(θ)),其中▄Zn~ N(0,vθI),对于vθ,θ的一些已知函数,b(θ)=(θ,θ).此外,假设b=((R)b,-“”b),其中“”b6=0。在此设置下,当k·k是欧氏范数时,唯一的伪真值为θ*= 然而,根据vθ,近似后验值不必集中在θ上*= 0、以下命题对此进行了总结。提案1。在上面的设置描述中,如果vθ/vθ*= σ(θ),f或vθ*一些已知函数,例如σ是连续的和σ((R)b/2)≥ 3,如果先验密度为正且连续[-\'b,\'b],然后∏{|θ- θ*| ≤ δ|η(y)}=oΠ|θ-\'b/2 |≤ δ|η(y)= o(1)。3不规范情况下的局部回归调整3.1后验集中局部回归对ABC的调整发现了对从业者的广泛适用性。然而,当人们愿意接受模型错误定义的想法时,我们警告不要盲目应用局部回归调整。如介绍性示例所示,使用这种特殊的调整可能会导致点估计量的行为与从m算法1获得的结果非常不同,即使在小样本中也是如此。在本节中,我们首先严格描述了模型误判下局部线性回归调整ABC(ABC Reg)的后验浓度。利用这个初始结果,我们将结论推广到局部非线性回归调整方法。为了简单起见,我们只考虑标量θ的情况,然而,我们允许η(y)是多维的。ABC Reg首先使用公差n运行算法1,以获得一组可接受的绘图和摘要{θi,η(zi)},然后使用线性回归模型调整θ的可接受值。

19
能者818 在职认证  发表于 2022-6-1 05:21:35
这样,通过线性回归模型θi=u+β,原始接受值θi与η(y)和η(z)部分相关{η(y)- η(zi)}+νi,其中νide表示模型残差。定义θ=PNi=1θi/N和η=PNi=1η(zi)/N。给定θi,ABC Reg然后根据θi=θi生成调整后的参数图-^β{η(zi)- η(y)},β=“NNXi=1η(zi)- ηη(zi)- η#-1“NNXi=1η(zi)- ηθi-θ#=dVar-1(η(zi))dCov(η(zi),θi)这个结果可以以更复杂的参数为代价进行扩展,但我们避免使用这种设置,以简化对结果的解释。因此,对于θi~ πθ的后验测度∏θ只不过是∏θ[·|η(y)]的缩放和移位版本。因此,ABC Reg后验值的渐近行为由∏[·|η(y)]、β和{η(y)的行为决定- η(zi)}。下面的结果描述了ABC Reg后验概率∏[·|η(y)]的渐近行为。推论2。假设[A0′、[A1]和[A2]满足且↓ *带n≥ *+ 中压-1n+v-10,n,足够大。此外,假设对于kβk>0的so meβ,k^β- βk=oPθ(1)。定义¢θ*= θ*- β(b(θ*) - b) 。设mn为任意正序列,取in-finity和δn≥Mn(n-*), thene∏[|θ-~θ*| > δ|η(y)]=oP(1),只要δn≥ 中压-1nu-D/κn=o(1),当(i)为消耗δn时≥ 中压-1n | log(un)| 1/τ=o(1),假设(ii)【A1】。un=n时-(*+ 中压-1n+v-10,n)≥ 0、备注7。推论1和推论2的直接结果是,ABC后∏∏[·|η(y)]的质量集中在θ上*= arg infθ∈Θd(b(θ),b),而ABC Reg posteriore∏[·|η(y)]将质量集中在θ上*= θ*- β(b(θ*) -b) 。因此,ABC Reg采用θ的绘图,该绘图在最小化观测和模拟摘要之间的所选距离d(·,·)方面(渐近)最优,并以(线性)方式对其进行扰动,无需保持原始绘图的最优性。

20
大多数88 在职认证  发表于 2022-6-1 05:21:38
此外,forkβk大,伪真值|θ*, ABC Reg集中在其上,可以很容易地躺在Θ之外。因此,如果模型规格错误,则无法保证ABC Reg返回的图纸在最小化d(·,·)方面是最优的,甚至无法保证ABC Reg返回的值为。备注8。重要的是,推论2的结果和备注7中讨论的现象不限于局部线性回归调整,而是扩展到回归调整的非线性变化。为简洁起见,我们在此仅勾勒出总体思路,并注意到严格的证明遵循与推论2相同的路线,因此省略。对于一些未知函数m(·),考虑非线性回归模型θ=m(η(z))+v。用^m(·)表示未知回归函数的非参数估计量,该函数是使用公认的图{θ}构造的l, η(zl)}l≤从附录endix中获得,我们在g和k分布的c定义中给出了这一后期行为的具体示例。ABC后∏[·|η(y)]。一种非线性回归后处理方法转换接受的θl进入¢θl= θl+^m(η(y))- ^m(η(zl)), 对于l = 1.五十、 (3)在正则条件[A0′、[A1]和[A2]下,如果(非参数)估计量^m(·)收敛到函数m*(·),^m(η)=m*(η) +op(1),在bandb(θ)的邻域内一致*), 然后通过η(y)和η(z)的浓度l), 方程式(3)变为|θl= θl+ {m*(b)- m级*(b(θ*))}+ op(1)=θ*+ {m*(b)- m级*(b(θ*))}+ op(1)。最后一个等式是∏[·|η(y)]向θ的后向浓度*, i、 e.,θl=θ*+ op(1)。因此,只要m*(b)- m级*(b(θ*)) 6=0无非线性回归后处理ABC后集中在一个不同于∏[·|η(y)]的值上,这不影响校正。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-24 05:16