楼主: mingdashike22
1582 58

[量化金融] ABC中的模型规格错误:后果和诊断 [推广有奖]

21
nandehutu2022 在职认证  发表于 2022-6-1 05:21:41
此外,鉴于^m(·)是使用模拟数据构建的,没有理由怀疑m*(b) =米*(b(θ*)). 最后,我们注意到,如果我们考虑了一个非线性条件异方差回归模型,如Blum和Fran,cois(2010),则上述计算不会发生显著变化。因此,非线性条件异方差回归调整将具有与非线性回归调整类似的渐近行为。备注9。推论1和2的另一个结果是,ABC后验∏[·|η(y)]和ABC Reg后验∏[·|η(y)]将产生不同的后验期望。根据∏[·|η(y)]和∏[·|η(y)]计算的期望值之间的差异解释了图6中观察到的ABC-AR和ABC Reg后验均值之间的差异。在下一节中,我们使用此行为推导出一个检测模型错误的过程。3.2调整局部回归调整模型规格错误情况下接受/拒绝ABC和ABC Reg之间的差异与回归调整有关,即重新调整接受图纸的中心θiby^β{η(y)- η(z)}。在正确的模型规格下很有用,当模型规格错误时,调整可以迫使θ偏离θ*并朝向|θ*, 它不需要位于Θ或在最小化D(·,·)方面是最优的。这种行为的原因是η(z)无法复制η(y)的渐近行为,这在Marin et al.(2014)的术语中意味着模型与观察到的总结不兼容。

22
可人4 在职认证  发表于 2022-6-1 05:21:43
汇总统计数据的这种不相容性确保了集中术语^β的影响{η(y)- η(z)}可以很容易地支配已被接受的绘图θi,而介绍性示例只是这种行为的一个示例。为了保持局部线性回归调整在ABC中的广泛适用性,并确保其在模型误判情况下给出合理的结果,我们建议对回归调整方法进行有用的修改。为了激发这种修改,回顾一下,在正确的模型规格和规则性条件下,一阶线性回归调整方法确保(见Frazier et al.,2018中的定理4):~θi=θi+β{η(y)- η(z)}=θi+^β{b- b(θi)}+Op(1/vn)=θi-θb(θ*)五、-1.θb(θ*)-1.θb(θ*)五、-1.θb(°θ)(θi- θ*) + Op(1/vn),(4),其中b=b(θ*) 根据正确的模型规格,’θ是满足‘’θ的中间值- θ*| ≤|θi- θ*|, V=limnVar[√n{η(y)- b} ,第三行来自均值展开和局部线性回归调整的定义。因此,从(4)可以看出,即使kη>kθ,η(y)的维数也不会影响ABC正则后验均值的渐近方差。这一结果(至少在第t部分)有助于解释(从技术角度)ABC Reg方法作为降维方法的普遍性。然而,在模型规格错误的情况下,对于任何θ,b6=b(θ)∈ 因此不存在中间值θ- b(θi)6=θb(°θ)(θ*-θi)。因此,如果模型不准确,等式(4)通常无效。ABC Reg在正确和不正确模型规范下的行为表明,用替代项替换η(y)可以缓解后者下的不良行为。为此,确定^θ=Rθd∏[θ|η(y)]为接受/拒绝ABC的后验平均值。

23
nandehutu2022 在职认证  发表于 2022-6-1 05:21:46
设^zm,m=1。。。,M、 是在假定DGP下模拟的一组长度n的伪数据,值为^θ,定义^η=MXm=1η(^zm)/M。使用^η,我们可以执行修改后的局部线性回归调整θi=θi+^β{^η -η(zi)}。这种改进方法的关键在于,在正确规格下,η的行为类似于η(y),而在错误规格下,η的行为类似于η(z)。这种构造的一个直接后果是,这种方法避免了模型错误指定下产生的不兼容性问题。此外,由于这种新的回归调整方法使用了从接受/拒绝ABC后验平均值^θ计算的中心序列,因此这种新方法的渐近行为类似于接受/拒绝ABC。示例1(续):回想假设的DGP为z,zniid为N(θ,1),但实际DGP为y,yniid为N(θ,σ)。ABC使用以下汇总统计数据进行:o样本平均值η(y)=nPni=1yi,o样本方差η(y)=n-1Pni=1(yi-η(y))。虽然M的选择不会渐近重要,但我们认为应选择M,以使^η相对于η(z)的变化率较小。我们考虑三种不同的DGP,对应于σ∈ {1 , 2, 3}. 对于每种情况,我们为长度为n=100的y生成1000个ar官方样本,并应用四种不同的ABC方法:接受/拒绝ABC方法(ABC-ar)、博蒙特等人(2002)的局部线性回归调整(ABC Reg)、我们新的局部线性回归调整(ABC Reg),以及Blum和Fran,cois(2010)使用神经网络(ABC-NN)进行的非线性回归调整。每个过程依赖于根据zji生成的N=25000个伪数据集~ N(θj,1),其中优先级由θ给出~ N(0,25)。

24
能者818 在职认证  发表于 2022-6-1 05:21:49
对于每个程序,我们将公差设置为模拟距离kη(y)的1%分位数- η(zi)k。图2绘制了蒙特卡罗重复和所有设计中每种方法的后验平均值。结果表明,新的回归调整在正确和不正确的模型规范中都保持了稳定的性能,而从ABC Reg和ABC-NN获得的点估计值变化更大。更具体地说,对于σ∈ {1,2}我们看到,所有回归调整往往会给出类似的结果。然而,对于σ=3,很明显,与其他ABC方法相比,传统的线性和非线性调整方法在重复样本中产生的点估计具有更大的可变性。这种额外的可变性是ABC Reg和ABC-NN在可接受的绘图θi和η(y)之间实施回归关系这一事实的直接结果- η(z),当一个不一定存在时。正如我们在推论y 2中所看到的,强制使用这个额外的(错误的)模型来产生θi的新值,它不需要考虑θi和η(y)之间的实际关系-η(z),将(随机)使调整后的牵引物偏离其初始后质量中心θ*, 并且可以在重复采样环境中产生更具可变性的点估计量。AR RegN Reg NN0.8 0.9 1.0 1.1 1.2 1.3σ2=1AR RegN Reg NN0.6 0.8 1.0 1.2 1.4σ2=2AR RegN Reg NN0.0 0 0.5 1.0 1.5 2.0σ2=3图2:ABC-AR(AR)、标准局部线性回归调整(Reg)、新回归调整方法(RegN)和跨σ的局部非线性回归调整(NN)的后验平均值比较∈ {1, 2, 3}.

25
何人来此 在职认证  发表于 2022-6-1 05:21:52
回想一下,σ=1对应于正确的模型规格。除了后验平均数的结果外,我们在表1中记录了每种方法的后验标准差、相应95%可信集的长度以及不同设计的蒙特卡罗覆盖率。表1中给出的值表示蒙特卡罗复制中这些数量的平均值。结果表明,所有局部回归调整,ABC Reg、ABC RegN和ABC-NN,都比ABCAR(平均值)具有更小的空间变异性和更短的可信集。因此,当模型被误判时,这种行为会给研究人员带来错误的精度感,并导致所有局部回归调整程序(线性和非线性)的覆盖率(伪真值)很低。因此,尽管我们的新回归调整程序在正确和不正确的模型规格下都能提供稳定的性能,但它仍能解决理论2之后的备注中提到的覆盖率问题。此外,补充附录中进行的其他数值实验表明,如Blum和Fran,cois(2010)中所述,对局部回归调整使用所谓的异方差校正并不显著改变这些结果。更具体地说,由此产生的经异方差校正的局部回归调整方法产生的结果与未经异方差校正的结果非常相似。

26
大多数88 在职认证  发表于 2022-6-1 05:21:56
有关这些详细信息,请参阅附录中感兴趣的读者。从这个简单的例子中,我们可以得出结论,在模型误判下,线性和非线性的局部回归调整方法,无论有无异方差校正,都可能导致对从这些方法获得的结果点估计的严重过度信任,并可能导致伪真值的覆盖率较低。表1:在不同模型误判水平下,简单正态样本的蒙特卡罗覆盖率(Cov)、可信集长度(Len)和后验标准差(Std)。Cov是95%可信集包含θ=1的时间百分比。Len是蒙特卡罗试验中信用集合的平均长度。Std是蒙特卡罗试验的平均后验标准差。ABC-AR ABC RegNCov Len Std Cov Len Stdσ=1 0.9820 0.4666 0.1221 0.9380 0.3851 0.1001σ=2 0.9610 0.6147 0.1576 0.8020 0.3837 0.0998σ=3 0.9130 0.6164 0.1581 0.7070 0.3839 0.0997ABC-Reg ABC NNCov Len Std Cov Len Std Cov Len Stdσ=1 0.9410 0.3820 0.0997 0.9500 0.3853 0.1006σ=2 0.7170 0.3826 0.0998 0.7290 0.4440 0.1228σ=3 0.4600 0.3821 0.0997 0.4190 0.5043 0.14904检测Mi规范在本节中,我们提出了两种方法来检测ABC中的模型错误规范。第一种方法基于正确和不正确模型规范下的接受概率行为。第二种方法基于比较∏[·|η(y)](从算法1获得)和∏[·|η(y)](使用局部线性回归调整获得)下计算的后验期望。4.1从Frazier等人的结果中,用一种简单的图形方法来检测误判。

27
能者818 在职认证  发表于 2022-6-1 05:21:59
(2018),在规则和正确模型规范下,验收概率αn=Pr[d(η(y),η(z))≤ n]saties,对于n大和>> v-1n,αn=Pr[d(η(y),η(z))≤ n] kθn.这样,asn→ 0验收概率αn→ 0以kθn近似线性的方式表示。然而,α与θn之间的这种关系不适用于模型特殊的情况。特别是,如果*> 0,一次n<n*即使是大量模拟,验收概率αN也将很小或为零。在正确和不正确的模型规格下,α的行为意味着可以通过比较αN的行为和公差值的递减序列来诊断错误规格。特别是,如果我们采用等距公差的递减序列1,n<2,n<····<J,则nwe可以构造并绘制生成的序列{αJ,n}jt,以确定{αJ,n}jd是否以(近似)线性方式递减为J,n}。虽然αnis在实践中不可能获得,但同样的程序也可以应用于αnre,由估计量^αn=PNi=11l[d(η(y),η(z))≤n]/n.这样,可以使用ABC参考表轻松执行此类图形检查。唯一的区别是,不是考虑单个公差,而是考虑一系列公差{j,n}jand记录,对于每个j,αj,n=NXi=11l[d(η(y),η(z))≤j,n]/n。一旦获得^αj,nHa,就可以绘制它与kθj,n的关系图(以某种方式),并可以分析关系,以确定是否存在明显的线性偏差。为了准确理解如何实现这样的过程,我们返回simplenormal示例。示例1(续):假设D GP为z,zniid为N(θ,1),但实际DGPis y,yniid为N(θ,σ)。

28
何人来此 在职认证  发表于 2022-6-1 05:22:02
我们再次使用以下汇总统计数据考虑ABC:o样本平均值η(y)=nPni=1yi,o样本方差η(y)=n-1Pni=1(yi-η(y))。Ta kingσ∈ {1,1+1/9,…,1+8/9},我们根据Yi生成大小为n=100的观察样本~ N(1,σ),iid,其中,对于九个不同的模拟数据集,我们保持随机数固定,只改变σ。我们考虑N=25000个根据zji生成的模拟数据集~ N(θj,1),带θj~ N(0,25),对于d(·,·),我们取欧几里德范数。对于j,n值序列,我们考虑j=100个等距增量,其中j,n与模拟距离的10%分位数相对应,其中1,n取模拟距离的0.1%分位数。在图3中,我们绘制了九个不同级别的误判结果。每幅图都包含两条不同的曲线:虚线表示观察到的αj、nand、n之间的关系,而实线绘制了αj、nand、n之间的线性关系,可用于直观地诊断偏离线性的情况。0.00 0.02 0.04 0.06 0.08 0.1 00.0 0.3 0.6^αnn0.00 0.02 0.04 0.06 0.08 0.1 00.0 0 0.3 0.6^αnn0.00 0.02 0.04 0.06 0.08 0.1 00.0.3 0.6^αnn0.00 0.02 0.04 0.08 0.1 00.1 0.4 0.7^αnn0.00 0.02 0.04 0.06 0.08 0.1 00.2 0.6^αnn0.00 0.02 0.04 0.06 0.08 0.1 00.3 0.6 0.9^αnn0.00 0.02 0.04 0.06 0.08 0.1 00.4 0.7 1.0^αnn0.00 0.02 0.04 0.06 0.08 0.1 00.6 0.9 1.2αnn0.00 0.00 02年0.04 0.06 0.08 0.1 00.7 1.0 1.3^αn配置图3:公差值j,n递减序列的经验验收概率^αj,n(虚线)和理论验收概率(实线)的图形比较。我们记得,在本例中,校正规范在^α和n之间存在线性关系,因为我们只对一个参数进行推断。

29
何人来此 在职认证  发表于 2022-6-1 05:22:05
更一般而言,在模型规格不正确的情况下,我们预计^α与kθn之间存在线性关系。分析图3,我们发现σ的关系相当线性≤ 1 + 1/3. 然而,当σ>1+1/3时,接受概率αj,与αj,之间的关系会导致显著的非线性行为。因此,在本例中,诊断者会建议,一旦σ>1+1/3,模型就被指定,这可以通过αn、jandj、n之间的非线性关系来证明。显然,从这种图形方法中获得关于模型错误指定的广泛结论取决于基础模型的许多特征、θ的维数和错误指定的精确性质。然而,始终可以将观测数据的结果与根据ABC参考表获得的结果进行对比。也就是说,使用ABCreference表,我们可以很容易地将上述诊断应用于一个或几个“观察到的”Sea。通过σ的不同值,使用端点对(αJ,n,J,n)=(0.10,J,n)和(αJ,n,J,n)=(0.001,1,n)构建实线。参考表中的ries。然后,如果观察数据中(αj,n,j,n)之间的关系与参考表中观察到的关系不同,则表明该模型有误。4.2使用回归A调整检测模型错误推论1和2证明接受/拒绝ABC(ABC-AR)和局部线性回归调整ABC(ABC Reg),将后质量放置在参数空间的不同区域。因此,对于θ7→ h(θ)一个已知的光滑函数,在模型错误指定下,h(·)在ABC-AR和ABC Reg下的后验预测,^h=Zh(θ)d∏[θ|η(y)],^h=Zh(θ)de∏[θ|η(y)],将在概率上收敛,如n→ +∞ 和n↓ *, 以区分不同的值。

30
大多数88 在职认证  发表于 2022-6-1 05:22:08
然而,如果模型规格正确,则可以表明,只要n=o(1),则^h和▄h在一阶下不会发生变化/√n) (该结果遵循Frazier等人,2018年的fr om定理4,或inLi和Fearnhead,2018a的定理3.1)。因此,检测模型误判的一种有用方法是比较不同的后验期望,如在两个后验条件下计算的矩或分位数。更具体地说,如果模型的规格正确,如果我们使用基于分位数的算法1,αn=δn-kθ/2,对于δ>0,则√nk^h-hk=oP(1)。然而,如果*= infθ∈Θd(b,b(θ))>0,在正则条件下,我们可以推导出k^h-hk=OP(1)。因此,如果√nk^h-香港很大,这是一个有意义的证据,表明该模型可能存在误判。通过分析√nk^h-香港要求使用tn表示的截水阀规格,以便√nk^h-hk大于tn,我们得出结论,模型可能存在误判。虽然有几种方法可以选择截面积值tn,但我们提出了一种基于模拟的方法,该方法使用ABC参考表。也就是说,我们使用的事实是,对于θ的任何固定值,例如可以从先验或ABC ARposterior中得出,我们总是可以模拟假设模型中的“观测数据”,以确定√nk^h-香港应在正确规格下。更具体地说,对于给定的θ值,我们始终可以模拟“观测数据系列”,然后在该模拟观测数据上运行ABC-AR和ABC REG来计算√nk^h-香港,型号规格正确。为了操作化该方法,我们生成b=1,B这些模拟的“观测”数据集,都具有相同的θ值,对于这些数据集,我们计算√nk^hb-hbk。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-24 15:04