楼主: mingdashike22
1579 58

[量化金融] ABC中的模型规格错误:后果和诊断 [推广有奖]

31
mingdashike22 在职认证  发表于 2022-6-1 05:22:11
然后,可以将切割值tn定义为模拟距离的经验分位数{√nk^hb-hbk}Bb=1,所有b均根据正确的规格计算。例如,tn可以定义为{√nk^hb-hbk}Bb=1。然后,可将从该程序中获得的tn值与的相应值进行比较√nk^h-根据实际观测数据y获得hk,如果√nk^h-hk>tnwe得出结论,模型可能存在误判。我们在简单的运行示例中演示了这种诊断模型误判的方法。示例1(续):假设D GP为z,zniid为N(θ,1),但实际DGPis y,yniid为N(θ,σ)。我们再次考虑以下汇总统计数据:o样本平均数η(y)=nPni=1yi,o样本方差η(y)=n-1Pni=1(yi-η(y))。对于观测数据a序列y,我们从均值θ=1、方差σ的正态随机变量中模拟n=100个观测数据点,取σ={2,3}。对于ABC-AR和ABCReg,我们再次获取N=25000个根据zji生成的模拟数据集~ N(θj,1),带θj~ N(0,25)。对于d(·,·),我们采用欧几里德范数,再次将公差设为模拟距离的1%分位数。对于函数h(θ)的选择,我们考虑h(θ)=(θ,θ), 因此,^h和▄h代表根据ABC-AR和ABC Reg计算的第二和第三后验矩s:^h=Zθd∏[θ|η(y)],Zθd∏[θ|η(y)],小时=Zθd∏∏[θ∏η(y)],Zθd∏∏[θ∏η(y)].回想一下,在正确的规格下√nk^h-hk=oP(1)。因此,如果模型的规格正确,我们预计将实现√nk^h-香港相对较小。计算√nk^h-香港在正确规格下,我们首先模拟b=1,B“观测数据”系列,其中每个系列包含n=100个观测值,这些观测值由平均值θ=1和σ=1的异常随机变量生成iid。

32
大多数88 在职认证  发表于 2022-6-1 05:22:14
然后,使用这些序列作为观测数据,运行ABC-AR和ABC Reg并计算{√nk^hb-hbk}Bb=1。对于本实验,wetake B=100次重复。然后,将切割值Tn定义为95%的经验分位数。在获得tn后,我们现在分析这种方法检测误判的能力。对于两个不同的错误指定DGP,对应于σ∈ {2,3},我们模拟了100Monte-Carlo复制并计算√nk^h-每次复制中的hk。结果抽样分布√nk^h-图4给出了hk。为了进行比较,在图4的面板A中,我们还给出了√nk^h-根据正确规范(σ=1)计算的hk。结果表明,样本分布之间存在显著差异√nk^h-香港的规格不正确或不正确。使用所选的切割值tn,我们在σ=2时检测到91%的误检,在σ=3时检测到97%。考虑到这些结果以及图4中的结果,很明显,这种简单的诊断方法允许我们在本例中检测模型错误。重要的是要认识到√nk^h-图4中观察到的hk不是我们选择的规格h(θ)的函数,而是由模型误判下ABC-AR和ABC regposterior的差异驱动的。特别是,Coro llary 1和2的结果表明,对于几乎任何表现良好的函数θ7,都会观察到类似的行为→ h(θ)。选择θ来模拟发现tn所需的伪“观测数据”,对大样本中的cuto off值的大小几乎没有影响。

33
大多数88 在职认证  发表于 2022-6-1 05:22:17
因此,可以从ABC AR后验值中随机选择θ值,而不会显著改变此处给出的结果。σ2=1σ2=20 5 10 15 20 25面板Aσ2=2σ2=30 20 40 60 80 100 1 20面板B图4:蒙特卡罗抽样分布√nk^h-在σ的正常示例中为hk∈ {1,2,3},其中h=(θ,θ). 回想一下,σ=1对应于正确的规格。为了说明这一事实,我们使用替代函数h(θ)=θ重复上述示例。在本实验中,我们使用与上述示例完全相同的数据集,并执行相同的程序来确定切割值tn,但现在是在h(θ)=θ的情况下。在整个MonteCarlo复制中,当σ=2时,该方法检测到96%的错误指定,当σ=3时,检测到99%的错误指定。类似地,图5绘制了√nk^h-~hk,当h(θ)=θ时。虽然量表与图4中的量表不同,但结果在质量上是相同的:在√nk^h-香港在正确和不正确的规范下。我们重申,这一结果并不令人惊讶,因为根据我们的结果,我们知道ABC-AR和ARC Reg将后部质量集中在不同的值上,因此,任何有效平滑的函数h(θ)将集中在ABC-AR和ABC Reg下的不同值上。σ2=1σ2=20面板Aσ2=2σ2=30面板B图5:蒙特卡罗抽样分布√nk^h-在σ的正常示例中为hk∈ {1,2,3},其中h(θ)=θ。回想一下,σ=1对应于正确的规格。最后,我们注意到,选择用于构建TN的θ不会显著改变报告的结果。为了证明这一点,我们在两个额外的θ值处重新运行诊断程序,用于构建tn。

34
可人4 在职认证  发表于 2022-6-1 05:22:20
如果我们使用值θ=0来获得tn,在h(θ)=(θ,θ)的情况下, 该程序将导致我们在σ=2和σ=3的情况下得出100%有利于误检的结论,而使用函数h(θ)=θ,我们将在σ=2和σ=3的情况下得出97%有利于误检的结论。类似地,如果我们考虑值θ=2并构造tn,在h(θ)=(θ,θ)的情况下, 对于σ=2,我们会在83%的时间内得出错误定义的结论,对于σ=3,我们会在92%的时间内得出错误定义的结论,而对于h(θ)=θ,我们会在σ=2,我们会在95%的时间内得出错误定义的结论,对于σ=3.5,我们会在98%的时间内得出错误定义的结论,ABC技术似乎不太适合于不规范的环境,因为它们严重依赖于假设模型再现观测数据集特征的能力。此外,他们根据实际数据将接近度(或公差)缩放为百分位,从而提供相对接近度而非绝对接近度。本文证明了ABC在这些环境中确实存在性能低下的问题,ABC版本越复杂,性能就越差。这种模式并不令人惊讶,因为更复杂的方法试图从模拟数据中提取更多信息。更令人兴奋的是,更基本的CABC版本的收敛结果,前提是满足汇总统计的可识别性约束。公差序列a lso的作用似乎比特定情况下更重要,这与该公差存在最小非零限制这一事实无关。此外,我们还证明,通过局部回归对ABC输出进行后处理可能会导致错误模型的推断不佳,并且我们提出了一种对模型规格的正确性不太敏感的替代方法。

35
能者818 在职认证  发表于 2022-6-1 05:22:23
在这一阶段,尚不清楚其他后处理ABCapproaches,例如边际调整法(Nott et al.,2014)或再校准法(Rodrigues et al.,2018),是否会在模型误判下执行类似于局部回归后处理的操作,需要在这方面进行更多研究以获得结论性结果。除上述内容外,我们还证明,很自然地,不同ABC版本之间的差异可以被用来检测模型错误,尽管在区分蒙特卡罗可变性和真实差异方面存在固有的困难。本文和附录中的示例都说明了检测是可以实现的,因为ABC生成的参考表可用于自动校准ABC不同版本之间的预期差异。由于这种机器学习技术旨在学习数据生成机制(generativenetwork)和将实际数据从生成的数据中分离出来(判别网络),因此本文中未研究的误认未来研究的一个潜在方向是将其与生成的DVersial网络相连接(GAN,Goodfello et al.,2014)。虽然已经注意到ABC和GANs之间的接近性,但从统计角度来看,这一领域对误认属性知之甚少。关于其他版本的基于机器学习方法的ABC,例如在Papamakarios和Murray(2016)中,我们的直觉是,与基于局部非线性回归调整的ABC类似,对模型的大规模和非结构化依赖性校准也会在误判情况下产生较差的性能。与GAN战略不同,在现阶段,我们没有看到解决这一难题的可靠解决方案。参考Beaumont,M。

36
能者818 在职认证  发表于 2022-6-1 05:22:26
A、 ,Zhang,W.,和Balding,D.J.(2002)。群体遗传学中的近似贝叶斯计算。遗传学,162(4):2025-2035年。Bernt on,E.、Jacob,P.E.、Gerber,M.和Robert,C.P.(2019)。使用wasserstein距离进行近似贝叶斯计算。皇家统计学会杂志:S系列B(统计方法学)。Blum,M.和Fran,cois,O.(20-10)。近似贝叶斯计算的非线性回归模型。统计与计算,20(1):63–73。Blum,M.G.(2018)。ABC回归方法。近似贝叶斯计算手册,第71-85页。Csill\'ery,K.、Fran,cois,O.和Blum,M.G.(2012)。abc:近似贝叶斯计算(abc)的r包。生态学与进化方法,3(3):475–479。Drovandi,C.C.和Pettitt,A.N.(2011)。多变量分位数分布的无似然贝叶斯估计。计算统计与数据分析,55(9):2541–2556。Fearnhead,P.和Prangle,D。(2012). 构建近似贝叶斯计算的汇总统计:半自动近似贝叶斯计算。皇家统计学会杂志:B辑(统计方法),7 4(3):419–47 4。Frazier,D.T.、Martin,G.M.、Robert,C.P.和Rousseau,J.(2018)。近似贝叶斯计算的渐近性质。Biometrika,105(3):593–607。古德费勒,I.、普吉·阿巴迪,J.、米尔扎,M.、徐,B.、沃德·法利,D.、奥扎尔,S.、库尔维尔,A.和本吉奥,Y.(2014)。生成性对抗网络。《神经信息处理系统国际会议记录》(NIPS 2014),第2672-2680页。Kleijn,B.和van der Vaart,A.(20-12)。错误定义下的Bernstein von Mises定理。电子J、 统计员。,6:354–38 1.Li,W.和Fearnhead,P.(201 8a)。关于近似贝叶斯计算估计的渐近有效性。Biometrika,105(2):285–299。Li,W.和Fearnhead,P。

37
mingdashike22 在职认证  发表于 2022-6-1 05:22:29
(2018b)。回归调整近似贝叶斯计算的收敛性。Biometrika,105(2):301–318。Marin,J.-M.,Pillai,N.S.,Robert,C.P.,和Rousseau,J.(2014)。贝叶斯模型选择的相关统计数据。皇家统计学会杂志:B辑(统计方法),76(5):833–859。Marin,J.-M.,Pudlo,P.,Robert,C.P.,a and Ryder,R.J.(2012)。近似贝叶斯计算方法。《统计与计算》,22(6):1167–1180。Marjoram,P.、Molitor,J.、Plag nol,V.和Tavare,S.(2003)。马尔可夫链蒙特卡罗方法。《美国国家科学院院刊》,100(26):1532 4–15328。英国穆勒(2013)。错误指定模型中的贝叶斯推断风险,以及三明治协方差矩阵。《计量经济学》,81(5):1805–1849。Nott,D.J.、Fan,Y.、Marshall,L.和Sisson,S.A.(2014)。近似贝叶斯计算和贝叶斯线性分析:面向高维ABC。计算与图形统计杂志,23(1):65–86。Papamakarios,G.和Murray,I.(2016年)。基于贝叶斯条件密度估计的模拟模型快速无ε推断。《神经信息处理系统的优势》,第128–1036页。Robert,C.P.(2016)。近似贝叶斯计算:近期结果调查,第185–205页。斯普林格国际出版公司。Rodrigues,G.、Pra ngle,D.和Sisson,S.A.(2018年)。重新校准:近似贝叶斯计算的后处理方法。《比较统计与数据分析》,126:53–66。Sisson,S.A.、Fan,Y.和Beaumont,M.(2018年)。近似贝叶斯计算手册。查普曼和霍尔/CRC,纽约。Sisson,S.A.、Fan,Y.和Tanaka,M.M.(2007年)。

38
可人4 在职认证  发表于 2022-6-1 05:22:32
无可能性的序贯蒙特卡罗。《美国国家科学院院刊》,104(6):1760-1765。主要结果的证明本节包含对正文中给出的理论结果的证明。定理1的证明该定理是Frazier等人(2018)的改编。设δn≥ Mn(n- *) ≥ 3Mnv-10,n,然后P(Ohmd) =1+o(1)Ohmd: ={y:d(η(y),b)≤ δn/2}。假设y∈ Ohmd、 考虑事件ad(δn):={(z,θ):{d(η(z),η(y))≤ n}∩ {d(b(θ),b)≥ *+ δn}}。注意,通过定义d(b(θ),b)≥ *, 带*> 0.对于所有(z,θ)∈ Ad(δn)和if y∈ Ohmd、 δn<d(b(θ),b)- *≤ d(b(θ),η(z))+d(η(z),η(y))+d(η(y),b)- *≤ d(b(θ),η(z))+n-*+ δn/2so thatδn≤ 4d(b(θ),η(z))。这特别意味着pr(Ad(δn))=Z{d(b(θ),b)≥*+δn}Pθ[d(η(z),η(y))≤ n]d∏(θ)≤ZΘPθ[d(b(θ),η(Z))≥ δn/4]d∏(θ)。(5) 如果(i)为多项式尾,则Pr(Ad(δn))≤ (vnδn)-k ZΘc(θ)d∏(θ)=o(1)(6)只要vnδn→ +∞, 或在(ii)指数tailsPr(Ad(δn))的情况下≤ Ce公司-c(δnvn)τ。(7) 此外,我们可以从下面的αn=ZΘPθ[d(η(Z),η(y))进行束缚≤ 注意{d(η(z),b(θ))≤ 中压-1n/2}∩ Ohmdd(η(y),η(z))≤ d(η(z),b(θ))+d(η(y),b)+d(b(θ),b)≤ v-10,T+Mv-1n/2+d(b(θ),b)≤ 越快越好*≤ d(b(θ),b)≤ n- v-10,T+Mv-1无/2。自n起- *≥ v-10,T+Mv-1n,开Ohmd、 ZΘPθ(d(η(Z),η(y))≤ n)d∏(θ)≥Zd(b(θ),b)≤(n)-*)/4.∨v-1牛米/2(1- Pθd(η(z),b(θ))≥ 中压-1牛/2d∏(θ)≥Zd(b(θ),b)≤(n)-*)/4.∨v-1牛米/21.-c(θ)2κMκd∏(θ)&(n- *)D∨ v-Dn和(n)- *)【A1】的Din案例(i),【A2】下。如果[A1]的情况(ii)成立,在[A2]下,我们有zΘPθ(d(η(z),η(y))≤ n)d∏(θ)≥Zd(b(θ),b)≤(n)-*)/4.∨v-1牛米/21.- c(θ)e-hθ(M/2)d∏(θ)&(n-*)d将这两个不等式与上界(6)或(7)结合,得到∏[d(b(θ),b)≥ *+ δn |η(y)]。(n)- *)-D(vnδn)-κ、 在(i)和∏[d(b(θ),b)的情况下≥ *+ δn |η(y)]。(n)- *)-扩散系数-c(δnvn)τ,在(ii)情况下。

39
kedemingshi 在职认证  发表于 2022-6-1 05:22:35
如果δn,则为o(1)阶≥ Mnv公司-1n(n-*)-D/κ在情况(i)中,或如果δn≥ Mnv公司-1n | log(n-*)|(ii)情况下为1/τ。推论1证明。定义Q(θ)=d(b(θ),b)-d(b(θ*), b) |。从θ7的连续性→ b(θ)和θ的定义*, 对于任何δ>0,存在一个γ(δ)>0,使得infθ:d{θ,θ*}>δQ(θ)≥ γ(δ) > 0. 那么∏[d(θ,θ*) > δ|η(y)]≤ ∏[| Q(θ)- Q(θ*)| > γ(δ)|η(y)]=∏[| d(b(θ),b)- d(b(θ*), b) |>γ(δ)|η(y)]=∏[d(b(θ),b)>*+ γ(δ)|η(y)]。如果∏[| d(b(θ),b)>,则结果如下*+γ(δ)|η(y)]=oP(1)。对于定理1中定义的δn>0且δn=o(1),根据定理1的结论,结果如下一次γ(δ)≥ δn.定理2Proof的证明。为了简单且不失一般性,我们编写了vn=√n、 锌=√n(η(z)-b(θ))和▄Zy=√n(η(y)- b) 。用Bn(K)={Kθ表示- θ*k≤ K} 。在整个证明过程中,一个通用常数可能因行而异。我们有所有θPθkη(z)- η(y)k≤ n= PθkZn-Zy+√n(b(θ)- b) k级≤ nn= PθkZnk+2hZn,√n(b(θ)-(b)-Zyi≤ n[n-kb(θ)- b-Zy/√nk]= PθhZn,b(θ)- bi公司≤√n[n- kb(θ)- b-Zy/√nk]-kZnk-2h▄Zn,▄Zyi√n现在开始Ohmn={kZyk≤ Mn/2},Mna序列以任意缓慢的速度进入完整性,因此Mn=o(n1/4),√nkb(θ)- b-Zy/√nk公司=√nkb(θ*) - 黑色+√n(θ- θ*)H*(θ - θ*)-2hb(θ*) - b、 Zyi+O(Mn/√n) +O(√nkθ- θ*k+kθ- θ*kMn)其中H*是θ7的二阶导数→ kb(θ)- bkatθ*, 注意到θ处的一阶导数等于0*. Let*= kb(θ*) - bk,e′=(b(θ*) - b) ,且>0。如果kθ- θ*k≤ 和事件上Ohmn={kZyk≤ Mn},其中Mn=o(√n) ,Pθkη(z)- η(y)k≤ n≤ PθhZn,e′i≤√n[n- (*)- (1+C)(θ)- θ*)H*(θ - θ*)/2] +hZy,e′i+C+kθ- θ*kMn公司+ PθkZnk>√编号/4≥ PθhZn,e′i≤√n[n- (*)- (1 - C)(θ- θ*)H*(θ - θ*)/2] +h▄Zy,e′i- C- kθ-θ*kMn公司-Pθk~Znk>√编号/4(8) 考虑以下情况:√n(n- (*)) → 2c∈ R

40
可人4 在职认证  发表于 2022-6-1 05:22:39
我们把Θ分解成{kθ- θ*k√n≤ M} ,{>kθ-θ*k>M/n1/4}和{≤ kθ- θ*k} ,其中非常小。如果kθ,则为第一个-θ*k√n≤ M√n[n- (*)- (1 - C)(θ- θ*)H*(θ - θ*)/2] +hZy,e′i+Mn√n+kθ-θ*kMn公司≤ c+hZy,e′i-(1 - C)√n(θ- θ*)H*(θ - θ*)+ 和√n[n- (*)- (1+C)(θ)- θ*)H*(θ -θ*)/2] +百万√n+kθ- θ*kMn公司≥ c+hZy,e′i-(1+C)√n(θ- θ*)H*(θ -θ*)- 此外,使用假设[A5],hZn,e′i=√n<∑n(θ)-1Zn,e′i=hZn,√n∑n(θ)-1e′i=hZn,A(θ*)e′i+o(kZnk)。然后我们得到了c′=c+h′Zy,e′i,x=n1/4(1- )1/2(θ -θ*) 和kθ- θ*k≤ M/n1/4≤ uif nis lar ge enoughPθkη(z)- η(y)k≤ n≤ PθhZn,A(θ*)e′i≤ c′-x个H*x++ ≤ Φc′+MkA(θ*)e′k-x个H*x4kA(θ*)e′k+ +supkθ′-θ*k≤uPθ′hZn,A(θ*)e′i≤ c′-x个H*x+-Φc′+kA(θ*)e′k-x个H*x4kA(θ*)e′k≤ Φc′+kA(θ*)e′k-x个H*x4kA(θ*)e′k+ C。类似地,y=n1/4(1+)1/2(θ-θ*)Pθkη(z)- η(y)k≤ n≥ Φc′- kA(θ*)e′k-yH*y4kA(θ*)e′k- - supkθ-θ*k≤uPθhZn,A(θ*)e′i≤ c′-yH*y- -Φc′- kA(θ*)e′k-yH*y4kA(θ*)e′k≥ Φc′- MkA(θ*)e′k-yH*y4kA(θ*)e′k+ Cf或所有t∈ R、 写x(θ)来强调它在θ中的依赖性,=ZBn(Mn1/4)supkθ′-θ*k≤uPθ′hZn,A(θ*)e′i≤ t型-x(θ)H*x(θ)-ΦtkA(θ*)e′k-x(θ)H*x(θ)4kA(θ*)e′kdθ=n-kθ/4Zkxk≤Msupkθ′-θ*k≤uPθ′hZn,A(θ*)e′i≤ t型-x个H*x个- ΦtkA(θ*)e′k-x个H*x4kA(θ*)e′kdx=n-kθ/4Mo(1),其中最后一个等式在m[A4]之后,我们得到了zbn(m/n1/4)Pθkη(z)- η(y)k≤ nπ(θ)dθ≤ π(θ*)(1+o(1))n-kθ/4Zkxk≤MΦc′+MkA(θ*)e′k-x个H*x4kA(θ*)e′kdx+o(n-kθ/4M)(9)类似zΘPθkη(z)- η(y)k≤ nπ(θ)dθ≥Zkθ-θ*k≤n-1/4MPθkη(z)- η(y)k≤ nπ(θ)dθ≥ π(θ*)(1+o(1))n-kθ/4Zkxk≤MΦc′-MkA(θ*)e′k-x个H*x4kA(θ*)e′kdx(1+oP(1))。(10) 如果>kθ- θ*k>M/n1/4,因为存在a>0使得zH*z≥ Akzk对于所有z,ifM足够大,Pθkη(z)- η(y)k≤ n≤ PθhZn,A(θ*)e′i≤ -是≤ PθkZnk>aM8kA(θ*)e′k. M-2κ现在让j≥ 0并设置Mj=2jM。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-23 21:18