楼主: 大多数88
1305 32

[量化金融] 这是幂律分布吗?经济收缩的例子 [推广有奖]

11
nandehutu2022 在职认证  发表于 2022-5-5 02:09:25
(6) 我们得到了这两个假设的相对概率的粗略近似值。不是说,例如,如果a和e都被认为是同等可能的先验,B等于概率比,exp(S)按数量级接近它。在最后一种情况下(等先验概率),或当数据的权重大于等式(6)中的先验概率时,选择的假设是使S最大化的假设,或等效地,使BIC最小的假设-2ln(f(D | H,^p)+νln(N),其中BIC代表贝叶斯信息准则或信息准则B,并以类似于Akaike[2 9]信息准则A(AIC)的方式表示,广泛用于比较假设。在几个相互竞争的假设中,Akaike的标准选择了一个最小的假设:-2ln(f(D | H,^p)+2ν。根据Schwarz的结果,Akaike的标准往往会高估参数的数量[2 6]。本文未使用AIC。在比较嵌套的高阶统计量(如截断幂律和截断对数正态统计量)时,频率学派也使用似然比(尽管在本例中,它只是几种可能的统计量之一)。Wilks[23]表明,如果带有较小参数的嵌套假设是正确的,并且N是la r ge,-2ln(λ)遵循带ν的卡方分布- ν自由度。例如,当比较截断幂律和截断对数正态分布时,当λ<0.147时,幂律的显著性水平为0.05,或当λ<0.036时,幂律的显著性水平为0.01。本研究同时考虑了Schwarz[28]贝叶斯准则和Wilks[23]f频数准则。3.计算。其中42个国家的人均GDP数据来自于Barro的年度经济数据集[1]。

12
大多数88 在职认证  发表于 2022-5-5 02:09:28
这些数据从每个国家最早的可靠数据(通常在19世纪)一直延续到2009年。参考文献[20]之后,有三个国家因二战前后数据缺失而被排除在外:马来西亚、菲律宾和新加坡。对于剩下的39个国家,每691次国家级经济衰退都会得到相对的顶部到顶部的收缩规模。在这项研究中,从上到下的距离GDP的计算是针对自人均GDP开始下降,直到其恢复到原来的水平(不考虑嵌套事件)的事件,并除以初始数据,即x=-GDP/GDP(如本文所述,指人均GDP)。这类措施之所以有用,是因为其简单、透明和易处理性。尽管存在进口退税,但每当经济下滑影响到几个计数时,它都会被视为一组独立的收缩。一个相关的问题是,本文中的统计处理假设独立,但这些数据并非完全独立。然而,鉴于大量数据和情况的多样性(许多经合组织和非经合组织国家,不同的历史时期),我假设抽样空间的覆盖范围足够广泛,足以与完全随机样本进行比较,至少在确定分布类型时是如此,这可能比参数的特定值更稳健。在TASEPOLAR应用的不同阶段,整个数据集或子数据集都按气味或降序排序。然而,当整个数据集按降序排序时,作为一种识别特定数据的方法,它们总是根据其位置进行标记,即。

13
kedemingshi 在职认证  发表于 2022-5-5 02:09:32
最大的偏差为#1,最小的偏差为#691.3.2塔塞波尔在经济收缩中的应用3。2.1幂律范围的确定首先,我选择了一系列幂律非常适合的值作为种子。这个选择相当随意。范围应该相对较大,但它应该在两侧留下数据序列,这些数据序列也可能成为幂律的一部分。我通过对经验PDF的目测选择了它,然后我测试了它的效果。选择范围是D80197。在此范围内,截断幂律和截断对数正态分布之间的似然比为0.79。如果幂律假设是正确的,这完全在我们预期的值范围内:根据威尔克斯近似,在这个假设下,λ80197的概率为0.49≤ 0.79.其次,我进行了逐点顺序比较,以扩大上侧的选定范围。图1给出了从D80197到1197的每个嵌套子集的可能性rat io。大多数序列显示λ=1以下的微小波动,这是我们期望的幂律。结束前的第八个基准(x=0.5034)是最后一个包含λ>0.99的基准。实际上,它给出了一个几乎等于1的值:λ8197=0.99906。将剩余的7个值依次包含在一起,得出一个向下的t趋势,在λ1197=0.4790处达到顶点。该λ不是非常低,可能是由随机波动引起的(frequentistWilks标准不允许拒绝任何显著水平<0.23的幂律)。对于λ1197,Schwarz统计量为S=-1.9,给予经验(-1.9)=0.15,作为贝叶斯系数的近似值,有利于幂律。然而,贝叶斯因子将与先验概率(Eq。

14
能者818 在职认证  发表于 2022-5-5 02:09:35
6) ,我们知道幂律在某一点上必须弯曲,因为它不能继续超过系统的总大小,所以很有可能图1:F ir st幂律和截断对数正态分布之间的逐点序列比较。幂律和截断对数正态f r om i=80到i=1之间的似然比λi,197,即对于从D80197到D1197的嵌套数据集序列。由于这些分布是嵌套的,λ不能取任何大于1的值。箭头表示选择作为幂律上限的点。尽管随后的下降并不比我们从幂律的随机波动中预期的更大,但在这种情况下,它很可能表示该分布的实际偏差,因为幂律必然有一个上限。几个最大的观测值不构成幂律的一部分。因此,我们不假设x-x值包含在幂律范围内。估计的xmaxis t husx=0.5034。由于序列中的上一个值为x=0.4987,下一个值为x=0.52714,因此xmaxis与0.5没有显著差异。第三,我进行了定义的逐点顺序比较。估算完dxmax后,我取了满足x的20个最大值≤ xmax,也就是D8,27,我逐步扩大了这个子集。图2给出了从D8,27到D8691的所有嵌套子集的似然比(Recallxis是样本中最小的收缩)。由于样本量较小,在经历了一些较大的波动后,我们再次发现了一个小而稳定的波动略低于λ=1的区域。我第一次选择作为种子的范围在这个区域内,这意味着这是一个有效的选择。在某个时刻,出现了下降的趋势。当序列完成时,我们剩下λ8691=7.5×10-53

15
何人来此 在职认证  发表于 2022-5-5 02:09:38
从常客的角度来看,这允许以4×10的显著水平拒绝幂律-54.施瓦兹的统计数据是s=-117,这给出了exp(S)≈ 2 × 10-51作为Bayes因子的近似值。这几乎可以肯定,这整个范围不能由一个单一的幂律来确定。选择λ>0.99(λ8270=0.99 31)的最后一个数据作为幂律的下限。该值为x=0.05327,即xmin≈ 0.053.因此,TASEPOLAR给出了功率定律的范围,覆盖范围从xmin=0.053到xmax=0.5,包含263个数据,或样本的39.5%,同时允许我们完全抛弃覆盖整个数据集的单一功率定律的本质。所选范围内幂律指数的最大似然估计为1.77.3.2.2幂律假设检验。我检验我们的候选幂律范围,包括数据#8-#270,是否是截断对数正态分布的一部分。如第2.1节所述,我们通过测试扩大的区域是否可以解释为单个t r未加保护的对数正态分布的两个切片来实现这一点。在本研究中,我们以一种最简单的方式扩大该区域,包括所有较小的值,即我们分析D8691。在这个区域,我们将截断对数范数l与双幂律进行比较。在继续之前,我们希望确保排除少数最重要的数据(#1-#7)不会对对数正态假设不公平。在幂律的情况下,上截断是不可避免的,因为否则,其平均值将是有限的(对于估计指数),即图2:幂律和截断对数正态之间的第二点顺序比较。幂律和截短对数正态分布之间的似然比λ8,b从j=17到j=691,即从D8,17到D8691的嵌套数据集序列。

16
mingdashike22 在职认证  发表于 2022-5-5 02:09:42
由于这些是嵌套分布,λ不能取任何大于1的值。箭头表示选择作为幂律下限的点。完全高于最大可能值x=1(对应于完全破坏)。对数正态分布的衰减速度比幂律快,因此在达到x=1之前,它的概率密度可能先验地变得可以忽略不计,在这种情况下,不需要显式截断。然而,对于我们案例中的已确定参数(见下文),如果没有计算,则任何一次活体收缩大于1的概率为0.025。因此,概率只有2.5×10-我们的691个数据都没有超过这个阈值,这意味着对数正态分布也需要显式截断。放大范围内截断对数正态分布参数的最大似然估计给出^τ=1.17和^ψ=1.18(相当于^u=-3.2 9, ^σ = 1.68). 通过对双幂律应用最大似然估计,两个幂律之间的边界似乎位于x=0.037。高于该值的估计指数为^τ=1.63(小于第3.2.1节中的估计值,因为包含了较小的值,这实际上不符合幂律),而低于该值的估计指数为^τ′=0.31。截断对数正态分布和双幂律(等式4)之间的似然比为2。2 × 10-6.赞成双重幂律。因为这些不是嵌套模型,所以无法使用威尔克斯标准将该数字转换为一个频度显著水平。然而,它可以给出贝叶斯解释。施瓦兹的统计数据是s=-9.76,经验=5.8×10-5近似于Bayes因子B(等式7)。

17
能者818 在职认证  发表于 2022-5-5 02:09:45
尽管从S到B的转换有很大的误差,但这个结果的大小几乎可以肯定,双幂律比截断对数更适合数据。截断对数正态分布只能在双幂律的先验概率高出几个数量级的情况下优于双幂律,但没有理由这样做,因为在我们的环境中,有一些看似合理的机制可以产生幂律,如第5.3节所述。因此,如果我们要决定我们的数据是否遵循未分类对数正态分布或双幂律分布,第二种选择更可能是由几个数量级决定的。这并不一定意味着双幂律给出了数据的最佳描述,因为我们只是比较两个选择的分布,部分是因为它们简单,而集合D8691可能有更复杂的形状。然而,这一结果在很大程度上支持了以下假设,即幂律是第3.2.1节所选区域的最佳函数,包括xmin≈ 0.053到xmax≈ 0.5.3.3补充分析3。3.1绘制PDF经验概率密度函数采用对数算术方法绘制。参考文献[31,第131-132页]描述了该方法(早在参考文献[32]中就已使用),并表明其适用于幂律和相关分布。为了给出幂律的清晰图像,将估计对数(xmin)和对数(xmax)之间的范围划分为七个相等的箱子。装箱也扩展到更小的(图5)和la r ger(图4和图5)值。连同经验PDF,F ig。4将拟合的幂律显示为代表概率区间的几段交叉线。经验PDF的数据点预计位于这些区间内,概率为2/3。

18
可人4 在职认证  发表于 2022-5-5 02:09:48
数据在各个箱子之间的分配应该遵循多项式分布,我将其近似为每个箱子的一个二项式分布。如果一个箱子从xAto xB开始运行,则收缩使该箱子达到par t的概率为F(xB)- F(xA),其中F是幂律的累积概率函数。这个概率是用于二项式的参数。通常,x的范围不会给出精确的2/3概率,因为事件数的分布是离散的。然而,我选择了x的值,给出了更小和更大的概率,我通过线性插值从中得到了间隔。3.3.2幂律指数:在频率分析法中,幂律指数τ(公式1)通过最大似然估计获得,并可通过置信区间进行补充。可以直接证明,τ的最大似然估计量是满足以下条件的值:ln(x)=(ττ)- 1)-1+x-^τ+1min(xmin)- 十、-^τ+1maxln(xmax)x-^τ+1min- 十、-^τ+1max。(8) 从贝叶斯的观点来看,如果我们要从数据集D估计τ,我们必须指定先验概率分布f(τ):f(τ| D)∝ f(τ)f(D |τ)。基于其他类型灾难性事件的大多数经验数据和试图预测它们的大多数模型都涉及τ值介于1和2之间或接近该范围[4]的事实,专家先验可能是广泛分布的,其模式介于1和2之间。由于(i)模式下的导数为零,(ii)分布应广泛,且(iii)模式的精确位置不清楚,因此对于不严重偏离范围1-2的值,均匀分布是合理的。

19
能者818 在职认证  发表于 2022-5-5 02:09:51
在我们的案例中,这一要求没有问题,因为我们发现的似然函数很窄,并且在这个范围内的值范围内。这简化了我们的计算,因为对于均匀先验,后验概率f(τ| D)与似然函数f(D |τ)成比例。此外,由于置信区间也是由似然函数确定的,因此在这种情况下,贝叶斯累积概率和频繁置信区间之间的差异最小。更成问题的是,dat a并不是完全独立的。然而,由于对它们之间相互关系的描述并不琐碎,我只是在独立性假设下获得了临时结果。式(8)中的Sinceln(x)是一系列变量的平均值,具有有限的均值和方差,近似为高斯分布。对于τ的每个可能值,ln(x)将遵循符合等式(8)和方差[ln(x)的均值ln(x)的高斯分布- ln(x)]/√N、 式中ln(x)=(ln(xmin)+τ-1ln(xmin)+(τ)-1) ]x-τ+1min- [ln(xmax)+τ-1ln(xmax)+(τ)-1) ]x-τ+1max)/(x-τ+1min- 十、-τ+1max)。由此计算出的每个τ的高斯密度函数是该τ的似然函数。3.3.3幂律和广义帕累托分布之间的比较Barr o和Jin[19]分析了本研究中使用的数据集的IIIAn ear lier版本。这些作者试图将幂律定义为y=1/(1)-x) 。由于f(x)=f(y)| dy/dx |,幂律f(y)=ay-τ对应于x的以下分布:f(x)∝ (1 -十)-γ、 这是指数γ=τ的广义帕累托分布III型(gPd3)-2(幂律是广义的帕累托分布II型,与原始帕累托分布相对应)[33]。Barro和Jin[19]通过目视检查y的累积概率来测试这种分布。

20
mingdashike22 在职认证  发表于 2022-5-5 02:09:54
鉴于预期图和获得的图之间存在显著差异,他们将正在分析的数据集x(所有数据均满足x>0.1,这是作者事先设定的标准)分为两个范围:(1)0.1<x<0.32,和(2)x>0.32。考虑到Barro和Jin的标准以及我的上述估计,我在几个范围内比较了幂律和gPd3。在所有情况下,我都会考虑这两个发行版的截断版本。对于D1,7(即,对于x>0.5,对应于我们从幂律中排除的大值),gPd类型III和幂律之间的似然比为0.95。如果可以应用,施瓦兹的标准将给出一个与此相似的Bayes f因子,因为两个假设的参数数量相同,但由于数据数量太少,无法应用。因此,我们无法根据数据区分这两个假设。然而,第三类广义帕累托分布(gPd3)更可能是先验的,因为我们预计塔塞波尔丢弃的上限范围对应于不遵循图3:广义第三类帕累托分布(gPd3)和幂律之间的逐点顺序比较的分布的par t。gPd3和幂律之间的似然比λ31,从j=40到j=270。由于这些不是嵌套分布,λ可以取大于1的值。幂律由于接近上限(x=1),而gPd类型III是用于有界变量的精确分布。威尔克斯的频率标准不能应用,不仅因为数据很少,而且因为这些数据不是嵌套分布。对于D1,30(对应于Barro和Jin选择的x>0.32范围,并综合TASEPOLAR在幂律范围内包括和排除的数据),似然比为0.51。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-5 13:08