楼主: 大多数88
836 23

[量化金融] 您需要多少数据?一个可操作的前渐近度量 [推广有奖]

11
能者818 在职认证  发表于 2022-6-6 21:34:19
我们的指标可以如下所示:表II比较帕累托与学生T(相同的尾部指数α)α帕累托-帕累托-帕累托-学生-学生-学生-学生-学生κ1,30κ1100κ1,30κ11001.25 0.829 0.787 0.771 0.792 0.765 0.7561.5 0.724 0.65 0.631 0.647 0.609 0.5871.75 0.65 0.556 0.53 0.543 0.483 0.4512。0.594 0.484 0.449 0.465 0.387 0.3522.25 0.551 0.431 0.388 0.406 0.316 0.2822.5 0.517 0.386 0.341 0.359 0.256 0.2272.75 0.488 0.356 0.307 0.321 0.224 0.1893. 0.465 0.3246 0.281 0.29 0.191 0.1593.25 0.445 0.305 0.258 0.265 0.167 0.1383.5 0.428 0.284 0.235 0.243 0.149 0.1213.75 0.413 0.263 0.222 0.225 0.13 0.104. 0.4 0.2532 0.211 0.209 0.126 0.093让Xg,1,Xg,2,Xg,ngbe是一个具有平均u和尺度σ的高斯变量序列。设Xν,1,Xnu,2,Xnu,nν是一些其他变量的序列,这些变量被缩放为相同的M(1),即Mν(1)=Mg(1)=qπσ。我们将计算对应于给定ng的nν值。κnis表示大数定律下的收敛速度和κn→ 0,表示在中心极限下求和收敛到高斯的速率,如图2所示。胖尾统计项目5nmin=inf(nν:EnνXi=1Xν,i- mpnν!≤ EngXi=1Xg,i- mgng公司!, nν>0),可使用κn=0计算高斯分布,并使用simpleapproximation从κ计算目标分布:nν=n-κ1,ng-1克≈ n-κ-1g,ng>1(7)这种近似是由于收敛缓慢。例如,一个具有3个自由度(α=3)的学生T需要120次观察,才能获得与高斯平均值(即置信水平)相同的方差下降,这是高斯平均值30的4倍。

12
mingdashike22 在职认证  发表于 2022-6-6 21:34:22
具有相同尾部指数α=3的单尾帕累托需要543次观察,以匹配30个高斯样本,比学生多4.5倍,这表明1)方差的不确定性不是肥胖的迹象(在我们的统计意义上),2)尾部指数也不是很好的指标3)对称Student分布和Paretodistribution如何不等价,因为Student的“钟形”(来自缓慢移动的函数)抑制了分布中心的变化。我们还可以得出相当违反直觉的结果。根据公式7,流行思想中的“帕累托80/20”,它映射到α周围的尾部指数≈ 1.14,需要比高斯函数多观测10次以上。四、 技术后果a。非对称分布的一些奇点稳定分布在倾斜时具有与对称分布相同的κ指数(换句话说,κ对等式4中的β参数是不变的,在求和时保持不变)。但单尾简单帕累托分布比等效对称分布的尾部更厚(我们在这里的目的是这样)。这是相关的,因为在实践中从未真正观察到稳定,并将其用作一些限制性的数学对象,而帕累托更常见。文献中没有很好地理解这一点。考虑以下使用稳定替代帕累托。在Uchaikin和Zolotarev【8】一文中,Mandelbrot提请注意这样一个事实,即使用极值稳定分布(对应于β=1)来描述经验原理比使用Zipf-Pareto分布更可取,原因有很多。从许多理论和应用出版物中可以看出,曼德尔布罗特的思想得到了专家们越来越广泛的认可。

13
大多数88 在职认证  发表于 2022-6-6 21:34:25
通过这种方式,希望之星在数学模型的框架中确认了经验性确立的原则,同时也澄清了这些原则的形成机制。即使是在夏天,这些动物也不一样。B、 附录中显示了学生T分布到高斯基的收敛速度——由于α=3的学生和的κ的显式推导,金融界普遍注意到的“立方”分布——求和下κ到0的收敛速度很慢。n-求和立方体学生密度的半封闭形式可以补充Bouchaud和Potters[9]中的结果(另见[10],如下所示)。他们的方法是分离“高斯区”,其中密度近似于高斯,以及尾部的“幂律区”,后者保留幂律递减的原始分布。“交叉”在中心的左右两个移动之间,以n个对数(n)的标准差的速度移动,速度非常慢。事实上,我们可以注意到,更多的和落在分布的中心,更少的落在分布之外,因此根据中心极限定理的收敛速度将根据密度是与中心有关还是与轨道有关而有所不同。进一步的研究将关注帕累托到列维稳定的收敛性,到目前为止,我们只得到了数字。C、 对数正态分布既非细尾也非厚尾,如图II所示,在参数σ值较低时,对数正态分布表现为高斯分布,而在σ较高时,它似乎具有各种柯西分布(单尾柯西分布,α=1,β=1的稳定分布),因为κ越来越接近1。

14
mingdashike22 在职认证  发表于 2022-6-6 21:34:29
这给了我们一个关于某些变量是帕累托分布还是对数正态分布的争论的一些方面的想法,例如,关于财富的争论【11】、【12】、【13】。事实上,这种辩论可能与现实世界有关。正如P.Cirillo【14】所观察到的,许多异常情况都是具有高方差的对数正态情况;然而,实际的统计结果比想象的要小。D、 kappa能为负值吗?正如混合高斯的峰度(即具有随机平均值,而非随机波动率)可以下降到3以下(或当使用将峰度测量为超出高斯值的惯例时,将其加上3)一样,当峰度为“负”时,kappa度量可以变为负。这些情况需要双峰性(即,固定方差下均值之间的切换过程,模式在标准偏差方面相距很远)。它们似乎不会出现在单峰分布中。附录中给出了详细信息和推导。五、 总结结论和结论,而极限定理(大数定律和中心极限)与→ +∞, 我们对小型和大型的有限和精确n(及其统计和风险影响)感兴趣。我们可以得出一些操作结果:厚尾统计项目6MarkowitzEstablishedSecurities投机证券0 200 400 600 800 1000n0.10.20.30.40.50.6变量图。简言之,为什么1/n启发式在投资组合理论(以及类似的决策问题)中有效:根据马科维茨的观点,需要更多的证券才能获得与通过投资组合分配相同的风险降低。我们假设这些证券是独立的,而它们不是,某种程度上加剧了这种效应。A.

15
何人来此 在职认证  发表于 2022-6-6 21:34:32
投资组合伪稳定我们的方法也可以自然且立即地应用拓扑组合构建和多元化的效果,因为将证券添加到投资组合中具有与添加额外观察以达到统计意义相同的“稳定”效果。“您需要多少数据?”翻译成“你需要多少证券?”。很明显,现代金融中的Markowicz分配方法【15】(Markowitz本人似乎不会将其用于自己的投资组合【16】)仅适用于接近0的κ;人们使用ConverxEuristics,否则他们会低估尾部风险,并像1998年著名的以投资组合理论为导向的对冲基金长期管理那样“炸毁”。[17][18]我们之前提到,接近“80/20”的帕累托分布需要比高斯分布多10个观测值;考虑到如果使用现代投资组合标准,在这种分布下的投资组合风险将被低估至少8个数量级。按照这样的推理,我们只需要更广泛的投资组合。还注意到,从峰度的简单标准来看,实际上没有比高斯分布更厚的金融安全[19],这意味着马科维茨投资组合分配永远不是最佳解决方案。代理明智地将噪声近似应用于启发式,行为科学家将其归类为这些偏见之一,但事实上被揭穿为错误(错误偏见是指,虽然观察到的现象存在,但并不构成“偏见在这个词的不好的意义上;相反,由于使用了错误的工具而不是决策者,研究人员才是错误的)。

16
kedemingshi 在职认证  发表于 2022-6-6 21:34:35
Benartzi和Thaler[20]认为这种“过度多元化”的倾向背离了最优投资行为,并在[21]中解释道:“当面对n个期权时,将资产平均分配到期权上。我们将这种启发式称为“1/n规则”。“然而,扩大一个人的多样性有效性至少与标准分配一样最优(见Windcliff和Boyle的评论[22]和[23])。简言之,在广泛的指标范围内,等权重投资组合的表现优于SP500。但即使是后两篇论文也没有考虑到胖尾巴的全部作用和特性,我们可以在这里看到一些精确的结果。图五显示了与马科维茨相比对证券的影响。这种错误的偏见是众多决策者“强迫”人们进入错误理性的例子之一,并迫使他们将投资组合风险增加了许多倍。关于金融投资组合风险的更多评论。SP500的κ约为。2,但需要考虑的是,它本身就是一篮子n=500的证券,尽管没有加权,而且由相关成员组成,对稳定股票的权重过高。单只股票之间有kappas。3和。7、意味着必须制定“过度驾驶”政策。同样,该指标在预测数据处理方面为我们提供了一些指导,通过建立样本效率,说明在说明气候条件是否“发生变化”之前,我们需要多少年的数据,见【24】。B、 统计推断的其他方面到目前为止,我们只考虑了单变量分布。对于更高的维度,一个潜在的研究领域是肥胖变量的多元分布的等效方法,马尔琴科Pastur(或Wishhart)分布无法捕获其抽样。在我们的情况下,添加变量并不容易从随机矩阵中消除噪声。C

17
mingdashike22 在职认证  发表于 2022-6-6 21:34:38
最后的评论正如我们前面所说,“统计从来都不是标准的”;然而,有一些启发式方法可以找出我们偏离标准的地方和程度。胖尾统计项目7附录A。立方学生T(高斯盆地)由于其在金融领域的普遍性,具有3个自由度的学生T在文献中特别受关注。由于方差的不确定性,它常常被错误地近似为高斯分布。渐近地,我们最终得到了阿高斯,但这并没有告诉我们任何关于收敛速度的信息。Mandelbrot和Taleb【25】指出,立方体更像是极端分布中的幂律,我们将在这里详细阐述,这要感谢thesum的明确PDF。设X是密度为p(X):p(X)的随机变量=√π(x+3),x∈ (-∞, ∞) (8) 提案1。设Y是X的和,Xn,n X的相同副本。设M(n)为n个总和与平均值的平均绝对偏差。收敛的“速率”κ1,n=nκ:M(n)M(1)=n2-κois:κ1,n=2-对数(n)对数(enn-nΓ(n+1,n)- 1) (9)其中Γ(,.)是不完全伽马函数Γ(a,z)=R∞zdtta公司-1e级-t、 自平均偏差M(n):M(n)=(√n=1时为π√π(enn-nΓ(n+1,n)- 1) 对于n>1(10),推导如下。对于pdf和MAD,我们遵循不同的路线。我们有n个求和的特征函数:Д(ω)=(1+√3Ωne-n√3 |ω| Y的pdf由以下公式给出:p(Y)=πZ∞(1 +√3ω)ne-n√3ωcos(ωy)dω经过艰苦的积分,我们得到了10的结果。

18
nandehutu2022 在职认证  发表于 2022-6-6 21:34:42
此外,由于文献中似乎没有找到以下结果,我们有一个副作用的结果:Y的PDF可以写成asp(Y)=en-iy公司√e2iy公司√E-nn+iy√+ E-nn-iy公司√√3π(11),其中E(.)(.) 是指数积分Enz=R∞et公司(-z) tndt。注意以下标识(来自Abramowitz和Stegun的更新)[26]n-n-1Γ(n+1,n)=E-n(n)=e-n(n- 1)!nnnXm=0nmm!关于渐近性,我们有以下结果(由Michail Loulakis提出):重新表示等式10:M(n)=√3n!πnnn-1Xm=0nmm!此外,e-nn型-1Xm=0nmm!=+O√n(根据中心极限定理,泊松变量和收敛到高斯分布时的行为:e-nPn公司-1m=0nmm!=P(Xn<n),其中Xn是参数为n的泊松随机变量。由于n个独立泊松随机变量与参数1的和是参数为n的泊松随机变量,中心极限定理表示Zn=(Xn)的概率分布- n)/√n接近标准正态分布。因此P(Xn<n)=P(Zn<0)→ 1/2 asn→ ∞.关于另一种方法,请参见[27],以证明1+n1+n2!+···+nn型-1(n-1)!~en.)使用limn→∞nexp(n)nn√n个=√2π,我们得到以下精确渐近:Robert Israel在数学堆栈上交换尾部统计项目8limn→∞log(n)κ1,n=π因此,在速度log(n)时,κ变为0(即,平均值变为高斯),速度非常慢。换句话说,即使有总结,这种行为也不能概括为高斯现象,这是B.Mandelbrot经常表达的直觉【25】。B、 对数正态分布从n个和的累积量的行为中,我们可以观察到,当σ低时,和的行为类似于高斯分布,当σ高时,和的行为类似于对数正态分布——在这两种情况下,我们都明确知道κn。对数正态分布(用u和σ参数化)没有明确的特征函数。但我们可以通过递归得到所有阶数i的累积量kii,对于我们的情况,求和r.v的相同副本。

19
mingdashike22 在职认证  发表于 2022-6-6 21:34:45
Xi,Kni=Ki(PnXi)=nKi(X)。累积量:Kn=neu+σKn=neσ- 1.e2u+σKn=neσ- 1.eσ+2e3u+3σKn=。这让我们可以计算:偏度=√eσ-1.eσ+2e(2u+σ)-u-σ√nand峰度=3+e2σeσeσ+2+3.-6nw我们可以立即从累积量/矩中证明:limn→+∞κ1,n=0,limσ→0κ1,n=0,我们对κ的约束变得明确:让κ*1,nbe对数正态和保持对数正态密度的情况,前两个时刻相同。我们有0个≤ κ*1,n≤ 1,κ*1,n=2-日志(n)日志神经衰弱vuutlogn+eσ-1n!√erf公司σ√1) 启发式尝试:在其他启发式方法中,我们可以通过两个步骤看到1)在σ,κ1,n的高值下→ κ*1,n,因为大数定律变慢了,2)κ*1,nσ→∞→ 1.2)Loulakis证明:证明了高方差κ1的上界,napproaches 1已正式显示在我的MichailLoulakis上,我们总结如下。我们从标识E(| X)开始-m |)=2R∞m(x- m) f(x)dx=2R∞m’FX(t)dt,其中f(.)是密度,m是平均值,FX(.)是生存函数。此外,M(n)=2R∞nm?F(x)dx。假设u=σ,或X=expσZ-σ其中Z是标准正态变量。设sn为X++Xn;我们得到M(n)=2R∞nP(Sn>t)dt。利用次指数性质([28]),P(Sn>t)≥ P(最大值0<i≤n(Xi)>t)≥ nP(X>t)-nP(X>t)。现在P(X>t)σ→∞→ 1,第二项为0(使用霍尔德不等式)。跳过步骤,我们得到lim infσ→∞M(n)M(1)≥ n、 同时,我们需要满足边界M(n)M(1)≤ n、 所以对于σ→ ∞,M(n)M(1)=n,因此κ1,nσ→∞→ 1.3)皮尔逊族计算方法:为了计算目的,σ参数不太大(如下所示≈ .3、为了便于计算,我们可以使用Pearson族–虽然对数正态分布不属于Pearson类(正态分布属于Pearson类,但我们非常接近计算)。

20
mingdashike22 在职认证  发表于 2022-6-6 21:34:49
直观地说,在低西格玛下,前四个矩是足够的,因为没有大的偏差;而不是在更高的西格玛下,保持对数正态分布是正确的方法。Pearson类在信息/通信理论等领域有着广泛的应用,其中有丰富的文献:关于对数正态变量的求和,请参见Nie和Chen[29],Pearson IV[30],[31]。Pearson族定义为满足以下微分方程的适当比例密度f。f(x)=-(a+ax)b+bx+bxf(x)(12)本文综述;Loulakis提出了一种形式化证明来代替启发式推导。胖尾统计项目9我们注意到,我们对a、b等的参数化确定了Pearson类内的分布,这似乎是Pearson IV。最后,我们得到了平均偏差的表达式,作为n、σ和u的函数。让m为平均值。Diaconis等人(32)根据铃木De Moivre(33)的一个老把戏表明,我们可以得到明确的平均绝对偏差。再次使用标识E(| X-m |)=2R∞m(x- m) f(x)dx和零件积分,E(| x-m |)=b+bm+bm一- 2bf(m)(13)我们使用n-和对数正态分布的累积量来匹配参数。设置a=1,m=b-a1级-2b,我们得到a=eu+σ-12n+(3-10n)e4σ+6(n-1) eσ+12(n-1) e2σ-(8n+1)e3σ+3e5σ+e6σ+12(6(n-1) +e2σ(eσ(5eσ+4)-3) )b=e2σeσ-1.2eσ+3(6(n-1) +e2σ(eσ(5eσ+4)-3) )b=eσ-1.eu+σeσeσeσ-4n+eσeσ+4+7.-6n+6+6(n-1)+12(n-1)(6(n-1) +e2σ(eσ(5eσ+4)-3) )b=-neσ-1.e(u+σ)eσ-2(n-1) eσ-3n+e3σ+3+6(n-1)(6(n-1) +e2σ(eσ(5eσ+4)-3) 4)多项式展开:其他方法,如Gram-Charlier展开,如Schleher[34],Beaulieu[35],证明对获得κn没有帮助。在σ值较高时,由于我们包括高阶lhermitpolynomic,近似变得不稳定。参见Dufresne[36]和[37]中的评论。C

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 09:35