楼主: 大多数88
834 23

[量化金融] 您需要多少数据?一个可操作的前渐近度量 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

67%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
70.8397
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23294 点
帖子
3809
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
大多数88 在职认证  发表于 2022-6-6 21:33:43 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《How Much Data Do You Need? An Operational, Pre-Asymptotic Metric for
  Fat-tailedness》
---
作者:
Nassim Nicholas Taleb
---
最新提交年份:
2018
---
英文摘要:
  This note presents an operational measure of fat-tailedness for univariate probability distributions, in $[0,1]$ where 0 is maximally thin-tailed (Gaussian) and 1 is maximally fat-tailed. Among others,1) it helps assess the sample size needed to establish a comparative $n$ needed for statistical significance, 2) allows practical comparisons across classes of fat-tailed distributions, 3) helps understand some inconsistent attributes of the lognormal, pending on the parametrization of its scale parameter. The literature is rich for what concerns asymptotic behavior, but there is a large void for finite values of $n$, those needed for operational purposes. Conventional measures of fat-tailedness, namely 1) the tail index for the power law class, and 2) Kurtosis for finite moment distributions fail to apply to some distributions, and do not allow comparisons across classes and parametrization, that is between power laws outside the Levy-Stable basin, or power laws to distributions in other classes, or power laws for different number of summands. How can one compare a sum of 100 Student T distributed random variables with 3 degrees of freedom to one in a Levy-Stable or a Lognormal class? How can one compare a sum of 100 Student T with 3 degrees of freedom to a single Student T with 2 degrees of freedom? We propose an operational and heuristic measure that allow us to compare $n$-summed independent variables under all distributions with finite first moment. The method is based on the rate of convergence of the Law of Large numbers for finite sums, $n$-summands specifically. We get either explicit expressions or simulation results and bounds for the lognormal, exponential, Pareto, and the Student T distributions in their various calibrations --in addition to the general Pearson classes.
---
中文摘要:
本注释给出了一个单变量概率分布的胖尾性的操作度量,单位为$[0,1]$,其中0为最大细尾(高斯),1为最大胖尾。除其他外,1)它有助于评估建立统计显著性所需的比较样本量,2)允许在不同类别的厚尾分布之间进行实际比较,3)有助于理解对数正态分布的一些不一致属性,取决于其尺度参数的参数化。有关渐近行为的文献非常丰富,但对于$n$的有限值,即用于操作目的的有限值,存在很大的空白。传统的厚尾性度量,即1)幂律类的尾部指数,以及2)有限矩分布的峰度,无法适用于某些分布,并且不允许跨类和参数化进行比较,即在列维稳定流域以外的幂律之间,或在其他类的分布之间,或在不同总和数的幂律之间。如何将100个三自由度学生T分布随机变量的总和与Levy稳定或对数正态类中的一个进行比较?一个人如何将一个有3个自由度的100个学生T的总和与一个有2个自由度的学生T的总和进行比较?我们提出了一个操作性和启发性的度量方法,允许我们在有限第一矩的所有分布下比较n$和的自变量。该方法基于有限和的大数定律的收敛速度,特别是n$-和。我们得到了对数正态分布、指数分布、帕累托分布和学生T分布在各种校准中的显式表达式或模拟结果和界,以及一般的Pearson类。
---
分类信息:

一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--
一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
-->
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:distribution Quantitative Multivariate Econophysics significance

沙发
kedemingshi 在职认证  发表于 2022-6-6 21:33:49
胖尾统计项目您需要多少数据?厚尾Nessnassim Nicholas TalebTandon工程学院的前渐近度量,纽约大学2018年11月即将出版的《国际预测杂志》(International Journal of ForecastingStract)本文提出了一个具有有限第一矩的单变量无模概率分布的操作度量,其中0为最大细尾(高斯),1为最大厚尾。它基于“一个人需要多少数据才能对给定数据库做出有意义的陈述?”应用:除其他外,它o有助于评估高斯分布以外的统计信号所需的样本量n,o有助于测量收敛到高斯分布(或稳定盆地)的速度,o允许对不同类别的胖尾分布进行实际比较,o允许评估投资组合构建中所需的证券数量,以实现一定程度的分散风险降低,o帮助评估各种设置下的风险,o帮助理解对数正态分布的一些不一致属性,取决于其方差的参数化。有关渐近行为的文献非常丰富,但对于n的有限值,即操作目的所需的值,存在很大的空白。背景:传统的厚尾性度量方法,即1)幂律类的尾部指数,以及2)有限矩分布的峰度,无法适用于某些分布,并且不允许跨类和参数化进行比较,即在列维稳定流域以外的幂律之间,或幂律与其他类的分布之间,或不同求和数的幂律。

藤椅
mingdashike22 在职认证  发表于 2022-6-6 21:33:52
一个人如何将100个具有3个自由度的学生分布随机变量的总和与Levy稳定或对数正态类中的一个进行比较?佳能如何将一个有3个自由度的100个学生T的总和与一个有2个自由度的学生T的总和进行比较?我们提出了一个操作性和启发性指标,允许我们在第一时刻确定的所有分布中比较n个求和的独立变量。该方法作者最应归功于Michail Loulakis的重点评论,此外,他还为Student T和对数正态分布的κ极限提供了严格的推导,以及Spyros Makridakis的耐心和智慧。该论文最初于2016年9月12日至16日在莱顿洛伦茨中心和2017年10月在库兰特研究所吉姆·盖瑟尔的Festschrift发表,主题为《高维度的极端与风险》。作者感谢Jean-PhilippeBouchaud、John Einmall、Pasquale Cirillo和其他人。劳伦斯·德哈恩建议将指标名称从“gamma”改为“kappa”,以避免混淆。此外,感谢科尔曼·汉弗莱、迈克尔·劳勒、丹尼尔·杜弗雷恩和其他人对推导的讨论和见解。基于有限和的largenumbers定律的收敛速度,特别是n-和。我们得到了对数正态分布、指数分布、帕累托分布和学生T分布在各种校准中的显式表达式或模拟结果和界,以及一般Pearson类。Cauchy(κ=1)Pareto 1.14立方Student TGaussian(κ=0)Degrees of at Tailedness2 4 6 10 N246810|Sn=X1+X2++Xn |图1。κ测量的直观性:r.v.Sn的相同拷贝之和的平均偏差=X+X+。xn随着样本的增加,我们将讨论如何比较不同类别的前共感分布。我

板凳
mingdashike22 在职认证  发表于 2022-6-6 21:33:55
导言和定义表明,我们可以将尾部α=2.1的帕累托分布与高斯分布进行比较吗?即,在方差有限的情况下,可以将其与高斯分布进行比较吗?渐进地,这些具有单位秒矩的规则变化类的分布在求和下变为高斯分布,但在预交感作用下,我们没有标准的方法来比较它们,因为依赖于更高矩的度量,如峰度,无法提供帮助。我们也无法将有限方差帕累托分布与其极限α稳定分布(当两者具有相同的尾部指数或尾部指数)进行比较。同样,我们如何将一个具有3个自由度的学生T的“厚尾”与一个尾部指数为1.95的LevyStable的“厚尾”进行比较?两种分布都有一个确定的平均值;在这两个变量中,只有第一个变量具有有限的方差,但根据一些操作标准,对于少数总和,其表现更为“厚尾”。“厚尾”指的是金融从业人员使用的通用术语,指的是比高斯分布更厚的尾,而不是指任何特定类别的分布。胖尾统计项目2κ1,30κ1100κ11000中心界限(κ1)1.0 1.5 2.0 2.5 3.0 3.5 4.0α0.00.20.40.60.81.0κ帕累托(α)κ1,30κ1100κ11.5 2.0 2.5 3.0 3.5 4.0α0.20.40.60.81.0κ学生T(α)图2。观察广义中心极限定理的效果:帕累托分布和学生T分布,在P类中,α指数,κ收敛到2- (α<2α +α≥22),或稳定的S级。我们观察到收敛速度有多慢,即使在1000个求和之后。这削弱了Mandelbrot的观点,即有限方差帕累托可以包含在稳定分布中。1) “厚尾性”标准:根据每个定义,有多种方法“定义”厚尾和等级分布。

报纸
大多数88 在职认证  发表于 2022-6-6 21:33:57
在所有矩有限的窄类分布中,是峰度,它允许简单比较并测量偏离高斯分布的情况,高斯分布用作范数。对于幂律类,它可以是尾部指数。也可以使用极值,取超过最大值的概率,通过量表进行调整(如极值理论中所实践的)。

地板
大多数88 在职认证  发表于 2022-6-6 21:34:02
对于操作用途,从业者的厚尾性是一种集中度,例如“有多少统计特性可归因于单个观察?”,或者,通过尺度(或平均离散度)适当调整,“一个国家的总财富掌握在最富有的个人手中有多少?”在这里,我们使用以下标准来衡量我们的目的,这与上一段中的浓度测量相吻合:“额外数据(在这种概率分布下)将在多大程度上有助于提高观察平均值的稳定性”。其目的并不完全是统计上的:它同样意味着:“在我的投资组合配置中增加额外的证券(即保持总不变)会在多大程度上增加其稳定性?”我们的度量与渐近度量(尤其是极值理论中使用的度量)的不同之处在于,它基本上是预交感的。现实生活和现实世界的实现都在渐近线之外。2) 指标做了什么:我们提出的指标,κ做了以下工作:o允许比较n-对给定数量的求和变量进行不同分布的求和,或对不同n进行相同分布的求和,并评估给定分布的预交感性质提供与极限分布(即Lévyα-稳定盆地)的距离度量(高斯分布是其特例)对于统计推断,允许评估大数定律的“速度”,表示为由于样本量n的增加,平均绝对误差的变化。允许比较评估两种不同单变量分布的“厚尾性”,当两种分布都具有有限的第一时刻允许我们提前知道蒙特卡罗模拟需要多少次运行。3) 统计推断的状态:最后一点“速度”似乎被忽略了。

7
能者818 在职认证  发表于 2022-6-6 21:34:06
因为在9400页的《统计科学百科全书》[1]中,我们能够找到一条关于达到渐近线所需时间的评论,或者如何处理n个大的总和,但对于所谓的“正态近似”来说可能不够充分。此外,关于StatisticalReference(由W.Hoefffing编写)的条目明确地回避了这个问题,声明:“统计数据的精确分布通常非常复杂,很难处理。因此,需要用一种更简单形式的分布来近似精确分布,其性质更为透明。概率论的极限定理为这种近似提供了重要工具。特别是经典的中心极限定理指出,大数之和rof独立随机变量在一般条件下近似正态分布。事实上,正态分布在可能的极限分布中起着主导作用。(...) 此外,许多统计量的行为类似于独立随机变量的和。所有这些都有助于解释正态分布作为渐近分布的重要性。“即使是社会科学对“小数定律”的讨论[2]也假设高斯属性为范数。至于极值理论,“小数函数定律”[3]涉及小概率的泊松碰撞;更普遍的是,极值理论(虽然自然配备了厚尾工具)关注maxima,notaverages的行为。我们的座右铭是“统计永远不是标准”。该指标旨在显示标准是如何成为标准的,胖尾统计项目3从统计意义的标准点测量与标准的准确偏差。二、METRICStudent T(3)或稳定α=1.7稳定α=1.2~ 高斯0.5 1.0 1.5 2.0 2.5 3.0σ0.20.40.60.81.0κ1Fig。3.

8
mingdashike22 在职认证  发表于 2022-6-6 21:34:10
对数正态分布在σ值较低时表现为高斯分布,但很快就等价于幂律。这说明了为什么在操作上,关于财富分配是对数正态分布(Gibrat)还是帕累托分布(Zipf)的争论没有多少操作意义。定义1(κ度量)。让X,Xnbe i.i.d.具有有限平均值的随机变量,即E(X)<+∞. 设Sn=X+X+…+Xnbe部分和。设M(n)=E(| Sn-E(Sn)|)是n个总和与平均值的预期平均绝对偏差。定义n个额外总和的“收敛速度”,从n:κn开始,n=min(κn,n:M(n)M(n)=nn型2.-κn,n,n=1,2,…),n>n≥ 1,因此κ(n,n)=2-日志(n)-日志(n)日志M(n)M(n). (1) 此外,对于基线值n=n+1,我们使用Shorthandκn。我们还可以在约束条件下,按照类似于“本地”利率的“本地”中间值分解κ(n,n)。κ(n,n)=2-日志(n)-log(n)Pni=0 log(i+1)-日志(i)2-κ(i,i+1)。(2) 平均偏差的使用:请注意,我们使用平均绝对偏差来衡量平均值周围的分散度,以便在没有有限方差的情况下保持在范数范围内–实际上,即使在存在有限方差的情况下,在幂律制度下,分布也会产生不稳定且无信息的二阶矩。平均偏差证明在那里更加稳健。(除了峰度等于3(高斯)的狭义情况外,平均绝对偏差可以显示为更“有效”,见[4]中更长的讨论;有关其他优点,请参见[5]。)三、 稳定收敛盆地作为基准定义2(P类)。r.v.X的幂律P类(调节)定义如下:P={X:P(X>X)~ L(x)x-α} (3)其中~ 意味着rhs与lhs之比的极限为1,即x→ ∞. L:[xmin+∞) → (0, +∞) 是一个缓慢变化的函数,定义为limx→+∞L(kx)L(x)=1表示任何k>0。

9
何人来此 在职认证  发表于 2022-6-6 21:34:12
常数α>0。接下来,我们用相同的参数定义了同分布变量之和的吸引域。定义3。(稳定S类)随机变量X遵循稳定(或α-稳定)分布,符号为X~如果其特征函数χ(t)=E(eitX)的形式为:χ(t),则S(¢α,β,u,σ)=e(iut-|tσ|Иα(1-iβtan(π|α)sgn(t)))|α6=1eit(2βσlog(σ)π+u)-|tσ|(1+2iβsgn(t)log(| tσ|)π)~α=1,(4)接下来,我们定义相应的稳定▄α:▄α,(αα<2+2α≥2如果X在P2中,则为其他。(5) 关于S类的进一步讨论如下。A、 所有nand n的稳定分布的等价性≥ 稳定S类中的1,带▄α≥ 1: κ(n,n)=2- 仅仅从M(n)=nαM(1)(6)的性质来看,这简单地表明,对于高斯函数,κn,n=0。n个总和的前症状问题归结为:on=1的分布特性是什么(或从标准的现成分布开始)NSUMands的分发属性是什么κn如何→ 2.- ~α,以什么速率?B、 样本充足率区间的实际意义:作为一种简单的启发式方法,κ越高,越不相称地不充分。上述κ的任何值。15有效地表明了“正态近似”的高度不可靠性。人们可能会立即怀疑众多厚尾领域研究论文的结果。例如,表II所做的排序计算允许我们比较各种参数化下的各种分布。

10
可人4 在职认证  发表于 2022-6-6 21:34:15
(比较各种帕累托分布与symmetricFAT TAILS统计项目4表IKAPPA FOR 2 SUMMANDS,κ。分布κStudent T(α)2-2日志(2)2日志2-αΓ(α-)Γ(α)!+对数(π)指数/伽马2-日志(2)2日志(2)-1.≈ .21帕累托(α)2-对数(2)对数(α-1)2-ααα-1Rα-1.-2α(y+2)-2α-1.α-1.-y由+2(-α,1-α)-截至1年+2月(-α,1-α)!dy!异常(u,σ),带切换方差σa w.p pb。2.-日志(2)日志√qapp公司-1+σ+p-2qapp-1+σ+pqapp公司-1+σ-r2ap-1+2+4σ+√a+σ+r2ap-1+2+4σp√a+σ-(p-1) qapp公司-1+σ对数正态分布(u,σ)≈ 2.-日志(2)日志2 erfrlogeσ+1√erf公司σ√.aB.(,.)是不完整的Beta函数:Bz(a,b)=Rzta-1(1 - t) b类-1dt;erf(.)是误差函数erf(z)=√πRze-tdt。bSee附录中的注释和推导,用于切换方差和平均值,因为它可能会产生kappa的负值。表II主要结果分布κnExponential/Gamma显式对数正态分布(u,σ)无显式κnbut显式下限上限(低或高σ或n)。用PearsonIV近似表示σ介于两者之间。κ的帕累托(α)(常数)显式(所有α的下界)。学生T(α)(slowlyvarying函数)明确表示κ,α=3。学生T,当然还有高斯函数,正如我们在导言中提到的那样,统计推断所需的样本大小是由n(总和的数量)驱动的。然而,大数定律经常在惯性条件下被引用;我们需要一个严格的样本量指标。许多论文在讨论财务问题时表示[6]使用有限方差作为厚尾的二元分类:尾部指数大于2的幂律被预测为“高斯盆地”的一部分,因此允许在财务应用中使用方差和其他此类指标。一个更自然的边界是金融应用的预期的不确定性[7]。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 07:20