楼主: 可人4
2146 30

[量化金融] 最大似然估计的渐近正态性及其运算 [推广有奖]

21
kedemingshi 在职认证  发表于 2022-5-8 22:13:15
在目前的情况下,我们也知道我们的40000个自举参数不是正态分布的,但如果定理2.1成立,那么增加样本量(即假设损失数据的大小)将减少对正态性假设的拒绝,或者,等效地,更大的p值。对于帕累托分布,我们使用了在nortest[Gross and Ligges,2015]中实现的安德森-达林测试。与Shapiro-Wilk测试不同,该测试具有适用于所有样本大小的优势。除2500个样本外,所有p值均与0(即小于10)无法区分-12). 对于2500个样本量,p值为2.28e- 09.对于剩余的多变量分布,我们使用MVN中实施的Mardia测试[Mardia,1970][Korkmaz等人,2014]。与Anderson-Darling检验不同,Mardia检验分别检查偏度和峰度。唯一的偏p值大于10的分布-15是对数正态分布。其p值如表1所示,其中,我们发现典型的5%显著水平不会拒绝样本大小1500和2500.0.00.51.01.52.010.5 11.0 11.5 12.0平均密度图理论自举平均对数:N(11.3,0.18)与理论自举平均对数:N(11.3,0.18)01231.50 1.75 2.25平均密度图理论自举平均数:N(1.78,0.128)对理论N(1.8,0.127)图4。UOM1:AN表示对数正态分布:真θ=(11.3,1.8),样本量1000123450.75 1.00 1.25 1.50形状密度图精神(核密度)理论自举形状:N(1.01,0.0867)与理论N(1,0.0837)0e+001e-052e-0560000 90000 120000 150000标度密度图精神(核密度)理论自举标度:N(8538814958)与理论N(8400014531)图5。

22
可人4 在职认证  发表于 2022-5-8 22:13:19
UOM1:AN对数逻辑:真θ=(184000),样本量10014操作风险模型和渐近正态性峰度检验导致GB2分布的p值基本为0。其他分布的峰度p值如表2所示。5%的显著性水平将无法拒绝对数正态分布的正态假设,以及1000和1500样本量的对数逻辑分布。0.000.250.500.750 1 2形状密度密度图理论(核密度)理论自举形状1:N(2.13,6.58)与理论N(0.837,0.593)0e+002e-064e-066e-060e+00 1e+05 2e+05 3e+05 4e+05标度密度图理论自举比例:N(9.13e+10,1.2e+13)vs理论N(11751789101)0.00.20.40.60 1 2 3 4形状密度图理论自举形状2:N(2.08,8.34)vs理论N(1.18,1.23)0.20.40.50 2 4形状密度图plotsEmpirical(内核密度)理论自举形状3:N(25250232661)与理论N(1.45,1.65)图6。UOM1:AN代表GB2:trueθ=(0.837,117516.887,1.184,1.454),样本量10001230.6 0.9 1.2 1.5形状密度图理论(核密度)理论自举形状1:N(0.869,0.13)与理论N(0.837,0.119)0.0e+005.0e-061.0e-051.5e-052.0e-051e+052e+053e+05scaledensity Density plotsEmpirical(内核密度)理论自举量表:N(11880919350)与理论N(11751717820)0.00.51.01.51 2形状密度plotsEmpirical(内核密度)理论自举形状2:N(1.17,0.268)与理论N(1.18,0.247)0.00.51.02形状密度plotsEmpirical(内核密度)理论自举形状3:N(1.44,0.363)对理论N(1.45,0.33)图7。

23
能者818 在职认证  发表于 2022-5-8 22:13:22
UOM1:AN对于GB2:trueθ=(0.837,117516.887,1.184,1.454),样本量2500操作风险模型和渐近正态性15威布尔分布是最明显不符合Reom 2.1假设的分布,因此峰度p值不单调增加也就不足为奇了。对于对数正态分布,峰度p值随样本数增加而单调增加的预期并不明显。这种行为可能是由于这样大的数据集的数值不稳定造成的。表1。每个样本大小的Mardia斜p值100 200 300 500 1000 1500 2500对数正态分布0.01 0.03 0.03 0.17 0.32 0.26表2。每个样本大小的马迪亚峰度p值100 200 300 500 1000 1500 2500威布尔0.00 0.00 0.00 0.00 0.02 0.00 0.00对数正态0.70 0.44 0.88 0.36 0.81 0.70 0.57对数逻辑0.00 0.00 0.00 0.00 0.00 0.00 0.55 0.36 0.00与本节中给出的p值相比,下一节将讨论定理2.1是否适用于研究常用的正态近似估计参数置信区间的有效性。3.3. 近似参数置信区间。现在,我们来看看导言中的问题2,关于使用定理2.1来近似参数置信区间。有几种方法可用于评估损失数据严重性分布的优度。我们在这里关注的一个直接来自渐近正态性。假设定理2.1成立,则MLE拟合参数正态分布在“真”(即拟合)参数附近,协方差矩阵由Fisher信息矩阵确定(见第2.1节)。然而,正如我们已经看到的,对于小样本的操作风险数据,这种正常假设是有问题的。

24
能者818 在职认证  发表于 2022-5-8 22:13:26
在本节中,我们将量化结果置信区间误差。下表显示了使用该近似值相对于增强参数分位数获得的“真实”95%置信区间的误差百分比,即我们比较了40000个自举参数的97.5%分位数和2.5%分位数与定理2.1规定的正态分布的相同分位数差异。表3中的结果反映了从图中可以看到的情况:对于帕累托分布、对数正态分布和对数逻辑分布,通常近似的95%密度区间在真实值的几%以内,而威布尔分布和GB2分布的近似值相对较差。对于GB2,正常近似置信区间在给定足够数据(2500损失)的真实置信区间的10%以内。随着样本量的增加,威布尔分布的近似值变得更糟,这一现象也可以从图2和3.16操作风险模型以及渐近正态性表3中看出。由样本大小的渐近正态性得出的95%置信区间的误差百分比100 200 300 500 1000 1500 2500帕累托形状2%1%0%0%1%0%-1%威布尔形状8%7%7%6%6%5%6%威布尔尺度9%8%9%10%13%16%22%对数正态平均值0%1%0%0%0%0%0%0%0%0%-1%0%对数逻辑形状3%1%0%0%0%0%0%0%0%0%0%0%0%0%-1%对数逻辑尺度2%1%1%1%0%1%1%1%GB3121%15%11%8%7%GB2量表79%78%73%61%31%17%7%GB2形状2 43%50%50%45%26%15%6%GB2形状3 43%55%58%53%30%17%7%操作风险模型和渐近正态性174。结论这里考虑的唯一渐近正态分布是对数正态分布,即使对于典型的运营损失数据样本量也是如此。回想一下,它的最大似然估计,以及帕累托分布,可以通过分析(即。

25
能者818 在职认证  发表于 2022-5-8 22:13:29
解一个简单的方程)。更一般地说,定理2.1的所有关键假设都可以有效地验证对数正态分布。渐近正态性也为MLE参数置信区间提供了非常好的近似值,所有样本大小的误差不超过1%。帕累托分布和对数逻辑分布的表现类似,通常近似的置信区间导致误差不超过3%。然而,与对数正态分布相反,Paretosape参数的Anderson-Darling p值表明所有样本量的正态假设均被拒绝。第二类广义贝塔分布(GB2)的渐近正态性检验最差。当涉及理想的MLE特性和置信区间时,仅应非常谨慎地使用此分布。更有趣的“表现不佳”是威布尔分布。在第二节中,我们证明了当威布尔分布不一致时,它是次指数分布。渐近正态性的图形和数值测试证实了这个问题。随着尺度参数样本量的增加,MLE置信区间的正态近似误差甚至变得更糟。

26
nandehutu2022 在职认证  发表于 2022-5-8 22:13:33
尽管这些分析给出了有关Weibull和操作风险严重度分布的MLE特性的明确警告信号,但我们将在[Larsen,2016]中显示,与其他分布相比,其作为样本大小函数的稳定性特性是好的。使用渐近正态性来近似参数置信区间的总体积极结果也应在更广泛的操作风险建模背景下考虑,尤其要详细说明我们的模拟研究所做的假设,以及这与实际损失数据的关系。参数自举的定义与MLE的一个关键假设相兼容,即数据是独立且相同分布的,因为自举的数据样本是独立于单个“真实”分布的。这些假设对实际损失数据的适用性受到质疑,而对MLE上不独立且分布相同的损失数据产生的影响是[Opdyke and Cavallo,2012]关注的焦点。运营风险文献在这个问题上并不一致,但ORX lossdata财团的定期评估为这一假设提供了普遍支持[Cope and Antonini,2008,Analytics,2012]。除了大样本量的假设外,我们还调查了关于分布的假设。然而,众所周知,即使在不满足理论假设的情况下,MLE也可以显示渐近正态性(参见[Smith,1985])。笼统地说,这些假设是证明结果所必需的,但不一定能使结果成立。对于其中三种分布(帕累托分布、对数正态分布和对数逻辑分布),我们发现理论和模拟之间的一致性很高,即使样本量很小。

27
可人4 在职认证  发表于 2022-5-8 22:13:37
第二类广义贝塔分布的渐近正态性假设很难验证。我们还隐式假设了标准MLE要求,即我们知道“真实”的基础分布。拟合方法对误判的18个操作风险模型和渐近正态模型(即选择错误的“真实”分布)的鲁棒性本身就是一个研究主题;西。g、 [Ergashev,2008,Opdyke和Cavallo,2012].5。利益声明和确认本文中表达的观点是作者的观点,并不反映安联SE或德意志银行股份有限公司的观点。只有作者对论文的内容和写作负责。这项研究是在我受雇于德意志银行时进行的。很高兴感谢Michael Kalkbrener,感谢他对本项目的支持和对整个项目的投入。我想对法比奥·皮亚琴扎表示感谢,他为我提供了许多见解和有益的改进建议。我还要感谢J¨org Fritscher、海德尔·海德尔、蔡仁林和格里戈里·廷琴科提供的有用的对话和建议。感谢您允许我使用运营风险数据交换协会(ORX)提供的损失数据,并感谢ORX的卢克·卡里克对我的支持和反馈。参考文献[Akahira,1975]Akahira,M.(1975)。非正则情形下位置估计的渐近理论,I:一致估计的收敛阶。统计应用研究报告,日本科学家和工程师联合会,22(1):8-26。[AMA集团,2013]AMA集团,R.M.A.(2013)。AMA量化挑战:关于“棘手的LDA主题”的大量实践和观察。技术报告,运营风险顾问。[Analytics,2012]Analytics,O.(2012)。相关性分析。

28
nandehutu2022 在职认证  发表于 2022-5-8 22:13:41
技术报告,ORX联合体。[Bihorel and Baudin,2014]Bihorel,S.and Baudin,M.(2014)。neldermead:Scilabneldermead模块的R端口。R软件包版本1.0-9。[Bookstaber and McDonald,1987]Bookstaber,R.M.and McDonald,J.B.(1987)。描述证券价格回报的一般分布。《商业杂志》,第401-424页。[Brazauskas,2002]Brazauskas,V.(2002)。费舍尔信息矩阵-帕累托分布。《统计与概率通讯》,59(2):159-167。[Cope and Antonini,2008]Cope,E.and Antonini,G.(2008)。在ORX财团数据库中观察到运营损失之间的相关性和依赖性。操作风险杂志,3(4):47-74。[Cope等人,2009]Cope,E.W.,Mignola,G.,Antonini,G.,和Ugoccioni,R.(2009)。从损失数据中衡量运营风险的挑战和陷阱。操作风险杂志,4(4):3-27。[Cox and Hinkley,1979]Cox,D.R.and Hinkley,D.V.(1979)。理论统计。华润出版社。[De Fontnouvelle等人,2007]De Fontnouvelle,P.,Rosengren,E.,和Jordan,J.(2007)。其他操作风险建模技术的影响。《金融机构的风险》,第475-512页。芝加哥大学出版社。[Delignette Muller等人,2013]Delignette Muller,M.L.,R.Pouillot,J.-B.丹尼斯和C.杜唐(2013)。fi tdistrplus:帮助将参数分布定义为非审查或审查数据。R软件包版本1.0-1。[Dutta and Perry,2007]Dutta,K.and Perry,J.(2007)。《尾巴的故事:估计操作风险资本的损失分布模型的实证分析》。技术报告,波士顿工作文件FRB。可在https://www.bostonfed.org/economic/wp/wp2006/wp0613.htm.[Embrechts等人,1997]Embrechts,P.,吉隆坡,C.,和Mikosch,T.(1997)。《保险和金融极端事件建模》,第33卷。斯普林格。[Ergashev,2008]Ergashev,B。

29
mingdashike22 在职认证  发表于 2022-5-8 22:13:46
(2008). 风险经理在量化操作风险时是否应该依赖最大似然估计方法?可通过SSRN 1075249获得。[Escobar and Meeker,1998]Escobar,L.A.and Meeker,W.Q.(1998)。具有截尾、截断和解释变量的Fisher信息矩阵。中国统计局,8(1):221-237。[Frachot等人,2004]Frachot,A.,Moudoulaud,O.,和Roncali,T.(2004)。实践中的损失分配方法。《巴塞尔手册:金融从业人员指南》,第527-554页。操作风险模型和渐近正态性19[Graf和Nedyalkova,2014]Graf,M.和Nedyalkova,D.(2014)。GB2,第二类广义贝塔分布:性质,可能性,估计。R软件包版本2.1。[Greene,2011]Greene,W.(2011)。经济计量分析。培生教育。[Gross and Ligges,2015]Gross,J.and Ligges,U.(2015)。MVN:用于评估多元正态性的R包。,1.0-4版。[Gupta和Kundu,2006]Gupta,R.D.和Kundu,D.(2006)。关于Weibull分布和GE分布信息的比较。《统计规划与推理杂志》,136(9):3130–3144。[Hastine et al.,2009]Hastine,T.,Tibshirani,R.,和Friedman,J.(2009)。统计学习的要素,第2卷。斯普林格。[J–ohnemark,2012]J–ohnemark,A.(2012)。运营风险建模。硕士论文,KTH。[Korkmaz等人,2014]Korkmaz,S.,Goksuluk,D.,和Zararsiz,G.(2014)。Mvn:用于评估多元正态性的r包。R期刊,6(2):151-162。[Larsen,2015]Larsen,P.(2015)。“小样本操作风险模型和最大似然估计误差”附录。可在https://pavellarsen.wordpress.com/publications/.[Larsen,2016]Larsen,P.(2016)。小样本操作风险模型的稳定性和最大似然估计。预印本。[Le Cam,1970]Le Cam,L.(1970)。

30
大多数88 在职认证  发表于 2022-5-8 22:13:49
关于证明极大似然估计渐近正态性的假设。安。数学统计学家。,41(3):802–828.[Leisch,2002]Leisch,F.(2002)。第一部分:混合乳胶。R新闻,2(3):28-31。[Leisch,2003]Leisch,F.(2003)。Sweave,第二部分:套餐小插曲。R新闻,3(2):21-24。[Mardia,1970]Mardia,K.V.(1970)。多元偏度和峰度的度量及其应用。Biometrika,57(3):519-530。[Mignola and Ugoccioni,2005]Mignola,G.and Ugoccioni,R.(2005)。极值理论的检验。操作风险,6(10):32-35。[Opdyke and Cavallo,2012]Opdyke,J.D.and Cavallo,A.(2012)。估计运营风险资本:截断的挑战,MLE的危害,以及稳健统计的前景。操作风险杂志,7(3)。[Piacenza and Sordi,2014]Piacenza,F.and Sordi,A.(2014)。严重性分布选择标准:UniCredit AMA模型。ORX分析工作组会议。[R核心团队,2014]R核心团队(2014)。R:用于统计计算的语言和环境。R统计计算基金会,奥地利维也纳。[Rayner和MacGillivray,2002]Rayner,G.D.和MacGillivray,H.L.(2002)。g-and-k分布和广义g-and-h分布的数值极大似然估计。统计与计算,12(1):57-75。[Resnick,2007]Resnick,S.I.(2007)。重尾现象:概率和统计建模。斯普林格。[Shoukri等人,1988]Shoukri,M.M.,Mian,I.U.H.,和Tracy,D.S.(1988)。对数logistic分布估计量的抽样性质及其在加拿大降水数据中的应用。加拿大统计杂志,16(3):223-236。[Smith,1985]Smith,R.L.(1985)。一类非正则情形的极大似然估计。Biometrika,72(1):67-90。[Wald,1943]Wald,A.(1943)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 01:45