楼主: 可人4
2144 30

[量化金融] 最大似然估计的渐近正态性及其运算 [推广有奖]

11
可人4 在职认证  发表于 2022-5-8 22:12:40
(0,∞) 每小时都在变化∞ 指数α∈ R iflimx→∞f(tx)f(x)=所有t>0的tα。请注意,对数正态分布和威布尔分布不是规则变化的。对于尾指数α>0的规则变化F,高于α的相关随机变量的所有矩都是无界的;见[Embrechts等人,1997年]提案A.3.8(d)。因此,有规律的变化意味着重尾的一个最终特征。基于有限矩的存在,一些来源在重尾分布和“轻尾”分布之间存在差异[De Fontnouvelle等人,2007年]。在这种分类下,对数正态分布和威布尔分布是轻尾分布,因为所有矩都是有限的,而帕累托分布、对数逻辑分布和GB2分布都是有限矩,在这种用法中被认为是重尾分布。下面我们不考虑的严重性分布的一个子类来自极值理论,例如广义极值(GEV)分布。这些分布通常不通过MLE进行校准,而是使用极值理论中的方法进行校准,例如超过阈值的峰值(见[Embrechts et al.,1997])。此外,在操作风险方面,共识似乎已转向反对EVT(参见[Mignola and Ugocconi,2005]了解EVT的稳定性问题)。因此,我们将分布限制为重尾分布,其中最大似然估计是一种重要的拟合方法。

12
大多数88 在职认证  发表于 2022-5-8 22:12:43
除了极值理论分布,我们还忽略了g和h分布,尽管最近文献中对其进行了关注,因为其PDF没有封闭形式,并且最自然地通过分位数匹配来拟合数据[Dutta和Perry,2007](尽管存在极大似然拟合方法[Rayner和MacGillivray,2002])。这里考虑的分布族的支持可能会有所不同,这在拟合损失数据时会出现问题,尤其是在我们研究的拼接分布的情况下。对于帕累托分布,其中一个参数定义了支持度,这与证明MLE渐近正态性所需的假设相矛盾。因此,我们将参数设置为拼接位置T,从而使Paretodistribution成为一个单参数族。对于第二类的对数正态分布、对数逻辑分布和广义贝塔分布,支持是正实数。为了拟合拼接分布,我们隐式地处理了广义帕累托分布(GPD),因为对于重尾分布,GPD降低为帕累托分布。操作风险模型和渐近正态性7有两种标准方法:用移位或截断版本替换分布,以确保支撑包含在拼接分布的尾部区域。截断分布可能会给MLE拟合带来困难[Opdyke和Cavallo,2012],此外,生成的Fisherinformation矩阵的显式表达式更为复杂,尽管原则上可以获得[Escobar和Meeker,1998]。出于这些原因,我们只考虑这些发行版的移位版本。2.2.1. 帕累托分布。

13
何人来此 在职认证  发表于 2022-5-8 22:12:46
如上所述,帕累托分布通常被定义为一个2参数族,但由于其支持度取决于一个参数(通常称为尺度参数T),我们将其作为拼接平均分布的阈值(例如T=100000),并将帕累托分布视为取决于一个参数,即形状α,从而导致Pdf(x |α)=Tαxα+1,其中x≥ T,否则为0。为了X~ P areto(α),请注意,X的第一个动量当且仅当α>1时有界,方差仅当α>2时有界。很容易证明,对于α的所有值,帕累托分布都是可识别的,费希尔信息矩阵是标量I(θ)=I(α)=1/α,它是一个正定义矩阵(大小为1×1)。概率方程的唯一解` = 0 isbα=nPnlog(xi/T),因此不需要数值解算器来执行帕累托分布的最大似然估计。2.2.2. 威布尔分布。威布尔分布是指数分布的推广。对于形状和比例参数a,b>0,PDF isf(x | a,b)=(a/b)(x/b)a-1exp-xbA.在[Wei,2007]中,考虑了三参数Weibull分布,其中一个额外的位置参数u决定了支撑。如上所述,关于帕累托分布,最大似然估计的一个关键假设是,支撑独立于待估计的参数。

14
何人来此 在职认证  发表于 2022-5-8 22:12:49
因此,我们考虑Weibull的移位分布,这相当于设置位置参数tou=T。Weibull分布的Fisher信息矩阵为(2.2)I(θ)=I(a,b)=A.ψ(1) + ψ(2)-b(1+ψ(1))-b(1+ψ(1))ab,;参见[Gupta and Kundu,2006],但请注意参数化:一些来源将尺度参数定义为此处给出的倒数。[Smith,1985,Woodroof,1972,Akahira,1975]研究了Weibull分布的最大似然估计(MLE)特性,尽管这些工作考虑了三参数Weibull分布,其中最大似然估计(MLE)尤其有问题。结果表明,如果a≤ 1.对于1<a<2,MLE不是渐近正态的,而如果a=2,MLE是渐近正态的,但与定理2.1的方差矩阵不同。如果a>2,则渐近正态性成立(以及渐近有效性)。注意,Weibull分布是重尾分布(即次指数分布),当且仅当a<1时([Embrechts等人,1997],例如8操作风险模型和if语句的渐近正态性1.4.3),而当≥ 1) 因此,次指数威布尔分布的极大似然估计会导致不一致估计。威布尔分布的似然方程可以显式求解。如第3节(和[Larsen,2015])所示,对于我们应用最大似然估计的所有四个损失数据集,α的“真”值都小于一,从而形成无界Fisher信息矩阵。这体现在FitDistripPlus算法中,警告消息表明生成的系统是奇异的。在极大似然估计不收敛的情况下,我们放弃了参数估计。2.2.3. 对数正态分布。对数正态分布logn(u,σ)有PDFf(x |u,σ)=√2πσxexp-(日志x)- u)2σ注意,我们选择第二个参数为σ,而不是σ。

15
kedemingshi 在职认证  发表于 2022-5-8 22:12:53
这种惯例在计算Fisher信息矩阵时存在差异,即(2.3)I(θ)=I(u,σ)=1/σ0 2/σ.对数正态分布的Fisher信息矩阵是非奇异的,sincea随机变量X是对数正态的当且仅当存在一个X=exp(Y)的正态分布随机变量Y,且函数exp:R→ (0, ∞) 是一个反同构(因此,松散地说,所有涉及导数和积分的属性,对于正态分布变量都适用于对数正态分布,反之亦然)。对数正态分布也适用于所有允许值(u,σ),因为正态分布也是如此。Fisher信息矩阵是正定义的,因为它是一个带有正项的对角矩阵。与帕累托分布一样,对数正态分布的似然方程可以方便地求解,因此(bu,bσ)的确定在计算上没有问题。2.2.4. 记录物流配送。与对数正态分布一样,当且仅当存在逻辑随机变量Y,使得X=exp(Y)时,随机变量X遵循对数逻辑分布。对数逻辑分布LL(a,s)有PDF(2.4)f(x | a,s)=axsax(1+(x/s)a)用于x≥ 0,否则为零。参数a和s都必须为正。与帕累托分布一样,对数逻辑分布可以有一个无界的第一时刻,即≤ 一段时间≤ 2.方差也是无界的。X的Fisher信息矩阵~ LL(a,s)是([Shoukri等人,1988])(2.5)I(θ)=I(a,s)=3+π9a像!,这是正定义,因为a,s>0。

16
mingdashike22 在职认证  发表于 2022-5-8 22:12:56
此外,对数逻辑分布对于a>1是可识别的,这遵循上述一般策略,因为其中值为s,模式为sA.-1a+11/a,在a中严格递增,ishence内射。操作风险模型和渐近正态性9为了拟合对数逻辑分布,我们使用FitDistripPlus,它使用Nelder-Mead算法进行优化。对于初始参数值,我们采用(参见[J¨ohnemark,2012])sinit=Median(x,…,xn)ainit=log(n- 1) 对数(最大(x,…,xn)/sinit)2.2.5。第二类广义贝塔分布。GB2分布(也称为变换贝塔分布)嵌套在更一般的贝勒-帕累托分布F P(u,σ,γ,γ,γ)中,其本身嵌套了威布尔分布、对数正态分布和对数逻辑分布(以及广义帕累托分布和逆伯尔分布[Brazauskas,2002]),因此,在建模或丢失数据时,GB2分布可以对通用性(GB2)和简约性(威布尔、对数正态和对数逻辑)之间的权衡进行评估。GB2发行版有PDF(2.6)f(x)=a(x/b)ap-1bB(p,q)(1+(x/b)a)p+q,其中b(p,q)是β函数(或欧拉积分),定义为p,q>0为(2.7)b(p,q)=Ztp-1(1 -t) q- 1dt,X的第m个力矩~ GB2(a,b,p,q)是BMB(p+h/a,q-h/a)B(p,q),并且没有时刻超过aqth one[Bookstaber and McDonald,1987]。GB2分布的Fisher信息矩阵可以从Feller-Pareto分布的信息矩阵中推导出来[Brazauskas,2002]。具体来说,由于GB2(a,b,p,q)=fp(0,b,1/a,q,p),我们使用变量公式JIF PJ>的变化,其中J是坐标变化的雅可比矩阵→ 0, σ → b、 γ→ 1/a,γ→ q、 γ→ P

17
大多数88 在职认证  发表于 2022-5-8 22:13:00
写I=(Ii,j)=(Ij,I),10个操作风险模型的Fisher信息矩阵和渐近正态YGB2(a,b,p,q)分布的中心为1,1=a+apqp+q+1I1,2=-pq(ψ(p)- ψ(q))+q- pb(p+q)- 1) I1,3=q(ψ(p)- ψ(q))- 1a(p+q)I1,4=p(ψ(q)- ψ(p))-1a(p+q)I2,2=apqb(p+q+1)I2,3=aqb(p+q)I2,4=-apb(p+q)I3,3=ψ(p)-ψ(p+q)I3,4=-ψ(p+q)I4,4=ψ(q)- ψ(p+q),其中ψ(x)=Γ(x)/Γ(x)是digamma函数,其导数ψ(x)是trigamma函数。我们为GB2发行版实施自己的MLE,如下所示。我们通过隐式惩罚将p,q上的线性边界纳入似然函数,并使用NelderMead软件包最小化负对数似然函数[Bihorel and Baudin,2014]。为了获得初始参数值,我们使用了软件包GB2的伪函数[Graf and Nedyalkova,2014]。由于NelderMead通常只返回一个局部最小值,我们在另外两个参数开始值处运行最小化,通过扰动损耗数据(一个损耗上移,另一个损耗下移)并对扰动的损耗数据应用伪MLE获得。如果三个起始参数中至少有一个导致收敛解,我们取对应于最低负似然值的校准参数。在讨论结果之前,请注意定理2.1假设我们能够找到似然函数的全局最大值。对于对数逻辑分布和GB2分布,无法保证找到全局最大值。我们希望上述方法的描述将有助于使用对数逻辑分布或GB2分布的从业者判断其优化算法的效果。3.

18
nandehutu2022 在职认证  发表于 2022-5-8 22:13:03
OpVaR严重性分布的渐近正态性在本节中,我们首先在分别适用于第3.1节和第3.2节中的中等严重损失数据时,以图形和数字方式评估上述严重性分布的渐近正态性。在第3.3节中,我们将研究这对用渐近正态性近似参数置信区间有何影响。其他三组损失数据的相应结果见[Larsen,2015]。操作风险模型和渐近正态性11为了设置阶段,我们详细描述了固定损失数据集损失的模拟程序(参数boostapping)和样本量,以{pareto,Weibull,lognormal,log logistic,GB2}为单位,CDF F(x |θ)(1)用MLE将损失与distn拟合,以获得真实参数θ*(2) 对于{1,…,m}(我们取m=40000)(a)中的i,从真实分布F(x |θ)中抽取n个样本*) 为了获得bootstrapped loss lossesi(b)Fit distn to lossesiw with MLE获得bootstrapped parameters bθi,对于每个分布族和每个样本大小n,我们因此获得了参数估计的统计量。然后我们比较boostrappedparametersbθ1,n,bθm,nto定理2.1的预测。例如,对于对数正态分布,eachbθi,n将是一个包含两个分量的向量,bθi,n=(ui,n,σi,n),对于这些分量中的每一个,我们绘制相应的核密度估计(本质上是一个智能直方图;参见例如[Hastee et al.,2009],第6章),以对抗定理2.1中该分量的正态分布。继续这个例子,对应于自举ui,n的正态分布将具有方差1/(σ)*). (为了便于阅读,在下面的图中,我们将预测的正态分布集中在真实值而不是0,并移动√n到极限的右侧)。

19
mingdashike22 在职认证  发表于 2022-5-8 22:13:07
请注意,对定理2适用性的全面研究。1需要的不仅仅是我们给出的曲线图和置信区间,它只关注估计参数的边际分布。在下面的例子中,基础损失数据集由损失组成,其中19%高于10万欧元的拼接阈值。数据并不特别沉重,平均值为131560,中位数为39018,且没有超过30欧元的损失。较重损失数据的结果见[Larsen,2015]。3.1。渐近正态性的图形检验。图1-7的正态性图形测试显示了边缘参数分布的正态性是如何变化的。在“正态”方面,即使帕累托分布(图1)和对数正态分布(图4)的样本量小到100,自举参数也表现在定理2.1中。然而,对于帕累托分布,p值说明了不同的情况(见下文),对于对数正态分布,可以看到对数正态分布σ的MLE估计的小样本偏差)。在剩余的威布尔分布、对数logistic分布和GB2分布中,每种分布都显示出不同程度的偏态;分别见图3、图5、图6和图7。威布尔分布的偏度并不像其他分布那样,随着样本量的增加而减小。然而,这种行为并不奇怪,因为真正的形状参数是0。对于56,这是不一致的。图6所示的100尾损失的GB2分布给出了到目前为止的渐近正态性。3.2. 渐近正态性的数值检验。上述图形测试只考虑了边际增强参数分布(即,每个拟合参数是否如理论预测的那样独立正态分布?)。

20
可人4 在职认证  发表于 2022-5-8 22:13:10
为了验证定理2.1,我们转向正态性的数值测试。正态分布数据的假设检验作为建模工具有其优缺点,但它仍然是监管统计12操作风险模型和渐近正态分布图的一个特征。当前基于模拟数据评估定理2.1有效性的任务与拥有真实数据的通常情况截然不同。01230.75 1.00 1.25 1.50 1.75形状密度图理论(核密度)理论自举形状:N(1.12,0.113)与理论N(1.11,0.111)图1。UOM1:AN代表帕累托:真θ=(1.11),样本量1000.02.55.07.510.00.4 0.5 0.6 0.7 0.8形状密度图精神(核密度)理论自举形状:N(0.569,0.045)与理论N(0.56,0.0415)0.0e+002.5e-065.0e-067.5e-061.0e-051e+052e+053e+054e+05scaledensityDensity plotsEmpirical(内核密度)理论自举量表:N(21775141073)与理论N(21230337902)图2。UOM1:AN代表威布尔:真θ=(0.56212303.18),样本量1000020340500.54 0.560.58 0.60形状密度图理论(核密度)理论自举形状:N(0.561,0.00856)与理论N(0.56,0.0083)0e+002e-054e-05200000 225000 250000标度密度图精神(核密度)理论自举标度:N(214799547)与理论N(2123037580)图3。UOM1:AN对于Weibull:trueθ=(0.56212303.18)、样本量2500操作风险模型和渐近正态性13,在现实世界中,可以安全地假设没有大型数据集是真正正态分布的,从而降低了大型样本的正态性测试值。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-2 01:41