楼主: 何人来此
968 23

[量化金融] 使用非常细的尾部进行风险分布模型 [推广有奖]

11
kedemingshi 在职认证  发表于 2022-5-31 19:47:06
实际上,在结果稳定之前,n可能超过一百万。在这种情况下,蒙特卡罗过程可能需要一到两个小时。在大多数情况下,100000次迭代就足够了,计算需要几分钟。Peter Mitic3.3。厚尾分布关于“厚尾”分布的一个解释可以在[11,12]中找到。方程(1)给出了密度函数f(x)和随机变量的相应分布函数f(x)在参数a方面的特征。对于大x,这些函数是多项式样的,而不是指数样的。                 (1) “厚尾”分布的典型示例是对数正态分布,具有分布函数(根据正态分布函数)        ,威布尔分布函数         .密度的归一化因子。帕累托分布,      尤其麻烦,因为它几乎总是返回非常高的99.9%VaR值。使用第3.1节所示数据的“厚尾”分布获得的99.9%VaR值总是高得让人无法接受,这促使我们寻找一种替代方法。在许多情况下,资本价值比预期价值大几个数量级。LDA算法对存在中小型损失和一些非常大损失的数据使用“厚尾”分布,效果很好。累计损失有效地构成了缺少正文的分布的尾部。3.4。

12
kedemingshi 在职认证  发表于 2022-5-31 19:47:09
细尾和非常细尾分布为了将LDA算法用于累计行为风险损失,所需的分布正好与“厚尾”分布相反:即“细尾”分布。这种分布的显著特征是,在随机样本中生成极值的概率应远小于使用指数分布生成极值的概率(“低损失=高概率;高损失=低概率”标准)。“细尾”分布的第一个近似值是正态分布。这被证明是很容易做到的,但仍然导致了不合理的巨大资本价值。另一种选择是类似于正态分布的分布,但能够在随机样本中产生相对较少的非常高价值损失。同时,产生较低价值损失的可能性也相对较高。通过替换<<>> 标准正态密度中的项<<>>, 通过为x.Peter Mitict选择一个合适的区域,这种分布的密度图类似于正态分布,但对于距离平均损失很远的损失,密度图更快。这是一个很大的优势,但缺点是在随机样本中产生非常小损失的概率很小。建议的实际密度引入了一个比例参数s,由数据确定,因此非标准化密度包含<<>>.

13
何人来此 在职认证  发表于 2022-5-31 19:47:12
由此产生的密度称为Exp4分布,其形式概率密度函数f(x,s)在方程(2)中给出。             (2) 归一化因子 由Mathematica生成,f(x,s)的最终表达式需要包含适当的假设,以使结果可用。附录A显示了详细信息和示意图。所示的密度定义是表示f(x,s)的最方便的方法。指数项中的四次方确保在随机样本中生成非常高值的概率较低,而域x>0确保在随机样本中生成低值的概率较高(如附录a中的密度图所示)。方程(3)给出了相应的累积分布函数F(x,s)。       (3) 方程式(3)中f(x,s)的积分再次由Mathematica提供,这需要明确的s>0和x>0,以避免生成涉及指数积分(Mathematica中的函数ExpIntegral[])的笨拙表达式。有关适当的表达式,请参见附录A。在方程(3)中,伽马函数的双参数形式是上不完全伽马函数,. 详见【13】。Exp4密度和分布函数的形状不同于“厚尾”分布。最重要的是,“厚尾”分布通常具有接近垂直的斜率,以实现较小的损失。

14
能者818 在职认证  发表于 2022-5-31 19:47:15
Exp4distribution设置为使用比例损失:特别是每个损失除以平均损失。这种缩放确保(2)和(3)中的参数x是与所示域一致的小正实数。在本文用于数值计算的R统计语言中,上部不完全gamma函数由gamma\\u inc()函数在gsl包中实现。在R中,通常为每个概率分布定义四个函数:一个用于密度,一个用于分布,一个用于逆分布,一个用于随机数生成。按照惯例,这些函数的名称前缀分别为d、p、q和R。附录B Peter Mitic3.5中给出了Exp4集合的R实现。参数估计和拟合优度鉴于前面章节中描述的Exp4分布和数据,通常的方法是估计分布参数,并在GoF测试中使用它们来评估拟合质量。在R中,尝试使用标准最大似然法将Exp4分布拟合到总损失数据被证明是困难的。通常会返回明显不正确的参数值。这归因于在参数空间中使用梯度搜索,即使参数值发生较大变化,对objectivefunction的影响也很小。这种情况可以比作试图在几乎平坦的地形上爬山。在几乎随机的方向上搜索最优解,找到的任何“最优”解都是局部最优的。另一种方法是,使用作者的TN(“转换正态”)方法将参数优化与GoF测试相结合【14】。

15
大多数88 在职认证  发表于 2022-5-31 19:47:19
有三种TN测试,最简单的概念和实践是TN-A测试。所有这些最初都是针对累积分布函数的专用GoF测试,通过将“厚尾”分布拟合到操作风险数据中获得。TN-A测试与“传统”GoFtests(如Anderson-Darling(AD)或Kolmogorov-Smirnov(KS))相比具有以下优势。  它满足了“如果配合看起来不错,测试应该这么说”的标准。AD和KS测试被发现拒绝了直觉上很适合的分布,尤其是对于大型数据集。  它与数据点的数量无关。  这是完全确定的。  TN-A统计值(即测试的目标函数)是拟合优度的直接度量。TN-A值越小,拟合效果越好。相反,ADand KS统计值仅表明是否应拒绝无效假设。TN-A统计数据的编制方式意味着它也可以用于数据拟合方法。这是用于拟合Exp4分布以进行风险损失数据的方法,也是首次以这种方式使用TN公式。因此,以下部分解释了TN公式的基本概念。3.5.1。TN-A方法:拟合优度给定一组n个实数X={X,X,…,xn}(即合计的行为风险损失),将概率yi分配给每个损失xi,其中yi=(i-0.5)/n。概率yi是一个累积计量器Miticprobability。集合D=然后定义X的累积经验分布。要求将概率分布拟合到D。假设通常使用分布函数F(X,p)进行拟合,其中p是已确定参数的系数。

16
kedemingshi 在职认证  发表于 2022-5-31 19:47:22
如果拟合合理,叠加在F(x,p)图上的setD图应类似于图3的左侧部分。注意D点与F(x,p)定义的曲线的相对位置。在F(x,p)曲线的下方或上方有连续的点链。如果这些链中的点由直线连接,则很少有连接线穿过F(x,p)曲线。这是对实际数据的准确评估。组合L={D,F(x,p)}在[14]中被称为损失空间,因为涉及实际损失。下面将解释图3的右侧部分。将变换T应用于L中的点,由此导出概率空间(所谓的变换是基于概率度量。图3。将损失空间变换为概率空间,现在考虑映射T的影响,定义见下面的等式(4))。        (4) 在T下,D中的元素yin没有改变,只是改名为Yi。元素xiin由分布函数映射,并标记为Xi。结果是概率空间是单位平方。F(x,p)曲线总是映射到线Y=x。这使得分析概率空间中的“封闭区域”更加容易,即线Y=x和映射点T(xi,yi)之间的封闭区域,一旦它被直线段连接起来。这是图3右侧的阴影区域。计算概率空间中的“封闭面积”非常容易。它越小,越合适。这就是GoF测试的彼得·米奇顿小组的精髓所在。使用TN-a检验的数据拟合的显著性水平可以很容易地计算出来。

17
何人来此 在职认证  发表于 2022-5-31 19:47:26
【14】中的一个详细的拓扑论证最终导致了重要性水平的一个简单的二次表达式(方程式5)。在(5)中,p是概率,a(p)是“封闭区域”。             (5) 为了获得TN-a统计的p%2尾显著性水平,应在(5)中使用值p/2(表示为概率而非百分比)。例如,使用p=5/(2×100)=0.025计算5%的显著性水平,其中A(0.025)=0.0682。如果计算的“封闭面积”,, 小于0.0682,拟合“通过5%的显著性检验”。附录C.3.5.2对该短语进行了更为严格的重述。TN-A方法:参数估计现在专注于最佳拟合本身,通过为Exp4分布参数s提供值,可以构建TN-A值数组,并选择最小值。对应于最小TN-A的SCOR值,, 然后是所需的参数值。在实践中 通过从初始估计开始,然后进行有序搜索,可以找到isfound。实际上,theordered搜索很可能嵌入到函数调用中。在R中,这是函数optimize(),在Mathematica中,它的等价物是FindMinimum[]。然而,请注意,使用TN-A测试来提供最佳拟合仅在当前上下文中有效,因为只需要估计一个参数。可能,搜索双变量参数空间也会工作得相当好,但需要更长的时间。要搜索一个包含两个以上参数的参数空间,可能需要一个复杂的算法才能高效搜索。使用TN-A方法进行参数估计以及GoF会自动生成非最佳拟合,并评估拟合程度。3.6。

18
能者818 在职认证  发表于 2022-5-31 19:47:29
将包含一个术语的密度扩展到更高的x/sUse幂,会引发一个问题,即x的更高幂是否合适。在这种情况下,人们必须小心不要过度适应。或许可以找到一种更适合数据或产生更低资本值的分布,但这种分布类型可能无法很好地与其他数据集配合使用。为了观察Exp4分布对x的高次幂的扩展效果,将第3.4节中使用的相同程序应用于x的高偶数幂。Peter MiticEquations(6)和(7)分别定义了密度fn()和分布fn()函数,用于所需的推广:ExpN分布。与Exp4分布一样,Mathematica被用来推导它们。    (6)      (7) 快速检查表明,当n=4时,ExpN减少到Exp4。ExpN分布适用性的一个有用测试是考虑所选n值的99.9百分位。图4显示了6到20之间的偶数n值的这些百分位的比较,以及相应的Exp4百分位。从图4可以清楚地看出,随着n的增加,99.9%的值会减少,但减少的速度会减小。观察到n的进一步减少很小≥因此,n=12的情况是Exp4distribution的潜在竞争对手,但第5节警告不要使用它。图4:。ExpN 99.9百分位与n4的变化。结果使用算法LDA和Exp4分布计算12组合计行为风险损失的资本值。其中三个的直方图如第3.1节图2所示。

19
大多数88 在职认证  发表于 2022-5-31 19:47:32
所有十二家公司都具有相同的特点,即只有少数几家大公司亏损,没有中小型亏损。下表2列出了简单统计数据(损失数量和总额)。表2还显示了每种类型的资本值(99.9%VaR)及其TNA测试值。在上一节中,引入了参数值为n=12的ExpN分布,作为Exp4的潜在替代方案。与其将n限制为极低的值,不如考虑一个更高的值,n=100,作为无穷大的代理。因此,作为比较,表2还显示了通过拟合正态分布和ExpN分布得到的资本值,其中n=100(即n→ ∞) 到每个数据集。所示金额和大写金额以百万欧元为单位。数据集计数SumCapitalTannormal CapitalExpN(n→ ∞) 资本1876.8539.20.1101825.7516.22110.9395.30.0742673.4365.73059.4503.80.0983045.6471.22287.20.0311728.51557.13437.91390.10.0362411.51295.32039.11307.50.074158.41141.72680.9968.60.1181827.5908.72329.31617.70.0402099.21495.9787.3170.60.094871.9147.8642.21276.70.2401100.11179.91385.7993.90.0731508.0891.1391.4235.30.101450.6262.8表2。使用Exp4和正态分布的资本值鉴于数据点的数量较少,预计拟合优度通常较差。事实上,出现了一个更加乐观的结果。双尾测试的显著性水平均低于10%的水平(即每尾5%),其中许多都在5%的范围内(每尾2.5%)。这些结果表明,Exp4分布确实与数据非常吻合。有一个例外:数据集10。这只有7个总损失,而Exp4分布偏向于较低的值。在LDA随机抽样中,非常高的价值仍然很重要,这会膨胀资本价值。

20
mingdashike22 在职认证  发表于 2022-5-31 19:47:35
显然,Exp4不适合这个特定的数据集。图5显示了最佳和最差Exp4配合的密度(左手最好,右手最差)。蓝色剖面是Exp4密度,红色剖面是经验密度。Peter Mitic图5。最佳拟合和最差拟合的Exp4和正态密度比较:(LHS=最佳,RHS=最差;蓝色=Exp4,红色=经验)在图5中,“最差”拟合失败得很严重,因为经验分布是双峰的。一种可能更好的拟合方法是使用密度为(1-p)×Exp4(s)+p×Exp4(s)的Exp4混合物,其中p是范围(0,1)内的实值权重,sand是两个Exp4分布的参数。[15]中使用了混合分布的概念,但使用了正态分布。在这种情况下,每个损失由正态分布的随机样本代替。结果只是可以接受的,用Exp4分布代替正态分布是一种可行的方法。“最佳”拟合效果很好,因为概率质量的大部分落在Exp4分布的域中,该分布可以在随机抽样中产生最高的概率。“最佳”拟合很好地说明了一个分布能够很好地处理累计损失的主要标准:产生较低价值损失的高概率和产生较高价值损失的低概率。具有n的扩展分发扩展→ ∞ 在大多数情况下是可以接受的。ExpN分布的一般趋势是资本值随着n的增加而减少,TN-A测量值随着n的增加而增加,但两者的变化率都在下降。如果n>12,则下资本的增益与LDA过程中固有的随机误差相当。除数据集12外,表2中的所有大写ExpN均小于相应的Exp4大写。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-10 15:18