楼主: mingdashike22
1497 34

[量化金融] 两种确定概率密度的最大熵方法 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
73.8816
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
24862 点
帖子
4109
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
mingdashike22 在职认证  发表于 2022-5-7 04:07:48 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Two maxentropic approaches to determine the probability density of
  compound risk losses》
---
作者:
Erika Gomes-Gon\\c{c}alves (UC3M), Henryk Gzyl (IESA) and Silvia
  Mayoral (UC3M)
---
最新提交年份:
2014
---
英文摘要:
  Here we present an application of two maxentropic procedures to determine the probability density distribution of compound sums of random variables, using only a finite number of empirically determined fractional moments. The two methods are the Standard method of Maximum Entropy (SME), and the method of Maximum Entropy in the Mean (MEM). We shall verify that the reconstructions obtained satisfy a variety of statistical quality criteria, and provide good estimations of VaR and TVaR, which are important measures for risk management purposes. We analyze the performance and robustness of these two procedures in several numerical examples, in which the frequency of losses is Poisson and the individual losses are lognormal random variables. As side product of the work, we obtain a rather accurate description of the density of the compound random variable. This is an extension of a previous application based on the Standard Maximum Entropy approach (SME) where the analytic form of the Laplace transform was available to a case in which only observed or simulated data is used. These approaches are also used to develop a procedure to determine the distribution of the individual losses through the knowledge of the total loss. Then, in the case of having only historical total losses, it is possible to decompound or disaggregate the random sums in its frequency/severity distributions, through a probabilistic inverse problem.
---
中文摘要:
在这里,我们提出了一个应用两个最大熵过程来确定随机变量复合和的概率密度分布,只使用有限个经验确定的分数矩。这两种方法是标准的最大熵法(SME)和平均最大熵法(MEM)。我们将验证获得的重建满足各种统计质量标准,并提供VaR和TVaR的良好估计,这是风险管理的重要措施。我们在几个数值例子中分析了这两种方法的性能和鲁棒性,其中损失的频率是泊松分布,单个损失是对数正态随机变量。作为工作的副产品,我们得到了复合随机变量密度的一个相当精确的描述。这是之前基于标准最大熵方法(SME)的应用程序的扩展,其中拉普拉斯变换的分析形式适用于仅使用观测或模拟数据的情况。这些方法还用于开发一个程序,通过对总损失的了解来确定单个损失的分布。然后,在只有历史总损失的情况下,可以通过概率反问题分解或分解其频率/严重性分布中的随机和。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Risk Management        风险管理
分类描述:Measurement and management of financial risks in trading, banking, insurance, corporate and other applications
衡量和管理贸易、银行、保险、企业和其他应用中的金融风险
--
一级分类:Statistics        统计学
二级分类:Methodology        方法论
分类描述:Design, Surveys, Model Selection, Multiple Testing, Multivariate Methods, Signal and Image Processing, Time Series, Smoothing, Spatial Statistics, Survival Analysis, Nonparametric and Semiparametric Methods
设计,调查,模型选择,多重检验,多元方法,信号和图像处理,时间序列,平滑,空间统计,生存分析,非参数和半参数方法
--

---
PDF下载:
--> Two_maxentropic_approaches_to_determine_the_probability_density_of_compound_risk.pdf (446.72 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:概率密度 最大熵 distribution Quantitative Construction

沙发
可人4 在职认证  发表于 2022-5-7 04:07:52
确定复合风险损失概率密度的两种最大熵方法Serika Gomes Gon,calvesa、Henryk Gzylb、Silvi a Mayorala、滥用管理局、马德里卡洛斯三世大学、金融中心、IESA、Cara casSeptember 1、,2018年摘要在这里,我们介绍了两个最大熵过程的应用,以确定随机变量复合和的概率密度分布,仅使用经验确定的分数矩的有限个数。这两种方法是标准的最大熵法(SME)和平均最大熵法(MEM)。我们将验证获得的重建满足各种统计质量标准,并提供VAR和TVaR的良好估计,这是风险管理的重要措施。我们在几个数字样本中分析了这两种方法的性能和鲁棒性,其中损失的频率是泊松分布,单个损失是对数正态随机变量。作为工作的副产品,我们得到了复合随机变量密度的一个相当精确的描述。这是之前基于标准最大熵方法(SME)的应用程序的扩展,其中拉普拉斯变换的分析形式可用于仅使用观测或模拟数据的acase。这些方法还用于开发一个程序,通过对总损失的了解来确定单个损失的分布。然后,在只有历史总损失的情况下,可以通过一个概率逆问题,在其频率/严重性分布中分解或分解随机和。1简介在保险业和银行业中,了解如何计算描述累积随机损失数的复合随机变量的密度是很重要的。

藤椅
可人4 在职认证  发表于 2022-5-7 04:07:55
在银行业,这是实施高级计量方法以确定监管资本的第一步,在保险业,这是确定保险费的第一步。在这两种情况下,这类工作都需要遵守监管要求。具体来说,在这项工作中,我们假设给定时间段内的LOSS频率由S=PNj类型的复合r和OM变量描述≥0Xj,其中N是强度的泊松随机变量l, 和{Xj,对于j=1,…,N}表示独立且相同分布的单个损失。这类问题已经研究了很长一段时间,有多种技术可以解决它,例如Panjer(2006),但这里提出的技术尚未得到广泛应用。从抽象的角度来看,我们实现的最大熵方法属于从几个参数值反转拉普拉斯变换的技术。实际上,我们已经在一种情况下尝试过了,在这种情况下,拉普拉斯变换可以通过分析确定,其沿实轴的值是已知的。在Gzyl等人(2013年)中,作者应用SME方法(以及其他方法)来确定复合随机变量的概率密度,其中频率为泊松,个体损失为Γ(a,b)。在这种情况下,复合密度可以近似于任何期望的程度,并且可以比较不同的重建方法。不幸的是,当单个损失为对数范数时,复合变量的密度和拉普拉斯变换都不可用,我们必须使用数值方法。

板凳
能者818 在职认证  发表于 2022-5-7 04:07:59
这发生在许多具有实际意义的案例中,我们的例子在这方面是典型的。特别是,当单个损失服从对数正态分布时,拉普拉斯变换技术很难实现,因为首先,对数正态密度的拉普拉斯变换未知。顺便说一句,考虑一下Liepnik(1991年)在近似计算中的作用。这是不可能的,而且从一开始就需要重复使用数值方法,这就是为什么我们考虑用这个模型来描述个人损失。除此之外,对数正态分布还经常被用于模拟各类保险业务中的索赔金额,并在风险理论中用于模拟不同风险事件造成的损失。它有一个沉重的尾巴这一事实很重要,因为它允许我们考虑描述非常大的索赔的可能性,这相当于威胁保险公司或银行偿付能力的损失。这对保费、风险准备金和再保险的确定具有重要意义(Crow等人,1988年)。我们的出发点是S(N)E[E]的拉普拉斯变换-αiS]=ψ(αi)=Z∞E-αisdFS(s),i=1。。。,K、 (1)通过复合对数损失的模拟数据进行数值计算,设置Y=e-Sas是区间[0,1]中的一个变量,其密度fY(y)将由分数矩推断。首先,我们认为前面的恒等式如下ψ(αi)=E[Yα]=ZyαidFY(Y),i=1。。。,K.(2)由于FSS的分布具有点质量e-l在S=0时,为了将ψ(α)与S或Y的密度fS(S)联系起来,我们必须在{Y=1}或{S=0}条件下求出mas。为此,我们考虑条件版本[e]-αiS,S>0]=ψ(αk)- E-l1.- E-l:= u(αi),i=1。。。,K.(3)定义了u(αi),这将是最大熵方法的输入。

报纸
kedemingshi 在职认证  发表于 2022-5-7 04:08:01
一旦Fy被确定,为了恢复fS(N),我们必须应用变量y=e的变化-弯腰站f*S(N)(S)=e-sfY(e)-s) 。本文提出的两种方法也用于开发一种程序,根据总严重程度的知识来确定个人损失的分布。然后,在只有总损失的历史记录的情况下,如果损失频率模型可用(在我们的情况下是可用的),则可以分解(rto分解)损失分布,并分解单个损失的分布。这对于风险经理来说可能很有用,因为他们可能想知道个人损失的分布情况,以便应用任何特定的纠正性损失预防政策。论文的其余部分组织如下。我们在第2节简要回顾了SME和MEM方法的基本细节。此外,在第3节中,我们简要概述了用于验证所获得结果的质量和可靠性的密度评估方法。在第4节中,我们展示了使用SME和MEM方法确定总损失分布的结果。在这一点上,我们提到了SME和MEM方法已成功地应用于各种各样的问题,详情和参考文献请参见Kapur(1989)或Gzyl和Vel\'asquez(2011)。第5节致力于计算两种最常用的风险度量,即V aR和T V aR,使用最大熵密度作为损失概率密度。这对风险经理来说可能很有趣,他们考虑为运营风险损失投保,以减少资本费用。第6节专门讨论分解问题,这将在我们的程序中起到检查测试的作用。

地板
nandehutu2022 在职认证  发表于 2022-5-7 04:08:05
在第7节中,我们给出了一些结论,最后,第8节中的附录详细描述了用于分析结果质量的各种测试和图形工具。2最大熵方法下面,我们回顾了SME和MEM方法的基础,这些方法用于解决从少量分馏时刻的知识中确定总严重程度密度的问题。2.1最大熵(SME)的标准方法这是Jaynes(1957)提出的一种变分程序,用于解决(逆)问题,包括找到概率密度fY(在这种情况下为[0,1]),满足以下积分约束:对于k=0,1,…,ZyαkfY(y)dy=uy(αk)。。。,K.(4)我们设置α=0和u=1,以满足Fy(y)的自然归一化要求。直觉相当简单:满足(4)的概率密度类是凸的。一个人可以通过最大化(或最小化)一个凹(凸)函数(entr opy)在该类中获得最大值(最小值),从而在该类中找到一个点。这个极值点就是问题的“最大熵”解。实际上,需要一个标准的计算才能看出,当问题有了解决方案时,它是F型的*K(y)=exp-KXk=0λ*kyαk!(5) 其中矩的数量K显式出现。书写通常是一种习惯-λ*= Z(λ)*)-1,其中λ*= (λ*, ..., λ*K) 是一个K-维向量。显然,归一化因子的一般形式由z(λ)=Ze给出-PKk=1λkyαkdy。(6) 用这个符号,解的一般形式看起来像*K(y)=Z(λ)*)E-PKk=1λ*kyαk=e-PKk=0λ*kyαk.(7)要完成,仍然需要指定向量λ*可以找到。

7
kedemingshi 在职认证  发表于 2022-5-7 04:08:08
因此,我们必须最小化对偶熵:∑(λ,u)=lnz(λ)+hλ,uYi(8),其中ha,bi表示标准的欧几里德标量乘积,u表示K-分量为uk的向量,显然,对α的依赖性是通过uY来实现的。2.2均值最大熵法(MEM)MEM提供了另一种有趣的方法来解决确定Fy(Y)的问题,从而使方程(2)成立。可以总结为,它包含一种技术,以获得fY(y)或其离散化版本,作为由熵最大化过程确定的辅助概率分布的预期值。要以数字方式实现MEM,第一步包括将问题离散化。这导致了一个方程组,如:MXj=1Ai,jxj=ui,i=0,1。。。,带xj的K≥ 0和j=1。。。,这里我们设置了xj=(1/N)f((j)- 1) /M)和Ai,j=(2j)-12M)αi,对于j=1,。。。,M.离散化模型定义xjcomes前的第一个因素≈ 1/M和Ai,作为所选分区的yαi的中点近似值。通过选择α=0,我们有一个dded异常化约束。注意,对于这个选项,我们有A0,j=1,对于j=1。。。,M和pmj=0xj=u=1作为标准化条件f或α=0。如果我们有一个K+1的未知量,那么我们把它看作是一个200个未知量的系统。实际上,原来的问题是由K+1方程组成,用来确定一个连续函数,所以从维数的角度来看,离散化似乎是一种改进。为了继续,为了考虑积极性约束,我们考虑一个空间Ohm = [0, ∞)M及其Borel集F。用ξ=(ξ,…ξM)表示Ohm 并定义坐标图Xj(ξ):Ohm → [0, ∞) 由Xj(ξ)=ξj。

8
nandehutu2022 在职认证  发表于 2022-5-7 04:08:11
在(Ohm, F) 我们放置一个参考测量值dQ(ξ),并搜索一个测量值P<Q,使得mxj=1Ai,jEP[Xj]=uifor 0=1。。。,K.(10)测度Q的选择取决于建模者,它可能被认为是P的初始值。对它的唯一限制是由其支撑生成的凸包是Ohm. 严格地说,关于ρ的任何条件都是正的Ohmξjρ(ξ)dξ∈ [0, ∞),也就是说,正性约束是自动满足的。其他约束将由P的一个特殊cho ice来实现。在上面没有引入任何条件的情况下,我们注意到概率类P={P<<Q以至于(10)成立}是一个凸的闭集,如果不是空的,我们假设是这样。在这个集合中,我们定义了entr opy函数sq(P)=-ZOhmρ(ξ)ln(ρ(ξ))dQ(ξ)当积分为有限或∞ 否则找到P*∈ 使SQ(P)最大化的P。(11) 从现在开始,例行程序与上一节基本相同。很明显,theMEM将中小企业作为垫脚石。问题是类似的,但在另一个设置中。一般解决方案为ρ型*(ξ) =Z(λ)*)E-H在λ处*,ξi(12) 在哪里,再一次λ*通过最小化对偶熵函数∑(λ,u)=Z(λ)+hλ,ui,(13)得到,其中,回想一下,λ是一个K维向量,而u是约束定义的K维向量(9)。此时,函数Z(λ)由Z(λ)=Z定义OhmE-H在λ处*,ξidQ(ξ)。以下结果是Borwein和Lewis(2000)第4章中所述对偶理论的简化版本。它为与下面两个例子相对应的计算提供了坚实的基础。定理1。假设inf∑(λ,u)是在n个内点λ上实现的*关于{λ∈RK|Z(λ)<∞}.

9
mingdashike22 在职认证  发表于 2022-5-7 04:08:15
在这种情况下,概率P*解(11)有密度ρ*(ξ) 由(12)和sq(P)给出*) = Σ(λ*, u).在下一节中,我们将在一个特定的设置中说明MEM。基本思想是,根据上文所述确定的概率,将xjare估计为预期值。2.2.1泊松参考测度参考测度我们使用泊松测度的乘积,即我们取q(dξ)=e-ηXk≥0ηkk!{k}(dξ)。这里我们用{a}(dξ)来表示a处的单位点质量(狄拉克δ)。当然,非负整数的凸函数是[0,∞). 注意nowZ(λ)=MYj≥0exp- η1.- E-(Atλ)j由此我们得到∑(λ)=-ηMXj-1.1.- E-(Atλ)j+ < λ、 注意现在如果λ*最小化t表达式,则(9)的估计解为isx*j=e-(在λ处)*)j(14)不要忘记上面,在λj=Pi=0λiAi,j.R ecall以及A0,j=1表示j=1。。。,M.AsPMj=0x*(j) =1,我们可以重写asx*j=e-(^At^λ)*)jz(^λ)*)(15) 其中,我们将^A定义为通过删除第0行从A获得的矩阵,将^λ定义为第8行-通过删除λ得到的维数向量。要完成,z(^λ)*) = E-λ=MXj=1e-^At^λ*j、 还记得x吗*j=(1/M)f*Y((j)-1) /M),由此我们确定f*Y(Y)近似为插值。3重建质量一旦确定了密度,就有必要测试它是否与数据一致。评估过程本质上是一个统计问题,涉及到对包含观察值和估计值的数据集进行探索、描述和推断。在这里,我们描述了一系列测试,并在附录中进一步详细介绍了这些测试。评估重建质量的探索性测试包括通过使用可靠性和校准图等图形工具进行视觉比较,这些图形工具测量估计值与观测数据之间的一致性。

10
大多数88 在职认证  发表于 2022-5-7 04:08:18
可靠性图(通常称为QQ图)用于通过最大熵分布的量子位与对角线的接近程度来确定IT的质量,近似值越接近越好。一个类似的工具是边缘校准图,它是F的图形*S(sj)-Fn(sj)与总损失{sj|j=1,…,n},其中F*S(·)是重建的最大熵密度的累积分布函数,Fn(·)是损失S的观测或经验分布函数。这里,关于零的微小波动意味着观测和最大熵估计具有相同(或几乎相同)的边缘分布(见附录)。在评估结果时,还考虑了数值比较。其中,我们计算了密度与观测数据柱状图之间的距离。这些距离由byL=G计算得出-1Xk=0Zbk+1bk | f*S(S)- fn(s)| ds+Z∞bG | f*S(S)| dsL=VuTG-1Xk=0Zbk+1bk(f*S(S)- fn(s))ds+Z∞bG(f)*S(S))d其中bk和bk+1是histogra m中箱子的边界,G是分区或箱子的数量,f*Sis是最大熵(重建)密度,Fn是从柱状图中获得的密度(即(存储单元k中的频率)/(数据集的大小))。这种方法的缺点是依赖于直方图的位置和箱子的数量。此外,我们还将平均绝对误差(MAE)和均方根误差(RMSE)视为最大熵方法得到的分布函数与观测数据之间的误差度量。这些计算如下:MAE=nnXj=1 | f*S(sj)- Fn(sj)| RMSE=vuutnnXj=1(F)*S(sj)- Fn(sj))其中F*S(sj)是最大熵过程的分布函数,Fn(sj)是观测数据的分布函数(Hyndman等人,2006)。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-28 17:49