楼主: 何人来此
1017 13

[量化金融] 广义线性模型在精算框架中的应用 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.8012
学术水平
1 点
热心指数
6 点
信用等级
0 点
经验
24593 点
帖子
4128
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
何人来此 在职认证  发表于 2022-5-26 23:06:29 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Application of the Generalized Linear Models in Actuarial Framework》
---
作者:
Murwan H. M. A. Siddig
---
最新提交年份:
2016
---
英文摘要:
  This paper aims to review the methodology behind the generalized linear models which are used in analyzing the actuarial situations instead of the ordinary multiple linear regression. We introduce how to assess the adequacy of the model which includes comparing nested models using the deviance and the scaled deviance. The Akiake information criterion is proposed as a comprehensive tool for selecting the adequate model. We model a simple automobile portfolio using the generalized linear models, and use the best chosen model to predict the number of claims made by the policyholders in the portfolio.
---
中文摘要:
本文旨在回顾用于分析精算情况的广义线性模型背后的方法,而不是普通的多元线性回归。我们介绍了如何评估模型的充分性,包括使用偏差和缩放偏差比较嵌套模型。Akiake信息准则被提出作为选择适当模型的综合工具。我们使用广义线性模型对一个简单的汽车投资组合进行建模,并使用最佳选择模型预测投资组合中投保人的索赔数量。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--

---
PDF下载:
--> Application_of_the_Generalized_Linear_Models_in_Actuarial_Framework.pdf (362.16 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:广义线性模型 线性模型 Quantitative Applications Econophysics

沙发
可人4 在职认证  发表于 2022-5-26 23:06:34
广义线性模型在精算框架中的应用MURWAN H.M.A.SIDDIGSchool of Mathematics,Faculty of Engineering Physical Science,University of Manchester,OxfordRoad,Manchester,M13 9PL,英国MURWAN_siddig@hotmail.comAbstract-本文旨在回顾广义线性模型背后的方法,这些模型用于分析精算情况,而不是一般的多元线性回归。我们介绍了如何评估模型的充分性,包括使用偏差和标度偏差比较嵌套模型。Akiake信息准则是一种综合性的模型选择工具。我们使用广义线性模型对一个简单的汽车投资组合进行建模,并使用最佳选择模型预测投资组合中投保人的索赔数量。关键词Akiake信息准则、汽车、红利、指数族、线性回归、残差、标度偏差。一、 在精算情况的调整和分析中引入普通的多元线性回归可能具有局限性,因为它假设责任变量仅服从正态分布,这在实践中并不方便。广义线性模型假设响应变量的分布更为一般,这使得精算情况建模更为可行。广义线性模型对普通多元线性回归的推广有两个方面。我们主要兴趣的变量我们试图解释的是,允许有任何属于指数分布的分布,而不仅仅是正态分布。

藤椅
mingdashike22 在职认证  发表于 2022-5-26 23:06:40
如果分布的概率质量/密度函数可以用以下形式表示,则该分布可以是指数族的一员:        (2) 其中a;b和c是给定的函数。此外 和 是参数。特别是, 被称为naturalparameter,它是感兴趣的主要参数。此外 在确定y的平均值时至关重要。 被称为离散参数,它对确定方差至关重要。  是一个仅依赖于.    是一个仅依赖于.  是一个依赖于和y,但不是.  此外  不影响y的最大可能性  .  更多信息见(14)。示例1:Let概率质量函数:                   (3) U可重写为:        (4) 在哪里  和  此外,这意味着 此外  是link函数(canonicallink),用于查找我们编写的 作为的函数.  因此 (日志链接功能)。备注1:广义线性模型的一个非常重要的特征是,我们可以使用乘法模型,而不必像普通的多元线性回归那样使用加法模型。假设我们有.  在创建广义线性模型时,我们将修复.因此, 也就是说可以解释为观测值i=1和j=1的预期值。

板凳
大多数88 在职认证  发表于 2022-5-26 23:06:43
这样做的原因是为了避免所谓的“虚拟陷阱”或“多重共线性”,这是一个在以下情况下出现的问题: 和一个因素,如 或 存在于模型中。换句话说,当模型中的两个或多个预测变量高度相关时。只需删除每个类别变量的一个级别,或者删除截距项,就可以解决这个问题。更多信息见(6)。三、 菲塔之善。一般来说,为了找到一个能充分拟合数据的模型,其中观测值与预测值相差不大,我们查看残差。残差越小,模型越好。残差最小的模型是所谓的“完整模型”,每个观测值都有自己的参数,模型只是重复数据,而不是预测数据。残差最大的模型是所谓的“零模型”,其中模型将y的所有变化归因于一个常数项,而不考虑附带数据。空模型过于粗糙,完整模型的参数太多,无法实际使用。最优模型介于这两个极端之间。为了检查残差,我们查看偏差D或标度偏差.在本文中,我们将使用标度偏差。如果我们拒绝了无效假设: 剩余偏差不大,就残差而言,模型良好,其中卡方检验值是否处于显著性水平  和p参数。如果不是,则为。我们还通过做另一个假设检验来观察估计参数的重要性。B

报纸
mingdashike22 在职认证  发表于 2022-5-26 23:06:46
比较嵌套模型通过检查残差和参数的显著性来拟合广义线性模型后,我们可以对模型进行一些改进。例如,如果我们使用加性模型,我们可以添加一个相互作用项,或者我们可以消除一些参数。这是通过使用所谓的“标度偏差变化”来实现的 , 哪里是新模型的比例偏差,以及是旧模型的缩放偏差。如果 式中,Q是新模型的参数数量与旧模型的参数数量之差,则新模型被拒绝。如果不是,则为。C、 模型选择的综合标准我们很可能最终得到几个嵌套模型,其中包含或排除一个参数会导致另一个模型。新参数的加入通常会减少残差。尽管如此,出现的复杂性在于评估残差的减少是否证明了新参数的加入是合理的。这可以通过使用Akiake信息标准(AIC)来解决。最好的模型是AIC最小的模型。四、 在本节中,我们将提出一个通用的线性模型来分析simpleautomobile投资组合。假设我们观察了一些虚构的汽车保险组合中的驾驶员,并记录了这些投保人在7年内产生的索赔数量。此外,我们还根据危险因素性别、地区、工作类别和汽车类型对驾驶员进行了分类。表I投资组合中观察到的索赔数量和风险敞口我们的主要目的是制定投资组合的费率。因此,我们希望预测每个保单持有人预计提出的索赔数量。

地板
能者818 在职认证  发表于 2022-5-26 23:06:49
说明so的技术是通过估计每个风险因素的参数,将年度索赔频率与风险因素联系起来。为了建立建议的广义线性模型的符号,我们让被观察的投保人在ijkl单元格中提出的索赔数量,其中,i、j、k和l连续表示风险因素的不同级别,包括性别、地区、CAR类型和职业类别。此外,一般来说,  哪里,  是单元格ijkl中的保单持有人进行aclaim的概率,N是投资组合中的保单持有人总数,以及是单元格ijkl中面临风险的保单持有人数量。尽管如此,因为大且很小,我们要用泊松分布来近似这个二项分布,这样~泊松分布()  具有aLog链接功能 (见示例1),如袁,J(2014)所示。因此,我们将使用的广义线性模型是:        (5) 但是  这意味着  我们将首先推出的第一款车型是Fit1:    (6) 在哪里 是截距项,这些参数连续代表风险因素性别、地区、车型和工作。使用R拟合模型,我们得到了表II所示的结果。表II模型FIT1的参数估计另外,我们得到53个自由度的零偏差为104.73。

7
能者818 在职认证  发表于 2022-5-26 23:06:53
46个自由度的残差偏差为41.93,AIC为288.24。为了检验残差,我们做了一个假设检验:残差偏差不大,就残差而言,模型很好。:  否则自从=41.93关于46个自由度,然后. 因此,我们没有证据可以拒绝在5%的显著性水平上,就残差而言,该模型是良好的。此外,为了测试参数的显著性,我们查看其表II中的数值。我们可以看到,参数sex2、job2和job3在5%的显著性水平上是不显著的,因为它们值大于0:05。因此,它们可以从模型中删除。然而,同时放弃这两个项目可能有风险。因此,在新提出的Fit2模型中,我们只会降低风险因素的性别。因此,Fit2是:   (7) 使用R拟合模型,我们得到了表III中所示的结果。此外,我们还得到,53个自由度的零偏差为104.732,47个自由度的剩余偏差为43.755,theAIC为288.06。表II模型FIT2参数的估计为了检查残差,我们进行了与我们在测试模型Fit1时相同的假设测试。: 残差并不是很大,就残差而言,模型是好的。:否则自从=  43.755,47度自由度,然后.因此,我们没有证据可以拒绝在5%的显著性水平上,就残差而言,该模型是良好的。为了测试这些参数的重要性,我们看一下它们表III中的数值。

8
大多数88 在职认证  发表于 2022-5-26 23:06:56
我们可以看到,风险因素工作的参数在5%显著性水平上仍然不显著,因为值大于0.05。因此,它们可以从新提出的模型Fit3中删除:  (8) 使用R拟合模型,我们得到了表IV所示的结果。表I估计了模型Fit3的参数。此外,我们得到,53个自由度的零偏差为104.73,49个自由度的剩余偏差为44.94,AIC为285.25。为了检查残差,我们进行了与测试Fit1和Fit2相同的假设测试。: 就残差而言,残差偏差并不大,模型也很好。:  否则自从  在49度的自由度上因此,我们没有证据可以拒绝在5%的显著性水平上,就残差而言,该模型是良好的。此外表IV中的值我们可以看到,模型Fit3中的所有参数在5%显著性水平下均具有显著性。同样的结果也可以用theAIC值推断出来。自从那么最好的型号是Fit3。尝试看看重大风险因素之间是否存在任何相互作用也是非常有启发性的,这些因素包括地区和车型。

9
能者818 在职认证  发表于 2022-5-26 23:06:59
这可以通过添加一个相互作用项来实现新提出的模型Fit4是:   (9) 使用R拟合模型,我们得到了表V中所示的结果。此外,我们还得到,53个自由度的零偏差为104.73,45个自由度的剩余偏差为42.412,AIC为290.72。查看新添加的术语值如表V所示,我们可以看到交互项在5%显著性水平下不显著。因此,它不应该包含在模型中,最好的模型是Fit3。使用AIC值可以推断出相同的结果。自从 那么最好的型号是Fit3。对于预测,我们将使用最佳估计模型Fit3。结合Fit3和方程式5,我们得到jkwhere公司  因此和jk公司 韦利特  避免如备注1所示的假陷阱。因此,我们将有以下内容:   (10) 要知道方程式10中相应单元格的保单持有人需要多少年才能提出一项索赔,我们有  ,  然后 . 类似地 (11) 因此,相应单元格不等式11的保单持有人提出一项索赔所需的年数为 ,  然后同样,我们也可以为 和五、 结论精算师应仔细处理的一个非常重要的问题是他们设置的评级系统,以计算从投保人处获得的保费。特别是在非人寿保险方面,当投保人认为自己被多收了费用时,他们可能会离开。

10
大多数88 在职认证  发表于 2022-5-26 23:07:02
相反,糟糕的评级体系可能会带来不良风险。最终评估旨在了解评级系统的准确性,以及它反映观察到的损失的准确性。根据适当的风险因素对观察到的损失进行分类,对于确定评级系统的准确性非常重要,因为风险因素告诉我们哪个级别的风险因素造成的损失最大(收取的保费最高),哪个级别的风险因素造成的损失最小(收取的保费最低)。除了一般风险因素(居住地区、投保人年龄、保险类型……)外,一些保险公司倾向于根据所谓的“BonusMalus系统”对观察到的损失进行分类。奖金-马吕斯系统是一种无索赔年(无索赔年)导致保费(奖金)折扣的系统。另一方面,由于一年的不良索赔记录(马吕斯),保费增加。附录中给出了奖金-马吕斯系统的略图。在Bonus-Malus系统中首先应该指出的是,步骤1(120%)是系统中唯一的Malus类。此外,没有任何历史知识的投保人(公司的新客户)从步骤2(100%)开始。为了进一步阐述,一般来说,保险公司有一些基本保费(保费系数),每个保单持有人将支付的保费根据这些保费进行调整。例如,假设基本保费为500美元,没有任何已知历史的apolicyholder将被收取该基本保费的100%,即500美元。此外,唯一马吕斯步骤(步骤1)中的投保人将收取该保费的120%,即。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-21 21:37