现在在用广义线性模型做一个车险定价的项目研究,主要想研究索赔次数、索赔强度和纯保费的拟合情况。现在公司能够提供数据作为研究使用,但是由于没接触过实务,不了解保单的数据结构,
应该向如何向公司索要数据(如如何提供详细的数据说明)?
希望大家多来提提意见,如果最终能汇总成一个关于GLM的建模流程,一定很有意义。
|
楼主: 黑暗的造访
|
5195
26
[CFA] 用GLMs做纯保费定价需要哪些保单信息 |
|
已卖:150份资源 教授 65%
-
TA的文库 其他...
|
回帖推荐tracymicky 发表于21楼 查看完整内容 我在做定价 就说说这块 模型本身不难 难的是数据的清理和归集 以及模型出结果之后的筛选及平滑 至于因子的需求 尽可能的多吧 如果是第一次做的话 每个因子都可以放进模型 然后剔除掉不显著的就好 另外你说的纯保费是指纯风险成本吗 如果是纯风险陈本的话 就还好 只用计算赔付率就好 如果不是 还要考虑费用率的情况 另外3-5年数据量有点时间长 不知道你的进展因子是怎么个调整方法 还有楼上有人说的endorsement就是批单 看有没有 ...
wangye0418 发表于19楼 查看完整内容 考虑好分组数量与模型稳定性的关系:分类因子多,每类因子水平又多,当然每个小组的数据量就少,这样估计出的参数可靠性差(此时参数也非常可能是显著的)。分组少的话,模型的精确性又不够,所以需要积累经验。同时,估计的结果要可用,也就是说未来你某一天调整费率的时候,不应该有过大幅度的调整(即GLM的参数估计结果不应该发生较大变化)。另外,鉴于你的数据量太小,跑跑模型,掌握一下方法就是了。还是争取找到更多的数据吧 ...
hijeannette 发表于20楼 查看完整内容 居住区域,职业,学历,收入,婚姻状况这种字段在中国都是不可信的。数据主要分为承保和理赔数据。承保信息里面应包括,车主年龄,性别,NCD,续转保,渠道,车辆使用性质,车辆种类,是否投保不计免赔,机构,还有所有的车辆信息(例如,座位数,厂牌车型,吨位数,车龄等)。理赔数据主要是出险日期,报案日期,立案日期,结案日期,出险金额和次数,终极赔款和次数。清理数据时要注意批单的处理,还有就是不计免赔是否能分摊到 ...
| ||
|
|
| ||
| ||
| ||
| ||
jg-xs1京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


