先看一道经典例题,有3组风险分别为A,B,C。第一年,A出险1个,B出险2个,C出险2个。第2年,A出险0个,B出险1个,C出险1个。
运用Empirical Bayes nonparametric method.求每一组风险在第三年的期望出险数。
后面的答案是这样写的:全局均值u=1.......... A组的信度均值是0.5和u=1的加权平均,B组的信度均值是1和u=1的加权平均,C组的信度均值是1.5和u=1的加权平均.瞎亮我的眼睛,我赶紧去翻Loss Model第4版,发现书上的方法也是这么写的。
多么愚蠢,直接违背了 Bayesian估计的基本原理。我们知道buhlmann估计是Bayesian估计的线性近似,用buhlmann方法求得的预测值本质就是Bayes估计的预测值。之所以有Bayes估计,是因为不知道模型参数θ的具体取值,先求得θ的后验分布,然后求得模型均值(或某些其它特定的量)在后验分布的上的均值。就是说,θ的值,我们不知道,所以求θ的分布,再求该量对θ的均值。
现在,θ的量是已知的,对于风险A,θ=A;对于风险B,θ=B,对于风险C,θ=C.跟θ的分布没有半毛钱的关系。所以第三年的预测值就跟全局均值u没有半毛钱的关系。
直观的想象,A组风险代表车险,B组风险代表癌症风险,C组风险代表出口信用风险。求A的预测值,跟B和C完全不搭边,所以信度加权就毫无意义。