楼主: 大多数88
1892 48

[量化金融] 保险中的自适应定价:广义线性模型和高斯模型 [推广有奖]

11
何人来此 在职认证  发表于 2022-6-24 08:49:53
den Boer和Zwart【10】提出了一种受控方差定价政策,在该政策中,他们围绕先前选择的平均价格创建禁忌区间,以确保有效的价格分散。该政策首次通过最大化拟似然估计来考虑需求未知的参数模型。他们得到了T周期后悔的渐近上界为O(T1/2+δ),其中δ>0非常小。这项工作构成了我们的保险定价模型的基础。定价问题也可以用非参数方法解决。Kleinberg和Leighton【59】对在线拍卖进行了分析,并引入了后悔来衡量定价策略的表现。Cope【60】采用非参数贝叶斯方法,以Dirichlet分布为先验,在电子商务市场中实现收入最大化目标。Rusmevichienton等人【61】开发了一种基于真实汽车数据集的多产品定价问题的非参数方法。Besbesand Zeevi【62,63】使用盲定价政策来平衡勘探开发贸易,并实现总体最优。Bandit在线学习问题。传统上,延迟可以视为固定常数。在这种情况下,Dudik等人[64]为随机上下文盗贼提供了一种有效的算法,并表明后悔是相加的。Chapelle和Li【65】提出了延迟反馈对新闻文章推荐中上下文强盗的影响。Cesa–Bianchi等人【66】研究非暴力匪徒网络。PikeBurke等人[67]讨论了延迟、聚合匿名反馈的情况,预期延迟是已知的。他们假设只有总的遗憾是可用的,而个人的遗憾是未知的。总的来说,延迟可能是一个随机过程。Agarwal和Duchi【68】分析了当延迟是i.i.d随机分布时基于随机梯度的优化算法。Desautels等人。

12
何人来此 在职认证  发表于 2022-6-24 08:49:56
【69】研究高斯过程问题中实验和观测之间有界延迟的并行实验。Vernade等人【70】考虑有限的随机延迟,其中一些反馈在阈值后无法观察到。对于延迟反馈在线学习和延迟后悔影响的系统研究,我们参考Joulani等人【71】。在他们的工作中,他们表明延迟会增加随机问题的重分类,而不需要了解延迟的分布。1.2. 论文各部分的结构如下。在第2节中,我们描述了保险设置中的优化定价问题,并定义了我们的定价模型。我们研究GLM和GP模型,以及与这些模型相关的假设和估计方法。在第3节中,我们提出了GLM和GP定价算法,并分别解释了它们的工作原理。第4节介绍了本文的主要结果。我们考虑累积后悔的界限,这有助于衡量每个定价政策的表现。在第5节中,我们用未知的延迟索赔扩展了这两个模型。第6节说明了实验装置和数值结果。最后,第7节给出了结论并讨论了未来的工作。附录中收集了辅助结果和证据。2、模型和假设在本节中,我们介绍了两个回归模型和重要假设。我们在第2.1节中简要概述了保险定价问题。在第2.2节中,我们讨论了自适应广义线性模型(GLM),这是一种参数模型,并解释了如何通过准似然估计估计未知参数。该模型是基于den Boer和Zwart【10】以及Lai和Wei【8】的思想构建的。在第2.3节中,我们介绍了一种具有UCBrule的自适应高斯过程(GP)模型。2.1.

13
mingdashike22 在职认证  发表于 2022-6-24 08:49:59
概述我们考虑一家保险公司,该公司在销售期限T>0的范围内销售单一产品。销售价格PTI在每个时段t开始时确定∈ {0,…,T}。我们通过P=【pl,ph】定义可接受价格集,其中0<pl<Phar是最低和最高售价。我们假设动态定价仅与过去的价格相关。给定一个确定的销售价格ptat时间段t,保险公司观察需求dt=dt(pt),这是随机需求函数D(·)对销售价格pt的独立化。同样,我们将时间段t内的总索赔额表示为Ct(pt),并观察总索赔额Ct=Ct(pt)。(通常我们会从i.i.d.随机变量d(·)和C(·)中取消子脚本t。)在保险业中,保费是保险公司获得的预期收入,索赔是保险公司损失的金额。如果已知销售价格,则在单个时间段t内收集的收入为ptdt- 计算机断层扫描。时间t的预期收入由r(pt)=E【ptD(pt)】给出- C(pt)]。(2.1)需求和总索赔同时响应每个时间段的价格变化。一旦价格确定,我们假设需求和总索赔是相互独立的。保险公司的目标是根据以前的销售价格{pi:i=1,…,t,找到一个产生最大收入的最佳定价政策-1} 观测值{di,ci:i=1,…,t-1}. 我们使用累积后悔来衡量定价政策的绩效。遗憾的是,由于没有使用最优价格,预计会造成收入损失。更正式地说,我们将时间范围内的累积后悔定义为后悔(T)=E“TXt=1r(p*) - r(pt)#。(2.2)此处,r(p*) 是最优价格p产生的收入*:p*= arg最大值∈Pr(pt)。

14
大多数88 在职认证  发表于 2022-6-24 08:50:03
(2.3)卖方的目标是使总收入最大化,即使累计后悔最小化。2.2. 广义线性定价模型我们首先考虑GLM环境下的动态优化定价问题。此处无法直接计算expectedrevenue,因为它依赖于必须推断的未知参数。我们应用最大拟似然估计(MQLE)来估计模型中的未知参数。我们关注广义线性模型(GLMs)中回归参数MQLE的强一致性。我们的模型基于den Boer和Zwart的工作【10】。然而,我们考虑的是具有需求和重尾索赔的单一保险产品。在这里,我们使用索赔日志来描述大额保险索赔。2.2.1. 模型和假设我们假设保险公司知道需求和索赔前两个时刻的函数形式。时间t的需求分布模型由[D(pt)]=h(a+apt),Var(D(pt))=σv(E[D(pt)]给出。同样,我们假设总索赔的对数具有期望值和方差,给定byE[log C(pt)]=h(b+bpt),Var(log C(pt))=σv(E[log C(pt)]。这里,参数a、a和b都是未知的。请注意,这里我们采用的是总索赔的对数,与收入管理的结果相比,这有点不标准。在保险的背景下,这可以用来模拟重尾索赔分布,例如对数正态分布。我们认为函数h(·),h(·)是价格p和未知参数的已知连接函数。方差函数v(·),v(·)是预期需求和索赔的方差。

15
nandehutu2022 在职认证  发表于 2022-6-24 08:50:06
随机分布需求和索赔的方差是常数σ、σ>0的方差函数的函数。函数h(·)和v(·)是两次连续可微分的,一阶导数和二阶导数分别由˙h(·)、¨h(·)和˙v(·)、¨v(·)表示。当˙h(x)=v(h)时,链接函数称为规范链接函数,否则称为一般链接函数。表示a=(a,a)>和b=(b,b)>,可以将(2.1)中的预期收入写成r(pt)=r(pt,a,b)。此外,T个时间段后(2.2)中的累积后悔变成了gret(T)=E“TXt=1r(p*, a、 (b)- r(pt,a,b)#。这里,最优价格p*定义见(2.3)。最后,我们将设计矩阵ptt定义为i=1,…,从价格向量p(i)=(1,pi)>获得的转置矩阵之和,t、 对于p∈ P×{1},设计矩阵由pt=tXi=1p(i)P(i)>给出。我们将设计矩阵的最大特征值pta表示为λmax(t)=λmax(Pt),将最小特征值表示为λmin(t)=λmin(Pt)。2.2.2. 未知参数的估计无法直接计算最优策略,因为遗憾取决于未知参数a、b。为了简化符号,我们将参数矩阵定义为β=(a、b)。我们用β表示回归参数β的真值。用bβt表示的最大拟似然估计量为解tolt(bβt)=tXi=1˙h(p>(i)bβt)σv(h(p>(i)bβt))p(i)易- h类p> (i)bβt= 0 . (2.4)让过滤(Ft)t∈由{pi,di,ci:i=1,…,t生成的Nbe- 1} 对于每个t,写入ηi=yi-h(p>(i)bβt)。误差项η表示一个鞅差序列w.r.t.Ft,即ηiis Ft可测和E[ηi | Fi-1] = 0. 我们还假设,对于某些γ>2几乎可以肯定,(A1)supi∈NE[ηi | Fi-1] ≤ σ< ∞ 和supi∈NE[|ηi |γ]<∞.(A2)λmin(t)→ ∞ 对数λmax(t)=o(λmin(t))。2.3.

16
大多数88 在职认证  发表于 2022-6-24 08:50:08
高斯过程定价模型现在,我们通过从高斯过程(GP)中抽取预期需求和预期总索赔来构建贝叶斯模型。我们的定价模型是Srinivas等人[13]的扩展,在考虑需求和索赔的保险领域采用了替代UCB规则。首先,我们简要介绍了高斯过程回归,更完整的细节可以在Rasmussen和Williams中找到【15】。高斯过程是随机变量的集合,其中任何一个变量都具有联合高斯分布。它完全由其平均函数u(p)和协方差函数(或核函数)k(p,p)确定,由u(p)=E[f(p)],k(p,p)=E[(f(p)- u(p))(f(p)- u(p))]。然后,我们可以生成一个高斯过程asf(p)~ GP(u(p),k(p,p))。在不丧失一般性的情况下,我们假设均值是常数,协方差函数是严格有界的。对于噪声样本yT=[y,…,yT]>,给定输入点{p,…,pT}的集合。我们将pta定义为第t个样本,yt=f(pt)+εt,这里是εt~ N(0,σ)是方差为σ的独立同分布高斯噪声。由于高斯过程可以描述函数上的分布,我们使用GP(u(p),k(p,p))作为f上的先验分布。f上的后验分布也是GP分布,其平均uT(p)和协方差函数kT(p,p)由uT(p)=kT(p)>KT+σI-1yT,kT(p,p)=k(p,p)- kT(p)>KT+σI-1kT(p),(2.5),其中kT(p)=[k(p,p),…,k(pT,p)]>和协方差矩阵kT是正定义矩阵,其中i的入口为Ki,j=k(pi,pj),j=1,T内核确定观察结果如何影响附近或相似性输入的预测。

17
大多数88 在职认证  发表于 2022-6-24 08:50:11
有两种常用的核:平方指数核kσ,land,Mat'ern核kν,l,由kσ,l(p,p)=exp-2l | p- p|,kν,l(p,p)=ν-1Γ(ν)√ν| p- p | lνBν√ν| p- p | l.这里,l是长度刻度,ν是平滑度参数。此外,Γ(·)是伽马函数,Bν(·)是第二类ν阶的修正贝塞尔函数。注意,Mat'ern核还原为指数核kν,l(r)=exp(-rl)当平滑度参数ν=1/2时,当ν→ ∞.我们定义了以PTA fd(pt)价格计算的预期需求函数,并将预期索赔定义为fc(pt)。函数fd(·)、fc(·)使用已知的均值ud、ucand和核kd(p,p)、kc(p,p)从GPs中独立采样。即fd~ GP(ud,kd)和fc~ GP(uc,kc)。FD和FCS上的后验值是GPs,也遵循(2.5)中的GP后验更新。给定确定价格ptat时间t isr(pt)=pt·fd(pt)的预期收入函数- fc(pt)+εrt。这里,噪声项εr~ N(0,σr)是需求噪声和索赔噪声的组合。我们可以看到,r(·)也是从GP中采样的,带有一个加性核。这是因为sumof GPs也是一个GP,内核的形式是直接和。那么,我们有r~ 已知ur=p·ud的GP(ur,kr)- ucand kr=p·kd+kc。时间范围内的累积后悔T变为后悔(T)=E“TXt=1(p*· fd(p*) - fc(p*)) - (pt·fd(pt)- fc(pt))#。我们的模型是Srinivas等人[13]工作在保险领域的延伸。Srinivas等人[13]只研究了一个函数f。在我们的例子中,我们考虑了一种加法形式,即收益函数r包含两个分量:fd(·)和fc(·),并使用加法核进行采样。这里,fd(·)和FC(·)的采样相互独立。3.

18
mingdashike22 在职认证  发表于 2022-6-24 08:50:15
定价策略在本节中,我们分别在第3.1节和第3.2节中提出了两种称为“GLM定价算法”和“GP定价算法”的算法。一种流行的定价策略是确定性等价定价,由Anderson和Taylor在一个简单线性回归模型中提出【39】,并由作者在更一般的多元回归模型中进一步发展【72】。我们用pcep表示确定性等价价格。如果当前参数估计值正确,这是有效的。给定MQLEbβt,pCEPI是最大化预期收入的价格,pCEP=arg maxp∈Pr(p,bβt)。(3.1)确定性等价定价之所以流行,主要是因为它将统计问题与优化收入和回报的问题分离开来。然而,由于收敛速度过快,参数估计可能会收敛到不正确的值。具体而言,Lai和Robbin【7,第2节】证明了在迭代最小二乘策略下,方差为常数的线性需求函数可能会出现不一致。den Boer和Zwart【10】进一步放宽了对价格价值的假设,提出了一种可变确定性等价定价:受控方差定价政策。通过围绕已选择的平均价格创建禁忌区间,他们可以选择这些区间之外的下一个价格来获取更多信息。Keskin和Zeevi[73]还指出,由于存在非信息价格,确定性等价定价的表现较差,因此引入了约束性最小二乘策略。3.1. 自适应GLM定价基于den Boer和Zwart[10]的工作,我们提出了一种在设计矩阵最小特征值上附加约束的动态定价策略,旨在控制定价策略的收敛性。

19
何人来此 在职认证  发表于 2022-6-24 08:50:18
如果我们确保λmin(t)上有一个下界,我们可以说有足够的价格分散性来保证MQLE的强收敛性。然而,λmin(t)和λmin(t+1)之间没有简单的显式关系。我们引入了逆设计矩阵tr(P-1吨)-1、对于任何n×n正定义矩阵A,我们有tr(A-1)-1.≤ λmin(A)≤ n tr(A-1)-设v,vbe关联的单位特征向量,是R的正交基。对于t>2,最优价格可以写成这些单位特征向量的线性组合,即pcep=Pi=1αivi。设L是一类正可微单调递增函数L,使得L(t)→ ∞ andt公司→L(t)是凸的。选择函数L(t)∈ 五十、 让tr(P-1吨)-1.≥ L(t)表示所有t≥ 2,那么我们有λmin(t)≥ L(t)。选择适当的函数L(t)可以保证有效的价格分散,从而保证参数估计与真实参数的一致性,以及价格序列向最优价格的渐近收敛性。具体地说,我们给出了当NL(t)=c时的最佳后悔界限√对于某些c>0的情况,t记录t。现在,我们将展示定价算法的工作原理。首先,我们选择三个线性独立的初始价格向量来估计未知参数bβtby(2.4)。如果MQLEbβt不存在或不满足价格离散度L(t)的限制,我们重复之前的价格,直到我们能够找到MQLEbβ的解决方案并满足算法1(I)中所示的有效价格离散要求。条件tr(Pt+j-1)-1.≥ L(t+j)最终会满足,因为j总是有限的。如果MQLEbβt列表和价格离散度L(t)的约束也得到满足,我们将下一个价格设置为确定的等价价格p(t+1)=pcep,并检查算法1中(II)中的条件是否成立。如果不成立,则选择p(t+1)=pcep+φt。

20
何人来此 在职认证  发表于 2022-6-24 08:50:21
这里,φt=Kq˙L(t)(v2,1cep- v) ,(3.2)和v2,1是v的第一个分量。常数K>0必须满足Kq˙L(t)≤ 1、算法1给出了这些定价步骤。算法1:GLM定价算法初始化:选择L∈ 五十、 在p中选择线性独立的初始价格向量p(1)、p(2)、p(3)≥ 3: 估算:计算bβtusing(2.4)。定价:(I)Ifbβt不存在或tr(P-1吨)-1. L(t),然后设置p(t+1)=p(1),····,p(t+j)=p(j),这里j是满足tr(Pt+j)的最小整数-1)-1.≥ L(t+j)。(二) Ifbβ测试者和tr(P-1吨)-1.≥ L(t),然后我们设置p(t+1)=pCEPA和considertrPt+p(t+1)p(t+1)>-1.-1.≥ L(t+1)。如果不成立,我们将p(t+1)=pcep+φ和φ设置为(3.2)中定义的值。这里我们可以选择kφtk=˙L(t)1+最大值∈Pkpk, 以满足上述要求。以下命题保证在选择价格时,价格分散条件(3.3)得到满足。命题3.1。Ifbβ测试者和tr(P-1吨)-1.≥ L(t),我们将下一个价格设置为p(t+1)=pcep+φt,然后Pt+p(t+1)p(t+1)>-1.-1.≥ L(t+1)。(3.3)证明。见附录A.3.2。自适应GP定价模型在GP设置中,我们根据置信上限(UCB)规则确定定价策略。Westart回顾了Srinivas等人的工作【13】,其中后GP用于构建UCB功能。在每个时间步t-1,他们将下一个采样点设置为最大化UCB函数的采样点,给定值为pt=arg maxp∈Put-1(p)+√Дtσt-1(p)。此处,后验平均值ut-t后得到1(·)-1观察值,是f的当前估计值。后标准偏差σt-1(·)是与该估计相关的不确定性。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-3-11 13:46