楼主: 大多数88
1975 48

[量化金融] 保险中的自适应定价:广义线性模型和高斯模型 [推广有奖]

21
何人来此 在职认证  发表于 2022-6-24 08:50:24
术语ut-1(·)是对我们已知和σt的明确利用-1(·)是我们对未知事物的探索。参数Д用于平衡开采ut之间的权衡-1(·)和勘探σt-1(·).在我们的工作中,我们使用加性均值和核更新UCB函数,定义为pt=arg maxp∈Purt-1(p)+√νtσrt-1(p)。这里,urt-1=pt-1udt-1+uct-1σrt-1(p)=pt-1σdt-1(p)+σct-1(p)。(3.4)现在,我们介绍了定价的GP算法的实现。在时间t-1,该算法生成一个使UCB函数最大化的价格,即最优价格p*. 每个价格由历史Ft确定-1以及UCB规则遵循的政策。在连续价格集中,最优价格p*存在且唯一。然后,我们将最优价格设置为下一个抽样价格pt。给定价格,我们分别对fd(pt)和fc(pt)进行采样。由于收入由两部分决定:保费·fd(pt)和总索赔额fc(pt),所选价格可以视为常数,因此抽样收入是抽样函数fd(pt)和fc(pt)的线性组合。因此,我们可以得到sampledrevenue函数。接下来,我们执行GP后验更新(2.5),以获得需求和总索赔的后验分布,并更新FD和FCF的后验分布,给定Ft=Ft-1.∪{pt,dt,ct}。最后,我们获得(3.4)中定义的平均ur和标准方差σr,然后更新UCB函数以确定下一个售价。通过GP定价算法为新发布的保险产品定价的伪代码如算法2所示。算法2:GP定价算法输入:GP Previoru,σ,kfor t=1,2。

22
nandehutu2022 在职认证  发表于 2022-6-24 08:50:27
doSelect价格:pt← arg最大值∈Purt-1(p)+√νtσrt-1(p);示例收入函数:rt← pt·fd(pt)- fc(pt)+εrt;更新估计值:oudt和σdt,通过执行GP后验更新(2.5);oucT和σcT通过执行GP后更新(2.5);o获得urt,σrt;在这一节中,我们展示了所提出的方法得到的理论分析。我们关于累积遗憾的主要结果在第4.1节的定理4.1和第4.2节的定理4.2中进行了阐述,并给出了一些结论。4.1. 自适应GLM算法证明了广义线性模型(GLM)中最大拟似然估计的强相合性和收敛性。Lai和Wei【8】研究线性随机回归模型中的最小二乘估计。Chen等人【41】将Lai和Wei【8】的结果扩展到具有正则链接函数的GLMs。遗憾界限取决于设计矩阵pta的最小特征值λmin(t)的下界以及所选价格和最优价格之间差异的预期值。我们将首先表明,研究后悔的界限等同于研究kβ的界限- βk.命题4.1。假设有一个开放的、有界的邻域V∈ R2×3为真β,因此,对于所有β∈ V,我们可以找到唯一的最优价格p*最大化收益函数r(p,β)。Givenp(β)∈ Pr(p*,β)p=0和r(p,β)p<0,我们可以导出| r(p,β)- r(p*, β) |=Okp公司- p*k. (4.1)此外,如果我们假设存在∈ N使得bβt∈ V代表所有t≥ t、 那么p(bβt)- p(β)= Obβt- β. (4.2)证明。见附录B。我们关注一个简单的情况,其中链接函数是正则的,即˙h(·)=v(h(·))。这就给出了t(bβt)=tXi=1σp(i)易- h类p> (i)bβt= 0 .在假设A1和A2下,我们证明了MQLEbβt实际上存在,并且该估计量也是非常一致的。提案4.2。假设假设A1和A2满足并支持∈Pkpk≤ r<∞,其中r=ph- pl。

23
mingdashike22 在职认证  发表于 2022-6-24 08:50:30
然后,MQLEbβtin(2.4)存在并限制→∞bβt=βa.s.安第斯bβt- β= O对数(t)L(t),给定λmin(t)≥ L(t)。证据见附录C。定理4.1根据函数L(t)提供了遗憾的上界。定理4.1。假设存在t∈ N、 如果MQLEbβ非常一致,并且满足以下条件:1。λmin(t)≥ L(t)=所有t的cpt对数(t)a.s≥ tand c>0,2。PTt=1p(t)- p(bβt)≤ KL(T)a.s.适用于所有T≥ 当K值大于0时,T个时间段后的后悔为greet(T)=OL(T)+TXt=1log(T)L(T)!。证据根据命题4.1中的(4.1),可以根据kp(T)推导出销售期限的后悔- p*k、 该isRegret(T)=OE“TXt=tkp(T)- p*k#!。我们可以将上述期望扩展如下,然后我们将逐步解释。E“TXt=tkp(t)- p*k级#≤ 2E“TXt=tp(t)- p(bβt)#+ 2E“TXt=tp(bβt)- p*#≤ 2KL(T)+2KE“TXt=Tbβt- β#= OL(T)+TXt=1对数(t)L(t)!,这里K>0是一些非随机常数。在第一个不等式中,我们使用(a+b)≤ 2a+2b,即kp(t)- p*k级=p(t)- p(bβt)+p(bβt)- p*≤ 2.p(t)- p(bβt)+ 2.p(bβt)- p*.在第二个不等式中,根据定理4.1中的假设2,我们对这些项进行了约束,以获得第一个项2e“TXt=tp(t)- p(bβt)#≤ 2KL(T)。根据命题4.1的(4.2),我们得到p(β)- p(bβt)≤ Kβ-bβt.这给出了第二个术语2e“TXt=tp(bβt)- p*#≤ 2KE“TXt=tbβt- β#.最后,通过命题4.2,我们可以用greet=OL(T)+TXt=1log(T)L(T)!。当L(t)=cpt log(t)时,我们找到了一个最优的定价策略,该策略实现了遗憾(t)=O√T日志T.我们得到的遗憾界与Kleinberg和Leighton[59,Theorem1.2]的结果相对应,但算法不同。4.2. 自适应GP定价模型我们现在为高斯过程(GP)贝叶斯优化建立了累积遗憾,该优化以最大信息增益γT为界。假设子集A={p。

24
mingdashike22 在职认证  发表于 2022-6-24 08:50:33
. , pT} P是有限的。LetyA=f(pA)+ε记录观察值,并让fAdenote记录这些点的函数值,即fA=f(pA)。我们引入香农互信息,并将其表示为I(·)。对于高斯过程,I(yA;fA)=H(yA)- H(yA | f),其中H是熵。在多元高斯情况下,H(N(u,∑))=log | 2πe∑|,因此I(yA;fA)=log | I+σ-2KA |,式中KA=[k(p,p)]p,p∈A、 四轮之后,Ya和Fa之间的最大信息增益为γT(k)=maxAP: | A |=TI(yA;fA)。(4.3)信息的界限增益γt取决于所使用的核。例如,线性回归下的γT=O(d log T),平方指数核下的γT=O((log T)d+1),以及γT=OTd(d+1)/(2ν+d(d+1))(对数T)在ν>1的Mat'ern核下。我们参考Srinivas等人【13】了解更多详细信息。在我们的模型中,我们将最大信息增益表示为γT(kd+kc),它描述了算法可以了解的关于需求和总索赔函数的最大信息量。假设需求和总索赔函数fd、Fc均满足以下假设4.1。它允许我们在定理4.2中推导累积后悔w.r.t.的界,即最大信息增益γt(kd+kc)。假设4.1。设f从核为k(p,p)的GP中采样,函数f几乎是连续可微的。考虑偏导数f级/pjof j=1的此示例路径,t满足以下高概率界限。对于某些常数a,b>0,P支持∈Pfpj公司> J≤ ae-(日本)。定理4.2。拾取δ∈ (0,1)并选择Дt=2 log(2tπ/(3δ))+2 logt型∈ O(对数t)。高概率1- δ和对于任何T≥ 1,遗憾(T)=OpγTT对数T.这里γ是γT(kd+kc)的缩写。证据遵循Srinivas等人[13]。我们将他们的模型扩展到需求和索赔的情况。我们在附录D中给出了Srinivas等人[13]的相关引理和结果。

25
能者818 在职认证  发表于 2022-6-24 08:50:36
对于任何价格p∈ P、 我们考虑需求和索赔函数fd,fc:P→ R从GPS中采样。时间范围T内的累积遗憾由白鹭(T)=E“TXt=1(p*· fd(p*) - fc(p*)) - (pt·fd(pt)- fc(pt))#=E“TXt=1r(p*) - r(pt)#。价格集P是有界的,预期需求和索赔函数fd、FCF是独立的多元高斯分布,方差有界。在不丧失一般性的情况下,我们假设kr≤ 1、根据UCB规则,我们可以得到由byr(p*) - r(pt)≤ 2.√νtσrt-1(pt)+rbplog(2a/δ)t.(此处为4.4),σrt-1(p)=pt-1σdt-1(p)+σct-1(p)。通过对数函数的凸性,我们知道u≤ v对数(1+u)/u对数(1+v)≤ v、 自σrt起-1(pt)≤ k(pt,pt)=1和σ-2σrt-1(pt)≤ σ-2,我们让u=σ-2σrt-1(pt)和V=σ-2、我们有σrt-1(pt)≤对数(1+σ-2) 日志1 + σ-2σrt-1(pt).根据Jensen不等式和νtis nondecreating,我们得到TXT=1√νtσrt-1(pt)≤ 2.√^1TVUUTTXT=1σrt-1(pt)≤ 2.√^1TVUUTTXT=1日志1 + σ-2σrt-1(pt)对数(1+σ-2)≤pTДTs8I(yT;fT)对数(1+σ-2)≤pCTДTγT.(4.5)此处C=8/对数1 + σ-2.γT=γT(kd+kc)。最后一个不等式是通过定义信息增益I(见附录D中的引理7.2)和最大信息增益γT(4.3)得到的。通过对(4.4)求和并使用(4.5),我们得到的概率大于1- 所有T的δ≥ 1TXt=1r(p*) - r(pt)≤TXt=1√νtσrt-1(pt)+rbplog(2a/δ)t=TXt=1√νtσrt-1(pt)+TXt=1rbplog(2a/δ)t!≤pCTИTγT+C。此处,C=PTt=1rbplog(2a/δ)/t是一个常数,因为a、b、r、δ是常数,p1/t=π/6。最后,我们得到了累积后悔的界。注意,对于加性核的组合,我们有γT(kd+kc)≤ γT(kd)+γT(kc)(详见附录D中的Lemma7.7)。5、延误案例在前面章节中,我们假设保险费和总索赔在每个保险期开始时支付。

26
能者818 在职认证  发表于 2022-6-24 08:50:40
这给出了如何在保险设置中应用这些方法的基本概述。然而,在现实世界中,索赔是在保险事件发生时触发的,因此在购买保险产品时不会支付。延迟期间的即时定价决策可能会给出错误的最优价格,并增加遗憾。因此,我们在这里涉及延迟索赔,并根据Joulani的想法将我们的定价问题视为延迟强盗问题[74]。5.1. 延迟模型我们假设,当选择价格时,需求会立即生成并得到遵守,而索赔可能会延迟。这可能会导致收入延迟。假设在时间t选择一个价格,并表示相应的延迟时间为τt。我们假设(τt)t≥1是一个i.i.d.序列,与价格和索赔无关。当没有延迟时,τt=0是可能的。假设存在最大等待时间m,延迟索赔只能通过时间t+m或如果τt≤ m、 在不丧失一般性的情况下,我们假设所有信息(需求和索赔)都可以在时间范围T结束时收到。当发生延迟时,保险公司观察时间t+τt的收入rtat。因此,根据历史Ht选择下一个销售价格PTI,历史Ht是价格和需求的过去信息{pi,di:i=1,…,t- 1} 和延迟索赔{ci:i+τi≤ t型- 1}. 如果所有t的τt=0,则我们得到的是Ht=Ft。如果在时间t选择了价格PTI,则我们表示ct+τt在时间t观察到的索赔。保险公司收集延迟索赔的开始时间集:ct={t:t=t- τt}乘以结束时间t。这里,延迟时间集可以是Ct= 例如,当所有t的τt=0或τt>m时,t时相应的观测收入为rt=ptdt- ct+τt。

27
mingdashike22 在职认证  发表于 2022-6-24 08:50:43
值得注意的是,由于索赔的延迟,决定p(t+1)的信息较少。我们将保险公司观察第s次索赔的时间表示为ρ(s),相应的收入表示为rρ(s),这里s=1,T设ers=rρ(s)。保险公司在观察ers后确定下一个销售价格eps+1。对于t=1,T,表示时间T结束时观察到的索赔数量- 1作为N(t)=Pt-1i=1{i+τi<t}。由于公司根据最近观察到的索赔确定下一个销售价格,因此我们的pt=epN(t)+1。设eτs=s-1.-N(ρ(s))。这里,s-1是在没有延迟的情况下可以观察到的索赔数量。N(ρ(s))是时间ρ(s)观察到的实际索赔数量- 因此,eτ是当算法在时间ρ(s)选择pρ(s)时,直到可以观察到相应的收入rρ(s)为止,尚未更新的延迟数。那么我们有pρ(s)=eps-eτsandPTs=1eτs=PTt=1τt(关于证明,我们参考附录e中的引理7.8)。因此,遗憾是XT=1Xt∈Ctr(p*) - r(pt)=TXs=1rρ(s)(p*) - rρ(s)(pρ(s))=TXs=1ers(p*) - ers(每股收益-eτs)=TXs=1ers(p*) - ers(eps)+TXs=1ers(eps)- ers(每股收益-eτs)。我们可以看到,延期索赔的后悔包括两部分:未延期的后悔和延期索赔引起的额外后悔。我们需要约束这两个术语中的每一个,以获得总体的遗憾约束。5.2. 具有未知延迟的自适应GLM定价在无延迟的GLMs回归模型中,我们通过最大化拟线性估计来找到未知参数。在延迟情况下,我们使用类似的方法。我们用BBT表示延迟索赔的新最小二乘估计量。Speci fibribbt是指由t(bbt)=tXi=1Xi给出的修改后的MQLE∈Ciσp(i)ci+τi- h类p> (一)bbt= 0 .以下结果将定理4.1扩展到延迟索赔。定理5.1。假设存在t∈ N、 如果MQLEbβ非常一致,并且满足以下条件:1。

28
何人来此 在职认证  发表于 2022-6-24 08:50:46
λmin(t)≥ L(t)=所有t的cpt对数(t)a.s≥ tand c>0,2。PTt=1p(t)- p(bβt)≤ (2m+K)L(T)a.s.适用于所有T≥ 一些K>0。遗憾的界限是greet(T)=OL(T)+TXt=1log(T)L(T)!证据证明类似于定理4.1。我们根据kp(T)考虑超过销售期限T的累计后悔- p*k、 此isRegret(T)=OE“TXt=tkp(T)- p*k#!。这里,kp(t)的期望值- p*kis给定byE“TXt=tkp(t)- p*k级#≤ 2E“TXt=tp(t)- p(bβt)#+ 2E“TXt=tp(bβt)- p*#≤ 2(2m+K)L(T)+2KE“TXt=Tbβt- β#= OL(T)+TXt=1对数(t)L(t)!在第一个不等式中,我们使用(a+b)≤ 2a+2b,即kp(t)- p*k级=p(t)- p(bβt)+p(bβt)- p*≤ 2.p(t)- p(bβt)+ 2.p(bβt)- p*.我们扩展了上述不等式中的第一项,即TXt=1p(t)- p(bβt)≤TXs=1ep(s)- eτs)-ep(s)+ep(s)- p(bβt)≤TXs=1kep(s- eτs)-ep(s)k+TXs=1ep(s)- p(bβt).通过该算法,我们可以得到kep(s- eτs)-ep(s)k≤eτs-1Xj=0kep(s- eτs+j)-ep(s)- eτs+j+1)k≤ eτsK˙L(t),对于某些K>0。由于L(t)是一个递增凹函数,根据中值定理,我们得到了L(t+1)- L(t)=˙对于任何s,L(s)∈ [t,t+1]。它意味着L(t+1)- L(t)≥˙L(t+1)和t-1Xt=0˙L(t+1)≤T-1Xt=0升(t+1)- L(t)=L(t)- L(0)=L(T)。连同定理5.1中的假设2和eτs≤ 2m对于任何s(为了证明,我们参考附录E中的引理7.9),我们获得了第二个不等式中第一项的界,E“TXt=tp(t)- p(bβt)#≤ 2mL(T)+KL(T),对于一些K>0的。根据命题4.2,第二项的界为bβt- β= O对数(t)L(t).最后,得到了遗憾界。5.3. 时滞未知的自适应GP定价目前,时滞GP不存在理论界。在本节中,我们将介绍在延迟索赔设置中实现另一种GP定价算法。

29
mingdashike22 在职认证  发表于 2022-6-24 08:50:49
例如,在每个时间t,我们通过GP算法2设置价格,并收集延迟索赔的开始时间集:Ct={t:t=t- τt}。每次t∈ Ct,保费可以在时间t given aspt·fdt(pt)观察到,而索赔是在时间t+τt收到的。我们用fct+τt(pt)表示延迟索赔。收到延迟索赔后,我们会更新每项索赔的GP及其保费。这就决定了下一个售价。算法3显示了通过GPalgorithm为新发布的延迟保险产品定价的伪代码。算法3:具有延迟索赔的GP定价算法输入:对于t=1,2,…,GP定价算法2。doCollect时间t接收到的延迟时间Ct集合;对于t∈ CtdoSelect价格:pt← GP定价算法2;用pt、fdt(pt)、fct+τt(pt)更新GP:endend(a)(b)图1:价格离散和参数估计的收敛。6、显式公式和数值示例在本节中,我们通过数值示例给出了GLMs和GP定价算法以及两者在延迟索赔情况下的仿真结果。6.1. 无延迟的自适应GLM定价消费者需求服从物流分布,总索赔服从规范链接函数下的对数正态分布。例如,让需求和索赔模型beE[D(p)]=11- 0.8p,E[对数C(p)]=3+0.25p。将三个初始价格向量设置为p(1)=(1,3)>、p(2)=(1,3.3)>和p(3)=(1,4.7)>,最低最高价格pl=0.5,ph=10。我们现在开始估计上述优化的参数。我们绘制了价格离散和参数估计的收敛曲线。根据图1a,价格离散度tr(P-1吨)-1/pt log(t)收敛到0.01。因此,我们将L(t)=0.01pt log(t),这可以保证有效的价格分散。图1b显示bβt- β, 参数估计值和真实参数之间差异的平方范数。

30
nandehutu2022 在职认证  发表于 2022-6-24 08:50:52
作为t→ ∞,bβt- β→ 0,即parameterestimates收敛到真实参数。这意味着参数估计的强一致性。(a) 累积后悔(b)收敛速度图2:GLM算法的累积后悔和收敛速度。GLM表示非延迟情况,D-GLM表示延迟情况。6.2. 无延迟的自适应GP定价机器学习最有趣的核是ν=3/2和ν=5/2的Mat'ern核,给定为yk3/2(r)=1+√3rl!经验值-√3rl!,k5/2(r)=1+√5rl+√5r3l!经验值-√5rl!。我们从GPs中采样随机函数fd、FCM,其核数分别为ν=1.5、2.5和长度标量=1。将样本噪声设置为σ=0.05。GP算法运行T=100次迭代,δ=0.1。这表明我们对参数β的选择取决于t.6.3。延迟案例为了发现延迟的影响,我们考虑与非延迟案例相同的设置。延迟是非负整数,未知,我们随机生成延迟。6.4. 比较无延迟和有延迟的GLM和GP算法,我们在图2和图3中给出了数值结果。GLM定价算法产生的累积后悔绘制在2a中。延迟情况下的后悔总是大于非延迟情况下的后悔,这表明保险公司可以避免额外损失。如上所述,在延迟索赔的情况下,由于索赔延迟,决定售价的信息较少。图2说明了遗憾以1/pT log(T)的速率收敛。延迟索赔后悔的收敛速度是无延迟索赔后悔收敛速度的渐近。图3中GP定价算法得到的结果与GLM定价算法相似。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-4-19 17:49