楼主: 大多数88
641 28

[量化金融] 动态广义随机利率变化的定义与估计 [推广有奖]

11
能者818 在职认证  发表于 2022-6-23 19:24:59 |只看作者 |坛友微信交流群
更一般地,估计δT需要选择T=T年的所有政策及其匹配。估计δr需要在T=1和T=0的年份中搜索每个策略的匹配项。无需根据策略中的所有条款和条件选择匹配的策略。唯一相关的特征是那些被认为既与预收费用有关,又与所写年份有关的特征。多年来,这些混杂的特征扭曲了各保单年的保费tr终点,因此,平衡这些特征非常重要。在实践中,可以忽略仅与保费费用弱相关的特征。这是因为,即使它们与所写年份密切相关,它们也消除了年份之间的偏差,但大大提高了统计效率(Brookhart et al.,2006)。在理想情况下,基于多个策略特征的相似性选择匹配可以等效地替换为对称为倾向scor e的单个特征的选择(Rosenbaum和Rubin,1983)。如果对T=1年的投资组合感兴趣,则该分数定义为P(T=1 | X),即特征为X的政策在T=1年被写入的概率。它为一项政策的特征提供了一个合适的定量总结度量。实际上,真实倾向得分未知,因此倾向得分通常通过logistic回归进行估计,但匹配估计器仍然是渐近有效的(Heckman et al.,19 98)。

使用道具

12
何人来此 在职认证  发表于 2022-6-23 19:25:02 |只看作者 |坛友微信交流群
倾向评分匹配为在特定年份编写的策略选择匹配项,无论这些策略的个人特征是否相似,而且更容易实施,因为它只涉及一个特征。然而,由于实践中存在抽样可变性和近似匹配,文献建议在倾向得分以及相关的个人政策特征上进行匹配(Rosenbaum和Rubin,1985)。大多数应用程序都涉及选择一个最佳匹配,但如果可能存在多个不一定是最佳的可接受策略匹配,则可以选择多个匹配。类似地,可以包括所有与最佳匹配匹配的策略,或者可以随机断开这些策略,以决定选择哪个策略作为样本的匹配。这两个考虑因素都涉及通过抽样更多的政策匹配来评估偏差的增加是否值得效率的提高。如果只有很少的保单可以在其中找到匹配项,则可能需要选择替换匹配项,但这有可能导致匹配样本中某些保单的过度代表性。Stuart(2010)及其参考文献详细讨论了这些和其他实用性。4.2量化政策之间的相似性在实践中,比较组合中可能没有与待匹配组合中的政策完全相同的政策。因此,有必要找到近似匹配,并确定两项政策之间相似性的一些定量度量。这允许通过评估各个政策特征的相似性来选择最佳匹配。这可以通过实现匹配来实现,以最小化马氏距离(MD)(Rubin,1980)。这是一个衡量两组个体之间多变量距离的标量。

使用道具

13
何人来此 在职认证  发表于 2022-6-23 19:25:05 |只看作者 |坛友微信交流群
它允许跨投资组合年的政策匹配,以最小化MD指标,从而最小化政策类型组合的总体差异。策略特征向量为X的两个策略i和j之间的MD ismd(Xi,Xj)=q(Xi- Xj)TS-1(Xi)- Xj),其中S是X的样本协方差矩阵,X是matr ix X的转置。MDmetric是定量特征的函数,因此可以给有序的定性特征一个数字标签来反映其顺序,然后特征可以与最近的标签匹配。否则,如果具有不同价值的政策不具有可比性,则无论是否有顺序,都应准确匹配需要匹配的质量特征。这种精确匹配将使特征toMD的贡献为零。公共关系开放性得分变量与其他所有特征一起包含在主题决策指标中。MD是实践中用于匹配的最常用度量。然而,不能保证最小化MD可以在整个政策年内实现最佳的投资组合平衡。其他一些指标可能更为理想。Sekhon(2011)提出了更灵活的MD推广,以实现最佳平衡GMD(Xi,Xj,W)=q(Xi- Xj)T(S-1/2)TW S-1/2(Xi- Xj),(3)其中W是k×k正定义矩阵,S-1/2是S的Cholesky分解,即(S-1/2)TS-1/2. 在通过样本方差进行标准化后,GMD度量为每个个别政策特征中的偏差提供了不同的权重。然而,md给予所有人同样的权重。

使用道具

14
能者818 在职认证  发表于 2022-6-23 19:25:08 |只看作者 |坛友微信交流群
然后可以选择权重matr ix W,以在最小化的情况下实现投资组合组合的最佳平衡。匹配过程可以使用卡尺来实现,卡尺可以为相似度度量的最大值确定某些阈值,从而将其视为可接受的匹配。零卡尺相当于精确匹配。4.3优化匹配算法实现匹配采样的经典alg算法涉及匹配选项和倾向得分的迭代。每次迭代后,如果平衡被评估为不满意,则调整下一次迭代,以改变匹配的变量、用于估计倾向得分的模型或其他匹配选项,以确定所选材料的数量。虽然这种方法涉及手动匹配铂离子,但它已成功应用于许多应用中。即使是没有任何条件的单步应用,也可以得到适当匹配的样本。然而,一些数据集可能需要多次迭代,但不能保证每次迭代后平衡得到改善。匹配样本迭代匹配的更高级方法涉及自动计算。Sekhon(2011)描述了一种自动遗传算法,该算法通过搜索所有W的空间来找到GMD度量,从而优化平衡,如式(3)所示,当最小化时,会得到的最佳平衡。它保证了均衡投资组合的最优样本的渐近收敛性。搜索最优W基本上找到了每个政策特征偏差的权重。它还有效地选择要匹配的变量,因为零权重意味着在选择匹配时不考虑特征。

使用道具

15
nandehutu2022 在职认证  发表于 2022-6-23 19:25:11 |只看作者 |坛友微信交流群
两个政策之间的任何特征差异都不会影响衡量两个政策相似性的GMD指标。Sekhon(2011)的自动平衡优化遗传算法已经问世,以改进使用经典匹配方法的已发表分析的结果(Ramsahai等人,2011)。其目的是为W提出一批批解决方案,称为世代,这些解决方案逐渐演化为一批包含W的最优解决方案。每一代中提出的解决方案的数量(称为群体规模)是固定的,增加群体规模通常会改善最终的解决方案。设计是这样的,每一个后续代都有比前一代更好的解决方案。更多技术细节留待参考。4.4评估匹配样本由于仅大致匹配,有必要评估匹配样本以确定其是否令人满意。这是通过检查不同政策类型的组合在不同年份之间是否平衡或相似来实现的。使用各种度量和图来评估相似度。其中包括不同政策年政策特征分布均匀性统计检验的检验统计量和p值。一些常用的检验统计量是似然比、标准化均值差异和Kolmog-orov-Smirnov(KS)检验统计量(Austin,2009)。KS检验统计量是年与年之间累积分布的最大偏差,并考虑了政策类型分布所有时刻的偏差。然而,其他指标仅测试分布平均值的偏差。检验统计量越小,或相应的p值越大,平衡性越好。分位数-分位数图对于比较不同政策年的政策分布也很有用。

使用道具

16
何人来此 在职认证  发表于 2022-6-23 19:25:14 |只看作者 |坛友微信交流群
还有必要确定匹配样本和原始兴趣投资组合之间的政策特征平衡。否则,匹配样本可能无法代表利益组合中的政策类型组合。5基于est i mator sIt的回归可以使用广义线性模型作为匹配方法的替代方法来估计速率变化。然而,他们需要对预期的保费uXT、保单特征X和承保年份T之间的关系进行假设。在预测中加入X可以调整政策特征的变化。回归中的估计系数只能解释为在某些情况下对大鼠变化的衡量。将考虑添加线性预测,但注释可以扩展到更复杂的模型。5.1估计个人费率变化考虑保单收取的个人保费的简单模型h(uXT)=β+ βX+βT(4),其中X和T是范畴的,h(·)是连接函数,β是截距,βX和βT是X和T的系数。该模型与不同地区收取的预期保费相关,如果系数已知,则可直接用于确定保费水平。对于特定的个人保单X,将该年替换为与其实际承保年不同的保单年,会产生ONLEVEL保费。如果等式(1)中的h(·)是恒等链接函数,g(·)是差分函数,则δX=β-β与X定义的所有政策相同。因此δX=β-^β是个人利率变化的估计量,其中^β是广义线性模型中β的估计量。类似地,如果h(·)是对数链接函数,等式(1)中的g(·)是比率函数,则^δ=exp(^β-^β)是个体利率变化的估计量。

使用道具

17
nandehutu2022 在职认证  发表于 2022-6-23 19:25:17 |只看作者 |坛友微信交流群
这里,所有保单的估值都是相同的。只有在此类特殊情况下,才可能将系数解释为对所有政策保持不变的费率变化度量。如果标识链接与比率一起使用,或者日志链接与差异一起使用,那么比率变化将取决于政策特征。对于等式(4)中的加性预测值,如果h(·)是身份链接函数,则时间相关的加载是给定年份中写入的所有保单的固定量。相反,如果h(·)是日志链接函数,则时间依赖性加载对于给定年份中编写的所有策略是固定比例。链接函数的选择可以基于判断哪些影响或其他影响最合适。如果线性预测因子βt=βt的时间相关成分是政策年的线性函数,则系数β可以分别解释为线性或对数链接函数下的简单或连续复合率变化。将交互作用纳入预测因素将使这些解释和简化无效。5.2估计平均利率变化公式(4)中的模型代表了个人层面上收取的保费与保单特征之间的关系。在总水平上,T′年对投资组合收取的平均保费为uT | T′=EX | T′{h-1(β+ βX+βT)}来自等式(4)。如果h(·)是恒等链函数,式(2)中的g(·)是差异函数,则T′年的po r tfolio平均变化率为δT′=β-β,可通过^δT′=β估计-^β. 无论投资组合是否为T′,平均利率变化δT′的值都是相同的。这是直观的,因为个人利率变化不取决于保单特征X,假设公式(1)中的g(·)也是一个差异函数。

使用道具

18
可人4 在职认证  发表于 2022-6-23 19:25:20 |只看作者 |坛友微信交流群
类似的推理也证实了一个事实,即平均值和个别值的变化是相等的,δT=δX。如果h(·)是对数链接函数,而式(2)中的g(·)是比率函数,则δT′=exp(β-^β)是平均速率变化的估计量。平均利率变化值在所有年份都是相同的,因为平均利率变化和个人利率变化是相等的,不取决于政策特征。6私人汽车保险数据的应用本节描述了数据的应用,附录B.6.1中的R代码用于实施。所讨论的方法用于从未知法国保险公司的私人汽车投资组合的保费数据库中估计费率变化。该数据集来自R统计软件(R Core Team,2017)中的CASdatasetspackage(Dutang和Charpentier,2018)。虽然数据是从2003年1月至2004年6月收集的,但从2003年(t=0)到2004年(t=1)估计了利率变化。该分析旨在估计2004年投资组合的历史风险变化。为简单起见,在分析中仅使用了5000项政策的子集,其中2004年portfo lio的2248项与2003年的其他政策相匹配。可变驾驶员年龄、驾驶员性别、奖金金额、车辆年龄、车辆功率、车辆类别、保单上的车辆数量、保单区域和车库类型是假设为符合条件的保单术语。它们与2003年和2004年收取的保费有关,并且在投资组合之间的分布也有所不同。基于2003年和2004年没有关于性别中立定价的规定,驾驶员性别被列为混杂因素。

使用道具

19
何人来此 在职认证  发表于 2022-6-23 19:25:23 |只看作者 |坛友微信交流群
将车辆功率变量转换为数字变量,并在标签上标注顺序,以允许近似匹配。6.2实施设置所有维修方法都需要与车辆等级、车辆数量和车库类型精确匹配,因为这些被认为是充电量的非常强的预测因素。只有这些条款完全相同的政策才能被视为具有可比性。此外,政策区域完全匹配,因为它是一个混杂因素,无法近似匹配,因为它无法合理地转换为数字变量。从估计利率变化所用的样本中,精确匹配排除了2004年的所有政策,这些政策在2003年的投资组合中没有相同的交易对手。因此,有必要确保仅从样本中删除少量策略。对数据集应用了多种匹配的采样方法。倾向得分是使用带有逻辑连接函数的广义线性模型和加法线性预测器估计的。经典匹配在各个变量上找到最佳匹配,包括倾向得分的线性预测因子。通常使用线性预测值代替实际倾向得分,因为它是一个有效的替代品,并且与匹配的变量相关,处于线性范围内。倾向得分匹配仅在倾向得分的线性预测上找到最近的匹配。完全匹配适用于查找所有条款和条件都相同的保单。计算匹配用于优化养老金分数和所有个人政策特征的匹配。

使用道具

20
mingdashike22 在职认证  发表于 2022-6-23 19:25:26 |只看作者 |坛友微信交流群
Austin and Small(2 014)中描述的简单bootstrapalgorithm用于估计匹配抽样方法的率变化估计的抽样变量。这里的计算匹配使用一个标准的优化函数,最大化最小的p值,以实现策略类型组合的最佳平衡。然而,可以定义更复杂的功能,如Ramsahai等人(2011)中的用户定义功能,该功能允许根据特定的政策特征优先顺序进行匹配。虽然计算模型涉及大量计算,但软件实现允许并行计算以减少计算时间。这里的应用程序是在一台台式机上实现的,通过使用R并行包在多个线程上使用多个cor e处理器进行并行计算(R Core Team,2017)。计算时间不足一小时。对数标度上的线性模型用作估计速率变化的匹配方法的回归替代品。该应用程序使用了一个加法线性预测器,并假设pr-emium字符遵循对数正态分布。在匹配的抽样方法中,预测者与配对者具有相同的策略特征。使用bootstrapapproach来计算比率变化估计的置信区间。6.3结果通过对二元政策特征的t检验和对其他二元政策特征的KS检验得出的p值,评估了2003年至2004年间匹配投资组合中政策类型分布的平衡。通过设计,所有匹配方法在车辆类别、车辆数量、车库类型和政策区域上都达到了最小的100%p值。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-26 20:55