|
为了测试风险的附加值与仅测量个人风险相关,我们在以下样本外测试中进行了性能比较。我们首先描述样本外的练习和测量,然后讨论应用程序。4.1. 评估模型性能为了判断在现实环境中一个指标优于另一个指标的程度,我们需要非常复杂且精心设计的练习和指标。评估练习既需要在应用真实设置时测量信号质量,也需要使用模拟当前问题的测量来测量性能。本文使用递归实时样本外测试来评估性能。在实践中,这意味着使用递归练习,在每个季度仅使用截至该时间点的可用信息导出新模型。在我们的案例中,通过考虑出版滞后和以增加窗口的方式使用信息,这使得我们能够测试衡量标准是否能够提供预测2007-2008年全球金融危机的手段,以及衡量标准在任务绩效方面的排名。按照Sarlin[39]中预警模型的标准评估框架,我们的目标是模拟一个理想的领先指标Cn(h)∈ {0,1}用于观测n(其中n=1,2,…,n)和预测视界h。这意味着除了在脆弱期为1,否则为零的二元指标外,没有其他含义。为了检测事件Cn,我们需要一个连续的度量来指示脆弱状态pn中的成员身份∈ [0,1],然后将其转换为二进制预测BN,如果Pn超过特定阈值τ,则取值1∈ [0,1]否则为零。
|