|
Roberts/利用高斯过程从异构数据流中提取预测信息,激励使用输入特定的特征长度尺度。在ARD内核中,等式(14)的标量输入长度标度l被替换为向量输入长度标度,每个输入维度I具有不同的LIF,允许不同的距离度量。这些超参数将适用于任何给定的数据集:大尺度的输入只会导致协方差函数的微小变化,而小尺度的输入会有效地放大这些变化。因此,我们可以将每个特征的相关性核心定义为其输入长度标度的倒数,并通过降低相关性对输入的显著性进行排序。相关性得分i=l-1i(15)ARD算法已成功应用于从生物信息学(Campbell and Tipping,2002)到地震学(Oh et al.,2008)的研究中,为修剪大量相关特征提供了有效工具。提出的方法学的一个局限性是,相关性得分仅提供模型特征之间的相对排名。两个同样无意义的输入将具有相似大小的相关性分数,两个同样有意义的特征也是如此。就其本身而言,这些分数为执行维度缩减提供了很小的基础。为了克服这一点,我们在每次回归中都包含一个由标准高斯噪声组成的基线特征。我们认为一个有意义的输入应该有一个比噪声大至少两个数量级的相关性核心,因此通过计算相关性比率,我们可以确定哪些特征是客观信息。相关性比率=相关性得分相关性得分噪音(16)5。结果在本节中,我们概述了我们的分析结果。
|