|
类条件密度由,pi=NXi=1αiδ(x)给出- i) (18)pi=NXi=1βiδ(x- i) (19)使得NXi=1αi=NXi=1βi=1δ(i- j) =δij=如果i 6=j,则为0,如果i=j,则为1。(20)让αi和βi分别记录α和β的最大似然估计,i=1。。。,N、 基于两个类别中每个类别的可用样本数:αi=mi1mβi=mi2m(21),其中mi1和mi2是x分别从类别c中取i值的样本数。我们将Bhattacharyya系数的样本估计值定义为^ρ=ρ^α,^β=NXi=1q^αi^βi(22),其中,α={^α,…,αN}和β=N^β。。。,^β不分别。(Djouadi,Snorrason&Garber 1990)基于两类训练样本(由多元高斯分布描述)的Bhattacharyya系数估计的偏差和方差的衍生封闭式表达式。数字样本用于显示密度的真实参数、训练样本数、类别方差和观测空间维数之间的关系。3.2尺寸缩减在实践中应用Bhattacharyya距离的一个关键要求是具有相同尺寸的数据集。(Fodor 2002;Burges 2009;Sorzano,Vargas&Montano 2014)是旨在使用主成分分析或奇异值分解及相关技术降低数据集维度的方法的综合集合。(Johnson&Lindenstrauss 1984)证明了一个基本结果(JL引理),即欧几里德空间的任何n点子集都可以嵌入k=O(logn)中) 任何一对点之间的距离变形不超过(1±)因数的尺寸), 对于任何0< < 1.虽然主成分分析仅在原始数据点本质上是低维的情况下有用,但JL引理完全不需要对原始数据进行假设。
|