协方差矩阵的计算方法
设矩阵A为输入。A的每一行为一个观测值,每一列代表一个特征(变量)。
计算步骤如下:
1. 计算每一变量的均值(列均值);
2. 中心化──每个元素减去该列的列均值;
3. 转置并相乘。
在excel
COVAR
全部显示
全部隐藏
返回协方差,即每对数据点的偏差乘积的平均数,利用协方差可以决定两个数据集之间的关系。例如,可利用它来检验教育程度与收入档次之间的关系。
语法
COVAR(array1,array2)
Array1 第一个所含数据为整数的单元格区域。
Array2 第二个所含数据为整数的单元格区域。
说明
参数必须是数字,或者是包含数字的名称、数组或引用。
如果数组或引用参数包含文本、逻辑值或空白单元格,则这些值将被忽略;但包含零值的单元格将计算在内。
如果 array1 和 array2 所含数据点的个数不等,则函数 COVAR 返回错误值 #N/A。
如果 array1 和 array2 当中有一个为空,则函数 COVAR 返回错误值#DIV/0!。
协方差计算公式为
其中 x 和 y 是样本平均值 AVERAGE(array1) 和 AVERAGE(array2),且 n 是样本大小。
示例
如果您将示例复制到空白工作表中,可能会更易于理解该示例。
操作方法
创建空白工作簿或工作表。
请在“帮助”主题中选取示例。不要选取行或列标题。
从帮助中选取示例。
按 Ctrl+C。
在工作表中,选中单元格 A1,再按 Ctrl+V。
若要在查看结果和查看返回结果的公式之间切换,请按 Ctrl+`(重音符),或在“工具”菜单上,指向“公式审核”,再单击“公式审核模式”。
Matlab代码如下:
function C = mycov(A)avg = mean(A);num = size(A, 1);normA = A - repmat(avg, num, 1);C = (normA' * normA) / (num -1);
这和Matlab的cov函数输出一致。
|