|
数据集的中值也可以测量中心趋势,但计算方法是将所有数字按数字顺序排列,每次删除一个值,直到找到一个中心值,或者如果有偶数的值,则删除剩余两个值的平均值。-12-中位数无法解释较低数字的聚类,即使其他值可能很遥远。 当向用户建议阈值时,我们如何确定哪个阈值将提供适当数量的边?为了做到这一点,我们将使用标准偏差,以确保在图形中获得一定百分比的边。数据集的平均值减去一个标准偏差提供了一个图表,该图表保留了16%相关性最小股票的边缘。平均值加上一个标准差给出了一个图表,显示了16%相关性最强的股票之间的联系。标准偏差公式基于平均偏差,即从每个数据值到平均值的距离的平均值。 不相关 相关的 — 13-为了消除绝对值,让我们对分子进行平方运算,因为绝对值很难处理较大的数字和数据集。这为我们提供了测量平方偏差的方差公式。使这个偏差为它的平方根。 这个公式可以重写为求和函数,而不是分子。 如果你看过标准偏差公式,你可能会问,为什么上面的分母是n而不是n-1。
|