关键概念:标准差(SD)
什么是标准差(SD)?
标准差(SD)用于量化数据的变异性或离散程度,其单位与您的数据单位一致。
当数据呈高斯分布(正态分布)时,如何解读标准差?
若数据是从高斯分布(正态分布)中抽样得到的,那么预计68%的数值会落在均值加减1个标准差的范围内,95%会落在均值加减2个标准差的范围内。下图展示了从高斯分布中抽取的250个数值。阴影区域涵盖了均值加减1个标准差的范围,包含了约三分之二的数值。虚线绘制在均值加减2个标准差的位置,约95%的数值会落在这些界限内。
下方的图表展示了标准差与高斯分布(正态分布)之间的关系。概率分布曲线的下的面积代表整个总体,因此,概率分布曲线下某一部分的面积就代表总体的一个比例。在左侧图表中,绿色(阴影)部分从均值下方1个标准差延伸至均值上方1个标准差。绿色区域约占总面积的68%。所以,略多于三分之二的数值处于均值加减1个标准差的区间内。右侧图表显示,约95%的数值处于均值加减2个标准差的范围内。
数据非高斯分布时,如何解读标准差
下方图形展示了三组数据,它们的均值和标准差完全相同。左侧的样本近似呈高斯分布。另外两组样本与高斯分布相差甚远,但均值(100)和标准差(35)恰好完全一致。
此图表明,若假设数据呈高斯分布(正态分布),但该假设不成立时,以常规方式解读均值和标准差可能会产生误导。
即便不假设数据服从高斯分布,标准差仍可进行解读。切比雪夫定理(Chebyshev theorem)指出,即便数据并非来自高斯分布:
- 至少75%的值必定落在均值的两个标准差范围内
- 至少89%的值必定落在均值的三个标准差范围内
如何报告标准差
许多人会这样报告均值和标准差,比如“115±10 mmHg”,并在“方法”部分添加脚注或说明来界定第二个数值为标准差。
计算标准差(SD)
标准差如何计算?
- 计算每个数值与样本均值差值的平方
- 将这些平方值相加
- 将总和除以n-1,这称为方差
- 对结果取平方根,得到标准差
为何是n-1?
为何在上述第三步中除以n-1而非n?在第一步中,您计算的是每个数值与这些数值均值的差值。您并不知道总体的真实均值,您所知晓的只是样本的均值。除了极少数样本均值恰好等于总体均值的情况外,数据会更接近样本均值,而非总体真实均值。所以,在第二步中计算出的值,相较于用总体真实均值计算的结果,可能会略小(且不会更大)。为了弥补这一点,我们除以n-1而非n。
但为何是n-1呢?如果您已知样本均值,且除一个数值外其余数值都已知,您就能算出那个未知数值。统计学家称存在n-1个自由度。
但我们见过分母是n而非n-1的公式!
当您分析样本数据并希望得出更具普通性的结论时,会用到n-1的公式。通过这种方式(分母为n-1)计算出的标准差,是您对总体标准差的最佳估计。
如果您只是想量化某组特定数据的变异性,且不打算外推以得出更广泛的结论,计算标准差时可用n作为分母。这样算出的标准差是该组特定数值的标准差,但极有可能低估这些数据所来自总体的标准差。
科学研究的目标始终是推广结论,所以在分析科学数据时,不应使用分母为n的公式。我们能想到唯一可能用n(而非n-1)作分母有意义的情况,是量化考试分数的变异性。但更好的做法是展示所有分数的散点图,或频率分布直方图。
Prism软件计算标准差时始终使用n-1。
计算标准差需要多少个数值?
标准差用于量化数据的离散程度,显然您需要不止一个数值!两个数值够吗?很多人认为仅用两个数值无法计算标准差,但这是错误的。当只有两个重复(n=2)数据时,计算标准差的公式依然有效。结果是否有效?从数学角度看没有理由质疑,但我们通过模拟来验证。模拟一万组n=2的数据,每个数据点随机取自高斯分布。由于所有统计检验实际都基于方差(标准差的平方),我们将由重复数值计算出的方差,与数据模拟所依据的真实方差进行对比。一万个模拟数据方差的平均值,与真实方差的误差在1%以内。这意味着,由重复数据计算出的标准差,是对数据离散程度的有效评估。它有同等可能性偏高或偏低,但可能与真实标准差相差较大。
用Excel计算标准差
Excel可使用STDEV()函数,根据一组数值计算标准差。例如,若您想知道B1到B10单元格中数值的标准差,在Excel中使用以下公式:
=STDEV(B1:B10)
该函数计算标准差时,分母用的是n-1。若您想分母用n计算标准差,可使用Excel的STDEVP()函数。
标准差(SD)与标准误(SEM)相同吗?
不相同!
标准差(SD)对离散程度的量化有多准确?
样本的标准差与总体的标准差不同
根据一组数值样本计算标准差是很直接的事。但这个标准差的准确性如何呢?偶然情况下,您可能恰好得到了紧密聚集的数据,使得标准差偏低;或者您可能恰好得到了比总体数据离散程度大得多的数据,使得标准差偏高。您的样本的标准差可能与总体的标准差不相等,甚至相差甚远。
标准差的95%置信区间(CI)
您可以将任何计算所得数值的精确性表示为95%置信区间(CI)。虽然这不常做,但计算标准差的置信区间是完全可行的。我们会在之后更详细地讨论置信区间,会讲解均值的置信区间。而这里我们要讨论的是标准差的置信区间,二者有很大不同。
解读标准差的置信区间很直接。您必须假设您的数据是从高斯分布中随机且独立抽样得到的。您根据这一个样本来计算标准差及其置信区间,并利用它对整个总体的标准差进行推断。您可以有95%的把握认为,标准差的置信区间包含了总体真实的标准差。
标准差的置信区间有多宽呢?答案当然取决于样本量(N),如下表所示:
| 样本量(N) | 标准差的95%置信区间 |
2 | 0.45*SD to 31.9*SD |
3 | 0.52*SD to 6.29*SD |
5 | 0.60*SD to 2.87*SD |
10 | 0.69*SD to 1.83*SD |
25 | 0.78*SD to 1.39*SD |
50 | 0.84*SD to 1.25*SD |
100 | 0.88*SD to 1.16*SD |
500 | 0.94*SD to 1.07*SD |
1000 | 0.96*SD to 1.05*SD |
上图中依据五个数值计算出的标准差为18.0。但这些数值所来自总体的真实标准差,可能会大不相同。由于样本量N=5,95%置信区间为10.8(0.60×18.0)到51.7(2.87×18.0)。当您仅依据五个数值计算标准差时,不同的95%置信上限与下限之间相差近五倍。
大多数人会对小样本对标准差的界定如此不准确感到惊讶。随机抽样对小数据集可能产生巨大影响,会导致计算出的标准远离总体真实标准差相差甚远。
注意,这些置信区间并非对称的。为何?因为标准差始终是正数,置信下限不可能小于零。这意味着,置信上限通常会在样本标准差上方延伸得比下限在样本标准差下方延伸得更远。对于小样本,这种不对称性非常明显。
若您想自行计算这些置信区间,可使用以下Excel公式(N为样本量;alpha取0.05对应95%置信度,取0.01对应99%置信度,依此类推):
- 下限:= SD*SQRT((N-1)/CHIINV((alpha/2),N-1))
- 上限:=SD*SQRT((N-1)/CHIINV(1-(alpha/2), N-1))


雷达卡



京公网安备 11010802022788号







