卡方检验的基本原理
卡方检验(Chi-square Test),也称卡方拟合优度检验(Chi-square Goodness-of-Fit Test),用于检验样本数据是否与某种概率分布的理论数值相符合,进而推断样本数据是否来自于该分布的样本问题。例如,抽奖球编号0至9,根据出现的数字概率是否均匀,即0至9的出现概率是否为1/10。
首要步骤是给出零假设:总体X服从某种分布,这里的样本是认为来自总体X的。卡方检验的基本原理是给定零假设条件下,根据样本值落在总体X的各个区间的频数与总体落在该区间的期望频数的差值构造服从卡方分布的Pearson统计量。
GraphPad Prism为你提供更优秀的卡方检验!
比较观察频率和预期频率
这个计算器使用卡方检验比较(最多20个)类别内观察到的频率和期望的频率。
在第一列中输入类别的名称,然后输入每个组观察到的和预期的实际计数。
在计算器下方的描述中了解更多关于卡方的信息。
卡方是什么?
卡方检验将不同组的计数数据与每组内的预期计数进行比较。实验中的“对象”可以是个人、事件、物品,或者任何可以计数的东西。
这是一种灵活的方法,研究人员必须确定每组的预期计数。预期的计数可以是相等的,基于先前的研究,遵循一些统计分布,或者完全是其他的东西。
关键在于它的重点是计数数据。如果你分析的是比率或百分比,那么卡方就不是合适的工具。
如何使用卡方表计算器?
在单独的一行上输入标签(可选)、观察到的主题(或事件)的实际计数以及每个类别的预期计数。每个类别的标签不用于计算,但通常有助于组织输入数据。
重要:预期频率(如观察到的频率)应作为计数输入。期望计数中的小数可以接受,只要它们不代表百分比(对于250个人总数的15%,输入37.5)。
示例实验设置
假设你总共有605个科目,分布在五个类别中,并观察每个类别的计数如下:
- A组:200人
- B组:102人
- C组:50人
- D组:153人
- E组:100人
我们可以将我们观察到的计数与预期分布进行比较,看看是否有证据表明我们的样本作为一个整体与假设分布不同。
我如何找到期望频率?
卡方计算器要求你输入每组的预期频率,以便它知道与之比较的是什么。
下面是一个如何计算期望频率的示例。一个常见的假设是所有组都是相等的(例如,每组期望605 / 5 = 121)。这个计算器允许更灵活的选项,并且小数是可以接受的,只要预期的频率加起来等于观察的总数。
卡方的一个特定用例是分析列联表。对于联列表,预期计数是在假设因素不相关的情况下确定的。这个列联表计算器包括一个做耶茨修正的选项。
如何手工计算卡方?
卡方检验不像一些统计检验那么复杂,有时可以手工完成。你可以使用下面的公式,输入每个组的观察到的(O)和期望的(E)频率。将每个类别的计算值相加,我们可以计算出卡方检验统计量,如下所示:
一旦计算出检验统计量,就需要使用计算机或卡方表来找到近似的P值。
虽然这可以手工完成,但有几个人为错误的机会,这就是为什么我们推荐这个计算器(或Prism进行更高级的分析)。
卡方假设
虽然卡方检验是统计学中比较灵活的检验之一,但它有以下假设:
- 分析计数(而不是百分比)
- 每类科目数量多(一般大于5个)
- 与理论分布相比
相关测试和计算器
列联表的卡方检验
卡方检验也用于分析列联表。如果你有一个2x2的列联表,使用这个计算器。不同之处在于,对于列联表,期望计数是在假设变量没有关联的情况下在后台计算的。
二项式检验
如果你只有两个类别,请使用这个二项式测试计算器。在这种情况下,卡方给出的P值可能过低,但二项式检验会准确地计算出它。
卡方检验vs t检验
卡方检验是否表明每个类别中观察到的计数与其预期的“理论”总体不同,而t检验评估两个样本均值(或一个样本均值和一个固定值)在统计上是否相等。
翻译结果
卡方p值检验观察到的计数是否与预期计数一致。你可以将卡方值低于显著性阈值(通常为0.05)的数据解释为“数据不是从你预期的分布中抽样的证据”。如果P值大于显著性阈值,则没有证据表明观测值与预期的理论分布不同。
请注意,P值很容易被误解,但大P值并不能证明不存在差异;这可能是因为你没有足够的数据来检测差异。
本计算器采用双尾卡方检验,P值显著性阈值为0.05。
结果页面还包括卡方统计量及其自由度。注意,在解释中根本不涉及类别名称。
绘制卡方结果图
这个计算器不创建卡方结果的图形。分组条形图通常用于可视化观察计数和预期计数之间的差异,是Prism提供的许多自定义图形之一。