知道何时以及如何选择正确的统计假设检验绝非易事。您可能需要花费多年的学习和实践才能熟悉它。
幸运的是,有一些方法可以通过制定流程,策略和漂亮的大图来简化它!
在这里,我将为您提供全部三个!
入门
我认为每个人都对良好的可视化反应良好,因此这就是我们要开始的地方。
我创建了所谓的“假设轮”,并在世界范围内首次亮相:
现在,这里有大量的信息,我不希望任何人都能快速浏览所有信息,因此您将花费大量的学习时间来掌握所有信息。
假设检验-四步策略
在做出选择哪种假设检验的决定时,您需要一个行动计划,这是我的四步策略:
推论结果变量的属性(又名因变量或假设变量)
推导输入变量的属性(又名自变量或预测变量)
推导关系的参数
在假设轮上查询统计信息
步骤1和2:您的变量属性
由于步骤1和步骤2是同一件事,因此您可以一起进行操作。您需要检查输入和结果变量的属性是:
数据类型
分布
班数
您将在研究中遇到4种不同的数据类型,它们是比率(R),间隔(I),序数(O)和标称(N),如下所示:
就分布而言,您需要检查数据(仅比率数据或间隔数据)是正态分布(ND)还是非正态分布(NND)。实际上,您真正需要知道的是它们是否对称-它们实际上不需要完全成熟的高斯分布就可以在这里进行限定。
最后,您需要检查(仅顺序或名义)数据中有多少个类(类别)。通过示例更容易解释什么意思-变量Gender有2个类;男性和女性,而《彩虹色》有7(ROYGBIV)。您真正需要知道的是变量是否具有2个类或大于2个类。
步骤3:关系参数
假设轮需要知道的关系参数是您要进行的分析类型,单变量还是多变量,如下所示:
假设轮颜色代码
为了帮助您浏览假设轮,我对它的各个部分进行了颜色编码,如下所示:
步骤4:在假设轮上查询您的统计信息
我们总是从假设变量的属性开始,该变量以紫色显示。有3个同心圆,分别对应于数据类型,分布和类数。
进一步旋转,以红色显示具有预测变量的属性-再次,有3个圆圈代表数据类型,分布和类数。
然后,对于关系参数,我们有一个蓝色圆圈,它表示我们的分析是单变量(UV)还是多变量(MV)。仔细观察,您会发现有两个假设轮,其中较大的一个仅包含单变量假设检验,而较小的一个仅包含多元假设检验。
最后,外部橙色圆圈告诉我们在任何给定情况下我们应该选择哪种假设检验。
假设轮示例
让我们放大一个特定的例子,看看如何使用假设轮告诉您应该使用哪个单变量检验。
假设您的假设变量具有以下属性:
序数
> 2类
您的预测变量具有以下属性:
标称
> 2类
现在让我们看一下假设轮的外观:
从中心开始,找到您的假设变量的数据类型(序数)。它有两个以上的类,因此我们也找到了它。旋转到红色部分,找到预测变量的数据类型(标称)。在这种情况下,由于假设变量具有两个以上的类别,因此预测变量具有多少个类别无关紧要-正确的统计量是卡方检验。
总结
假设轮不仅是另一个流程图,可帮助您选择应使用的统计假设检验。世界不需要另一个流程图,它需要一个更好的流程图-我相信就是如此。
假设轮是一个框架,可帮助您提出正确的数据问题,以便获得正确的答案。您需要做的是问3个问题,以正确选择假设检验:
``我的数据类型(RION)是什么?
``它们的分布是(ND,NND),和/或它们有多少个类别(2,> 2)?
我想进行哪种类型的分析(UV,MV)?
关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!