楼主: 时光永痕
590 0

[数据挖掘新闻] 统计假设检验–旋转轮子 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)三级

37%

威望
0
论坛币
26 个
通用积分
49.7576
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
316 小时
注册时间
2020-7-21
最后登录
2024-4-24

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
统计假设检验–旋转轮子
知道何时以及如何选择正确的统计假设检验绝非易事。您可能需要花费多年的学习和实践才能熟悉它。
幸运的是,有一些方法可以通过制定流程,策略和漂亮的大图来简化它!
在这里,我将为您提供全部三个!
入门
我认为每个人都对良好的可视化反应良好,因此这就是我们要开始的地方。
我创建了所谓的“假设轮”,并在世界范围内首次亮相:
现在,这里有大量的信息,我不希望任何人都能快速浏览所有信息,因此您将花费大量的学习时间来掌握所有信息。
假设检验-四步策略
在做出选择哪种假设检验的决定时,您需要一个行动计划,这是我的四步策略:
推论结果变量的属性(又名因变量或假设变量)
推导输入变量的属性(又名自变量或预测变量)
推导关系的参数
在假设轮上查询统计信息
步骤1和2:您的变量属性
由于步骤1和步骤2是同一件事,因此您可以一起进行操作。您需要检查输入和结果变量的属性是:
数据类型
分布
班数
您将在研究中遇到4种不同的数据类型,它们是比率(R),间隔(I),序数(O)和标称(N),如下所示:
就分布而言,您需要检查数据(仅比率数据或间隔数据)是正态分布(ND)还是非正态分布(NND)。实际上,您真正需要知道的是它们是否对称-它们实际上不需要完全成熟的高斯分布就可以在这里进行限定。
最后,您需要检查(仅顺序或名义)数据中有多少个类(类别)。通过示例更容易解释什么意思-变量Gender有2个类;男性和女性,而《彩虹色》有7(ROYGBIV)。您真正需要知道的是变量是否具有2个类或大于2个类。
步骤3:关系参数
假设轮需要知道的关系参数是您要进行的分析类型,单变量还是多变量,如下所示:
假设轮颜色代码
为了帮助您浏览假设轮,我对它的各个部分进行了颜色编码,如下所示:
步骤4:在假设轮上查询您的统计信息
我们总是从假设变量的属性开始,该变量以紫色显示。有3个同心圆,分别对应于数据类型,分布和类数。
进一步旋转,以红色显示具有预测变量的属性-再次,有3个圆圈代表数据类型,分布和类数。
然后,对于关系参数,我们有一个蓝色圆圈,它表示我们的分析是单变量(UV)还是多变量(MV)。仔细观察,您会发现有两个假设轮,其中较大的一个仅包含单变量假设检验,而较小的一个仅包含多元假设检验。
最后,外部橙色圆圈告诉我们在任何给定情况下我们应该选择哪种假设检验。
假设轮示例
让我们放大一个特定的例子,看看如何使用假设轮告诉您应该使用哪个单变量检验。
假设您的假设变量具有以下属性:
序数
> 2类
您的预测变量具有以下属性:
标称
> 2类
现在让我们看一下假设轮的外观:
从中心开始,找到您的假设变量的数据类型(序数)。它有两个以上的类,因此我们也找到了它。旋转到红色部分,找到预测变量的数据类型(标称)。在这种情况下,由于假设变量具有两个以上的类别,因此预测变量具有多少个类别无关紧要-正确的统计量是卡方检验
总结
假设轮不仅是另一个流程图,可帮助您选择应使用的统计假设检验。世界不需要另一个流程图,它需要一个更好的流程图-我相信就是如此。
假设轮是一个框架,可帮助您提出正确的数据问题,以便获得正确的答案。您需要做的是问3个问题,以正确选择假设检验:
``我的数据类型(RION)是什么?
``它们的分布是(ND,NND),和/或它们有多少个类别(2,> 2)?
我想进行哪种类型的分析(UV,MV)?

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:统计假设检验 假设检验 Gender 非正态分布 数据类型

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-24 20:47