楼主: 时光永痕
1448 0

[数据挖掘新闻] 显着性水平vs置信水平vs置信区间 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)三级

49%

威望
0
论坛币
26 个
通用积分
49.7576
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34070 点
帖子
2731
精华
0
在线时间
316 小时
注册时间
2020-7-21
最后登录
2024-4-28

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
显着性水平vs置信水平vs置信区间
您可能已经发现统计数据并不是一门科学。许多术语易于解释,有时会有很多词表示同一事物(例如“平均”和“平均”),或者听起来像它们应该表示同一事物,例如重要性程度和置信度。  
尽管它们听起来很相似,但重要性水平和置信度实际上是两个完全不同的概念。置信水平和置信区间  也听起来像是相关的。它们通常相互结合使用,这增加了混乱。但是,它们的含义确实有很大不同。
简而言之,这是这三个的定义。
显着性水平:  在假设检验中,显着性水平α是在原假设 为真时做出错误决定的概率  。
置信度:  如果一遍又一遍地重复一次投票/测试/调查,则获得的结果的概率相同。置信度= 1-alpha。
置信区间:预期包含感兴趣的总体参数的民意测验,实验或调查得出的一系列结果。例如,平均响应。置信区间是使用重要性级别/置信级别构建的。
在以下各节中,我将深入研究这些定义中的每一个(相对)纯语言的含义。
置信度与置信区间
将置信区间(CI)和置信度(CL)放在一起时,结果是数据的统计合理  分布。例如,结果可能报告为“ 50%±6%,置信度为95%”。让我们将统计分为几个部分:
置信区间:50%±6%= 44%至56%
置信度:95%
置信区间本质上与置信度相关。 置信度水平以百分比表示(例如,置信度为90%)。如果您以90%的置信度重复进行实验或调查,我们希望90%的结果与您从总体中得到的结果相匹配。置信区间是您期望真实值出现的结果范围。例如,您调查了一组儿童,以查看一年进行了多少次应用内购买。您的测试处于99%的置信度水平,结果是置信区间(250
让我们深入研究这两个术语。
1.置信区间
盖洛普民意测验 指出CI和CL。投票结果令人担忧,有人回答说2016年总统大选是“操纵的”,三分之二的美国人(66%)在大选前说“ ...他们对选票“非常”或“有点自信”将在全国范围内准确投放和计数。” 文章的下半部分提供了有关该统计信息的更多信息:“在95%置信水平下,抽样误差的容限为±6个百分点。”
让我们先以陈述的百分比为准。“ 66%”的结果只是图片的一部分。这是一个估计,如果您只是想大致了解人们对选举操纵的看法,那么对于大多数目的,例如演讲,报纸文章或将信息传递给您的阿尔伯特叔叔,66%应该足够好,他喜欢进行良好的政治讨论。但是,您可能有兴趣获取有关该估算实际值的更多信息  。例如,真实的估计值可能在46%到86%之间(这实际上是一个很差的估计值),或者民意测验者可以得出非常准确的数字:例如,在64%到68%之间。百分比分布(从46%到86%或64%到68%)是  置信区间。 但是这有多好具体民意调查?? 他回答这一行:
“采样误差的幅度为±6个百分点……”
这个误差幅度告诉我们,报告的66%可能是6%。因此,我们的置信区间实际上是66%,正负6%,可能的范围是60%至72%。
2.置信度
同样,以上信息对于大多数用途而言可能足够好。但是,为了科学起见,假设您想要更加严格。仅仅因为民意测验报告得出了一定的结果,并不意味着它是对公众舆论整体的准确反映。实际上,许多来自不同公司的民意测验针对相同的人群报告了不同的结果,主要是因为抽样(即询问人口的一部分而不是全部)并不是一门精确的科学。
为了使轮询结果统计上合理,您想知道是否重复(一次又一次)轮询,轮询结果是否相同?输入置信度。 置信水平表示您对自己的结果(无论是调查,测试还是实验)可以无限次重复获得相同结果的信心。在理想世界中,您希望您的置信度为100%。换句话说,您希望100%确定,如果竞争对手的民意测验公司,公共实体或街外的乔·史密斯执行相同的民意测验,他们将获得相同的结果。但是,这是统计数据,而且从来没有100%。通常,置信度设置为90-98%。
对于此特定示例,盖洛普报告的 置信度为“ 95%”,这意味着如果要重复进行民意测验,盖洛普将在95%的时间内获得相同的结果。
置信水平为0%意味着您完全  不相信 ,如果重复调查,您将获得相同的结果。实际上,您确定结果将完全不同。
100%的置信度意味着 毫无疑问 ,如果您重复调查,您将获得相同的结果。结果将是100%的时间可重复。
置信度与重要度
上面,我定义了一个置信度水平来回答问题:“ ... 如果重复(反复)进行调查/测试/实验,结果是否相同? ”本质上,置信度水平涉及可重复性。另一方面,重要性级别与可重复性完全无关。它们是在特定类型的实验(“假设检验”)的开始时设置的,并由您(研究人员)控制。
的显着性水平  (也称为α水平)是用于测试一个假设的术语。更具体地说,是 在原假设 为真时做出错误决定的可能性  。  用统计学的话来说,这是另一种说法,那就是您犯I型错误的可能性。
构建具有显着性水平的置信区间
使用正态分布,可以使用以下公式为任何显着性水平创建一个置信区间:
样本统计量±z *(标准误差)
(z * =乘数)
使用统计表(例如z表或t表)围绕点估计值(如平均值)构建置信区间,该表给出了正态分布数据的已知范围。正态分布的数据是可取的,因为数据倾向于以已知的方式运行,一定百分比的数据与均值之间有一定距离。例如,大约95%的时间点估计值将落在1.96标准偏差之内。
如果您对这个想法背后的数学,如何使用公式以及使用显着性水平构造置信区间感兴趣,可以在此处找到有关如何找到置信区间的简短视频。

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:显着性水平 置信水平 置信区间 显着性 Alpha

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 22:35