【GraphPad】统计推断中的十二个重要概念-经管之家官网!

人大经济论坛-经管之家 收藏本站
您当前的位置> 考研考博>>

考研

>>

【GraphPad】统计推断中的十二个重要概念

【GraphPad】统计推断中的十二个重要概念

发布:GraphPad_China | 分类:考研

关于本站

人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!

经管之家新媒体交易平台

提供"微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯"等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

提供微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

“如果你了解关于一个特定主题的十二个概念,则对于只知道两三个概念的人而言,你就像个专家。”——ScottAdams《十二法则(RuleofTwelve)》在学习统计学的时候,我们很容易陷入细节而失去对全局的理解。下面列出了Gr ...
扫码加入统计交流群


“如果你了解关于一个特定主题的十二个概念,则对于只知道两三个概念的人而言,你就像个专家。” —— Scott Adams 《十二法则(Rule of Twelve)》
在学习统计学的时候,我们很容易陷入细节而失去对全局的理解。下面列出了GraphPad根据统计推断(statistical inference),总结出的十二个重要概念,帮助大家加强对统计学全局的理解。
01
统计学让你从有限的数据中得出一般结论‍
推论统计学(inferential statistics)的全部要点,是从有限的数据中推断出一般结论。“描述性统计学(Descriptive statistics)”只是描述数据,未得出任何一般结论。但统计学的挑战和困难之处在于从有限的数据中得出一般结论。
02
统计学并不“直观”
“直观”一词有两层含义。其一是“易于使用和理解”,是我在写《直观生物统计学(Intuitive Biostatistics)》的主要目标;其二是“本能、或即便没有理由,也会按照自己认为正确的事情采取行动”。在第二层含义中,统计推理与“直观”毫不沾边。因为在我们思考数据时,直觉往往会将我们引入歧途。人们经常在随机数据中看到模式,并得出毫无根据的结论。
要从数据中得出有效的结论,需要统计上的严密性。
03
统计结论总是以概率的形式出现‍
“统计学意味着永远不能说你绝对确信。”如果你认为一个统计学结论似乎已经确定,那可能存在一些误解。统计学的全部意义在于量化不确定性。
04
所有统计检验均基于假设‍
每个统计推断均基于一系列假设。不要试图解读任何统计结果,直至你看完列表。每一次统计计算背后的假设,数据是随机抽样的,或至少能代表可收集到的更大数量的数据集。如果你的数据不能代表本可以(但实际没有)收集的更大数据集,那么统计推断就没有意义。
05
应提前决定如何分析数据
分析数据需要许多决定。参数检验或非参数检验?是否排除异常值?是否首先转换数据?是否对外部对照值进行标准化?是否调整协变量?是否在回归中使用加权因素?所有这些决定均应该成为试验设计的一部分。如果统计分析的决定是在检查数据之后作出,统计分析很容易成为一种高科技的Ouja board - 一种产生预定结果的方法,而非分析数据的客观方法。这个新名称是p-hacking。
06
置信区间量化精确度,且易于解读‍
假设你已计算所收集的一组值的平均值,或者产生某个事件的受试者比例,这些值描述了分析的样本。但有关你所采样的群体总数如何?真实的群体平均值(或比例)可能更高,也可能更低。那么95%置信区间的计算就考虑到了样本量和分散性。给定一组假设,你可以有95%的把握确定置信区间包含真实的群体值(只能通过收集无限量的数据进行确定)。当然,“95%”仅仅是一种惯例。置信区间可以计算任何程度的期望置信。几乎所有结果 -- “比例、相对风险、优势比、平均值、平均值之间的差值、斜率、速率常数等” --应附加置信区间。
07
P值检验零假设,起初可能难以理解
P值的逻辑起初似乎很奇怪。检验两组是否不同时(不同平均值,不同比例等),首先假设这两个群体实际上是相同的,这被称为“虚假设(null hypothesis)”。然后考虑:如果“虚假设”为真,那么随机获得与实际观察到的差异一样大(甚至更大)的样本的可能性有多大?如果P值很大,那么你的数据与“虚假设”一致;如果P值很小,随机机会产生实际观察到的巨大差异的可能性很小。
这会让你怀疑虚假设是否正确。如果你不能确定虚假设,就无法解释P值。
08
“统计学显著性”并不意味影响很大或在科学上很重要‍
如果P值小于0.05(这是一个任意的、但被广泛接受的阈值),那么可以认为结果具有统计学显著性。但这仅仅意味着,你观察到的(或更大的)差异只会在不到5%的情况下发生。一个在科学上或临床上不重要的微小效应可能具有统计学显著性(尤其是在大的样本量中)。这个结论也可能错误,因为你会得出结论,结果具有统计学显著性的概率为5%。
09
“无显著性差异”并不意味着没有效果、效果很小或与科学无关‍
如果差异无统计学显著性,那么可得出这样的结论:观察到的结果并不与虚假设不一致(注意双重否定)。你不能断定虚假设为真。很有可能是虚假设是错误,群体之间确实存在差异。这是对于小样本存在的问题。当你需要根据这个结果做决定时,定义一个结果在统计上显著或不显著是有意义的。否则,统计显著性的概念对数据分析的帮助不大。
10
多重比较使得统计结果‍难以解释
同时检验许多假设时,多重比较的问题使其结果变得具有欺骗性。如果5%的检验碰巧具有“统计学显著性”,那么如果检验了许多假设,就会得到大量统计显著性结果。可以使用特殊方法来减少发现错误但统计上有意义的结果的问题,但是这些方法也使得很难找到真实的效果。多重比较可能非常难以实施,仅当所有分析都计划妥善,并且所有计划的分析都被执行和报告的时候,统计分析才能被正确地解释。
11
相关性并不意味着因果关系‍
两个变量之间具有统计学显著性的相关性或关联可能表明一个变量会受到另一个变量的影响。但这可能只是意味着两者都受到第三个变量的影响。或者这可能是一个巧合。
12
发表的统计数据往往都是积极的
当你在读一篇论文的时候,就已经产生很多选择。当试验成功时,科研人员会继续进行这个项目,而许多其他项目会被放弃。科研人员更有可能写一些能产生显著结果的项目,或者继续以各种方式分析数据,直到得出“具有统计学显著性”的结论。期刊也更有可能会发表一些“积极的”研究。如果虚假设为真,那么你可能会期望在5%试验中得到具有统计学显著性的结果,而这5%的试验比其他95%的试验更有可能被发表。
「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
本文关键词:

本文论坛网址:https://bbs.pinggu.org/thread-10075929-1-1.html

人气文章

1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
经管之家 人大经济论坛 大学 专业 手机版