DAY #14
1.主题
爱上统计学 尼尔.J.萨尔金德 中文版 第二版
2.摘要
零假设 == 无罪推定 ——>学术猜测的源头与比较基础
零假设的初心:
①.在没有开始收集资料之前,对一无所知的两个变量最好保持沉默,判定他们之间没有瓜葛;
②.即使两个变量之间存在些许瓜葛,在没有彻底查清获取足够证据支持之前,仍判定他们之间的瓜葛源于偶发性因素;
③.基于此假设,我们要搞清楚的就是哪些因素导致了两个变量之间的相关性,从而颠覆了最初的假设;
④.也就是说,零假设是随机因素引发的相关性或没有相关性,而研究目的是看是哦福存在非随机因素导致了相关性,从而给观察到的现象一个更合理的解释;
零假设 == 等价关系——>暗含的假设——>对应总体——>只能间接检验
研究假设 == 不等价关系——>明确的假设——>对应样本——>可以直接检验
单尾检验 == 有方向假设——> > or <
双尾检验 == 无方向假设——> ≠
抽样的理论基础 == 正态分布 == 假设总体中的抽取的样本服从正态分布,即大多数事件或次数大多分布在数据的中间地区,较少分布在数据的两个极端地区;
正态分布的面积就是事件出现或发生的概率,可以说,正态分布图实现了概率的可视化;
显著性水平的实质:
①.影响到研究对象的潜在因素有很多,属于不可控因素;
②.这些潜在因素会导致研究结论出现错误,但只在一定概率水平下,其他时候,研究结论还是正确的;
③.砍掉这一小块可能出错的部分,研究结论就趋于完全正确,但这并不现实;
④.于是,你愿意承担这部分风险,这就是显著水平,即研究结论出错的可能性大小;
零假设的逻辑基础:
零假设<——>统计类型<——>数据分布
接受零假设 == 零假设为真 == 偶然性导致
拒绝零假设 == 零假设为假 == 必然性导致
统计分析 = 统计显著 + 效应量规模
COMPARE MEANS
两个群体的均值检验的两种类型:
①.两个独立群体的两组数据对比——>独立样本t检验,Independent Samples T Test
②.同一组群体前后两次数据对比——>非独立样本t检验,Paired Samples T Test
两个群体的均值检验的结果解读:
p = Sig(2-tailed) > 0.05 ——> 接受零假设——>不存在显著性差异——>偶然因素导致,外部因素
p = Sig(2-tailed) < 0.05 ——> 拒绝零假设——>存在显著性差异——>特定因素导致,内部因素
也就是说,p是量群体没差异的概率,即零假设正确的概率是p。
F检验One Way ANOVA
一元方差分析的逻辑:
多个组别在同一个因素上是否产生差异——>产生差异源自随机因素还是特定因素
组内 == 随机因素
组间 == 特定因素
两个群体之间F与t的关系——> F = t²
Univariate Analysis Of Variance
析因方差分析/二元方差分析:
多个最别在多个因素上是否产生差异
差异的来源:
主效应——>因素内部影响导致
交互效应——>因素交叉影响导致
相关系数Bivariate Correlation
检验两个变量之间的关系
线性回归Linear Regression
利用两个变量之间的相关系数,用一个变量值估计另一个变量值
相关系数的绝对值越大,估计就越准确,因为两个变量之间共享的特征越多,依据一个变量就能越多地了解另一个变量。
非参数统计
单样本卡方检验Chi-Square
检验观察到的实际频数是不是符合随机分布,即没有差异
3.心得感悟
零假设 == 无罪推定
检验统计量7步法:
①.零假设与研究假设
②.设置零假设显著性水平
③.选择适合的检测统计量
④.计算检测统计值/实际值
⑤.查找出拒绝零假设的临界值
⑥.比较实际值与临界值
⑦.决定拒绝或接受零假设
弄清楚SPSS统计表如何解读是关键,搞清楚p与显著性水平大小比较就行了;
推论型统计检验路线图:
核心 == 验证是否具有显著性
分类 == 参数检验 + 非参数检验
参数检验 == 符合正态分布 == t检验 + F检验 + 析因方差分析 + 相关系数 + 回归分析
分参数检验 == 不符合正态分布 == 卡法检验
4.时间统计
昨日阅读5小时,累计470小时
|