统计学(statistics)
运用概率论和数理统计的基本原理和方法,研究数据的收集、整理和分析的一门学科。将统计学应用于医学领域,则称为医学统计学。
1. 总体:
总体是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种变量值的集合。
2. 样本:
样本是从总体中随机抽取部分观察单位,其实测值的集合。随机抽样的目的是为了减少偏性,使样本对总体有代表性。
随机抽样......减少偏性,使样本对总体有代表性
随机抽样的目的:用样本信息来推断总体特征
3. 概率:
概率是描述随机事件发生的可能性大小的数值,常用P表示。随机事件的概率在0与1之间。P越接近1,表明某事件发生的可能性越大, P越接近0,表示某事件发生的可能性越小。
小概率事件:当一个事件的概率P≤0.05或 P≤0.01时,称为小概率事件。小概率事件表示某事件发生的可能性很小,在一次试验中基本上是不会发生的。
资料的类型
(1) 数值变量(Numerical Variable)又称 为定量资料或计量资料,其变量值是定量的,表现 为数值大小,一般有度量衡单位。例:血压,身高,体重等测量指标
(2) 分类变量(Categorical Variable)又 称为定性资料,其变量值是定性的,表现为互不相 容的类别或属性。有两种情况:
无序分类(Nominal Variable)又称为名义变 量。包括变量值取无等级顺序的二项分类或多项分 类。 例:性别、血型等分类指标。
有序分类(Ordinal Variable)又称为等级资 料,各类之间有程度的差别,给人以“半定量”的概念,即定性变量的变量值取有等级顺序的几类。例:临床疗效可以分为痊愈、显效、好转、无效、恶化。
不同类型的资料,统计方法不同
数值变量 t检验、方差分析、回归与相关
无序分类变量 卡方检验
有序分类变量 秩和检验
各种类型的 资料之间是可以相互转化的
误差:
(1)抽样误差
(2)随机测量误差
(3)系统误差
(4)过失误差
抽样误差和随机测量误差是不能避免的,但可控制。系统误差和过失误差是可以避免的。
统计工作的基本步骤
(1)设计
(2)搜集资料
(3)整理资料
(4)分析资料
SPSS软件基本数据管理功能
排序 分割 描述 计算变量 赋值 重新编码
散