- 相关分析简介
- 现代自然科学研究, 经济检验, 企业管理等活动中普遍存在相互影响的关系
- 函数关系是严格的确定对应关系,
- 相关关系-是一种不要求确定性对应, 具有一定随机性的关系
- 相关分析用来研究变量间相关关系
- 现代自然科学研究, 经济检验, 企业管理等活动中普遍存在相互影响的关系
- 相关关系的种类
- 按照相关关系的表现形态来划分, 可以分为线性相关和非线性相关
- 按变量之间相互关系的方向, 分为正相关和负相关
- 按变量之间相关的程度划分, 可以分为完全相关, 不相关, 和不完全相关
- 相关分析的主要内容
相关分析是对相关关系密切程度的研究, 相关分析的主要内容为
- 确定现象之间有无相关关系、
- 确定相关关系的表现形式
- 确定相关关系的密切程度和方向相关分析常通过图形 (散点图) 和数值 (相关系数) 两种方法来揭示事物之间统计关系的强弱 程度
- 绘制散点图
2 Pearson相关分析
- Pearson 相关分析系数
- 在相关分析中, 对于两个数值型变量, 通常采用Pearson相关系数来度量两 个变量之间的相关性,设 X=(x1,x2,…,xn) , Y=(y1,y2,…,yn) ,则变量 X 和 Y 的Pearson相关系数定义为
- 在相关分析中, 对于两个数值型变量, 通常采用Pearson相关系数来度量两 个变量之间的相关性,设 X=(x1,x2,…,xn) , Y=(y1,y2,…,yn) ,则变量 X 和 Y 的Pearson相关系数定义为
- Pearson 相关系数的含义和相关性是否显著的检验
- Pearson 相关系数实际是两个中心化之后的两个变量的夹角余弦
- 当两个变量完全正相关时(两向量方向完全相同), r=1
- 若两个变量完全负相关, r=-1
- 若两个变量无关(相互垂直), r=0
- 在两个变量不相关的原假设下, 可以证明:
- 近似服从自由度为n-2的t 分布
据此可以检验两个变量之间的相关性是否显著
- 缺点:如果X和Y为有序的等级变量, 此时数值上的加减没有意义, Pearson相关系数失去意 义, 为此我们考虑基于秩次的 Spearman 相关系数
3 Spearman相关分析
- Spearman 相关系数
- Spearman相关系数常用来度量定序型变量之间的线性相关关系
- 该系数的设计思想与Pearson简单相关系数完全相同
- 由于变量不是定距型数据, 不能直接采用原始数据进行计算, 而是利用数据的秩
- 所谓秩是指 xi 在 x1,…,xn 中按照一定的准则排序的顺序
- Spearman 相关系数的计算是将上述秩次带入到pearson 相关系数的计算公式中
- 变量的秩次
- 利用两变量的秩次大小作线性相关分析, 对原始变量的分布不作要求.
- 设 X=(x1,x2,…,xn) 和 Y=(y1,y2,…,yn) 为两个属性变量, 分别对A和 B从小到大进行排序, 求出秩次, 记为 UX, VY
- 例如 X=(1,5,7,3,4), 1排在第一位, 秩为1, 5 排在第4位, 秩为4, 可 得 $UX$=(1,4,5,2,3),
- Spearman相关系数 的具体计算
- 分别求出变量X 和 变量 Y 的秩次, 分别记为 UY=(U1,…,Un),VY=(V1,…,Vn),是取值1,…,n 的数值变量
- 计算 UX,VY 的 Pearson相关系数, 即为 变量 X 和Y 的 Spearman相关系数


雷达卡



不错,虽然咱们用得最多的是皮尔逊的,但是其他两个也很重要
京公网安备 11010802022788号







