楼主: JMPer
2430 0

[学习分享] 如何在JMP中进行相关分析(Correlation Analysis) ? [推广有奖]

  • 1关注
  • 31粉丝

合作版主

教授

86%

还不是VIP/贵宾

-

威望
0
论坛币
18143 个
通用积分
5.4451
学术水平
92 点
热心指数
91 点
信用等级
86 点
经验
40746 点
帖子
698
精华
4
在线时间
806 小时
注册时间
2014-7-24
最后登录
2023-7-14

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

相关分析,是常见的统计分析方法,它旨在研究两个或多个变量之间是否存在某种依存变化关系你知道如何判断变量之间的相关性?如何在JMP中实现相关分析?今天的文章我们就来一起探索相关分析。


相关分析通常关注两个维度:相关大小和相关方向

  • 相关大小用相关系数r的大小表示,r越大说明相关性越强。
  • 相关方向通过r的正负值来反映,正值表示正相关,负值表示负相关。

关于相关系数的强弱并无统一的划分界限,但也有一些约定俗成的看法是,|r|大于0.7认为相关性强;0.5-0.7为中等强度相关;0.3-0.5为弱相关。也有其它划分方式,如大于0.8认为相关性强,等等不一而足。尽管有这些所谓标准,但不同领域的各有侧重,例如社会学现象能达到0.7的非常少,而医学实验室指标达到0.9以上的比比皆是。所以这些所谓的划分标准,大家稍微了解一下即可,不能太死板教条。


通常意义上说的相关系数是指Pearson相关系数(有时也包括Spearman相关系数),它是用来描述线性相关的。但实际中除了线性相关外,还存在大量的非线性相关关系,例如对数相关、抛物线相关等。


因此,在进行相关分析前,最好先绘制散点图,粗略探索数据的相关性,只有数据呈现线性关联的时候,才考虑用Pearson相关系数。如果散点图显示两个变量之间可能是非线性关系,可以考虑对其中某一变量进行变量变换,然后再计算相关系数。


另外需要注意,相关不代表因果关系,一定要结合专业知识有合理解释。比如游泳死亡人数与冰糕销售量呈现正相关,我们不能推断吃冰糕会增加游泳死亡风险。变量A和B具有相关性,除了A和B具有因果关系外,另一个原因可能是有另一变量C同时对A和B产生影响,导致A和B呈现出表面上的虚假相关。比如冰糕销售量与游泳死亡风险的例子中,天气炎热就是变量C,同时导致了游泳死亡人数和冰糕销售量的上升。


本文主要介绍Pearson相关、Spearman相关以及偏相关

  • 当两个变量服从正态分布时,通常用Pearson相关系数度量相关性。
  • 如果有变量不服从正态分布,通常用Spearman相关系数度量相关性。
  • 如果想了解在控制了其它变量后,两个变量之间的相关系数大小,可以计算偏相关系数,例如控制年龄的影响后体重与血压之间的相关关系。

本文将基于图1所示数据,探索BMI与躯体健康评分的相关性,以及校正年龄后BMI与躯体健康评分之间的偏相关系数。

图1.png

图1 示例数据



01  Pearson相关与Spearman相关


Pearson相关和Spearman相关均可通过JMP菜单“分析”→“多元方法”→“多元”来实现(图2)。

图2.png



在“多元与相关性”界面中,将BMI与躯体健康评分放到“Y,列“(图3)。

图3.png



默认结果输出Pearson相关系数矩阵(图4)和散点图矩阵(图5),可以看出两个变量的Pearson相关系数为0.1479。

图4 (2).png


图5.png



由于BMI与躯体健康评分均不符合正态分布,因此需要输出Spearman相关系数,可点击“非参数相关性→Spearman ρ”(图6)。

图6.png



结果如图7所示,Spearman 相关系数为0.1739。

图7 (2).png




想显示其它结果均可通过点击“多元”左侧的红色三角形按钮来输出(图6),如想输出相应的P值,可点击相关性概率;想输出相关系数的置信区间,可点击相关性置信区间。



02  多变量的偏相关

在了解了BMI与躯体健康评分的相关性后,我们还想探索在校正年龄后BMI与躯体健康评分之间的偏相关系数。


偏相关也是通过JMP 菜单“分析”→“多元方法”→“多元”来实现。


同时将年龄、BMI与躯体健康评分三个变量拖入图2中的“Y,列”。


在结果界面中,点击“多元”左侧的红色三角形按钮,在下拉菜单中点击“偏相关性”和“偏相关性概率”(图8),即可输出偏相关系数及其P值。

图8.png


输出结果见图9,校正年龄的影响后,BMI和躯体健康评分之间的相关性略有提高,从0.1479提升到0.1940,说明年龄对这两个变量之间的关系具有一定影响,但影响有限。


图9.png


如果想要在JMP中亲自动手实践的话,可下载最新的JMP 16免费试用



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:correlation relation Analysis Analysi Analys

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-16 23:34