楼主: spssau
790 0

[学习资料] 数据分析中有哪些可视化图形(二)? [推广有奖]

  • 0关注
  • 34粉丝

教授

22%

还不是VIP/贵宾

-

威望
0
论坛币
165 个
通用积分
1001.5595
学术水平
20 点
热心指数
22 点
信用等级
20 点
经验
16842 点
帖子
535
精华
0
在线时间
636 小时
注册时间
2018-1-14
最后登录
2024-4-26

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

一、P-P/Q-Q图

1.使用场景

P-P图和Q-Q图常用于直观查看数据是否正态分布。P-P图和Q-Q图的目的性基本一致,但原理上有着区别。使用场景如下:

(1) 方差分析(包括普通单因素方差,双因素方差,三因素方差,多因素方差,协方差分析等),对应的Y值是否具有正态性特质的判断;

(2) 回归分析(包括线性回归,逐步回归等)前,对应的Y值是否具有正态性特质判断;回归分析(包括线性回归,逐步回归等)后,使用P-P图和Q-Q图检查残差值是否有正态性特质;

(3) 二元Logit回归后的残差值是否有正态性特质。

(4) 其它用于直观展示数据正态性的场景。

2.原理

(1)P-P图原理:针对P-P图,其原理在于如果数据正态,那么数据的累积比例与正态分布累积比例基本保持一致。分别计算出数据累积比例,和假定正态时的数据分布累积比例;并且将实际数据累积比例作为X轴,将对应正态分布累积比例作为Y轴,作散点图。

(2)Q-Q图原理:针对Q-Q图,其原理在于如果数据正态,那么其假定的正态分位数会与实际数据基本一致。计算出假定正态时的数据分位数;并且将实际数据作为X轴,将假定正态时的数据分位数作为Y轴,作散点图。

(3)无论是P-P图,或者Q-Q图;如果说数据呈现出正态性,那么散点图看上去应该近似呈现为一条对角直线,此时说明数据呈现出正态性。如果散点图看上去明显不是一条直线,那么说明数据很可能不具有正态特质。P-P图和Q-Q图的功能一致,使用时并没有区别,看使用偏好选择即可。

3.操作

SPSSAU操作如下图

4.SPSSAU中输出P-P图说明

分析结果来源于SPSSAU

说明1

上图是回归分析保存的残差值作P-P图,用于检测残差是否满足正态性,上图可以看出,数据基本上呈现出一条对角直线,也即意味着残差服从正态性分布特质。

分析结果来源于SPSSAU

说明2

上图可以看出,数据基本上呈现出一条对角直线,但也有较多的点并不在直线上, 只是接近在直线上,因而说明数据基本上满足正态性特质,可以接受。

说明3

上图可以看出,数据中较多的点并不在直线上,因而说明数据不太满足正态性特质。

5.扩展

二、帕累托图

1.使用场景

帕累托图是“二八原则”的图形化体现,80%的问题是由20%的原因所致;通常情况下帕累托图可用来展现某‘问题’的占比情况,通过图形找出最重要的原因,比如有一项关于员工离职的市场调研。现希望使用帕累托直观展示出员工离职的重要原因,便于为企业提供决策建议。

PS:SPSSAU进行帕累托图时,共支持两种数据格式,分别是常规格式和加权数据格式;帕累托图用于直观展示数据,利用‘二八原则’,便于分析时使用。即找出导致前累积80%的项,并且重点关注和分析。

2.操作

SPSSAU操作如下图

3.SPSSAU中帕累托图输出说明

分析结果来源于SPSSAU

说明

从上图可以看出,共有八项累积加和占比为80.4%,分别是工资待遇与福利、公司发展前景与预期落差大、激励机制较差、晋升机会少;当前职业无法发挥个人专长、工作压力较大、工作缺少成就感、上级处事方式较差。

相对来说,前四项(工资待遇与福利、公司发展前景与预期落差大、激励机制较差、晋升机会少)为待遇福利等与收入相关项;此四项的累积占比为52.3%,是非常重要的原因。而接着四项(当前职业无法发挥个人专长、工作压力较大、工作缺少成就感、上级处事方式较差)属于软性方面的问题,更多与工作自身属性相关项。

总结可知:员工离职的主要原因是由于待遇福利等与收入相关的因素所致,应该重点关注;其次,员工工作本身属性相关项也是比较重要的离职原因,应该在招聘员工时加大关注员工兴趣与工作匹配度。

三、簇状图

1.使用场景

如果希望展示两个分类数据时的特征,比如不同性别并且不同学历群体时,身高的特征差异。此时就涉及到两个分类数据,分别是性别和学历。类似此类情况时,就可以使用簇状图。‘簇状图’用于同时展示2个分类数据的特征情况。

所有此类可同时展示2个分类数据特征,均可称作‘簇状图’。而展示的图形类型上,又可分为簇状折线图、簇状柱形图和簇状条形图等,SPSSAU默认均提供。以及对于数据的特征情况上,通常情况下是汇总平均值,比如不同性别和学历群体的身高平均值,除此之外,SPSSAU同时还提供计数、求和、中位数,共四种特征汇总值。

除此之外,为便于用户使用,如果用户仅放一个分类数据,甚至不放分类数据时,SPSSAU也默认提供对应的图形展示。

2.操作

SPSSAU操作如下图

3.SPSSAU中输出簇状图说明

SPSSAU输出簇状图时,用户可结合需要选择对应的簇状折线图、簇状柱形图和簇状条形图,并且可直接切换平均值、计数、求和以及中位数四种汇总值,如下图所示

如果希望展示两个类别数据是特征情况,还可以使用比如‘误差线图’、‘箱线图’等。类似如下

说明

簇状图用于展示数据,可结合图形和专业领域知识情况进行文字分析。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分析 可视化 SPSSA 协方差分析 logit

www.spssau.com
您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 17:24