楼主: 有福有德
53200 126

[学习分享] 散点图在统计中的作用   [推广有奖]

教师

院士

6%

还不是VIP/贵宾

-

威望
4
论坛币
56500 个
通用积分
8.4735
学术水平
344 点
热心指数
203 点
信用等级
274 点
经验
37400 点
帖子
1138
精华
10
在线时间
945 小时
注册时间
2010-10-14
最后登录
2024-3-21

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

    散点图主要是度量两变量关系强弱的最直观的图形,虽然三维图形也在起着类似的作用,但就直观性上仍然不能取代二维图的效果,不过在探索多维变量间关系上提供了非常好的视角,另外比较常用的是侦察相对回归面的异常值,尤其具有可视化的优势,不过个人认为这并不比二维图更清晰。至于矩阵图其本质上仍然是二维关系。

下面从不同的侧重点来说明

1)探索数据主体模型


1.png


proc sort data=data_anl.performance;by scale;run;

proc sgplot data=data_anl.performance;

  scatter x=gcharacteristic y=jaim /group=scale;

  ellipse x=gcharacteristic y=jaim;

run;


   散点的相对疏离程度主要反映在相关系数上,其趋势状况是由回归系数,或斜率来反映。

   散点分布信息如线性,非线性,提供了统计模型的多项式信息;而分布的长短对应数据或统计信息的大小。图中显示了线性、且第一组提供的信息更丰富一点(方差大)。

    95%的预测区间,给出了数据的主体模型,及其可能存在异常值的观测信息,如果两变量sj线性关系已经确定的话,那么符号圆点、加号两组均有异常案例,其中圆点组有较多的异常。这对模型的预测效果将产生很大的影响。




2)探索模型残差信息



2.png


proc sort data=data_anl.performance;by scale;run;

proc sgplot data=data_anl.performance;

    title 'reg to fit';

    reg y=gcharacteristic x=jaim/group=scale clm cli;

run;



    第一组数据的离散性更大一点,预示着不同类型的异常信息,提示在建模时对这些观测需多加小心,其中杠杆点最值得关注。

       95%的预测区间和置信区间,给出了不同组模型的拟合效果,两组数据比较相近,故置信区间有些重叠,至于模型残差信息,以第一组为例,红色箭头指向的那个点和蓝色箭头指向的点,均是较强的杠杆点,但杠杆点所起的效应是否会破坏模型的有效性,需要视OLS估计的残差而定,我们知道回归参数标准误来源于残差等信息的计算(正向关系),因此红色箭头点将带来的相对较大的残差(相对第一组回归线而言),如果这种信息超出了一定的规则,OLS估计将无效。

   垂直特异性是另一个值得关注的异常信息,像第一组的数据(最下方的几个圆点,包括红色箭头指向的点)可能带来回归截距的变化(当然回归线两边分布点大致相当的话除外),如果数据点同时具有上述两种特征,那么该数据点没有理由不处理。




3)探索残差的相对信息



3.png


proc sgpanel data=data_anl.performance;

  title "Scatter plot for staff performance";

  panelby scale / columns=2;

  reg x=jaim y=gcharacteristic / cli clm;

run;

title;





4.png


proc sgscatter data=data_anl.performance;

   matrix gcharacteristic jaim jhonour jcompetency

           jpromotion jhonour

          /group=scale;

run;



    矩阵图或镶有嵌板的图,在观测多变量或不同特征群组间的关系时,很方便。

   上面的两幅图提供的信息很类似,例如矩阵散点中,变量G3J均有不同数据点偏离的比较远,这预示着在多维空间里,这些点的特殊性,不过这要结合更专业的残差图综合分析,例如某残差的权势图、稳健距离图等等。






https://bbs.pinggu.org/thread-2169380-1-1.html

http://amos.pinggu.org/

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:散点图 performance Competency panel data Performan 信息 散点图 多项式

已有 18 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
yukiooy + 1 + 1 + 1 好久没有看到这么精彩的帖子了
melodygong + 1 + 1 + 1 鼓励积极发帖讨论
meilin8 + 60 + 2 根据规定进行奖励
天地宽广 + 1 + 1 + 1 对我们刚刚起步学习的很有帮助
sfhsky + 1 精彩帖子
zhdefei + 1 + 1 精彩帖子
w08241081 + 100 + 2 + 2 + 2 对论坛有贡献
maidong731 + 1 + 1 + 1 精彩帖子
fengyu86 + 1 + 1 精彩帖子
np84 + 1 精彩帖子

总评分: 经验 + 340  论坛币 + 60  学术水平 + 24  热心指数 + 20  信用等级 + 18   查看全部评分

本帖被以下文库推荐

所有模型都是错的
沙发
ermutuxia 发表于 2013-3-15 17:13:04 |只看作者 |坛友微信交流群
不错!

使用道具

藤椅
人脉引爆点 在职认证  发表于 2013-3-15 17:15:08 |只看作者 |坛友微信交流群
签名被屏蔽

使用道具

板凳
小⑥ 发表于 2013-3-15 17:17:08 |只看作者 |坛友微信交流群
在相关分析和回归分析之前绘制散点图是必要的,因为散点图是度量变量间关联程度的最直观的方式,有助于探索变量间的关系。
-----------------------------------
我说的没错吧~

使用道具

报纸
husteconyy 发表于 2013-3-15 17:17:28 |只看作者 |坛友微信交流群
支持有福有德老师,赞一个!
没有过不去的坎儿

使用道具

地板
flowercat0215 发表于 2013-3-15 19:50:53 |只看作者 |坛友微信交流群
真心不错啊~~~~

使用道具

7
xiaodao99 发表于 2013-3-15 20:35:03 |只看作者 |坛友微信交流群
好啊

使用道具

8
songasia 发表于 2013-3-15 20:35:13 |只看作者 |坛友微信交流群
说的很透彻很形象^_^

使用道具

9
gazifjfz 发表于 2013-3-15 20:35:39 |只看作者 |坛友微信交流群
不错,很有用,特别是残差分析时好用。这好像是用SAS做的图吧

使用道具

10
qfss 发表于 2013-3-15 21:38:31 |只看作者 |坛友微信交流群
挺不错!
秋风思伤

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 16:02