楼主: hdyak002
40885 9

[问答] 聚类分析时是否需要对变量进行标准化? [推广有奖]

  • 2关注
  • 2粉丝

博士生

14%

还不是VIP/贵宾

-

威望
0
论坛币
279 个
通用积分
0.0015
学术水平
6 点
热心指数
0 点
信用等级
5 点
经验
7689 点
帖子
145
精华
0
在线时间
109 小时
注册时间
2014-2-21
最后登录
2021-11-28

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在用SPSS进行个案聚类分析时是否需要对变量进行标准化?还是直接采用原始数据惊喜聚类?两者出来的结果好像不一致,那么采用哪个为准呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:聚类分析 标准化 SPSS 原始数据 PSS

沙发
xddlovejiao1314 学生认证  发表于 2015-12-11 18:06:36 |只看作者 |坛友微信交流群
需要标准化,因为原始数据中的极端异常值会严重影响结果。祝好运~

使用道具

藤椅
南南数据 发表于 2015-12-11 18:35:54 |只看作者 |坛友微信交流群
亲,不需要标准化的。聚类主要是看观察值的聚类。如果想用标准化数据来做,可以在SPSS聚类分析中选择0-1标准化的值来处理,而不需要事先在原始数据中标准化。此外,如果数据中存在极端值,标准化之后的数据依然存在极端值,因此,极端值的处理不是通过标准化而是通过删除处理的。另外,聚类分析对原始数据的原始值非常重视,即便是极端值,它们本身也是“特殊一类”,所以,对极端值的处理要慎重。

使用道具

板凳
hdyak002 发表于 2015-12-13 14:40:45 |只看作者 |坛友微信交流群
谢谢上面两位的回答。  我仔细看看了书,发现,在用K-means快速聚类时,是不需要对变量进行标准化的。但是做层次聚类时,特别是R型层次聚类时,如果各变量存在有量纲的差异化,数据存在数量级的差异,还是需要做标准化处理的,否则出来的结果就不一致的。做R型层次聚类时,还需要各变量之间有较强的相关关系。

使用道具

报纸
dearmrdee 发表于 2016-2-17 18:35:58 |只看作者 |坛友微信交流群
hdyak002 发表于 2015-12-13 14:40
谢谢上面两位的回答。  我仔细看看了书,发现,在用K-means快速聚类时,是不需要对变量进行标准化的。但是做 ...
请问你看的是什么书啊,我要用密度聚类,不知道是不是需要标准化?

使用道具

地板
xiaowangge 学生认证  发表于 2017-4-5 15:48:24 |只看作者 |坛友微信交流群
hdyak002 发表于 2015-12-13 14:40
谢谢上面两位的回答。  我仔细看看了书,发现,在用K-means快速聚类时,是不需要对变量进行标准化的。但是做 ...
你好,请问什么书上写有关于聚类分析需不需要对数据进行标准化的内容?

使用道具

7
hdyak002 发表于 2017-5-25 17:33:56 |只看作者 |坛友微信交流群
人大薛薇的SPSS分析书

使用道具

8
spsssas 发表于 2020-2-17 23:19:49 |只看作者 |坛友微信交流群
hdyak002 发表于 2015-12-13 14:40
谢谢上面两位的回答。  我仔细看看了书,发现,在用K-means快速聚类时,是不需要对变量进行标准化的。但是做 ...
为什么K-means聚类不需要标准化?薛薇老师《统计分析与SPSS应用》第几版?谢谢!

使用道具

9
hdyak002 发表于 2021-11-28 11:48:40 |只看作者 |坛友微信交流群
基于SPSS的数据分析  第三版

使用道具

10
DAWN1406 发表于 2023-2-16 17:06:58 |只看作者 |坛友微信交流群
聚类算法是根据距离进行判断类别,因此一般需要在聚类之前进行标准化处理,SPSSAU默认是选中进行标准化处理。数据标准化之后,数据的相对大小意义还在(比如数字越大GDP越高),但是实际意义消失了。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 16:36