楼主: satellite111
21751 35

请问聚类分析中,分类变量如何处理 [推广有奖]

11
醉_清风 发表于 2011-5-24 19:21:29 |只看作者 |坛友微信交流群
建议 连续型数值变量和分类变量 使用proc split 根据目标变量 进行分组 之后用分组变量进行聚类
从来不需要想起 永远也不会忘记

使用道具

12
flutter88 发表于 2011-5-24 19:35:18 |只看作者 |坛友微信交流群
醉_清风 发表于 2011-5-24 19:21
建议 连续型数值变量和分类变量 使用proc split 根据目标变量 进行分组 之后用分组变量进行聚类
哦,这种做法很奇怪,一般聚类都是对连续变量进行,楼上能不能把原因仔细讲讲,呵呵!

使用道具

13
醉_清风 发表于 2011-5-25 09:50:55 |只看作者 |坛友微信交流群
做logistic回归时我一般都用这种方法处理数据
所以建议在聚类中也可以尝试下
从来不需要想起 永远也不会忘记

使用道具

14
zhenglaiyi 发表于 2011-5-26 11:09:55 |只看作者 |坛友微信交流群
一般参与聚类的变量都是数值型的,你也可以将分类变量处理成数值型

使用道具

15
satellite111 发表于 2011-6-15 19:39:45 |只看作者 |坛友微信交流群
ddddddddddddd

使用道具

16
baojiwolong 发表于 2011-6-16 08:54:54 |只看作者 |坛友微信交流群
继续关注!

使用道具

17
baojiwolong 发表于 2011-6-16 09:08:03 |只看作者 |坛友微信交流群
zhenglaiyi 发表于 2011-5-26 11:09
一般参与聚类的变量都是数值型的,你也可以将分类变量处理成数值型
有什么原则或诀窍没,简单处理成0,1,2之类似有不妥吧!

使用道具

18
小春1988 发表于 2011-6-16 09:08:30 |只看作者 |坛友微信交流群
12# flutter88
logistic回归的确是这样做的,但是logistic有确定的目标变量,聚类分析本来就是无目标的细分方法,怎么去合理将连续变量离散化是个问题。

使用道具

19
天堂之路 发表于 2011-6-16 14:32:49 |只看作者 |坛友微信交流群
详情请见,高惠璇老师的书,网上的有下

使用道具

20
satellite111 发表于 2011-7-13 11:21:25 |只看作者 |坛友微信交流群
有朋友知道没,还没解决啊

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 17:54