楼主: 东篱暗香
12262 11

[统计软件] R语言聚类分析怎么处理非数值型 [推广有奖]

  • 0关注
  • 1粉丝

高中生

65%

还不是VIP/贵宾

-

威望
0
论坛币
13 个
通用积分
0
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
2050 点
帖子
17
精华
0
在线时间
33 小时
注册时间
2013-9-8
最后登录
2018-9-8

楼主
东篱暗香 发表于 2014-2-19 20:33:38 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位高人,本人想求助一个问题,R程序中聚类分析是针对于距离的计算进行的分类,那么非数值型的应该怎么聚类啊?谢谢大家了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:怎么处理 聚类分析 R语言 数值型 R程序 程序

沙发
念小年 发表于 2015-3-10 10:04:53
Use the k-medoids
并不是所有的数据都能满足这样的要求,对于数值类型的特征,比如身高,可以很自然地用这样的方式来处理,但是类别 (categorical) 类型的特征就不行了。举一个简单的例子,如果我现在要对犬进行聚类,并且希望直接在所有犬组成的空间中进行,k-means 就无能为力了,因为欧氏距离 \|x_i-x_j\|^2 在这里不能用了:一只 Samoyed 减去一只 Rough Collie 然后在平方一下?天知道那是什么!再加上一只 German Shepherd Dog 然后求一下平均值?根本没法算,k-means 在这里寸步难行!

在 k-medoids 中,我们把原来的目标函数 J 中的欧氏距离改为一个任意的 dissimilarity measure 函数 \mathcal{V}:

\displaystyle\tilde{J} = \sum_{n=1}^N\sum_{k=1}^K r_{nk}\mathcal{V}(x_n,\mu_k)
cluster
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
xiaodata + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

藤椅
燕儿ida 发表于 2014-2-20 17:27:26
恩,不太清楚你是用了什么非数值型变量。但是我们在处理数据的时候很多时候都需要将定性的指标量化处理。可以赋值处理吧。
附件是有关数据标准化的处理办法。希望能帮到楼主!

数据标准化.JPG (113.06 KB)

数据标准化.JPG

已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
yangyuzhou + 8 + 1 + 1 + 1 鼓励积极发帖讨论

总评分: 论坛币 + 8  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

板凳
东篱暗香 发表于 2014-2-23 17:08:40
燕儿ida 发表于 2014-2-20 17:27
恩,不太清楚你是用了什么非数值型变量。但是我们在处理数据的时候很多时候都需要将定性的指标量化处理。可 ...
谢谢您了,我会仔细想想的,再次感谢!!

报纸
dash731 发表于 2014-4-8 21:07:16
是无量纲化的过程吗,可以考虑用无量纲化的过程处理非数值数据,前提是有作为标准的数值数据

地板
东篱暗香 发表于 2014-4-12 11:17:48
dash731 发表于 2014-4-8 21:07
是无量纲化的过程吗,可以考虑用无量纲化的过程处理非数值数据,前提是有作为标准的数值数据
那么可以自己设定一个标准吗?然后进行相关距离的计算可以吗?

7
dash731 发表于 2014-4-12 12:02:56
东篱暗香 发表于 2014-4-12 11:17
那么可以自己设定一个标准吗?然后进行相关距离的计算可以吗?
可以,但标准化的方法已经有很多参考,你可以借鉴《区域经济分析方法》(侯景新)关于聚类分析这章内容,内容很充实,连软件操作步骤都有
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
yangyuzhou + 12 + 1 + 1 + 1 热心帮助其他会员

总评分: 论坛币 + 12  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

8
东篱暗香 发表于 2014-4-12 14:35:51
恩,万分感谢。。。谢谢

9
δΨξτ毅力 发表于 2014-5-5 10:05:50
有没有关于r语言聚类分析的例子,我想学习

10
pingguzh 发表于 2015-5-12 10:57:11
我也想学习学习

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-27 03:51