楼主: 一统2012
11684 8

聚类分析后为什么要进行判别分析 [推广有奖]

  • 2关注
  • 0粉丝

已卖:23份资源

本科生

10%

还不是VIP/贵宾

-

威望
0
论坛币
693 个
通用积分
0.1500
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
379 点
帖子
44
精华
0
在线时间
50 小时
注册时间
2012-2-28
最后登录
2016-2-13

楼主
一统2012 发表于 2012-6-2 09:18:04 |AI写论文
5论坛币
我在做一个31个省区的某个方面的分析 老师让我先聚类 然后在判别分析,我不是很理解,是不是先拿大多数省区做一个聚类分析,分类后,再把剩余的几个省区做个判别分析,他说这样可以检验聚类分析的准确性,但是那几个剩余省区开始在哪一类根本不清楚啊,如何判断准确与否?
望高手不吝指教!

关键词:判别分析 聚类分析 不吝指教 准确性 如何

回帖推荐

dujh 发表于5楼  查看完整内容

聚类分析我们知道有两种方法,比如我们事先不知道应该分为几类的时候,可以用分层聚类法,当知道需要分为几类的时候,用快速聚类法。但是这个分类的结果是否合理,是受到你采用的变量以及距离的测度方法等多个因素的影响的,可能会出现分类结果不稳定的现象。所以这个时候我们就要用判别分析去验证,之前的聚类是不是合适。具体的验证,其实就是我们讲的交叉验证的那5个内容,包括增加样本验证什么的,还有以其中一部分作为判别方程 ...

本帖被以下文库推荐

沙发
wlou69 发表于 2012-6-2 09:35:38
是两种方法的结果互相验证,或者你凭什么说你的聚类分析(或者判别分析)的结果是正确的?

藤椅
一统2012 发表于 2012-6-2 09:45:34
我不敢保证开始聚类分析的结果就是合适的 但是剩余几个省区由于不知道他们本应该属于哪一类,现在得到的判别分析的结果也不能证明什么啊

板凳
dujh 发表于 2014-12-18 22:33:24
聚类分析我们知道有两种方法,比如我们事先不知道应该分为几类的时候,可以用分层聚类法,当知道需要分为几类的时候,用快速聚类法。但是这个分类的结果是否合理,是受到你采用的变量以及距离的测度方法等多个因素的影响的,可能会出现分类结果不稳定的现象。所以这个时候我们就要用判别分析去验证,之前的聚类是不是合适。具体的验证,其实就是我们讲的交叉验证的那5个内容,包括增加样本验证什么的,还有以其中一部分作为判别方程样本,另一小部分作为验证样本进行的交叉验证,然后回头看之前的聚类结果是否合理
类似于你是一个医生,每次病人来了之后,你根据自己之前的从医经验,觉得你去检查那几项,我就能知道你是病人还是好人。但事实上每个病人的情况都是很复杂的,而且你自己了解的内容是有限的,所以不能保证你所判别的病人和正常人,就一定是合理的。这个时候就需要对所有的病人和正常人放到一起建立判别方程,然后逐个重新检查一次,看看是否之前有别人被你判断错误了,就是这个意思。具体怎么做,还是我之前说过的交叉验证,交叉验证的5个方法事实上都是可以用的,具体怎么用,根据你样本的实际情况来决定
已有 3 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
Unclebravo + 1 + 1 + 1 精彩帖子
sharonzhang10 + 1 + 1 精彩帖子
我的素质低 + 3 精彩帖子

总评分: 论坛币 + 3  学术水平 + 2  热心指数 + 2  信用等级 + 1   查看全部评分

报纸
dujh 发表于 2014-12-18 22:34:25
聚类分析我们知道有两种方法,比如我们事先不知道应该分为几类的时候,可以用分层聚类法,当知道需要分为几类的时候,用快速聚类法。但是这个分类的结果是否合理,是受到你采用的变量以及距离的测度方法等多个因素的影响的,可能会出现分类结果不稳定的现象。所以这个时候我们就要用判别分析去验证,之前的聚类是不是合适。具体的验证,其实就是我们讲的交叉验证的那5个内容,包括增加样本验证什么的,还有以其中一部分作为判别方程样本,另一小部分作为验证样本进行的交叉验证,然后回头看之前的聚类结果是否合理
类似于你是一个医生,每次病人来了之后,你根据自己之前的从医经验,觉得你去检查那几项,我就能知道你是病人还是好人。但事实上每个病人的情况都是很复杂的,而且你自己了解的内容是有限的,所以不能保证你所判别的病人和正常人,就一定是合理的。这个时候就需要对所有的病人和正常人放到一起建立判别方程,然后逐个重新检查一次,看看是否之前有别人被你判断错误了,就是这个意思。具体怎么做,还是我之前说过的交叉验证,交叉验证的5个方法事实上都是可以用的,具体怎么用,根据你样本的实际情况来决定

地板
dujh 发表于 2014-12-18 22:38:22
总之你记住,判别分析和聚类分析的结果都是不确定的
当样本量增多,当变量变化的时候,测度的距离方法不同,结果就会不同

7
dujh 发表于 2014-12-18 22:44:36
正是因为结果的不稳定性,所以无论是聚类分析还是判别分析,一定是结果为王,只有你能解释清楚的时候,这个判别分析或者聚类分析才是合理的,所谓聚类和判别,它只是辅助你判别的,而不是决定你判别的,类似于我们去医院除了找人做相关检查之外,最终宣布什么病情,还是医生说了算,否则医生都下岗了,医院就只有实验员了。所以大家经常可以看到很多检查单上都写着,只对本次样本负责。说的就是这个意思,因为当样本量不一样的时候,结果就可能出现差异,当结果出现差异的时候,意味着可能会大于或者小于判别临界点,最终影响到结果的判定。

8
dellenovo 发表于 2016-12-18 16:01:23 来自手机
一统2012 发表于 2012-6-2 09:18
我在做一个31个省区的某个方面的分析 老师让我先聚类 然后在判别分析,我不是很理解,是不是先拿大多数省区 ...
这个是不是先根据31个省直辖市的数据进行聚类分析,然后再找新的31个省直辖市的数据根据聚类分析的结果进行判别分析

9
a0756 发表于 2019-6-6 12:35:10
学习学习,长知识了

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-9 06:10