请选择 进入手机版 | 继续访问电脑版
楼主: 8810
2798 3

[数据挖掘理论与案例] 数据挖掘中分类与聚类的对比分析 [推广有奖]

  • 0关注
  • 0粉丝

小学生

0%

还不是VIP/贵宾

-

威望
0
论坛币
15 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
90 点
帖子
2
精华
0
在线时间
2 小时
注册时间
2016-12-27
最后登录
2017-3-6

8810 发表于 2017-3-6 15:34:00 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

想获取数据挖掘软件SmartMining的伙伴可以留言或者私信我。分    类  

分类是数据挖掘中应用非常广泛的一项技术,利用分类算法可以从数据集中提取描述数据类的一个函数或模型,并把数据集中的每个对象归结到某个已知的类别中。从机器学习的观点,分类属于监督学习,每个训练样本的数据对象已经有类标识,通过学习可以形成表达数据对象与类标识间对应的知识。数据挖掘的目标就是根据样本数据形成的类知识并对数据进行分类,以预测未来数据的归类。分类具有广泛的应用,例如医疗诊断、信用卡的信用分级、图像模式识别、营销用户画像等。

分类挖掘所获的分类模型可以采用多种形式加以描述输出。其中主要的表示方法有:分类规则、决策树、数学公式和神经网络等。


  聚    类  

聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类的目的是使得属于同类别的对象之间的差别尽可能的小,而不同类别上的对象的差别尽可能的大。因此,聚类的意义就在于将观察到的内容依据相应算法组织成类分层结构,把类似的事物组织在一起。与分类技术不同,在机器学习中,聚类是一种无监督学习。也就是说,聚类是在预先不知道欲划分类的情况下,根据信息相似度原则进行信息聚类的一种方法。通过聚类,人们能够识别密集的和稀疏的区域,因而发现全局的分布模式,以及数据属性之间的有趣的关系。

从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。常见的聚类算法包括:K-均值聚类算法、K-中心点聚类算法、层次聚类、DBScan、EM聚类、层次聚类等。聚类分析广泛应用于金融、营销、电力、交通、教育等多种行业领域。

聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。

更多分类与聚类算法相关内容可以查看这篇文章

http://mp.weixin.qq.com/s/oGf1uAFtyNgiymLYpZV8cw

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:分类 聚类

icu002 发表于 2017-3-7 14:07:51 |显示全部楼层 |坛友微信交流群
都是要花钱的吗

使用道具

ydc129 发表于 2017-3-31 11:02:31 |显示全部楼层 |坛友微信交流群
thanks

使用道具

ydc129 发表于 2017-3-31 11:02:54 |显示全部楼层 |坛友微信交流群
thanks

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 06:50