楼主: LAOACAI
1838 0

python数据分析-聚类分析(转载) [推广有奖]

  • 0关注
  • 1粉丝

硕士生

14%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
365.1940
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1200 点
帖子
62
精华
0
在线时间
39 小时
注册时间
2022-4-18
最后登录
2022-7-27

楼主
LAOACAI 发表于 2022-7-15 18:09:57 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
聚类分析是一类将数据所对应的研究对象进行分类的统计方法。这一类方法的共同特点是,事先不知道类别的个数与结构;进行分析的数据是表明对象之间的相似性或相异性的数据,将这些数据看成对对象距离远近的一种度量,将距离近的对象归入一类,不同类对象之间的距离较远。

聚类分析根据对象的不同分为Q型聚类分析和R型聚类分析,其中,Q型聚类是指对样本的聚类,R型聚类是指对变量的聚类。本节主要介绍Q型聚类。


一、距离和相似系数



1.1、距离在聚类过程中,相距较近的样本点倾向于归为一类,相距较远的样本点应归属于不同的类。最常用的是Minkowski距离。
当各变量的单位不同或变异性相差很大时,不应直接采用Minkowski距离,而应先对各变量的数据做标准化处理,然后用标准化后的数据计算距离。
使用SciPy库spatial模块下的distance子模块可以计算距离,使用该子模块下的pdist函数可以计算n维空间中观测值之间的距离,其语法格式如下:

微信截图_20220714183059.png

微信截图_20220714183152.png 微信截图_20220714183205.png 微信截图_20220714183219.png 微信截图_20220714183231.png 微信截图_20220714183242.png 微信截图_20220714183253.png 微信截图_20220714183308.png



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Python数据分析 python 数据分析 聚类分析 Distance

微信截图_20220714183253.png (53.99 KB)

微信截图_20220714183253.png

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-10 10:26