楼主: 角尖
18908 5

[学科前沿] 求问:余弦相似度和皮尔逊相关系数的区别? [推广有奖]

  • 1关注
  • 2粉丝

博士生

87%

还不是VIP/贵宾

-

威望
0
论坛币
7 个
通用积分
36.4494
学术水平
3 点
热心指数
3 点
信用等级
2 点
经验
3154 点
帖子
199
精华
0
在线时间
347 小时
注册时间
2008-6-10
最后登录
2025-1-6

楼主
角尖 发表于 2012-1-13 14:30:07 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在做聚类分析时,我发现用余弦相似度和皮尔逊相关系数作为相似性度量所得到聚类结果有一定差异。请问,这两者有什么区别?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:相关系数 相似度 皮尔逊 聚类分析 相似性 皮尔逊相关系数 偏相关系数 pearson相关系数 相关系数检验 spearman相关系数 复相关系数 相关系数矩阵

回帖推荐

金珠翠 发表于3楼  查看完整内容

遇到同样的疑惑,还没明白本质区别 但是:1.如果数据密集(所有数据几乎都有属性值,属性值量级重要),就用欧几里德算法 2.数据受级别膨胀影响(不同的用户使用不同的评分标准),就用皮尔逊相关系数算法 3.数据稀疏性强,就考虑用夹角余弦相似度算法

本帖被以下文库推荐

沙发
角尖 发表于 2012-1-14 11:01:34

藤椅
金珠翠 发表于 2014-2-21 11:00:26
遇到同样的疑惑,还没明白本质区别
但是:1.如果数据密集(所有数据几乎都有属性值,属性值量级重要),就用欧几里德算法

2.数据受级别膨胀影响(不同的用户使用不同的评分标准),就用皮尔逊相关系数算法

3.数据稀疏性强,就考虑用夹角余弦相似度算法
已有 1 人评分经验 论坛币 收起 理由
胖胖小龟宝 + 10 + 10 热心帮助其他会员

总评分: 经验 + 10  论坛币 + 10   查看全部评分

板凳
zorro999 发表于 2015-3-27 16:49:52
金珠翠 发表于 2014-2-21 11:00
遇到同样的疑惑,还没明白本质区别
但是:1.如果数据密集(所有数据几乎都有属性值,属性值量级重要),就 ...
很好的经验总结

报纸
幸运的小p超 发表于 2015-5-13 10:18:49
金珠翠 发表于 2014-2-21 11:00
遇到同样的疑惑,还没明白本质区别
但是:1.如果数据密集(所有数据几乎都有属性值,属性值量级重要),就 ...
能说明为什么这样麽?是不是因为 不同用户有不同的评分标准所以应该去中心化,而数据比较稀疏,计算出来的平均数不准,所以要用余弦相似度呀?

地板
sinopart 发表于 2015-6-18 10:34:05
请问stata中有直接计算余弦相似度的命令吗?多谢

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-2 20:14