楼主: hyalone
1111 2

[数据挖掘理论与案例] 胡氏相似度、距离 [推广有奖]

  • 0关注
  • 0粉丝

已卖:262份资源

本科生

24%

还不是VIP/贵宾

-

威望
0
论坛币
522 个
通用积分
24.0590
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
703 点
帖子
42
精华
0
在线时间
98 小时
注册时间
2008-8-14
最后登录
2025-10-29

楼主
hyalone 在职认证  发表于 2013-1-28 21:23:18 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
发布一种两个分布的相似度、距离的度量——胡氏相似度、距离(原创,如果已有此定义欢迎指出)。
Bhattacharyya会夸大相似度,比如取两个值的分布,概率分别为90%、10%,另一个概率分别为10%、90%,巴氏距离会得到0.6的相似度。
胡氏距离的结果是0.36,更合理。

(请回复,谢谢!如想不回复查看,请等待更新,可能在3个月后)

本帖隐藏的内容

离散型胡氏相似度 H=Σ(2*p(x)*q(x)/(p(x)+q(x)))
连续型胡氏相似度 H=∫(2*p(x)*q(x)/(p(x)+q(x)))dx
离散型胡氏距离 -log(Σ(2*p(x)*q(x)/(p(x)+q(x))))
连续型胡氏距离 -log(∫(2*p(x)*q(x)/(p(x)+q(x))))dx
p(x)、q(x)任一值为0时,对应的2*p(x)*q(x)/(p(x)+q(x))取值为0

注:
离散型巴氏相似度 B=Σ(sqrt(p(x)*q(x)))
连续型巴氏相似度 B=∫(sqrt(p(x)*q(x)))dx
根据0≤a≤1、0≤b≤1,0≤2ab/(a+b)≤sqrt(ab)≤(a+b)/2≤1;容易证明上式均满足相似度[0,1]、距离[0,∞)的条件,且同分布相似度为1、距离为0,完全不同的分布相似度为0、距离为无穷。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:相似度 attach hide 巴氏距离 连续型

沙发
zhourongwang 发表于 2013-1-28 21:43:34
胡氏距离?

藤椅
hyalone 在职认证  发表于 2013-4-24 11:23:28
巴氏用的是几何平均值,胡氏用的是调和平均值。
取最小值也是一个不错的选择。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-20 08:08