楼主: JLOGAN
1965 2

[学习分享] R语言实体匹配实现 [推广有奖]

  • 3关注
  • 0粉丝

硕士生

16%

还不是VIP/贵宾

-

威望
0
论坛币
24 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2830 点
帖子
87
精华
0
在线时间
97 小时
注册时间
2016-5-28
最后登录
2018-8-4

楼主
JLOGAN 发表于 2016-10-16 15:27:15 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位,我现在有一组数据,比如下表形式,有很多不同类型的属性,我想要对每一行样本进行两两之间的相似度计算?该如何实现?
name属性1属性2属性3
AASD

1

1.2

BGFFBS

2

5.2

CSDFG

3

6

DFS

4

66.3

EB

5

0.2

FYUK

6

0.5

GJHGJRTY

7

9.6

HHJYU

8

6.5

自己想法是:每一行看作一个向量或者集合,进行相似度计算,问题是如何实现向量化或者集合化?结果输出每两个实体名和相似度:比如
name1name2SIM
AB

0.3

希望大家多多指教,谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:R语言 name 如何实现 结果输出 相似度 如何 样本

沙发
飞天玄舞6 在职认证  发表于 2016-10-16 15:51:50
字符串和字符串变量怎么能做相似度呢

藤椅
JLOGAN 发表于 2016-10-16 16:09:50
飞天玄舞6 发表于 2016-10-16 15:51
字符串和数值型变量怎么能做相似度呢
可以分别计算相似度吧,比如对第一个字符型计算相似度,采用词频相似度,接下来进行数值型相似度计算,然后把所有的相似度加一块就构成样本总的相似度,好像很麻烦的感觉,特别是属性比较多的情况

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 13:53