楼主: lucy9383
567 1

[问答] SAS如何比较中文词组间的相似度 [推广有奖]

  • 0关注
  • 1粉丝

博士生

20%

还不是VIP/贵宾

-

威望
0
论坛币
94 个
通用积分
1.2245
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
658 点
帖子
212
精华
0
在线时间
172 小时
注册时间
2012-7-31
最后登录
2021-11-23

3论坛币
Hello,

我有一些数据,需要比较两列变量(都是中文字符)的相似度。我知道英文的可以用complev和spedis,但是似乎用到中文上不太对劲?有人知道在SAS里要怎么做吗?如果不用SAS,stata有比较好的比较中文字符相似度的命令吗?


谢谢!!!!!

关键词:相似度 Stata hello tata comp
沙发
乐天天12300 发表于 2021-6-16 13:50:57 |只看作者 |坛友微信交流群
如果你知道你所谓的相似度计算规则,可以自己写个算法,可以考虑循环遍历,难就难在你是否在意汉字出现的顺序,或者同意汉字的处理方式等

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 21:17