楼主: hawkscry
4149 3

[问题] SAS如何做字符间的相似性度量 [推广有奖]

  • 4关注
  • 3粉丝

已卖:26份资源

讲师

61%

还不是VIP/贵宾

-

威望
0
论坛币
558 个
通用积分
0.8500
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
5349 点
帖子
564
精华
0
在线时间
525 小时
注册时间
2009-8-2
最后登录
2023-9-15

楼主
hawkscry 发表于 2014-1-23 22:29:29 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
大家好,最近遇到一个匹配居住地址与工作地址相似度的问题,问题原来是这样的:要看客户居住地的所在城市要与工作地址的城市是否匹配,但是数据库中工作地址与居住地址特别乱,数据很脏,有些记录中两个地址只有具体的街道,有些好些会具体到省市等,想求教大家该如何相对准确的去匹配这两个地址的城市是否一致?一下是本人随便想的思路,实在没有头绪

*关于居住地址与工作城市是否一致的判断;
step1:首先使用=*相似度算法,找出居住地址与工作地址季度相似的案例 then rule1=1;
step2:if find(residual_addr,"市") and find(org_addr,"市")
            residual_city=ksubstr(residual_addr,find(residual_addr,"市"))
            if find(org_addr,residual) then rule2=1;
step3:。。。




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:相似性 Residual SUBSTR resid Dual SAS 数据处理

互联网金融,风控,模型开发

沙发
hawkscry 发表于 2014-1-23 22:30:43
自己给自己顶一下
互联网金融,风控,模型开发

藤椅
changgz 发表于 2014-1-25 09:59:23
能不能发一段数据上来。
如果简单的话,用where语句的like进行通配查询,或者用spedis()函数进行模糊匹配。数据整理阶段,建议考虑用正则表达式处理。如果实在太复杂,需要断句的话,我目前只能用R处理,不知道其他同学有什么更好的方法。

板凳
derary66 发表于 2018-7-16 22:09:15 来自手机
spedis函数无法处理汉字字符串的相似度比较

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-15 04:48