楼主: qcasrl
3767 5

[问答] 两个数据集名字的模糊查找 [推广有奖]

  • 6关注
  • 0粉丝

博士生

27%

还不是VIP/贵宾

-

威望
0
论坛币
99 个
通用积分
17.8700
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
503 点
帖子
106
精华
0
在线时间
397 小时
注册时间
2014-1-16
最后登录
2023-12-7

楼主
qcasrl 发表于 2015-8-13 00:02:42 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据集A和数据集B共有变量为姓名,性别,年龄,出生地,需要将两个数据集匹配起来。

需要解决的问题:两数据集的姓名,如果3个字中有两个字相同,就认为是可能是同一个人。
                          proc sql?
                          程序如何实现?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据集 proc sql 如何实现 ROC sql 出生地 程序 如何 姓名

沙发
happyzihao 发表于 2015-8-16 22:30:42
你的数据是中文的还是英文的?

藤椅
qcasrl 发表于 2015-8-17 08:43:29
happyzihao 发表于 2015-8-16 22:30
你的数据是中文的还是英文的?
中文的,但是考虑到读音的问题,也提取了拼音

板凳
happyzihao 发表于 2015-8-17 14:00:20
qcasrl 发表于 2015-8-17 08:43
中文的,但是考虑到读音的问题,也提取了拼音
姓名为什么可以两个字相同就当做同一个人了呢?

报纸
happyzihao 发表于 2015-8-17 14:01:51

proc sql noprint;
create table x as
select *
from x1 as a left join x2 as b
on a. firstname = b. firstname
and a.lastname = b.lastname;
quit;

思路大概是这样的,但是觉得你用的match变量怪怪的。

地板
Tigflanker 发表于 2015-8-17 14:52:51
例如
A表中有名字:李建国
B表中有名字:马建国
就匹配


A表中有名字:李香兰
B表中有名字:李晓兰
呢?

建议把情况描述周全喔

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-24 12:44