楼主: bookkeeper
2710 3

使用SAS程序或者其他程序解决两个数据库匹配难题,求解! [推广有奖]

  • 0关注
  • 0粉丝

小学生

50%

还不是VIP/贵宾

-

威望
0
论坛币
17 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
187 点
帖子
10
精华
0
在线时间
4 小时
注册时间
2012-1-9
最后登录
2020-7-1

楼主
bookkeeper 发表于 2016-9-4 16:42:28 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
小弟在此请教各位大神一个难题:
现在已有一个数据库have,里面有许多个人信息(大概2000条),主要变量有:姓名,性别,出生日期,疾病诊断日期,地址。
想从另一个数据库bb中,包含有以上变量(大概80000条)。
目的:从bb数据中找出并且提取出和自己数据库是同一个人的信息,得到一个数据库Want。

困难地方:1是, 姓名可能会写错,比如拼音同而字不同,如:横和恒; 形似而字不同,比如:凤和风.
2是,出生日期可能不完全一致,甚至年份都相差1-2年。
3是,疾病诊断日期困难不完全一致,尤其是月份和日不同。
4是,地址基本都是一个城市内,但是进一步镇和村,详细度不一致。

传统做法:两个数据合并然后按照姓名排序,用眼睛一个个看比较综合判断。

请问各位大神,能否用SAS程序或者其他电脑程序解决这个难题。或者退一步假设以上2-4条完全一致,只用姓名字段匹配即最简单的按照姓名匹配,提出所要信息。
非常感谢!!!!!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:sas程序 数据库 出生日期 Have 电脑程序 数据库 程序

沙发
黃河泉 在职认证  发表于 2016-9-4 16:58:48
我不懂 SAS,但认为 Stata 可以"有些"帮助!我之所谓"有些"乃是因为你的资料(不是因为 Stata)完全违反一般的合并原则,所以你可以先"大致"先用 SAS or Stata 合并(对于那些资料一致的),然后再花一些"洪荒之力"去人工校正!

藤椅
bookkeeper 发表于 2016-9-4 17:02:49
黃河泉 发表于 2016-9-4 16:58
我不懂 SAS,但认为 Stata 可以"有些"帮助!我之所谓"有些"乃是因为你的资料(不是因为 Stata)完全违反一般 ...
感谢回复!数据库存在问题的确很多,但是数据量太大,已经用了洪荒之力,疯了后才来求教!

板凳
黃河泉 在职认证  发表于 2016-9-4 17:12:41
bookkeeper 发表于 2016-9-4 17:02
感谢回复!数据库存在问题的确很多,但是数据量太大,已经用了洪荒之力,疯了后才来求教!
加油!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 06:45