楼主: cfkse
2470 8

求SAS程序帮忙查找合并数据 [推广有奖]

  • 1关注
  • 0粉丝

已卖:2份资源

硕士生

21%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
2.7000
学术水平
2 点
热心指数
2 点
信用等级
2 点
经验
489 点
帖子
70
精华
0
在线时间
181 小时
注册时间
2013-5-7
最后登录
2025-4-21

楼主
cfkse 发表于 2016-10-5 10:26:17 |AI写论文
100论坛币
老板要我把中国工业企业数据库的资料和CSMAR上的资料合并起来(通过中文名字匹配),用excel做工作量太大,只能手动的去搜索关键字。 求高手能不能用SAS帮忙做这个模糊合并的工作。下面是具体的excel文件
merge.xlsx (23.61 MB)



下面是具体的excel里的内容
55DB.tm.png
A-C列是CSMAR中我们留下来的数据 G-K列是中国工业企业数据库的资料。 要求: 如何C列的企业在I列中有, 就把F列的firm id 记录到E列的firm code 里面。 因为很多公司名字在两个数据库不是完全一样的, 比如说A 公司在 C列中叫做A 公司, 可能在I列里面叫做A 集团。  有描述的不详细的地方,可以给我发消息我会仔细说一下。

也可以手动在excel里面一个一个的做 求帮忙
可有偿做 具体信息qq:3444148576

607D.tm.png (87.1 KB)

607D.tm.png

关键词:sas程序 合并数据 中国工业企业数据库 工业企业数据库 用excel SAS excel 数据库 模糊查找 合并

沙发
the_fly_winds 发表于 2016-10-5 11:04:50
先把数据导入sas。
data;两个数据集,加入是a,b。
然后语句格式是:
data c;
merge a b;
by var(变量名)
run;

采纳呀MUA!
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
admin_kefu + 20 + 2 + 2 热心帮助其他会员

总评分: 论坛币 + 20  学术水平 + 2  热心指数 + 2   查看全部评分

藤椅
llulla 发表于 2016-10-5 13:35:30
对你的问题, 有两点要澄清,1. 是CSMR与工业数据和并,或是工业数据与CSMR和并, 或是企业在任何两个数据出现,都需要合并。2.合并数据前需要对数据排序。对工业数据库中,企业名称输入不规范,比如天津市企业名称前带有*,或(, 或空格。这样的数据排序后,无法与对应的企业匹配。建议在EXCEL中将数据清洁整理。然后导入SAS,对企业名称排序后,按楼上的建议合并数据。并设定条件,是A与B合并, 或B与A和并,或A和B都合并。
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
admin_kefu + 22 + 2 + 2 热心帮助其他会员

总评分: 论坛币 + 22  学术水平 + 2  热心指数 + 2   查看全部评分

板凳
NOIL 发表于 2016-10-5 21:22:46
用stockid去爬公司的中文名,然后再做merge.
已有 1 人评分论坛币 收起 理由
admin_kefu + 11 热心帮助其他会员

总评分: 论坛币 + 11   查看全部评分

报纸
cfkse 发表于 2016-10-6 09:51:23
NOIL 发表于 2016-10-5 21:22
用stockid去爬公司的中文名,然后再做merge.
有公司的中文名 第三列就是

地板
cfkse 发表于 2016-10-6 10:09:10
llulla 发表于 2016-10-5 13:35
对你的问题, 有两点要澄清,1. 是CSMR与工业数据和并,或是工业数据与CSMR和并, 或是企业在任何两个数据出 ...
确实很多数据老师在下载过程中出了错误,导致出现你所说的* ( , 空格)等问题。 我已经在excel中用Vlookup 把C列和I列中名字完全一样的找出来了  现在存在的问题就是有很多企业的名字在这两列里面不是完全相等的,只能是近似相等。 那个merge by的方法不适用, 而且 sql的like选项好像只能是英文字符的匹配。

7
cfkse 发表于 2016-10-6 10:09:59
the_fly_winds 发表于 2016-10-5 11:04
先把数据导入sas。
data;两个数据集,加入是a,b。
然后语句格式是:
这一个步骤我已经在EXCEL中用vlookup做了的  就是文档里面D列标示了1

8
cfkse 发表于 2016-10-6 11:12:41
求帮忙 论坛币已经追加到了100个

9
sas9.4 发表于 2016-10-9 20:29:33
建议先把两边的 公司名称里面的空格 标点符号,“有限公司”,“集团” 这类的信息 去掉, 生成新的变量 作为merge 的key variable,然后再merge

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 08:58