楼主: binyehan
2535 12

[原创博文] 数据集之间 汉字查找 [推广有奖]

  • 0关注
  • 0粉丝

高中生

97%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
302 点
帖子
30
精华
0
在线时间
36 小时
注册时间
2012-8-1
最后登录
2014-1-17

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我现在有两个数据集a和b,变量分别是x,y,z和x,w
其中数据集a观测值为:
x                  y           z
上海市        10          0.6
南京苏州     20          0.8
北京京        30          0.6

数据集b观测值为:
x                 w
上海           100
苏州           200
北京           300

我现在想要达到的目的是数据集c如下:相当于将a数据集merge到b上
x                w              y     z
上海           100         10    0.6
苏州           200         20    0.8
北京           300         30    0.6

求各位sas高手帮忙。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据集 Merge 观测值 上海市 汉字 上海市 南京 北京 苏州

回帖推荐

ziyenano 发表于8楼  查看完整内容

proc sql; create table c as select b.x,b.w,a.y,a.z from a inner join b on index(a.x,compress(b.x)) ne 0; quit;

本帖被以下文库推荐

沙发
luling2010 发表于 2012-8-7 10:44:59 |只看作者 |坛友微信交流群
楼主,汉字也是可以直接匹配的,但是您的北京是不是写成了北京京?

使用道具

藤椅
wodemac 发表于 2012-8-7 11:25:50 |只看作者 |坛友微信交流群
那个北京京应该录入的问题!!

使用道具

板凳
wodemac 发表于 2012-8-7 11:26:24 |只看作者 |坛友微信交流群
汉字查找的sas函数一般有哪些,大神指点一下

使用道具

报纸
binyehan 发表于 2012-8-7 11:26:29 |只看作者 |坛友微信交流群
luling2010 发表于 2012-8-7 10:44
楼主,汉字也是可以直接匹配的,但是您的北京是不是写成了北京京?
因为我们的原始数据集a就是这样的,有点乱,存在北京京的汉字。
所以我们现在想更新原始数据。

使用道具

地板
stormhoof 发表于 2012-8-7 11:47:05 |只看作者 |坛友微信交流群
if index(x,”上海") ne 0 then x="上海",不知是否可以这样

使用道具

7
binyehan 发表于 2012-8-7 13:18:22 |只看作者 |坛友微信交流群
stormhoof 发表于 2012-8-7 11:47
if index(x,”上海") ne 0 then x="上海",不知是否可以这样
明白你的意思,但是我们目标数据集的“上海”这个观测值,有将近一百来个(例如北京、天津、江苏、江西、浙江),很多的,那我不可能写一百多条记录吧。不过还是谢谢你。

使用道具

8
ziyenano 发表于 2012-8-7 13:33:53 |只看作者 |坛友微信交流群
proc sql;
create table c as
select b.x,b.w,a.y,a.z from a inner join b on index(a.x,compress(b.x)) ne 0;
quit;
已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
bakoll + 3 + 3 精彩帖子
maidenhan + 1 + 1 + 1 simple and helpful

总评分: 经验 + 3  论坛币 + 3  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

9
wodemac 发表于 2012-8-7 13:46:22 |只看作者 |坛友微信交流群
这个程序不错!!

使用道具

10
binyehan 发表于 2012-8-7 13:58:12 |只看作者 |坛友微信交流群
binyehan 发表于 2012-8-7 13:18
明白你的意思,但是我们目标数据集的“上海”这个观测值,有将近一百来个(例如北京、天津、江苏、江西、 ...
谢谢,这个程序可以实现。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 18:04