楼主: marui415
1750 3

[原创博文] 求助:两个数据集的匹配问题 [推广有奖]

  • 1关注
  • 0粉丝

高中生

65%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
225 点
帖子
30
精华
0
在线时间
26 小时
注册时间
2011-3-11
最后登录
2013-5-5

楼主
marui415 发表于 2012-8-1 16:47:16 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位大侠:现在有两个数据集,我想在第二个数据集中挑选出含有第一个数据集中变量a的所有观测,程序怎么写?变量a是第一个数据集中的变量,只有这一个变量;变量c,d是第二个数据集中的变量(第二个数据集中有上百万条数据)
a                    c               d
0101        0101        1000
0102        0101        200
0103        0101        2466
0104        0101        6788
0105        0101        1110
0106        0102        4355
0107        0102        5036
0108        0102        5717
0109        0102        6398
0110        0102        7078
0111        0102        7759
0112        0103        8440
0113        0103        9121
0114        0103        9802
0115        0103        10482
0116        0103        11163
0117        0103        11844
0118        0103        12525
0119        0103        13206
0120        0103        13886

也就是说,我现在要在第二个数据集中挑出含有0101-0120的所有观测;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据集 各位大侠 程序

沙发
stormhoof 发表于 2012-8-1 17:15:34
proc sql;
select a.a,b,c from a inner join b
on a.a=b.a;
quit;

藤椅
zhangzachary 发表于 2012-8-1 17:16:42
"第二个数据集中挑出含有0101-0120的所有观测" 是变量c 吗?还是d 也算的?排过序的话直接merge,不追求效率又比较简单易懂的用sql,追求效率的话用hash,追求实际效率的话,还是merge吧……
寒冰凤凰 My blog: http://blog.sina.com.cn/u/1058955485

板凳
lynette_89 发表于 2012-8-1 21:13:50
要不用merge也行的
用下in= 变量~~~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 03:59