楼主: littlellx
5151 16

如何有条件地选取两个数据集中的一些观测值生成新的数据集? [推广有奖]

  • 1关注
  • 2粉丝

硕士生

36%

还不是VIP/贵宾

-

威望
0
论坛币
1169 个
通用积分
2.4023
学术水平
1 点
热心指数
1 点
信用等级
1 点
经验
2696 点
帖子
89
精华
0
在线时间
184 小时
注册时间
2006-7-2
最后登录
2023-10-30

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请问SAS大牛们     我有两个数据集 A和B    A中有变量x 和year;B中有变量y和year;   如何写命令  当A中的x=B中y   并且,年份相同时  生成新的数据集C??   谢谢大家   
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据集 观测值 year ear 如何写 如何

回帖推荐

sushe1527 发表于2楼  查看完整内容

沙发
sushe1527 发表于 2015-3-12 21:14:34 |只看作者 |坛友微信交流群
  1. data a;
  2. input x year;
  3. cards;
  4. 2 3
  5. 3 5
  6. 7 1
  7. ;run;
  8. data b;
  9. input y year;
  10. cards;
  11. 2 3
  12. 6 1
  13. 4 9
  14. ;run;
  15. proc sort data=a;by year;run;
  16. proc sort data=b;by year;run;
  17. data c;
  18. merge a(in=a) b(in=b);
  19. by year;if a and b and x=y;
  20. run;
复制代码
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
littlellx + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

藤椅
littlellx 发表于 2015-3-12 23:01:40 |只看作者 |坛友微信交流群
sushe1527 发表于 2015-3-12 21:14
太好了      O(∩_∩)O谢谢   真是好人 啊
这里您能不能给讲一下    为什么要  in(=a)?

使用道具

板凳
littlellx 发表于 2015-3-13 09:24:54 |只看作者 |坛友微信交流群
sushe1527 发表于 2015-3-12 21:14
报错了   怎么出不来啊   
NOTE: MERGE 语句有多个数据集带有重复的 BY 值。
NOTE: 从数据集 TMP1.a 读取了 2889918 个观测
NOTE: 从数据集 TMP1.b 读取了 22796309 个观测
NOTE: 数据集 TMP1.MERGE 有 0 个观测和 253 个变量。

不应该有0个观测啊   怎么办啊    大神继续帮忙看看吧



使用道具

报纸
sushe1527 发表于 2015-3-13 10:02:34 |只看作者 |坛友微信交流群
littlellx 发表于 2015-3-13 09:24
报错了   怎么出不来啊   
NOTE: MERGE 语句有多个数据集带有重复的 BY 值。
NOTE: 从数据集 TMP1.a 读 ...
很明显 你用的这个by 变量,在数据集里肯定有重复的。 比方说某几列都叫year,你可能没注意到

使用道具

地板
littlellx 发表于 2015-3-13 10:11:32 |只看作者 |坛友微信交流群
sushe1527 发表于 2015-3-13 10:02
很明显 你用的这个by 变量,在数据集里肯定有重复的。 比方说是有两个year,你可能没注意到
我看了  是有重复的   那该怎么办啊?

使用道具

7
sushe1527 发表于 2015-3-13 10:20:10 |只看作者 |坛友微信交流群
littlellx 发表于 2015-3-13 10:11
我看了  是有重复的   那该怎么办啊?
改名字啊,一个叫year 一个叫year1 即可

使用道具

8
littlellx 发表于 2015-3-13 10:37:48 |只看作者 |坛友微信交流群
sushe1527 发表于 2015-3-13 10:20
改名字啊,一个叫year 一个叫year1 即可
在B数据集里   有的y 变量对应好几个相同的year  ,  数据是类似这样子滴

data A                                                              dataB
year           x          x1     x2     x3                        year        y      y1   y2  y3
2000          2                                                      2000      2
2001           2                                                     2000       2
2000           3                                                     2000       2
2000            4                                                     2001      3
2001            4                                                     2000      4

使用道具

9
sushe1527 发表于 2015-3-13 10:40:45 |只看作者 |坛友微信交流群
是列方面有重复,不是行,行的那叫观测,咧的叫变量
data A                                                              dataB
year           year                                                 year        y     
2000          2                                                      2000      2
2001           2                                                     2000       2
2000           3                                                     2000       2
2000            4                                                     2001      3
2001            4                                                     2000      4

比方data a 是year 和year  并不是 year和x

使用道具

10
littlellx 发表于 2015-3-13 10:41:34 |只看作者 |坛友微信交流群
sushe1527 发表于 2015-3-13 10:20
改名字啊,一个叫year 一个叫year1 即可
我会错意了

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 20:25