楼主: the_fly_winds
5292 8

sas中by var的含义 [推广有奖]

  • 0关注
  • 1粉丝

硕士生

97%

还不是VIP/贵宾

-

威望
0
论坛币
1634 个
学术水平
16 点
热心指数
24 点
信用等级
14 点
经验
2327 点
帖子
104
精华
0
在线时间
236 小时
注册时间
2014-9-28
最后登录
2019-4-17

the_fly_winds 发表于 2016-10-3 16:31:42 |显示全部楼层
10论坛币
数据源很简单,就股票代码(code)、交易时间time、与日最高价high。proc sort data=d;
by high;run;
上面的语句容易理解,就是对数据集d,按照high从小到大进行排序。

但是,我的老师给出了这样的语句,很迷惑:
proc sort data=test2 out=test3 nodup
proc sort data=test2 out=test3 nodupkey
data data1 data2;
        set test3;
        by code time;
        if first.code then output data1;
        if last.code then output data2;
run;

第一,这里by后面加了两个变量,如果是进行排序,那是什么意思呢?不可能是对数据同时按照code和time进行排序吧?逻辑是什么?
第二,if first.stkcd then output data1;这句什么意思呢?first是什么?


谢谢MUA



最佳答案

DriftKingHan 查看完整内容

1. 在DATA步中,BY语句是将obs分组的意思 在使用BY语句之前,变量所在的数据集应该事先经过排序或索引 在PROC SORT中,BY var1 var2; 的意思是 先按var1升序排序,对于有相同var1值的obs,再将这些obs按照var2升序排序 2. 在数据步中,SAS会为每一个BY语句中的变量建立2个临时变量 FIRST.var 和 LAST.var 当当前的obs是var某一个组中的第一个obs时,则 FIRST.var=1,反之为0 当当前的obs是var某一个组中的最后一个ob ...
关键词:VaR NODUPKEY output First outpu
stata SPSS
DriftKingHan 发表于 2016-10-3 16:31:43 |显示全部楼层
本帖最后由 DriftKingHan 于 2016-10-3 23:03 编辑

1.
在DATA步中,BY语句是将obs分组的意思
在使用BY语句之前,变量所在的数据集应该事先经过排序或索引

在PROC SORT中,BY var1 var2; 的意思是
先按var1升序排序,对于有相同var1值的obs,再将这些obs按照var2升序排序

2.
在数据步中,SAS会为每一个BY语句中的变量建立2个临时变量
FIRST.var 和 LAST.var
当当前的obs是var某一个组中的第一个obs时,则 FIRST.var=1,反之为0
当当前的obs是var某一个组中的最后一个obs时,则 LAST.var=1,反之为0


以上是我的理解
已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
xy_ycl + 2 + 1 + 1 + 1 精彩帖子
the_fly_winds + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 2  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

回复

使用道具 举报

dogmamongo 发表于 2016-10-3 22:37:14 |显示全部楼层
先依照code排序

然后每个code中再依照time排序
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
the_fly_winds + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

回复

使用道具 举报

the_fly_winds 发表于 2016-10-4 17:16:54 |显示全部楼层
DriftKingHan 发表于 2016-10-3 22:56
1.
在DATA步中,BY语句是将obs分组的意思
在使用BY语句之前,变量所在的数据集应该事先经过排序或索引
可以讲一下在我给的那段程序中,使用fisrt.var的是要进行什么操作呢?我看不太懂
回复

使用道具 举报

DriftKingHan 发表于 2016-10-4 18:44:05 |显示全部楼层
the_fly_winds 发表于 2016-10-4 17:16
可以讲一下在我给的那段程序中,使用fisrt.var的是要进行什么操作呢?我看不太懂
这样的目的是有选择的输出
比如if first.code then output data1;
是对有相同code值的一组obs中的第一个(first.code = 1, 则为TRUE),输出到数据集data1中
对于不是一组中第一个的,则不执行 output data1 这个操作,即不输出
建议对比一下数据集test3和输出的结果data1 data2,这样更容易理解
回复

使用道具 举报

xy_ycl 发表于 2019-1-21 20:21:59 |显示全部楼层
DriftKingHan 发表于 2016-10-3 16:31
1.
在DATA步中,BY语句是将obs分组的意思
在使用BY语句之前,变量所在的数据集应该事先经过排序或索引
当当前的obs是var某一个组中的第一个obs时,这里的某一个组怎么理解?
回复

使用道具 举报

DriftKingHan 发表于 2019-2-10 10:32:57 |显示全部楼层
xy_ycl 发表于 2019-1-21 20:21
当当前的obs是var某一个组中的第一个obs时,这里的某一个组怎么理解?
确切的说应该是“每一个组”
举个例子:
有一组数,BY var1,PDV大概是这样的
sas by first last.JPG


回复的比较晚,不知道还能不能帮到你


已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
xy_ycl + 5 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 5  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

回复

使用道具 举报

xy_ycl 发表于 2019-2-21 19:00:57 |显示全部楼层
DriftKingHan 发表于 2019-2-10 10:32
确切的说应该是“每一个组”
举个例子:
有一组数,BY var1,PDV大概是这样的
谢谢您的回复,虽然从别的地方弄懂了,还是谢谢您
回复

使用道具 举报

zpq59515357 发表于 2019-3-15 16:48:29 |显示全部楼层
感谢,学习了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2019-4-20 11:15