我的数据有这些列:
SYMBOL TIME PRICE
现在想把相同SYMBOL和PRICE,又在五秒钟之内的项合并,也就是说假设有这些项:
AA 9:00:00 10
AA 9:00:03 10
AA 9:00:06 10
AA 9:00:07 12
BB 9:00:00 30
合并之后只有第二行会被去掉,也就是:
AA 9:00:00 10
AA 9:00:06 10
AA 9:00:07 12
BB 9:00:00 30
我试着用以下代码(数据集名称为trade):
data tempct;
set trade;
run;
data trade;
set tempct;
time1=intnx("SECOND", time, -5, "SAME");
lagsymbol=lag(symbol);
lagprice=lag(price);
lagtime=lag(time);
if symbol = lagsymbol & lagtime >= time1 & price = lagprice then
do; no=_n_; modify trade point=no; remove; end;
run;
但是得到的结果却是:
AA 9:00:00 10
AA 9:00:07 12
BB 9:00:00 30
第三项也被去掉了。。。应该是因为lagtime并不能得到五秒内的项被去掉之后新的前一项的time。我试了试其他方法,得到的结果更差。。。请问各位大大,有没有办法实现我对数据集的操作目标呢?