筛选观测值 - 经管之家

16关注
0粉丝

本科生

86%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 25 个
通用积分: 0
学术水平: 2 点
热心指数: 2 点
信用等级: 3 点
经验: 1770 点
帖子: 58
精华: 0
在线时间: 102 小时
注册时间: 2012-8-31
最后登录: 2015-1-19

楼主

虞子期 发表于 2013-5-31 09:56:41 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

a b c
173.2465 5.641 28375
173.2908 5.645 7161
173.1294 5.642 767098
197.2151 9.998 51203
197.2644 9.999 13350
197.0907 9.999 1193382
197.3505 10.001 6035
173.8311 6.39 6832
197.899 10.34 7456

上述数据中，任意两行观测的变量a和b相减，若-0.5=<变量a的差值=<0.5, -0.3=<变量b的差值=<0.3，则将这些观测输出。
谢谢各位了！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：筛选观测观测值 51203

本帖被以下文库推荐

· sas of boe|主题: 257, 订阅: 16

沙发

playmore 发表于 2013-5-31 10:03:53

任意两行需要全连接下，即
proc sql noprint;
select a.*,b.a as a_b,b.b as b_b,b.c as c_b
from table as a,table as b;
quit;

然后用data步算下a和a_b，b和b_b，c和c_b的差值，再筛选就好了

我这是麻烦的办法，可能还有好办法，等楼下的吧

playmore邀请您访问ChinaTeX论坛！！！进入ChinaTeX论坛

藤椅

playmore 发表于 2013-5-31 10:03:57

任意两行需要全连接下，即
proc sql noprint;
select a.*,b.a as a_b,b.b as b_b,b.c as c_b
from table as a,table as b;
quit;

然后用data步算下a和a_b，b和b_b，c和c_b的差值，再筛选就好了

我这是麻烦的办法，可能还有好办法，等楼下的吧

playmore邀请您访问ChinaTeX论坛！！！进入ChinaTeX论坛

板凳

jingju11 发表于 2013-5-31 10:05:25

PROC SQL;
SELECT _1.* FROM HAVE AS _1, HAVE AS _2 WHERE _1.A-_2.A BETWEEN -.5 AND .5 OR/AND _1.B-_2.B BETWEEN -.3 AND .3;

报纸

playmore 发表于 2013-5-31 10:12:24

jingju11 发表于 2013-5-31 10:05
PROC SQL;
SELECT _1.* FROM HAVE AS _1, HAVE AS _2 WHERE _1.A-_2.A BETWEEN -.5 AND .5 OR/AND _1.B-_2 ...

嗯，这个看起来简单多了
但还是要靠全连接吧
表大的话还是比较费时间的

playmore邀请您访问ChinaTeX论坛！！！进入ChinaTeX论坛

地板

虞子期 发表于 2013-5-31 10:27:13

谢谢！我的表确实很大，有什么更精简的方法吗？

7楼

jingju11 发表于 2013-5-31 10:54:21

费时间在这里应该不是最大的问题。因为这种程序通常不需要反复执行。问题是是否有足够的内存。从内存使用的方面来看，ＳＱＬ在ＳＡＳ里是最好的选择之一。我的观察是ＳＱＬ在数据变大时，所占内存相对较为稳定，而其他的过程则不然。个人观点。京剧
我对ＳＱＬ和ＦＲＥＱ的运算效率有个比对。
http://blog.sina.com.cn/s/blog_a3a926360101d69b.html

8楼

yongyitian 发表于 2013-5-31 11:06:24

/* try this */

data aaa;
input a  b  c;
datalines;
173.2465  5.641 28375
173.2908  5.645 7161
173.1294  5.642 767098
197.2151  9.998 51203
197.2644  9.999 13350
197.0907  9.999 1193382
197.3505 10.001 6035
173.8311  6.39  6832
197.899  10.34  7456
;run;

proc sql;
select count(*) into :Nobs from aaa;
select a into :a separated by ' ' from aaa;
select b into :b separated by ' ' from aaa;
quit;

data bbb;
array aa{&nobs} _temporary_ (&a);
array bb{&nobs} _temporary_ (&b);
set aaa end=last;
   do i = 1 to &Nobs;
      a1 = aa(i);
      b1 = bb(i);
   if  -0.5 <= a-a1 <= 0.5 or
      -0.3 <= b-b1 <= 0.3 then output;
   end;
run;

已有 1 人评分	学术水平	热心指数	信用等级	收起理由
boe	+ 1	+ 1	+ 1	精彩帖子

总评分: 学术水平 + 1 热心指数 + 1 信用等级 + 1 查看全部评分

9楼

虞子期 发表于 2013-5-31 15:43:32

谢谢楼上的大侠但是我运行不了，我的QQ2393695206，能否加你？

10楼

邓贵大 发表于 2013-5-31 21:55:42

if either column A or B has a big deviation, then grouping the observations by their distance to the origin before selecting will have a clear advantage over Cartesian product. For example,

data hell;
do n=1 to 1000000;
a = 1000*rannor(12345);
b = 10*rannor(12345);
c = rannor(12345);
zone = floor(sqrt(a*a+b*b)/.6);*sqrt(0.5^2+0.3^2)<0.6;
output;
end;
proc freq data=hell;
tables zone/nocum nopct;
run;
proc sql;
*create table pairs as
select A.n as n_a, B.n as n_b, A.a as a_a, B.a as a_b, A.b as b_a, B.b as b_b, A.c as c_a, B.c as c_b
from hell a, hell b
where abs(A.a-B.a)<=0.5 and abs(A.b-B.b)<=0.3 and a.n < b.n;
quit;
proc sql;
create table pairs1 as
select A.n as n_a, B.n as n_b, A.a as a_a, B.a as a_b, A.b as b_a, B.b as b_b, A.c as c_a, B.c as c_b
from hell A join hell B on A.zone=B.zone
where abs(A.a-B.a)<=0.5 and abs(A.b-B.b)<=0.3 and a.n < b.n
outer union corr
select A.n as n_a, B.n as n_b, A.a as a_a, B.a as a_b, A.b as b_a, B.b as b_b, A.c as c_a, B.c as c_b
from hell A join hell B on A.zone+1=B.zone
where abs(A.a-B.a)<=0.5 and abs(A.b-B.b)<=0.3;
quit;

复制代码

However if you data looks like the following, then I have to say that may the Lord bless you!

data hell;
do n=1 to 1000000;
a = rannor(12345);
b = ranuni(12345);
c = rannor(12345);
zone = floor(sqrt(a*a+b*b)/.6);*sqrt(0.5^2+0.3^2)<0.6;
output;
end;

复制代码

已有 1 人评分	经验	论坛币	学术水平	热心指数	信用等级	收起理由
Imasasor	+ 100	+ 100	+ 3	+ 3	+ 3	精彩帖子

总评分: 经验 + 100 论坛币 + 100 学术水平 + 3 热心指数 + 3 信用等级 + 3 查看全部评分

Be still, my soul: the hour is hastening on
When we shall be forever with the Lord.
When disappointment, grief and fear are gone,
Sorrow forgot, love's purest joys restored.

筛选观测值 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

本帖被以下文库推荐

浏览过的帖子

浏览过的版块

初级学术勋章

初级热心勋章

中级热心勋章

本版微信群

筛选观测值 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

本帖被以下文库推荐

浏览过的帖子

浏览过的版块

初级学术勋章

初级热心勋章

中级热心勋章

本版微信群

扫码加我拉你入群