楼主: 依然2010
6280 13

请高手指点:随机抽样后的剩余样本如何提取出来 [推广有奖]

  • 0关注
  • 1粉丝

硕士生

30%

还不是VIP/贵宾

-

威望
0
论坛币
2780 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1863 点
帖子
105
精华
0
在线时间
184 小时
注册时间
2006-10-31
最后登录
2022-4-14

楼主
依然2010 发表于 2010-3-26 09:54:08 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
用proc surveyselect 进行随机抽样后,比如抽样比例是70%,现在要把剩下的30%另存为一个数据集,如何操作,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:高手指点 随机抽样 如何提取 surveyselect Surveys 样本 高手 随机 指点

回帖推荐

小春1988 发表于5楼  查看完整内容

data a; set a; indic=_n_; run; proc surveyselect data=a out=b sampsize=7000; run; proc sql; create table c as select * from a where indic not in (select indic from b); quit; 这样数据集b就是抽样出来的集,c就是没被抽中的数据

soporaeternus 发表于3楼  查看完整内容

很笨的办法.... 对surveyselect选项不熟 直接用data步抽样的话倒是可以一个样本,一个剩余

本帖被以下文库推荐

沙发
爱萌 发表于 2010-3-26 10:23:23
你想分训练数据和检验数据,
最恨对我说谎或欺骗我的人

藤椅
soporaeternus 发表于 2010-3-26 10:43:41
  1. data a;
  2.         do i=1 to 10000;
  3.                 x=ceil(ranuni(0)*100);
  4.                 output;
  5.         end;
  6.         drop i;
  7. run;

  8. data a_t1;
  9.         set a;
  10.         i+1;
  11. run;

  12. proc surveyselect data=a_t1 out=a_t2 sampsize=7000;run;quit;

  13. proc sort data=a_t1;by i;run;quit;
  14. proc sort data=a_t2;by i;run;quit;

  15. data a_t3;
  16.         merge a_t1(in=in_a_t1) a_t2(in=in_a_t2);
  17.         by i;
  18.         if in_a_t1 and not in_a_t2;
  19. run;
复制代码
很笨的办法....
对surveyselect选项不熟

直接用data步抽样的话倒是可以一个样本,一个剩余
已有 2 人评分经验 论坛币 学术水平 热心指数 收起 理由
bakoll + 3 + 3 精彩帖子
crackman + 1 + 1 精彩帖子

总评分: 经验 + 3  论坛币 + 3  学术水平 + 1  热心指数 + 1   查看全部评分

Let them be hard, but never unjust

板凳
sushe1527 发表于 2010-3-26 11:14:38
proc sql;select * from a_t1 where not exists

(select * from a_t2 where a_t1.i=a_t2.i);quit;

报纸
小春1988 发表于 2010-3-26 17:12:58
data a;
set  a;
indic=_n_;
run;
proc surveyselect data=a out=b sampsize=7000;
run;
proc sql;
create table c as select * from a
where indic not in (select indic from b);
quit;
这样数据集b就是抽样出来的集,c就是没被抽中的数据
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

地板
08liurenxing 发表于 2010-3-26 17:56:35
学习一下,顶起

7
依然2010 发表于 2010-3-26 21:34:28
2# 爱萌 是的,谢谢大家,我另外想了个办法,搞定了,多谢各位!

8
依然2010 发表于 2010-3-26 21:35:17
3# soporaeternus 谢谢!收藏了!我同学想了另外一个办法,做出来了,多谢!

9
依然2010 发表于 2010-3-26 21:37:59
5# 小春1988 谢谢高手!收藏了!多谢!

10
依然2010 发表于 2010-3-26 21:40:15
4# sushe1527 感谢您!收藏了!多谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-26 00:41