楼主: doudoupigfish
5466 12

求助:如何用SAS构造不同缺失率的随机缺失数据集? [推广有奖]

  • 0关注
  • 0粉丝

本科生

20%

还不是VIP/贵宾

-

威望
0
论坛币
24 个
通用积分
0.0113
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
3049 点
帖子
58
精华
0
在线时间
92 小时
注册时间
2010-1-19
最后登录
2020-2-22

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
因为要研究缺失数据的一些问题,想要先通过模拟完整数据集,然后在此基础上构建不同缺失率(如缺失10%,30%,50%等)的随机数据集,不知道该如何用SAS 实现,还请高手相助, 非常感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:缺失数据 数据集 如何用 非常感谢 随机数 SAS 随机 缺失 数据集 构造

回帖推荐

bobguy 发表于6楼  查看完整内容

Here is an example of random sample w/o replacement. The METHOD=SRS option specifies simple random sampling as the sample selection method. In simple random sampling, each unit has an equal probability of selection, and sampling is without replacement. data t1; do i = 1 to 100; x=rannor(123); x2=x+0.001*rannor(123); err= rannor(123); y=1+ x+x2 ; output; end ...

本帖被以下文库推荐

沙发
bobguy 发表于 2010-5-14 11:16:39 |只看作者 |坛友微信交流群
doudoupigfish 发表于 2010-5-14 10:10
因为要研究缺失数据的一些问题,想要先通过模拟完整数据集,然后在此基础上构建不同缺失率(如缺失10%,30%,50%等)的随机数据集,不知道该如何用SAS 实现,还请高手相助, 非常感谢!
You need to define your problem or question in detail. Non-random missing is a quite difficult issue. One needs to fully understand the data generating process before he creates a simulation data set for analysis.

使用道具

藤椅
doudoupigfish 发表于 2010-5-14 12:02:49 |只看作者 |坛友微信交流群
谢谢bobguy.
我想先做MAR情况下的缺失数据分析。 现在的情况是我有一个完整数据集,我想模拟这个数据集某个outcome 不同的缺失率情况,特别是如果这个outcome 是个longitudinal data 的数据,比如说有4个不同时间下的测量值。在time1时,这个outcome缺失了10%, 在time2, 该outcome缺失了20%,time3缺失率为30%, time4为50%。 并假设是monotone的缺失形式。

我想知道如何用SAS 实现这个目标,首先如果我已经有一个完整的数据集,其次是如果我需要自己产生一个模拟的随机数据集(这个是不是更困难些,因为应该要考虑到4个不同时间outcome 的相关性和协方差关系。)

非常感谢!

使用道具

板凳
sushe1527 发表于 2010-5-14 12:28:23 |只看作者 |坛友微信交流群
monotone缺失?random缺失?

使用道具

报纸
doudoupigfish 发表于 2010-5-14 19:30:22 |只看作者 |坛友微信交流群
monotone指的是缺失的形式(partern),而不是缺失机制,也就是单调缺失的情况。

使用道具

地板
bobguy 发表于 2010-5-16 10:11:41 |只看作者 |坛友微信交流群
doudoupigfish 发表于 2010-5-14 10:10
因为要研究缺失数据的一些问题,想要先通过模拟完整数据集,然后在此基础上构建不同缺失率(如缺失10%,30%,50%等)的随机数据集,不知道该如何用SAS 实现,还请高手相助, 非常感谢!
Here is an example of random sample w/o replacement.

The METHOD=SRS option specifies simple random sampling as the sample selection method. In simple random sampling, each unit has an equal probability of selection, and sampling is without replacement.  

data t1;
  do i = 1 to 100;
    x=rannor(123);
    x2=x+0.001*rannor(123);
    err= rannor(123);
    y=1+ x+x2 ;
    output;
end;
run;

***if you know the sample size in numbers***;
   proc surveyselect data=t1 seed=778
      method=srs n=80 out=t2;
   run;



***if you know the proportion***;
    proc surveyselect data=t1 seed=778
      method=srs rate=0.8 out=t3;
   run;
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

使用道具

7
doudoupigfish 发表于 2010-5-16 22:29:25 |只看作者 |坛友微信交流群
非常感谢bobguy!!!!  谢谢您了。 高手不仅水平高,人也非常nice!

使用道具

8
hawkscry 发表于 2011-6-30 22:56:52 |只看作者 |坛友微信交流群
真的高手,很受益啊。。。
互联网金融,风控,模型开发

使用道具

9
cecile26 发表于 2011-11-21 17:32:09 |只看作者 |坛友微信交流群
同求
i am learning English.

使用道具

10
ademons 发表于 2011-11-22 22:35:32 |只看作者 |坛友微信交流群
surveryselect抽取观测,和楼主的要求不一致。
data step实现更好。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 03:25