10328 15

[问答] 用SAS在大数据中抽取部分数据 [推广有奖]

11
小宝爱波1314 发表于 2014-1-2 10:48:35
yongyitian 发表于 2013-12-25 10:06
hi,我想问您一个问题。我有一个excel的数据集,从左到右有四个变量number1,data1,number2,data2。我的问题是这样的,如果number2里面的数据与number1里面的数据相等的话,用data2这个变量的数据来替换data1里面的数据。还需要考虑的是number2里面的数据可能有好几个是和number1里的数据匹配的,出现这种情况时,我只想用number2出现第一次时对应的data2里面的数据来替换data1里面的数据
已有 1 人评分论坛币 收起 理由
admin_kefu + 20 热心帮助其他会员

总评分: 论坛币 + 20   查看全部评分

12
小宝爱波1314 发表于 2014-3-18 16:41:44
yongyitian 发表于 2013-12-16 09:22

您好,我之前把您的那个harsh刚刚搞懂,现在又有新的问题了。自己试了好多次都不行,想请您帮我看一下。以上是一个birth_data的数据集。里面的变量包括patientage,一共有N个观测。现在我想要通过SAS产生一些模拟数据集。要求如下:

1)  在age的最大值和最小值之间随机产生0.1*N个模拟数。 birth_data3.xls (256.5 KB)

2)  在birth_data随机抽取10%的干净数据,这些数据将被上一步中产生的模拟数据代替。随机抽取的次数为1000次,相应地,替代的次数也为一千次。这样可以得到1000个被抽取和替代后的birth_data的模拟数据集。

3)  得到的1000个模拟数据集以后,分别计算出这些模拟数据集中age的均值和方差,并且将这些均值和方差合并入格式如下的数据集中。

  

Simulation degree

  

Simulation set order

mean

std

0.1

1

0.1

2

0.1

3

0.1

4

0.1

5

0.1

... …

0.1

1000

数据的附件在这里,谢谢您。

13
bluehaiku 发表于 2016-9-20 16:47:02
yongyitian 发表于 2013-12-16 09:56
/* see the notes in the code below */
/* the idea is to add a variable of random number */
/* th ...
order by 后面跟着一个随机数列,着实不懂啊。order by ranuni(&seed);
allData数据集中,又没有ranuni(seed)这个变量,真的不懂啊,大神,求解释

14
yongyitian 发表于 2016-9-22 12:14:27
bluehaiku 发表于 2016-9-20 16:47
order by 后面跟着一个随机数列,着实不懂啊。order by ranuni(&seed);
allData数据集中,又没有ranuni( ...
这是SQL的一种特殊的用法。
ranuni(&seed) 生成一组随机数.
order by ranuni(&seed) 将选出来的观测按这组随机数排序.
proc sql outobs=100; 语句的 output=100 输出随机选出的前100行数据.

Ref:  Getting Your Random Sample in Proc SQL

15
bluehaiku 发表于 2016-9-22 12:38:29
yongyitian 发表于 2016-9-22 12:14
这是SQL的一种特殊的用法。
ranuni(&seed) 生成一组随机数.
order by ranuni(&seed) 将选出来的观测按这 ...
Thank you

16
流水不朽 发表于 2016-9-24 17:26:56
proc surveyselect data=  method=srs n=out= ;run;

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 08:47