楼主: crazygoing
4791 1

[SAS] 病例对照、匹配(配对)抽样 SAS 程序(原创) [推广有奖]

  • 0关注
  • 47粉丝

已卖:716份资源

教授

29%

还不是VIP/贵宾

-

威望
1
论坛币
4821 个
通用积分
21.8870
学术水平
165 点
热心指数
203 点
信用等级
146 点
经验
48691 点
帖子
441
精华
1
在线时间
1326 小时
注册时间
2007-11-9
最后登录
2024-7-27

楼主
crazygoing 发表于 2015-2-13 17:12:12 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

匹配抽样+源代码+参考


1、匹配抽样



      最近需要用到sas来对我的一个数据进行1:1抽样,我在网上找了些资料看,没怎么看懂,于是自己想了一个思路来编写这个抽样程序,现分享给大家。

      首先,数据库js如下,含有唯一变量ID,需要匹配的变量 shcool、grade、class和age,case是定义变量,1是病例,0是对照。抽样要求school、grade、class要相同,age相差不超过2岁。



      先说我的思路,首先是生成病例库和对照库, 然后依次从病例库中抽选1条,然后按照条件从对照库选择符合的样本组成待抽选库,然后从这个待抽选库中随机抽选1条,最后把抽出的这条从对照库中剔除,然后重复上述过程直到每条病例都匹配完成,最后合并抽出来的样本。







2、源代码




代码如下:


  1. proc sort data=js out=a1;
  2. by school grade class case age;
  3. data a1;set a1;
  4. pp=compress(school||grade||class); *班级匹配变量pp;
  5. run;
  6. data a_case a_control;set a1;
  7. if case=1 then output a_case; *病例数据集a_case;
  8. if case=0 then output a_control; *对照数据集a_control;
  9. run;

  10. %macro ss;
  11. proc datasets lib=work;delete sample;run;*清除前次抽选样本,方便重复运行宏抽样程序;
  12. proc sql noprint;
  13. select count(*) into: num from a_case; *统计病例个数;
  14. %do i=1 %to #
  15. %let k=%eval(&i-1);
  16. proc sql noprint;
  17. select id into: idx separated by ' ' from a_case;  *病例ID号 到宏idx;
  18. %let xx=%scan(&idx,&i,' ') ;
  19. data case&i;set a_case;
  20. if id=&xx then call symput("pp_v",pp); *相同匹配条件pp;
  21. if id=&xx then call symput("age_v",age); run; *范围匹配条件age;
  22. data control&i;set a_control;
  23. if pp="&pp_v" and abs(age-&age_v)<3; run; *生成符合匹配条件control样本;
  24. proc surveyselect noprint data=control&i method=srs n=1 out=sample&i seed=1000;        *n=1 ,1:1匹配;
  25. data a_control;set a_control sample&i; run;
  26. proc sql noprint;
  27. create table a_control as  select * from a_control  group by id having n(id)=1;        *剔除已选择control样本;
  28. %end;
  29. data sample;set sample:;run; *生成匹配样本库;
  30. data hb;set a_case sample;run; *生成总库;
  31. proc datasets lib=work;save a1 js a_case a_control sample hb; run; *清除过程文件;
  32. %mend;
  33. %ss;
复制代码


      最后,说说程序缺陷,首先是运行效率低,因为是循环语句反复生成数据库,病例较多时,运行肯定慢; 其次未考虑到匹配未成功的情况;第三,程序还是有点啰嗦。 仅供参考。





3、参考




[程序分享] 病例对照、匹配(配对)抽样 SAS 程序(原创)
本文来自: 人大经济论坛 SAS专版 版,详细出处参考:
https://bbs.pinggu.org/forum.php?mod=viewthread&tid=2845169&page=1&from^^uid=3495972



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:病例对照 proc sql separate datasets compress school 数据库 程序 网上 样本 school 数据库 程序 网上 样本

已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
niuniuyiwan + 100 + 100 + 5 + 5 + 5 精彩帖子

总评分: 经验 + 100  论坛币 + 100  学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

本帖被以下文库推荐

沙发
niuniuyiwan 在职认证  发表于 2015-8-11 07:12:39
好帖,感谢分享

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-27 04:22