楼主: bridge1989
950 0

[程序分享] 数据横向的重复的检测小程序分享 [推广有奖]

  • 0关注
  • 1粉丝

讲师

14%

还不是VIP/贵宾

-

威望
0
论坛币
4603 个
通用积分
7.4803
学术水平
7 点
热心指数
7 点
信用等级
5 点
经验
1864 点
帖子
108
精华
0
在线时间
748 小时
注册时间
2013-10-11
最后登录
2024-4-2

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
  1. /*********************************************************************/
  2. | 数据重复检测程序,用于鉴别观测中有没有大量重复;
  3. | data=    指定需要检测的数据集;
  4. | var=     指定哪些变量的重复性,例如有20个变量,n1-n20
  5. | percent= 指定重复率,数字范围(0,100)

  6. |for example: %repeat_test(data=lwy_x,var=n1-n20,percent=60);
  7. /********************************************************************/;
  8. %macro repeat_test(data=,var=,percent=)/store;
  9. options center nonumber nodate formdlim=" " linesize=180;
  10. data _temp_;set &data;keep &var;run;
  11. proc sql noprint;
  12. select cats('col',count(*)) into:num_of_obs from _temp_;
  13. quit;
  14. proc transpose data=_temp_ out=_trans_;run;
  15. ods listing close;ods results off;
  16. proc freq data=_trans_;
  17. table col1 - &num_of_obs;
  18. ods output OneWayFreqs=_freq;
  19. run;
  20. proc sql ;
  21. create table max_repeat as
  22.         select distinct(compress(table,"表“”")) as col_name, max(Percent) as rep_percent,
  23.                    input(compress(table,"表“”COL"),5.) as col_sort
  24.         from _freq
  25.         group by calculated col_name;
  26. quit;
  27. proc sort data=max_repeat out=max_repeat_sort(drop=col_sort);by col_sort;run;
  28. data _result_;
  29. merge &data max_repeat_sort(keep=rep_percent);
  30. run;
  31. ods listing;ods results on;
  32. proc print data=_result_;
  33. where rep_percent ge &percent;
  34. run;
  35. proc datasets library=work;
  36. delete max_repeat max_repeat_sort _freq _result_ _temp_ _trans_;
  37. quit;
  38. %mend repeat_test;
复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:小程序 Transpose calculate proc sql compress 程序 检测

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-27 00:35