[问答] 如何在pc SAS中提交并行的程序？ [推广有奖]

0关注
0粉丝

初中生

38%

还不是VIP/贵宾

威望: 0 级
论坛币: 3 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 136 点
帖子: 21
精华: 0
在线时间: 8 小时
注册时间: 2011-3-21
最后登录: 2013-7-7

楼主

register_me 发表于 2012-9-7 23:48:26 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

rt，最近有以下大运算量的程序，总是感觉运算的速度太慢

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：运算量程序如何

相关帖子

沙发

bakoll 发表于 2015-3-20 08:59:06

数据集较大，能尽量在DATA步做的工作，就避免在SQL里操作；另外，强制一些Proc步的结果不要输出显示；此外，值得注意的是对没有排序的较大数据集进行MERGE，会耗费大量的时间，如果两个数据集有共同的变量，不妨先排序，然后通过MATCH进行MERGE，从而提高运行速度。
利用SAS处理一个大数据量的时候，使用一些小技巧可以很好的提高SAS的效率
一、过滤数据
  1）当你作数据预处理的时候，你可以会从一个很大的数据集中读入一些数，形成子集。
  则这个时候使用IF的效率就不如WHERE了。为什么？因为IF的作用是把数据读入PDV后再作判断，而WHERE在数据读入PDV之前就作判断。
  2）在PROC过程中的直接使用WHERE 条件来过滤数据。
  3）对于从外部读入的数据，如果需要过滤，则直接在这个变量读入过程中加上相应的条件。
   input x; if x>10; input y; 当X不满足条件时候，则不再读入后续数据。
二、生成数据
  1）如果不要生成最终数据集，只是处理一个过程。建立多使用：data _null_;
  2)合并二个数据集的时候，如果二个数据集相关，建议使用proc apend 过程；
data one;
set one two;
run;
---方法二只是读入TWO的数据并入到ONE中。
proc append base = one data = two;
run;
  3）在SET 后面直接过滤不需要的变量（set test(keep=var1);) 可以避免不需要的变量进入PDV
  4）建立索引。如果读入大数据量的时候，可以在读入的时候即为数据集加上索引，方便后续的高效访问（data test (index=));）
  5)预编译
对于常用的生成数据过程，可以利用PGM的过程预编译好，存储起来，要使用时候，直接调用。可以节约编译器时间。
例如：
DATA one2/ pgm = progname ;
SET one;
RUN ;
DATA pgm= progname ;
RUN;