在Matlab和R中,这个问题挺简单的
在SAS里就稍微复杂点,因为SAS只能在Data步里从上至下依次的循环
- %macro GetCountForSeq(SourceTable,TargetTable,ByFactors,InputVar,OutputVar);
- /**********************************************************************/
- /* 此宏的作用是计算某数据表中指定变量的重复次数,即连续出现同一值的次 */
- /* 数。其中,SourceTable是原始表格;TargetTable是结果表格;ByFactors */
- /* 是分组变量;InputVar是目标变量,可设置为多个,用空格分隔;Output_ */
- /* Var是结果变量,其值为该观测值在序列中重复的次数,若不指定,则为原 */
- /* 目标变量后加后缀_Cnt。注意,在运行本宏之前需要将原始表格进行合适的 */
- /* 排序。 */
- /* */
- /* 最终得到包含原数据表中指定变量的重复次数的结果表格。 */
- /* */
- /* Created on 2012.12.21 */
- /* Modified on 2013.3.20 */
- /**********************************************************************/
- /* 检查TargetTable的存在性,若不存在则设为&SourceTable */
- %if &TargetTable EQ %STR() %then %let TargetTable=&SourceTable;
- /* 检查ByFactors的存在性 */
- %if &ByFactors NE %STR() %then %do;
- %ChkVar(SourceTable=&SourceTable,InputVar=&ByFactors,FlagVarExists=GCFS_FlagVarExists1);
- %if %SYSFUNC(FIND(&GCFS_FlagVarExists1,0)) NE 0 %then %do;
- %put ERROR: The ByFactors "%SCAN(&ByFactors,%SYSFUNC(FIND(&GCFS_FlagVarExists1,0)))" does not exist in SourceTable, please check it again.;
- %goto exit;
- %end;
- %end;
- /* 检查InputVar的存在性 */
- %ChkVar(SourceTable=&SourceTable,InputVar=&InputVar,FlagVarExists=GCFS_FlagVarExists2);
- %if %SYSFUNC(FIND(&GCFS_FlagVarExists2,0)) NE 0 %then %do;
- %put ERROR: The InputVar "%SCAN(&InputVar,%SYSFUNC(FIND(&GCFS_FlagVarExists2,0)))" does not exist in SourceTable, please check it again.;
- %goto exit;
- %end;
- /* 拆分InputVar */
- %SeparateString(InputString=&InputVar,OutputString=GCFS_InputVar);
- /* 检查OutputVar的合法性 */
- %if &OutputVar NE %STR() AND %SYSFUNC(COUNT(&InputVar,%STR( ))) NE %SYSFUNC(COUNT(&OutputVar,%STR( ))) %then %do;
- %put ERROR: The number of InputVar and OutputVar should be equal, please check it again.;
- %goto exit;
- %end;
- /* 若OutputVar为空,则设置为InputVar后加_Cnt后缀 */
- %if &OutputVar EQ %STR() %then %do;
- %let OutputVar=%SYSFUNC(TRANWRD(&InputVar,%STR( ),_Cnt%STR( )))_Cnt;
- %end;
- /* 拆分OutputVar */
- %SeparateString(InputString=&OutputVar,OutputString=GCFS_OutputVar);
- /* 开始进行计算 */
- /* 第一步:生成新的分组变量 */
- data &TargetTable;
- set &SourceTable;
- GCFS_OrderVar=_N_;
- run;
- %do GCFS_i=1 %to &GCFS_InputVar_Num;
- data &TargetTable;
- set &TargetTable;
- retain GCFS_VarNo_&GCFS_i GCFS_ByFactors_&GCFS_i;
- by &ByFactors &&GCFS_InputVar_Var&GCFS_i NOTSORTED;
- if first.&&GCFS_InputVar_Var&GCFS_i then GCFS_VarNo_&GCFS_i.=1;
- else GCFS_VarNo_&GCFS_i.+1;
- if _N_=1 and first.&&GCFS_InputVar_Var&GCFS_i.=1 then GCFS_ByFactors_&GCFS_i.=1;
- else if first.&&GCFS_InputVar_Var&GCFS_i then GCFS_ByFactors_&GCFS_i.+1;
- run;
- %end;
- /* 第二步:得到计数变量 */
- %do GCFS_j=1 %to &GCFS_InputVar_Num;
- proc sort data=&TargetTable;
- by GCFS_ByFactors_&GCFS_j DESCENDING GCFS_VarNo_&GCFS_j.;
- run;
- data &TargetTable(drop=GCFS_ByFactors_&GCFS_j GCFS_VarNo_&GCFS_j.);
- set &TargetTable;
- by GCFS_ByFactors_&GCFS_j;
- retain &&GCFS_OutputVar_Var&GCFS_j;
- if first.GCFS_ByFactors_&GCFS_j then &&GCFS_OutputVar_Var&GCFS_j=GCFS_VarNo_&GCFS_j;
- run;
- %end;
- /* 删除临时生成的OrderVar */
- proc sort data=&TargetTable out=&TargetTable(drop=GCFS_OrderVar);
- by GCFS_OrderVar;
- run;
- %exit:
- %mend;
- %macro Demo();
- %let SourceTable=RankOfStk;
- %let TargetTable=RankOfStk1;
- %let ByFactors=;
- %let InputVar=PE_Rank; /* 需要处理的目标变量,可设置为多个,用空格分隔 */
- %let OutputVar=;
- %GetCountForSeq(&SourceTable,&TargetTable,&ByFactors,&InputVar,&OutputVar);
- %mend;



雷达卡



京公网安备 11010802022788号







