gaotao0727 发表于 2013-3-20 11:26
感谢9楼大神!!关于下面这一段我想补充一下,
data &Lib..&DSin;
set &Lib..&DSin;
if &&Var&i > &p1V and &&Var&i < &p99V;
run;
这样处理极端值的话,每次循环,会把极端值所在的整条记录删除,导致数据量不断减少。之后变量的1% 99%分位数可能与原数据出现偏差。
所以,我觉得改成每次只删除极端值,最后再统一删除出现空缺值的记录较为妥当。这样做能保证计算所有变量的1% 99%分位数时,使用的都是原数据集。