楼主: suly
25611 17

winsorize的使用 [推广有奖]

11
suly 发表于 2010-7-24 21:19:25
我的意思是,在这段程序里都没有把我的数据集的名字和变量名称放进去,怎么会对它操作呢。分析我看了,数据没有变

12
BraveMadMan 发表于 2010-7-25 02:29:49
建议你用那段宏。如果不行的话,发一些你的样本数据。
Don't get lost in technical details. What is the big picture?

13
hongxx 发表于 2010-7-26 22:47:47
7# suly

data a 只是我举例的数据集。跟i,j无关。当使用你自己的数据集时,i或者j变量就是要你替换为自己数据集里的变量。
data a的步骤就完全不用了。

14
swufexl 发表于 2011-6-20 20:40:45
%do %until ( %scan(&vars,&xn)= );
    %let token = %scan(&vars,&xn);
    %let varL = &varL &token.L;
    %let varH = &varH &token.H;
    %let xn=%EVAL(&xn + 1);

我想请教一下这段程序是什么意思呢?
为什么能这样定义变量呢?token.H;

15
linglan27 发表于 2012-6-7 21:57:56
总是提示说最后一句有误哦,这是怎么回事?我的数据集名都没有错啊,哪个高手再来解答一下啊!还有,为什么,我之前的数据全部都没有了呀?

16
rencongcongyes 发表于 2013-3-19 21:43:44
初学者,不太看得懂

17
龙潭丰乐 学生认证  发表于 2014-1-11 10:13:09
swufexl 发表于 2011-6-20 20:40
%do %until ( %scan(&vars,&xn)= );
    %let token = %scan(&vars,&xn);
    %let varL = &varL &token. ...
这里你要看懂scan的意思就差不多理解了,scan一个一个提取&vars里面的字符(也就是变量名字),然后命名p1、p99

18
matlab-007 发表于 2015-10-27 14:06:41
异常值处理,原理大致是将异常值修建成与正常分布最大值or 最小值相同。
eg,如果你的log_size都在20左右,例如在15~20之间区间浮动,有些特别大或特别小的值出现,用winsorize就会把他们变成区间的最大值or最小值。这个“特别大”or“特别小”是你自己可以定义的,如果你认为比20高出10%算作异常值,那么22就会被修改成20,放在样本里。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 10:56