资料狂人 发表于 2012-5-4 08:24
坛友zhanchaoqun:何老师,您好!
在数据存在异常值的时候,我们应该采取什么样的标准去去除异常值呢?
感 ...
有标准的方法识别异常值和处理方法,详细见下面两本书
1、 Introduction to Linear Regression Analysis (Douglas C. Montgomery著)的第6章。
2、Neter 和Kutner等人写的教材Applied Linear Regression Models, 4th ed. (ISBN 9780073014661)
winsor是采用随机的方法处理,每次的结果会不同,但是每次的结果应该不会有本质区别的。Winsor很多时候可以作为稳健性检验,比如说1%水平的winsor处理是比较常见的。
关于数据结构,我不清楚你说的那个标准。如果你的模型对变量有分布或则其他假设话,你可以对数据做描述统计(比如画直方图)看一下是否满足假设。