95972 50

[数据管理求助] Winsorize数据处理和删除异常值的区别是什么?   [推广有奖]

21
落雪雪 发表于 2013-11-24 16:42:24
哈哈 今天看论文也看到了winsorize处理 看了这个贴后明白了 谢谢各位大侠

22
valderfield 发表于 2013-12-30 20:23:47
谢谢大神们~

23
angelqii 发表于 2014-3-4 13:15:15
jose.liupei 发表于 2013-4-16 23:31
如果你有一个变量叫mpg,就建立一个新的变量Wmpg,p(0.01)表示winsor数据分布两边各1%
winsor mpg, gen( ...
研究变量与在1%分位指做winsor处理是什么关系啊?主要是1%分位是什么啊?求详解。。。

24
jose.liupei 发表于 2014-3-5 23:21:08
angelqii 发表于 2014-3-4 13:15
研究变量与在1%分位指做winsor处理是什么关系啊?主要是1%分位是什么啊?求详解。。。
第一个问题没有看懂。。。
第二个问题,1%分位就是做这个变量的分布图,分布图左边取1%,右边取99%,小于1%和大于99%的分布值都会被winsor
未出土時先有節,及凌雲處尚虛心

25
angelqii 发表于 2014-3-10 23:55:48
jose.liupei 发表于 2014-3-5 23:21
第一个问题没有看懂。。。
第二个问题,1%分位就是做这个变量的分布图,分布图左边取1%,右边取99%,小于 ...
恩,谢谢。这个处理是要把变量先sort一下,然后取1%分位进行winsorize,是这个意思吧?

26
jose.liupei 发表于 2014-3-14 22:39:09
angelqii 发表于 2014-3-10 23:55
恩,谢谢。这个处理是要把变量先sort一下,然后取1%分位进行winsorize,是这个意思吧?
按理说确实需要sort,但其实直接用winsorize的命令,STATA会自己先sort,然后取1%,99%分位,所以不用自己再手动sort
未出土時先有節,及凌雲處尚虛心

27
kocoma 在职认证  发表于 2014-10-21 12:04:17
denver 发表于 2012-5-7 22:40
winsorize是用相应分位数的值替代分位数之外的值,而不是删掉,这样可以最大限度的保存数据信息另外,这个跟 ...
赞!懂了。

28
wangcl390 发表于 2014-11-24 22:00:51
学习了

29
smartpigeon 在职认证  发表于 2015-3-22 22:33:35
学习了。

30
夏虫可以语冰 发表于 2015-3-31 10:39:07
我想知道,回归之前会有很多自变量,那么分别对每一个变量都要进行winsor?还是只进行其中一个即可?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-3 08:11