95938 50

[数据管理求助] Winsorize数据处理和删除异常值的区别是什么?   [推广有奖]

31
anyanimal 发表于 2015-4-28 20:16:49
涨姿势了!

32
dengxin128 发表于 2015-5-6 10:38:16
denver 发表于 2012-5-7 22:40
winsorize是用相应分位数的值替代分位数之外的值,而不是删掉,这样可以最大限度的保存数据信息另外,这个跟 ...
说的很清楚,谢谢啦

33
xiao87083 学生认证  发表于 2015-5-10 09:22:01
谢谢分享

34
xiao87083 学生认证  发表于 2015-5-10 09:22:55
谢谢分享

35
xiao87083 学生认证  发表于 2015-5-10 09:36:20
谢谢分享

36
Lennydongsun 学生认证  发表于 2015-5-25 14:30:22
谢谢哇

37
空间机器人 发表于 2015-6-5 11:37:17
我正要用这种方法,回答的真好

38
不断前进 学生认证  发表于 2015-6-14 11:21:41
夏虫可以语冰 发表于 2015-3-31 10:39
我想知道,回归之前会有很多自变量,那么分别对每一个变量都要进行winsor?还是只进行其中一个即可?
个人认为只要数据有极端值的都要做winsorize处理,因为要得到好的结果的话,极端值会影响回归结果。

39
1029812370 学生认证  发表于 2015-6-25 20:11:26
截尾的话,stata的命令是什么啊?

40
ajiao4310 发表于 2015-8-5 10:14:27
不断前进 发表于 2015-6-14 11:21
个人认为只要数据有极端值的都要做winsorize处理,因为要得到好的结果的话,极端值会影响回归结果。
请问下,winsorize这个命令是不是自己本身没有判断异常值的功能,等于说需要通过箱图或者其他手段确定哪些变量有异常值后再来用这个命令进行缩尾?如果带入完全正态分布的数据进入这个命令分析,它也会被取代前后百分之一的变量值吗?????

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-29 08:59