异常值处理,原理大致是将异常值修建成与正常分布最大值or 最小值相同。
eg,如果你的log_size都在20左右,例如在15~20之间区间浮动,有些特别大或特别小的值出现,用winsorize就会把他们变成区间的最大值or最小值。这个“特别大”or“特别小”是你自己可以定义的,如果你认为比20高出10%算作异常值,那么22就会被修改成20,放在样本里。
个人理解,仅供参考~
|
楼主: 想读博的孩子
|
95936
50
[数据管理求助] Winsorize数据处理和删除异常值的区别是什么? |
| ||
| ||
|
未出土時先有節,及凌雲處尚虛心
|
|
|
未出土時先有節,及凌雲處尚虛心
|
|
|
未出土時先有節,及凌雲處尚虛心
|
|
| ||
加好友,备注jltj京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


