楼主: peyzf
2609 2

[Stata高级班] 有关于异常值的处理 [推广有奖]

  • 1关注
  • 63粉丝

警督

大师

59%

还不是VIP/贵宾

-

威望
2
论坛币
566901 个
通用积分
188.2104
学术水平
218 点
热心指数
240 点
信用等级
140 点
经验
132143 点
帖子
12795
精华
0
在线时间
2969 小时
注册时间
2007-9-8
最后登录
2024-4-24

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

在有些比率值(如研发密度)变量中,有些记录值往往高得离谱,在这种情况下,是直接将其删除,还是做Winsor处理。处理的比例一般为多少?1%,5%?

是不是需要对所有的变量进行统一的处理(winsor 及其比例),还是只需要针对一些敏感的变量进行处理?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:异常值 winsor wins Win SOR 异常

沙发
arlionn 在职认证  发表于 2013-2-14 19:57:11 |只看作者 |坛友微信交流群
通常是对主要变量进行 winsor 缩尾处理,左右各 1%。
但处理之前,你还需要认真查看一下原始数据,如果某家公司的多个指标都存在问题,可以考虑删除这家公司。
相对而言,我认为缩尾比直接删除要好一些。
最后,还需要对比一下处理离群值后和处理之前的回归结果,看看二者之间是否存在非常大的差异。

使用道具

藤椅
peyzf 发表于 2013-2-15 02:27:02 |只看作者 |坛友微信交流群
谢谢。如果处理后与没有处理的情形存在很大的差异,则意味着将要采取哪种处理方式?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-9 00:02