楼主: peyzf
2836 2

[Stata高级班] 有关于异常值的处理 [推广有奖]

  • 1关注
  • 63粉丝

警督

大师

59%

还不是VIP/贵宾

-

威望
2
论坛币
566735 个
通用积分
200.4746
学术水平
218 点
热心指数
240 点
信用等级
140 点
经验
132065 点
帖子
12769
精华
0
在线时间
2976 小时
注册时间
2007-9-8
最后登录
2025-10-10

楼主
peyzf 发表于 2013-2-13 09:00:33 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

在有些比率值(如研发密度)变量中,有些记录值往往高得离谱,在这种情况下,是直接将其删除,还是做Winsor处理。处理的比例一般为多少?1%,5%?

是不是需要对所有的变量进行统一的处理(winsor 及其比例),还是只需要针对一些敏感的变量进行处理?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:异常值 winsor wins Win SOR 异常

沙发
arlionn 在职认证  发表于 2013-2-14 19:57:11
通常是对主要变量进行 winsor 缩尾处理,左右各 1%。
但处理之前,你还需要认真查看一下原始数据,如果某家公司的多个指标都存在问题,可以考虑删除这家公司。
相对而言,我认为缩尾比直接删除要好一些。
最后,还需要对比一下处理离群值后和处理之前的回归结果,看看二者之间是否存在非常大的差异。

藤椅
peyzf 发表于 2013-2-15 02:27:02
谢谢。如果处理后与没有处理的情形存在很大的差异,则意味着将要采取哪种处理方式?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-25 05:31