楼主: peyzf
3162 6

[数据管理求助] winsor or drop? [推广有奖]

  • 1关注
  • 63粉丝

警督

大师

59%

还不是VIP/贵宾

-

威望
2
论坛币
566735 个
通用积分
200.4746
学术水平
218 点
热心指数
240 点
信用等级
140 点
经验
132065 点
帖子
12769
精华
0
在线时间
2976 小时
注册时间
2007-9-8
最后登录
2025-10-10

楼主
peyzf 发表于 2013-2-13 08:57:04 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

在有些比率值(如研发密度)变量中,有些记录值往往高得离谱,在这种情况下,是直接将其删除,还是做Winsor处理。处理的比例一般为多少?1%,5%?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:winsor drop wins SOR Win 多少 还是

沙发
黑李庄 发表于 2013-2-13 09:14:15
如果样本量够大drop。但是drop可能影响面板回归,若采用混合回归加上样本量够大可以drop,否则winsor.第一选择是winsor,原因是不损失样本。
已有 1 人评分学术水平 收起 理由
peyzf + 1 good suggestion

总评分: 学术水平 + 1   查看全部评分

藤椅
黑李庄 发表于 2013-2-13 09:14:40
winsor的比例一般选择0.01

板凳
黑李庄 发表于 2013-2-13 09:17:03
如果极端值的比例较大,0.01winsor之后还存在极端值,可以考虑0.05.

报纸
peyzf 发表于 2013-2-13 15:09:37
many thanks.

地板
lclray3 发表于 2013-7-20 08:58:12
学习了

7
peyzf 发表于 2013-7-20 09:23:35
thanks.

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-3 11:09