楼主: Jonas5678
9035 5

[数据管理求助] 关于异常值的处理问题 [推广有奖]

  • 1关注
  • 0粉丝

博士生

1%

还不是VIP/贵宾

-

威望
0
论坛币
288 个
通用积分
18.0640
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
6326 点
帖子
116
精华
0
在线时间
135 小时
注册时间
2014-6-30
最后登录
2022-5-11

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
stata回归结果与预期有偏差,猜测可能是样本中异常值的影响,用以下命令对因变量有异常值的样本进行了删除:
xtile s=larate,nq(100)
drop if s>=90 | s<=10
drop s

结果画箱线图,还是这个样子:

是不是说明还有很多离群值?怎么办啊?已经删掉很多样本了?用Winsor命令可以么?但是虽然Winsor不会减少样本数量,但是它是缩尾处理,那样的话会不会对回归结果有影响啊?急求高人解答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:异常值 xtile Stata 回归结果 Tile 因变量 样本 影响

stata.png (3.62 KB)

stata.png

沙发
xddlovejiao1314 学生认证  发表于 2015-4-24 17:28:13 来自手机 |只看作者 |坛友微信交流群
Jonas5678 发表于 2015-4-24 17:10
stata回归结果与预期有偏差,猜测可能是样本中异常值的影响,用以下命令对因变量有异常值的样本进行了删除: ...
如果是偏正太分布,可通过取对数进行处理。

使用道具

藤椅
Jonas5678 发表于 2015-4-24 19:11:35 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-4-24 17:28
如果是偏正太分布,可通过取对数进行处理。
已经取了对数~,这就是取了对数之后的箱线图~

使用道具

板凳
xddlovejiao1314 学生认证  发表于 2015-4-25 20:13:07 |只看作者 |坛友微信交流群
Jonas5678 发表于 2015-4-24 19:11
已经取了对数~,这就是取了对数之后的箱线图~
那考虑用缩尾处理吧。
已有 1 人评分经验 收起 理由
SpencerMeng + 20 热心帮助其他会员

总评分: 经验 + 20   查看全部评分

使用道具

报纸
Jonas5678 发表于 2015-4-26 10:25:00 来自手机 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-4-25 20:13
那考虑用缩尾处理吧。
删掉了一个不显著的变量,然后就没问题了~
已有 1 人评分经验 收起 理由
SpencerMeng + 20 感谢分享

总评分: 经验 + 20   查看全部评分

使用道具

地板
暮格乖乖 发表于 2016-3-20 11:22:20 |只看作者 |坛友微信交流群
楼主好像也是做的避税吧?请问到底如何缩尾呢

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-10 09:23