楼主: wuyangsem
15316 8

[学科前沿] 如何通过删除异常值来提高R方 [推广有奖]

  • 3关注
  • 3粉丝

博士生

58%

还不是VIP/贵宾

-

威望
0
论坛币
1892 个
通用积分
0.7601
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
4985 点
帖子
149
精华
0
在线时间
441 小时
注册时间
2007-6-28
最后登录
2024-9-13

100论坛币
回归方程的R方较小(<0.8),为了提高该值,想删除一些异常值。请问如何选出最少的异常值来使R方大于0.8?选择的标准是什么?如何操作?多谢帮忙!

最佳答案

zhangtao 查看完整内容

楼主碰到的问题很常见,原因很多,我就不详细不说了,最常见的解决方法如下: 统计值t=(样本观测值-样本平均值)/标准差,如果一些样本观测值的t值明显大于或小于 其他样本观测值的t值,那这些样本观测值就是异常值,你可以删除他们,然后再回归, 可以提高R方,提高估计值。 楼主,我研究的方向就是统计与应用计量经济学,希望多讨论! 如果我说的你还不明白,可以再提问,我们相互学习相互讨论!不要有什么顾虑。 再给你一 ...
关键词:异常值 回归方程 如何

回帖推荐

zhangtao 发表于2楼  查看完整内容

楼主碰到的问题很常见,原因很多,我就不详细不说了,最常见的解决方法如下: 统计值t=(样本观测值-样本平均值)/标准差,如果一些样本观测值的t值明显大于或小于 其他样本观测值的t值,那这些样本观测值就是异常值,你可以删除他们,然后再回归, 可以提高R方,提高估计值。 楼主,我研究的方向就是统计与应用计量经济学,希望多讨论! 如果我说的你还不明白,可以再提问,我们相互学习相互讨论!不要有什么顾虑。 再给你一 ...

本帖被以下文库推荐

沙发
zhangtao 发表于 2010-10-17 18:25:46 |只看作者 |坛友微信交流群
楼主碰到的问题很常见,原因很多,我就不详细不说了,最常见的解决方法如下:
统计值t=(样本观测值-样本平均值)/标准差,如果一些样本观测值的t值明显大于或小于
其他样本观测值的t值,那这些样本观测值就是异常值,你可以删除他们,然后再回归,
可以提高R方,提高估计值。
楼主,我研究的方向就是统计与应用计量经济学,希望多讨论!
如果我说的你还不明白,可以再提问,我们相互学习相互讨论!不要有什么顾虑。
再给你一个例子:如果某一月某一商场所有商品打折,该月销售额肯定比其他月高,那么t值肯定高于其他月份,
那这一月的销售额就是异常值,做回归时就要删除。
如果数据很少,可以设阿尔法=0.01,进行t检验,如果数据非常多,就没有必要了。
如果数据非常非常多,可以用excel中数据菜单中的数据筛选中的自定义进行筛选,然后,
用筛选出来的数据做回归,可以提高R方。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
wuyangsem + 1 + 1 + 1 多谢指教

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

藤椅
zhangchx 发表于 2010-10-17 18:50:11 |只看作者 |坛友微信交流群
可以根据库克距离进行判断,按库克距离从大到小依次删除异常值点,直到满足要求为止。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
wuyangsem + 1 + 1 + 1 好的意见建议

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

板凳
yumingchao 发表于 2010-10-17 20:32:53 |只看作者 |坛友微信交流群
首先不明白楼主为什么要提高R方,0.75也可能是个好模型,把R2提高到0.99也不能说明模型就是好模型,反而很有可能是存在问题R方才很高。
如果是要删除异常值,简单的方法可以看标准化残差,经验原则是以2为判断标准,stata里面标准化残差使用predict res,rstandard就可以得到了。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
wuyangsem + 1 + 1 + 1 好的意见建议

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

报纸
bobguy 发表于 2010-10-18 03:04:07 |只看作者 |坛友微信交流群
wuyangsem 发表于 2010-10-17 18:25
回归方程的R方较小(
Unless you have strong evidence(business reasons) to justify it is indeed a outlier, otherwise just leave it only.
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
wuyangsem + 1 + 1 + 1 好的意见建议

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

地板
Marooners 发表于 2011-4-1 23:56:06 |只看作者 |坛友微信交流群
我论文发现我的R方值也特别低  怎样从样本入手将一些不适合的数据给删掉 这样是在作假我知道 但是如果可以提高R方值 就行 求救呀

使用道具

在spss里可以直接做卡方检验然后剔除

使用道具

8
neversarah 发表于 2014-6-30 13:19:30 |只看作者 |坛友微信交流群
很多现实问题中R^2在0.2几也很正常的

使用道具

9
SevtnXu 发表于 2015-3-27 00:33:19 |只看作者 |坛友微信交流群
高贵冷艳攻城狮 发表于 2014-4-7 22:07
在spss里可以直接做卡方检验然后剔除
你好!请问,做卡方检验,剔除什么样的数据呢?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 22:52