楼主: Mirror..
1905 6

[基础理论] 【从零开始学统计】2.可决系数真的决定一切么? [推广有奖]

院士

21%

还不是VIP/贵宾

-

威望
1
论坛币
67318 个
通用积分
10.1197
学术水平
502 点
热心指数
518 点
信用等级
460 点
经验
42826 点
帖子
2409
精华
2
在线时间
716 小时
注册时间
2014-11-10
最后登录
2019-4-21

初级学术勋章 初级热心勋章 中级学术勋章

楼主
Mirror.. 在职认证  发表于 2014-11-19 13:24:20 |只看作者 |坛友微信交流群|倒序 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
  前几天逛知乎的时候看到一个帖子,学计量的和学统计的在争论关于anova里的可决系数的问题。突然萌生了一个念头,想听听大家对这个R2是怎么理解的。(引用的知乎链接,大家可以前去看看http://www.zhihu.com/question/22935472;当然本坛里也展开过一个关于计量和统计两学科区别的讨论,大家也可看看https://bbs.pinggu.org/thread-2930588-1-1.html

       那我先来说说我对这个R2的理解吧:

       R2是什么?它就是可决系数(coefficient of determination),也被称为拟合优度。说到拟合优度一般理解为回归直线与观测值的一个拟合程度,请看图:

       如果样本回归线对样本观测值拟合程度越好,各样本观测点与回归线靠得越近,由样本回归做出解释的离差平方和与总离差平方和越相近;反之,拟合程度越差,相差越大。(说的更简单点,R2越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集)。既然是平方那么可决系数的取值范围在0到1之间,它是一个非负统计量。试想如果所有的点都在直线上,一点也没有离开直线,那就说明拟合度很好,是1。就是能够完全解释。

       而现实情况肯定没有这样的。就比如你的努力程度和历次考试成绩,虽然越努力成绩越好,但是你不能保证自己没有失误啊。这个失误就是残差,但是失误肯定不是主要部分,所以R2还是很大的。

       R2没有很明确的界限,说什么就是好什么就是不好,有的时候时间序列的拟合程度都不是很好,甚至只有0.3到0.4,所以要综合来看,没有很确定的界限。例如,考虑这样一个例子。在冬季的几个月里,人们经常通过燃油取暖,因为取暖用的燃油在冬季的销售额比在夏天的销售额要高。同样,滑雪设备的销售额在冬季也比夏天要高。事实上,如果我们打算运行一个以滑雪设备的销售额作为自变量x以及取暖用的燃油的销售额作为因变量y的回归模型,那么产生的模型将是很好的模型,并具有很高的R2数值。不过,我们知道滑雪设备的销售额并没有造成人们购买更多的家用取暖的燃油。

       当然还有其他情况,比如当回归直线是平行于x轴,并且与原始数据的散点图拟合度也非常高,但R2=0.说明一个低的R2数值,并不一定意味着回归模型缺乏可信度。(极端举例)又或者,一个高的R2数值但原始数据的散点图表明因变量y的观测值用一条曲线拟合比用一条直线拟合的效果可能会更好。(这是我们也会考虑参考其他拟合指标,比如AIC准则……)

       So,楼主觉得R2数值有时会给出有关线性回归模型对数据拟合程度好的误导信息。一般说来,较高的R2数值比较低的R2数值要好。接受回归模型足够好的R2数值的决定因素主要取决于这个模型的应用目的以及经验和良好的管理知识。

  
       在扩展一下,拟合优度检验和F检验有区别吗
       还是有区别的,拟合优度是指这个模型对于数据来说,解释变量能够解释被解释变量的程度,F说明的是整个模型中所有的解释变量的显著程度,和T值是对应的。

       在问,那R2与R的关系呢?
       撇开平方不说,R指的是线性相关系数,也就是说因变量和自变量之间的线性相关程度(注意强调的是线性!),如果两者关系很大,那么自然用他们做出的模型当然比较好用自变量解释因变量。(当然这又要引申出多重共线的问题了……这就不深究了)

       楼主也希望听听大家的见解,特别是看到知乎上的那位学计量的高票答案,有些确实说的有道理,但可能作为学统计的我,确实有些地方也不太能完全赞同吧,不知大家怎样觉得?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:从零开始 可决系数 coefficient EFFICIENT question 从零开始 统计

只想做一个勤勤恳恳的搬运工
沙发
蓄势之水 发表于 2014-11-19 13:25:57 |只看作者 |坛友微信交流群
暖贴,顶楼,灌水

使用道具

藤椅
Mirror.. 在职认证  发表于 2014-11-19 16:53:32 |只看作者 |坛友微信交流群
蓄势之水 发表于 2014-11-19 13:25
暖贴,顶楼,灌水

没事多来这个版块玩玩啊。

使用道具

板凳
littledog.. 发表于 2014-11-19 17:16:23 |只看作者 |坛友微信交流群
好帖。支持支持

使用道具

报纸
Mirror.. 在职认证  发表于 2014-11-19 17:29:48 |只看作者 |坛友微信交流群
[sweat][sweat]才发现图片显示不出来

使用道具

地板
Mirror.. 在职认证  发表于 2014-11-19 17:30:26 |只看作者 |坛友微信交流群
littledog.. 发表于 2014-11-19 17:16
好帖。支持支持
才发现图片显示不出来

使用道具

7
ViVi微 发表于 2014-11-19 17:50:24 |只看作者 |坛友微信交流群
支持支持。谢谢分享

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 09:00