楼主: ljspss
7740 8

[问答] 多元回归方程的预测值都偏高,怎么解释呢 [推广有奖]

  • 0关注
  • 0粉丝

初中生

9%

还不是VIP/贵宾

-

威望
0
论坛币
2 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
156 点
帖子
14
精华
0
在线时间
6 小时
注册时间
2010-6-2
最后登录
2011-2-18

楼主
ljspss 发表于 2010-8-5 14:04:40 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我把一堆数据随机分成了2部分,一部分用spss 多元回归了一个方程。另一部分作为校对数据来验证自己的回归方程。现在发现预测值比校验的数据都大,预测值和校验值的误差都在0以上,不在0上下震荡,为什么会出现这个现象呢?这个方程可用吗?如何改进?请哪位达人解释下,我没学过回归统计。谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:多元回归方程 回归方程 多元回归 预测值 SPSS 方程 预测 解释

回帖推荐

kuangsir6 发表于2楼  查看完整内容

可能的原因: 1. 数据太少,是偶然现象。 2. 数据不满足线性回归的各种假设条件。 3. 随机分成两部分的过程实际上不随机。 4. 其它不明因素的影响。

本帖被以下文库推荐

沙发
kuangsir6 发表于 2010-8-5 14:15:55
ljspss 发表于 2010-8-5 14:04
我把一堆数据随机分成了2部分,一部分用spss 多元回归了一个方程。另一部分作为校对数据来验证自己的回归方程。现在发现预测值比校验的数据都大,预测值和校验值的误差都在0以上,不在0上下震荡,为什么会出现这个现象呢?这个方程可用吗?如何改进?请哪位达人解释下,我没学过回归统计。谢谢

可能的原因:

1. 数据太少,是偶然现象。

2. 数据不满足线性回归的各种假设条件。

3. 随机分成两部分的过程实际上不随机。

4. 其它不明因素的影响。
已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

藤椅
ljspss 发表于 2010-8-5 14:58:27
谢谢你的回复。当时取的数据很多,用于回归的221组,校验的有242组。觉得也很符合回归,因为事先知道了这些数据也是统计回归出来的,只是我不知道统计回归的公式,现在是逆推公式。

板凳
ljspss 发表于 2010-8-5 15:04:44
当时采集的数据是厂家采集好的,拿过来我问了下说是它们随机采样的,有点像超市排队一样,排好队了就按照排队顺序把数据记录下来。我就把前面一半221组拿出来,剩下的当做校验。不知道这算不算随机?

报纸
kuangsir6 发表于 2010-8-5 15:19:05
ljspss 发表于 2010-8-5 15:04
当时采集的数据是厂家采集好的,拿过来我问了下说是它们随机采样的,有点像超市排队一样,排好队了就按照排队顺序把数据记录下来。我就把前面一半221组拿出来,剩下的当做校验。不知道这算不算随机?
当然不算随机!
把所有数据按排队顺序连续编号,按单双号分成两组,再试试看。

地板
ljspss 发表于 2010-8-5 15:53:07
谢谢你告诉我怎么随机分数据,谢谢。我早点来这求救,就不会浪费我那么多时间了。呜呜,重新开始了 5# kuangsir6

7
ljspss 发表于 2010-8-5 16:09:19
kuangsir6 发表于 2010-8-5 15:19
ljspss 发表于 2010-8-5 15:04
当时采集的数据是厂家采集好的,拿过来我问了下说是它们随机采样的,有点像超市排队一样,排好队了就按照排队顺序把数据记录下来。我就把前面一半221组拿出来,剩下的当做校验。不知道这算不算随机?
当然不算随机!
把所有数据按排队顺序连续编号,按单双号分成两组,再试试看。
我还有个问题,因为之前没做过统计回归,遇到的困难蛮多的。
1、怎么选取回归的因子呢?而且是非线性的。原始数据变量用v1、v2、。。。表示;回归方程y=k1*x1+k1*x2+k3*x3+...;而X1=V1*2/V2;这些因子我是连蒙带猜的。怎么选因子呢?

2、怎么评价几个回归阿方程的好和坏呢?SPSS中有调整的判断系数R^2(R的平方)来表示,还有一个Std. Error of the Estimate (SEE)SEE越小越好,R^2的接近于1,这样的回归回归方程就好?是不是还有其他指标?

3、我在回归的时候,发现因子越多,R^2越接近1,后来看了本书 说有共线问题。共线的方程式,我觉得误差很小,有点舍不得扔掉?

4、我用回归方程得到的预测值,很多组数据,和标定数据怎么比较,就说明我的回归预测是正确的呢?有时看到误差中某几个值忽的飚的很高,最大误差在10%,然而其他数据都在5%左右,是不是说我的回归方程式不够好?

5、好像采集来的数据中有错误数据,怎么踢出来?一个一个找的话,估计眼都要花。有没好办法?


6、数据中有重复测量的数据,这些数据只有超微的差别,怎么办?丢掉去一个还是留在里面。我是取了一组,其他的都丢掉了!

还请达人指点一二。之前也下了电子书,看了但是属于快餐式的,碰到问题都找不到书里哪块是讲这个内容的,所以发帖求问了!谢谢kuangsir6 的热心回答。

8
kuangsir6 发表于 2010-8-5 16:21:43
1# ljspss
你的问题我可以回答,就是要打的字太多了。看我给你的短消息。

9
ljspss 发表于 2010-8-6 09:57:06
自个顶了,没人提点下吗 7# ljspss

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-26 15:23