楼主: a42325913
31810 17

[问答] 关于线性回归多分类变量设置虚拟变量后结果分析问题 [推广有奖]

  • 0关注
  • 1粉丝

已卖:80份资源

高中生

52%

还不是VIP/贵宾

-

威望
0
论坛币
440 个
通用积分
1.0611
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
534 点
帖子
24
精华
0
在线时间
24 小时
注册时间
2014-10-27
最后登录
2015-10-30

楼主
a42325913 发表于 2015-10-27 13:40:03 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有一个自变量为4分类变量,设置虚拟变量为D1,D2,D3。采用进入法将所有变量纳入回归,分析结果显示D1的系数没有通过t检验,P>0.05,但是D2,D3均通过检验,这样子的结果虚拟变量应该怎么解释呢?
假设4分类变量为4个品种:1、2、3、4。以品种1为参照,设置3个虚拟变量D1,D2,D3。我个人认为如果虚拟变量中有一个(D1)不通过t检验,说明3个虚拟变量所代表的品种这个4分类变量对因变量的影响均不显著,即品种对因变量无显著相关性,这样的分析对不对?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:虚拟变量 变量设置 分析问题 线性回归 分类变量 相关性 因变量 自变量 品种 影响

回帖推荐

xddlovejiao1314 发表于3楼  查看完整内容

第一个问题:类别变量有4类,处理为3个虚拟变量了。SPSS一般默认以最高组为参照组,假设其为4,那么在解释时这样说:与参照组相比,D2,D3比其多/少xx(这里的xx表示偏回归系数。其中,偏回归系数为正则表示比参照组多xx;偏回归系数为负则表示比参照组少xx)。 第二个问题不对。D1与参照组比差异不显著那只表明D1与参照组间无显著差异。而D2与D3若通过t检验,那么D2和D3则与参照组差异显著。

沙发
a42325913 发表于 2015-10-27 13:40:57
自己顶起来

藤椅
xddlovejiao1314 学生认证  发表于 2015-10-28 16:11:13
   第一个问题:类别变量有4类,处理为3个虚拟变量了。SPSS一般默认以最高组为参照组,假设其为4,那么在解释时这样说:与参照组相比,D2,D3比其多/少xx(这里的xx表示偏回归系数。其中,偏回归系数为正则表示比参照组多xx;偏回归系数为负则表示比参照组少xx)。
   第二个问题不对。D1与参照组比差异不显著那只表明D1与参照组间无显著差异。而D2与D3若通过t检验,那么D2和D3则与参照组差异显著。
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
fightingmary + 1 + 1 + 1 精彩帖子
QueenCi.Shine + 2 精彩帖子

总评分: 学术水平 + 1  热心指数 + 3  信用等级 + 1   查看全部评分

板凳
a42325913 发表于 2015-10-28 16:35:26
xddlovejiao1314 发表于 2015-10-28 16:11
第一个问题:类别变量有4类,处理为3个虚拟变量了。SPSS一般默认以最高组为参照组,假设其为4,那么在解 ...
非常感谢参与讨论!个人的理解:虚拟变量的设置以某一个为参照的意思应该是说D1-D3取值均为0表示品种A,以此为参照;D1=1,D2、D3为0代表为品种B,D2=1,D1、D3为0代表品种C;D3=1,D1、D2为0代表品种D。此时的参照我理解应该是设置虚拟变量时仅作为一个赋值的参考,而比较时应该不是D1-D3的虚拟变量与参照之间比较吧,应该是要整体分析D1、D2、D3所代表的这个分类变量对因变量y的影响吧。因为D1、D2、D3分别取值000,100,010,001才能代表一个变量,分开就没有意义了,也就没有必要采用进入法,把虚拟变量强行纳入模型了吧。

报纸
xddlovejiao1314 学生认证  发表于 2015-10-28 16:39:40
a42325913 发表于 2015-10-28 16:35
非常感谢参与讨论!个人的理解:虚拟变量的设置以某一个为参照的意思应该是说D1-D3取值均为0表示品种A,以 ...
类别变量有4个类别,设置了一个参照组和3个虚拟变量,如果分开写回归方程那就有3个了。所以解释的时候D1,D2,D3分别与参照组比怎样怎样,而不是再将其作为一个整体变量考虑了。

地板
a42325913 发表于 2015-10-30 17:34:56
xddlovejiao1314 发表于 2015-10-28 16:39
类别变量有4个类别,设置了一个参照组和3个虚拟变量,如果分开写回归方程那就有3个了。所以解释的时候D1, ...
又仔细的看了几天虚拟变量的内容,总算是弄明白了,果然是虚拟变量,虚的都不好理解了,终于画图看结截距看出了点儿名堂。。。还是很感谢大神的解答的,以后多交流哈

7
儒雅谦和 发表于 2016-1-28 16:16:45
a42325913 发表于 2015-10-30 17:34
又仔细的看了几天虚拟变量的内容,总算是弄明白了,果然是虚拟变量,虚的都不好理解了,终于画图看结截距 ...
您好,可否告知一下你对分类虚拟变量回归结果的理解?这两天我也遇到这个问题,但是没有搞定,还请赐教,万分感激!

8
邂逅晨风 发表于 2016-6-22 15:38:37
xddlovejiao1314 发表于 2015-10-28 16:11
第一个问题:类别变量有4类,处理为3个虚拟变量了。SPSS一般默认以最高组为参照组,假设其为4,那么在解 ...
那D2与D3系数的大小有比较的意义么?

9
wangzhd 发表于 2016-6-30 13:27:25
1这个变量对因变量的影响显著,也就是说自变量水平的不同,因变量差值之间至少有一个是显著的,类似于F检验那样去理解即可,D2与D3系数的大小有比较的意义,它们都是相对于参照组因变量无值的比较结果,相互之间的差值是它们因变量之间的差值,只是这个差值是否显著不知道,如果想知道,将D2做参照组做一遍就知道了

10
nuokuo 发表于 2016-7-2 10:42:29
儒雅谦和 发表于 2016-1-28 16:16
您好,可否告知一下你对分类虚拟变量回归结果的理解?这两天我也遇到这个问题,但是没有搞定,还请赐教, ...
举个例子吧:宗教(天主教、D1犹太教、D2伊斯兰教、D3其他)对受教育程度存在影响,这里以天主教为参照组,犹太教、伊斯兰教和其他成为虚拟变量,D1不显著,意味着犹太教相对天主教在受教育程度上并不存在显著差异;D2、D3显著,意味着伊斯兰教和其他宗教相对天主教在受教育程度上存在显著差异。
例子仅为举例,不代表实际情况,请勿攻击。
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
fightingmary + 1 + 1 + 1 精彩帖子
yudacool + 2 + 2 + 2 精彩帖子

总评分: 学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 18:08