楼主: zhaorugang
14171 10

[问答] spss16.0中虚拟变量的处理 [推广有奖]

  • 0关注
  • 1粉丝

本科生

76%

还不是VIP/贵宾

-

威望
0
论坛币
15 个
通用积分
0.1200
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
8681 点
帖子
22
精华
0
在线时间
184 小时
注册时间
2010-6-1
最后登录
2016-6-2

楼主
zhaorugang 发表于 2011-8-24 09:11:06 |AI写论文
10论坛币
我论文中的自变量有三个虚拟变量:控股类型(国有控股1,非国有控股0);董事长和ceo是否一人兼任(是1,否0);行业类型(有13个行业类型),另外的自变量还有企业规模、总资产回报率等。要做多元回归分析,请问怎样处理这些虚拟变量好?(最好能具体一些)

关键词:SPSS 虚拟变量 PSS 多元回归分析 多元回归 回归分析 董事长 自变量 规模 论文

回帖推荐

appleqiuqiu 发表于10楼  查看完整内容

13个行业需要设定12个虚拟变量,为了方便举例,我举一个四个水平的变量。例如教育水平这个分类变量,我有中学生、大学生、硕士研究生和博士研究生,现在为中学生为基准,设置三个虚拟变量,即D1、D2和D3。 D1 =1,代表大学生; D1=0,代表其他(这里就是中学生、硕士研究生和博士研究生); D2=1,代表硕士研究生; D2=0,代表其他(这里就是中学生、大学生和博士研究生); D3=1,代表博士研究生; D3=0,代表其他(这里就是 ...

本帖被以下文库推荐

沙发
bobob 发表于 2011-9-5 14:28:02
设回归模型为:
Y=b0+b1X1+b2X2+.....BnXn+C1D1+C2D2+C31D31+C32D32+,,,,+C312D312
其中:X1~XN为一般的自变量,D1、D2为控股类型、是否一人兼任两个虚拟变量
         D31~D312为13个行业类型的虚拟变量。
另外建议你,对于行业类型建议你分别建立回归模型可能效果更好一些。

藤椅
bobob 发表于 2011-9-5 14:28:36
设回归模型为:
Y=b0+b1X1+b2X2+.....BnXn+C1D1+C2D2+C31D31+C32D32+,,,,+C312D312
其中:X1~XN为一般的自变量,D1、D2为控股类型、是否一人兼任两个虚拟变量
         D31~D312为13个行业类型的虚拟变量。
另外建议你,对于行业类型建议你分别建立回归模型可能效果更好一些。

板凳
ghostshang 发表于 2011-9-9 08:55:44
楼主说的1和0的问题不是自己输入的么?行业变量那个我不知道怎么弄,咱俩的模型有点像

报纸
chuanbomeihao 发表于 2011-10-19 01:46:50
同问,我也想知道行业类的虚拟变量设置。

地板
phenixe 发表于 2012-1-4 13:14:24
谢谢

7
zhouwm 发表于 2012-1-4 14:18:50
一般来说虚拟变量的个数是原始类别-1,但是这个虚拟变量个数也可以小于原始类别-1。这个的话,需要自己编码,设定一个编码规则,在看生成新变量。我觉得你可以随便找个分类变量最因变量,用Logistic回归试下,看Logistic回归的编码是怎么处理的。
go on...

8
大白兔奶糖啊 发表于 2012-4-24 09:48:14
同问啊,相同的问题

9
小哑 发表于 2012-11-2 17:24:48
借楼同问   定性变量水平多的话在spss里怎么处理

10
appleqiuqiu 发表于 2012-12-26 00:51:51
13个行业需要设定12个虚拟变量,为了方便举例,我举一个四个水平的变量。例如教育水平这个分类变量,我有中学生、大学生、硕士研究生和博士研究生,现在为中学生为基准,设置三个虚拟变量,即D1、D2和D3。
D1 =1,代表大学生;
D1=0,代表其他(这里就是中学生、硕士研究生和博士研究生);
D2=1,代表硕士研究生;
D2=0,代表其他(这里就是中学生、大学生和博士研究生);
D3=1,代表博士研究生;
D3=0,代表其他(这里就是中学生、大学生和硕士研究生)。

这些都用SPSS中“重新编码为不同变量”实现,D1、D2和D3就是你新生成的变量,在接下来的回归中不要用原来的教育水平这个变量,要用D1、D2和D3,结果解释如下:

设D1的系数为a,D2的系数为b,D3的系数为c,则a代表大学生与中学生的差异,b代表硕士研究生和中学生的差异,c代表博士研究生和中学生的差异,b-a代表硕士研究生和大学生的差异,c-b代表博士研究生和硕士研究生的差异,c-a代表博士研究生于大学生的差异,

这是其中一种虚拟变量的编码方法,还有一种,明早再写吧,太困了,希望能帮助你~
已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
feoy + 1 + 1 + 1 精彩帖子
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 12:13