楼主: sander88
40936 35

[学术与投稿] 请问大侠:性别、年龄、职业、学历等定性和定序变量为自变量如何做回归分析? [推广有奖]

  • 0关注
  • 0粉丝

大专生

61%

还不是VIP/贵宾

-

威望
0
论坛币
197 个
通用积分
5.4151
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
485 点
帖子
33
精华
0
在线时间
65 小时
注册时间
2010-5-7
最后登录
2023-7-1

楼主
sander88 发表于 2011-5-22 17:24:08 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请问大侠:性别、年龄、职业、学历等定性变量和定序变量为自变量能做回归分析吗,如何处理数据?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:回归分析 定序变量 自变量 处理数据 变量 职业 回归分析 学历 性别

回帖推荐

lwfaaa3 发表于4楼  查看完整内容

可以做 引入虚拟变量 虚拟变量又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作用,而且接近现实。   例如,反映文程度的虚拟变量可取为:1:本科学历;0:非本科学历 在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:   1)如果有m种互斥的属性类型,在模型中引入 ...

sskkyy611 发表于3楼  查看完整内容

可以做回归分析,只不过自变量的数据是不连续的双值变量(也称“虚拟变量”),即这个变量只有两个值,0和1(“是”和“非”)。这种数据主要是用来衡量质的变化。 如何处理数据: 1)性别:性别只有男和女两个值。所以可设置一个变量a来表示性别,a=1表示女,a=0表示男。 2)职业、学历等要稍微复杂一点,因为它们的分类情况不止两种: 如学历,若分为小学,初中,高中,大学四个层次。就需要设置4个自变量b1,b2,b3,b4 ...

南冰 发表于2楼  查看完整内容

这个是可以做回归分析的,你定义虚拟变量就行的。如果是两个(如性别)那么定义为0和1即可,但是方程中如果全是定性或者定序变量,建议楼主用方差分析!
已有 1 人评分论坛币 收起 理由
guo.bailing + 1 您的帖子被选入“版主悬赏贴”,请在您的帖子得到回答之后,及时地对回帖作出评价,以

总评分: 论坛币 + 1   查看全部评分

沙发
南冰 发表于 2011-5-29 17:31:12
这个是可以做回归分析的,你定义虚拟变量就行的。如果是两个(如性别)那么定义为0和1即可,但是方程中如果全是定性或者定序变量,建议楼主用方差分析!
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
guo.bailing + 60 + 10 + 1 + 1 + 1 根据规定进行奖励

总评分: 经验 + 60  论坛币 + 10  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

一直怀有一个梦想,希望在不久的将来能读个博士,做做学术搞搞研究,饱尝学术的艰辛

藤椅
sskkyy611 发表于 2011-5-29 18:35:08
可以做回归分析,只不过自变量的数据是不连续的双值变量(也称“虚拟变量”),即这个变量只有两个值,0和1(“是”和“非”)。这种数据主要是用来衡量质的变化。

如何处理数据:
1)性别:性别只有男和女两个值。所以可设置一个变量a来表示性别,a=1表示女,a=0表示男。
2)职业、学历等要稍微复杂一点,因为它们的分类情况不止两种:
  如学历,若分为小学,初中,高中,大学四个层次。就需要设置4个自变量b1,b2,b3,b4。
  b1=1小学;b1=0其它。
  b2=1初中;b2=0其它。
  b3=1高中;b3=0其它。
  b4=1大学;b4=0其它。
  而不是只用一个变量表示,如b1=1,2,3,4。因为这中间的差距不是等距的关系。
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
guo.bailing + 60 + 10 + 1 + 1 + 1 根据规定进行奖励

总评分: 经验 + 60  论坛币 + 10  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

板凳
lwfaaa3 发表于 2011-5-29 19:35:08
可以做
引入虚拟变量
虚拟变量又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作用,而且接近现实。   例如,反映文程度的虚拟变量可取为:1:本科学历;0:非本科学历
在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:  
1)如果有m种互斥的属性类型,在模型中引入(m-1)个虚拟变量,否则会导致多重共线性。称作虚拟变量陷阱。 例如,性别有2个互斥的属性,引用2-1=1个虚拟变量;再如,文化程度分小学、初中、高中、大学、研究生5类,引用4个虚拟变量。   
2)关于定型变量中哪个取0哪个取1是任意的,不影响检验结果。  
3)若定型变量取值为0,所对应的类别称为基础类别。  
4)对于多于两个类别的定型变量可采用设一个虚拟变量,而对于不同类别采取赋值不同的方法处理。
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
guo.bailing + 60 + 10 + 1 + 1 + 1 根据规定进行奖励

总评分: 经验 + 60  论坛币 + 10  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

日新月异

报纸
子君2011 发表于 2011-5-29 22:08:45
自己对这个也不是特别的清楚,来这里正好看到楼上几位的回复,又懂了不少,谢谢楼上的朋友啊,(*^__^*)
已有 1 人评分经验 论坛币 收起 理由
guo.bailing + 30 + 1 鼓励积极发帖讨论

总评分: 经验 + 30  论坛币 + 1   查看全部评分

只要开始永远不晚,只要进步永远有空间!

地板
ecjtjg 发表于 2011-5-30 08:48:27
定义虚拟变量后,可以考虑用logit回归,做影响因素分析。
已有 1 人评分经验 论坛币 收起 理由
guo.bailing + 30 + 1 根据规定进行奖励

总评分: 经验 + 30  论坛币 + 1   查看全部评分

7
yingzi1989 发表于 2011-5-30 19:27:03
将性别、职业、学历等定义虚拟变量
已有 1 人评分经验 论坛币 收起 理由
guo.bailing + 30 + 1 鼓励积极发帖讨论

总评分: 经验 + 30  论坛币 + 1   查看全部评分

8
tangmay 发表于 2011-5-31 20:09:20
学习了,谢谢大家的分享!
已有 1 人评分经验 论坛币 收起 理由
guo.bailing + 30 + 1 鼓励积极发帖讨论

总评分: 经验 + 30  论坛币 + 1   查看全部评分

9
飞翔的花卷 发表于 2011-5-31 22:40:11
真好~~学习到了~~~~
已有 1 人评分经验 论坛币 收起 理由
guo.bailing + 30 + 1 鼓励积极发帖讨论

总评分: 经验 + 30  论坛币 + 1   查看全部评分

10
scofieldkang 发表于 2011-6-1 13:43:17
采用0-1变量法,如:性别男为0,女为1·····。再用matlab统计工具箱的regress函数就可以做回归分析了
已有 1 人评分经验 论坛币 收起 理由
guo.bailing + 30 + 1 鼓励积极发帖讨论

总评分: 经验 + 30  论坛币 + 1   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-3 21:49