楼主: 滨滨有利123
1516 0

[投稿经验分享] 用spss做哑变量--给不敲代码同学福音 [推广有奖]

  • 0关注
  • 30粉丝

副教授

24%

还不是VIP/贵宾

-

威望
0
论坛币
198 个
通用积分
25.4545
学术水平
1 点
热心指数
2 点
信用等级
0 点
经验
9596 点
帖子
328
精华
0
在线时间
381 小时
注册时间
2015-4-26
最后登录
2023-9-23

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

今天给各位分享怎么用spss做哑变量,也算是给不想敲代码的同学带来一些福利。


大家好,各位周五下班愉快,希望人人都能在地铁上看到这篇文章。我是番茄学院的小番茄:人在蒙古、刚下航母,明去白宫,谢邀谢邀,匿了匿了。但还是挡不住跟各位分享的热情,今天来分享一些内容。


今天给各位分享怎么用spss做哑变量,也算是给不想敲代码的同学带来一些福利。


首先介绍下什么是哑变量。哑变量是由虚拟变量衍生过来,指的是非数值型的字符变量转换而来的变量,通常情况下这些变量都是无序的变量。如性别、职业等等。


因为如果你用0表示女,1表示男,这里数值上,由于1大于0,所以会造成在模型解释上取值为男的权重会比女的大,所以对于这样的无序变量,通常不使用有大小的数值表示。而是引入两个虚拟变量sex_0与sex_1;


另外对某些好似是有序的变量如教育程度,这些是不是应该用梯度的数值的表示,如果高中、专科、本科、硕士分别对应0、1、2、3.,我个人也建议结合自家的数据情况分析,比如学历里对于数值相差较大,难道不能取0,3,5, 6?


OK,本篇文章来实际介绍下如何给数值进行哑变量编码。这里我们引入spss工具。这个不需要敲代码的工作,现在是sas、python、R的天下,但本人觉得工具只是实现的手段,重要的是理解里面的原理。


我们本篇文章会介绍spss,并把相关的数据集跟下载链接,放在知识星球,各位有兴趣学习spss的可以上去下载破解版的软件跟数据集。


本次给各位介绍的是一份关于客户是否会愿意购买某超市产品的一份数据,里面包括的字段有性别(sex),负债能力(dept),产品价格(price),送货距离(distance)等数十个字段…然后我们去预测客户是否购买(purchase)产品,


首先,我们导入的数据如下:

图片1.jpg


具体的对应的数据如下:

图片2.jpg


我们此次选择用逻辑回归算法:

图片3.jpg


选取了purchase作为因变量,而此次为了操作简便只选取四个变量:sex, dept, price, distance;


接着需要把sex跟distance两个作为分类变量,进行相关的哑变量处理:

图片4.jpg


完成之后,直接单击下一步就完成了

图片5.jpg


输出以下结果:

图片6.jpg

可以看到哑变量输出里,因为性别是只有男女两个类型,所以哑变量只输出一个。而distiance有5种类型,输出4个哑变量;最后是关于其他数值的解读,我们有机会再在以后的文章里为各位解读。接下来,会有一部分关于spps的安装教程,我们也把下载的链接放在知识星球。



以下为安装教程:可略过


图片7.jpg


图片8.jpg


图片9.jpg


图片10.jpg


图片11.jpg


图片12.jpg


图片13.jpg


图片14.jpg


图片15.jpg


图片16.png


图片17.jpg


图片18.jpg




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 00:08