楼主: spssau
804 0

[学习资料] 数据处理之变量编码与标签 [推广有奖]

  • 0关注
  • 34粉丝

教授

22%

还不是VIP/贵宾

-

威望
0
论坛币
165 个
通用积分
1001.5595
学术水平
20 点
热心指数
22 点
信用等级
20 点
经验
16842 点
帖子
535
精华
0
在线时间
636 小时
注册时间
2018-1-14
最后登录
2024-4-26

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

数据标签和数据编码是一对容易混淆的概念,但事实上两者有着本质的区别,想要搞清这两个概念其实很简单。

1 基础概念

<1> 数据标签: 顾名思义,就是给数据加上标签。没有设置标签的数据,在分析时,会按原本的数值显示,比如‘1.0’、‘2.0’,这样就没有办法了解这些数字原本的含义。

没有标签的数据展示

因此为了方便识别,让数字具有实际意义,就需要用到数据标签功能,标识出数字代表的意义。

有标签的数据展示

修改数据标签对数值本事不会有任何影响,比如这里的‘1.0’,加上标签后,显示为“男”,即数值1,代表男性,如果改变标签,数值代表的意思也会随之改变,但即使换了标签对原本的数值也不会有影响。

<2> 数据编码: 数据编码是在原始数值的基础上进行替换,因此**对数据重新编码会改变原本的数据。**比如原本的数字是1编码为3,意味着数据中的1直接就变成3,再做分析就会按3来分析。

2 操作步骤

<1> 数据标签

点击【数据处理】->【数据标签】,选择进行设置标签的标题,填好对应标签即可。

(可配合ctrl或者shift键同时选择多项,批量一次性操作处理)

设置了数据标签的标题前,会标有蓝色的标签;没有标签的则是灰色的

<2> 数据编码

点击【数据处理】->【数据编码】,选择进行编码的标题,填写编码即可。

(可配合ctrl或者shift键同时选择多项,批量一次性操作处理)

如果希望直接覆盖原始数据,请将“覆盖”按钮打勾即可。

同时下拉复选框,可选择范围编码,针对某一区间的数据编码成某个数字。

3 应用场景

<1> 数据标签

① 针对数据标签,通常只有“定类”数据需要设置,“定量”数据通常不需要设置。(如果是量表态度题如非常不满意,比较不满意,中立,比较满意,非常满意,根据需要设置即可)

② 此外涉及下面分析方法时,通常也需要设置数据标签:

  • 频数分析
  • 交叉(卡方)分析
  • 方差分析、事后检验
  • T检验
  • 多选题
  • 双因素、多因素方差
  • Logit回归等

<2> 数据编码

① 数据编码可用于数据组合,比如遇到样本比例严重不平衡,可以将样本数据组合处理,如1代表高中,2代表大专,3代表本科,4代表硕士,5代表博士。希望组合成三组分别是:本科以下,本科,硕士及以上.则可处理为:1->1,2->1,3->2,4->3,5->3,最终数字1代表本科以下,2代表本科,3代表硕士及以上。

② 数据编码还可用于反向题处理。比如量表中存在反向题,一定要先给这道题进行反向计分操作,然后再进行具体的分析。

4 搭配使用

数据编码和数据标签在多数情况下可以搭配使用。例如,在进行数据上传时,如果数据中有字符信息,SPSSAU系统会识别字符信息,按照字符顺序依次进行标签设置。

例如:统计分析学生成绩情况,原始数据如图1所示,导入系统后,系统识别第三列为字符信息将其编码为数字:‘1’=‘不合格’;‘2’=‘优秀’;‘3’=‘合格’;‘4’=‘良好’。原来的字符信息被自动记为对应数值的数据标签。

原始数据

上传后数据

数据标签

此时数值和标签顺序与我们想要得到的顺序并不一致,可以通过数据编码来进行修改,然后再为新编码的数值设置标签。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据处理 shift SPSSA logit 原始数据

www.spssau.com
您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 21:53