数据标签和数据编码是一对容易混淆的概念,但事实上两者有着本质的区别,想要搞清这两个概念其实很简单。
1 基础概念
<1> 数据标签: 顾名思义,就是给数据加上标签。没有设置标签的数据,在分析时,会按原本的数值显示,比如‘1.0’、‘2.0’,这样就没有办法了解这些数字原本的含义。
没有标签的数据展示
因此为了方便识别,让数字具有实际意义,就需要用到数据标签功能,标识出数字代表的意义。
有标签的数据展示
修改数据标签对数值本事不会有任何影响,比如这里的‘1.0’,加上标签后,显示为“男”,即数值1,代表男性,如果改变标签,数值代表的意思也会随之改变,但即使换了标签对原本的数值也不会有影响。
<2> 数据编码: 数据编码是在原始数值的基础上进行替换,因此**对数据重新编码会改变原本的数据。**比如原本的数字是1编码为3,意味着数据中的1直接就变成3,再做分析就会按3来分析。
2 操作步骤
<1> 数据标签
点击【数据处理】->【数据标签】,选择进行设置标签的标题,填好对应标签即可。
(可配合ctrl或者shift键同时选择多项,批量一次性操作处理)
设置了数据标签的标题前,会标有蓝色的标签;没有标签的则是灰色的
<2> 数据编码
点击【数据处理】->【数据编码】,选择进行编码的标题,填写编码即可。
(可配合ctrl或者shift键同时选择多项,批量一次性操作处理)
如果希望直接覆盖原始数据,请将“覆盖”按钮打勾即可。
同时下拉复选框,可选择范围编码,针对某一区间的数据编码成某个数字。
3 应用场景
<1> 数据标签
① 针对数据标签,通常只有“定类”数据需要设置,“定量”数据通常不需要设置。(如果是量表态度题如非常不满意,比较不满意,中立,比较满意,非常满意,根据需要设置即可)
② 此外涉及下面分析方法时,通常也需要设置数据标签:
- 频数分析
- 交叉(卡方)分析
- 方差分析、事后检验
- T检验
- 多选题
- 双因素、多因素方差
- Logit回归等
<2> 数据编码
① 数据编码可用于数据组合,比如遇到样本比例严重不平衡,可以将样本数据组合处理,如1代表高中,2代表大专,3代表本科,4代表硕士,5代表博士。希望组合成三组分别是:本科以下,本科,硕士及以上.则可处理为:1->1,2->1,3->2,4->3,5->3,最终数字1代表本科以下,2代表本科,3代表硕士及以上。
② 数据编码还可用于反向题处理。比如量表中存在反向题,一定要先给这道题进行反向计分操作,然后再进行具体的分析。
4 搭配使用
数据编码和数据标签在多数情况下可以搭配使用。例如,在进行数据上传时,如果数据中有字符信息,SPSSAU系统会识别字符信息,按照字符顺序依次进行标签设置。
例如:统计分析学生成绩情况,原始数据如图1所示,导入系统后,系统识别第三列为字符信息将其编码为数字:‘1’=‘不合格’;‘2’=‘优秀’;‘3’=‘合格’;‘4’=‘良好’。原来的字符信息被自动记为对应数值的数据标签。
原始数据
上传后数据
数据标签
此时数值和标签顺序与我们想要得到的顺序并不一致,可以通过数据编码来进行修改,然后再为新编码的数值设置标签。