楼主: spssau
1138 0

[学习资料] 数据处理过程中如何快速计算和转化变量 [推广有奖]

  • 0关注
  • 34粉丝

教授

22%

还不是VIP/贵宾

-

威望
0
论坛币
165 个
通用积分
1001.5595
学术水平
20 点
热心指数
22 点
信用等级
20 点
经验
16842 点
帖子
535
精华
0
在线时间
635 小时
注册时间
2018-1-14
最后登录
2024-4-23

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

计算和转化变量是数据处理分析过程中一个非常重要的过程,针对一些分析方法,原变量可能并不适合分析,此时就需要对原变量进行转化,以利于后续分析。

针对这一需求,SPSSAU提供多种计算变量的方法,三步即可生成变量,不需要再单独输入函数。

操作步骤

Step1:点击 [数据处理] 下的 [生成变量]。

Step2:点击选择具体分析题项,下拉复选框选择计算功能(如平均值、乘积等)。

Step3:填写新变量名(部分功能不需要填写),点击确认处理。

生成变量的一系列功能包括:常用函数、量纲处理、科学计算、汇总处理、其它。下面进行说明。

常用功能

  • 平均值

平均值是最常使用的,作用是将多个变量值的取平均,生成新的变量。

适用场景:可将多个题目合并为一个维度进行分析等。

例如,计算每个学生各科成绩的平均值或将“我愿意向朋友推荐SPSSAU”,“我有需要会再来使用SPSSAU”,合并为“忠诚度”一个整体维度。

  • 求和

求和多用于计算多个题项的总体得分,如量表总分等。

适用场景:计算总和,例如每个学生各科成绩的总成绩等。

  • 乘积(交互项)

用于计算两个变量或多个变量的乘积值。

适用场景:计算权重与指标的乘积,或计算调节作用交互项等。

  • 虚拟(哑)变量

用于将分类变量纳入模型。

适用场景:研究回归分析,逐步回归,分层回归,Logistic回归,PLS回归、调节作用等这类影响关系研究的方法时,需要将分类变量作为研究变量加入模型中,需要做哑变量处理。

  • 标准化(S)

标准化用于数据无量纲化处理。在多数模型研究中,都需要先对数据进行标准化处理,以消除量纲影响。

  • 中心化(C)

中心化也是无量纲化处理方法之一。与标准化的区别是,标准化需要除以标准差,而中心化则没有要求。

适用场景:数据无量纲化处理,即如果原始数据不是统一量纲的,需要先进行数据标准化处理,以消除量纲(单位)不同对结果造成的影响。

  • 自然对数(Ln)
  • 10为底对数(Log10)

取对数是常见的数据变换处理。取对数可以缩小数据的绝对数值,方便计算。在计量研究中,经常先取对数再做回归。

适用场景:数据的数值过大不方便计算;数据呈偏态时可以通过取对数调整数据分布。(数值必须大于0)

其他常用的数据变换方式:

(1)对数变换(2)平方根变换(3)倒数变换(4)幂变换等

量纲处理

量纲处理

除了上面介绍的标准化、中心化。spssau还提供了其他多种量纲处理方法,大致可分为三种类型:

①极值化方法

归一化——每个变量值与变量最小值之差除以该变量取值的全距(最大值减最小值)。标准化后使各变量的取值范围限于0~1。

区间化——标准化后使各变量取值范围限于固定的区间范围内。

最大值化——每个变量值除以该变量取值的最大值。标准化后使各变量的最大取值为1。

最小值化——标准化后使各变量的最小取值为1。

极值化方法在无量纲化过程中仅与变量的最大值和最小值有关,该方法过分依赖极端这两个极端值。因而,最大值和最小值这两个值会对结果产生很大影响。

②标准化方法

标准化——无量纲化后个变量的平均值为0,标准差为1。

标准化的不足之处在于转换后消除了各变量在变异程度上的差异,如果后续分析中需要比较变量变异程度上的差异,则不适合使用标准化方法。

③均值化方法

均值化——每一变量除以该变量的平均值。均值化后各变量的平均值都为1,标准差为原始变量的变异系数。均值化保留了各变量取值差异程度上的信息。

对于一般用户而言,不需要掌握这么多量纲处理方法,大多数情况下选择标准化或归一化即可。

  • 正向化(MMS)
  • 逆向化(NMMS)

在综合评价中,可能同时存在正向指标(数值越大评价越好)和逆向指标(数值越小评价越好)。两种指标数据方向不一致,分析时必须先将所有指标统一成一个方向。此时,可以对数据进行正向化或逆向化处理。

正向指标:(X-Min)/(Max-Min) (正向化指标用正向化MMS)

逆向指标:(Max-X)/(Max-Min) (逆向化指标用逆向化NMMS)

除此之外,还可以通过取倒数、取负数等方式使指标一致化。

除了以上常用的计算变量方法,还有一些其它的变量处理功能。具体整理在下面表格里。

如果以上生成变量功能无法满足计算需求,可使用自主性更强的**[高级公式]**进行操作。

当前公式支持sin、cos、tan、exp、ln、log、sqrt、abs等函数。

其他说明

生成变量功能,标题都是直接选中即可,不需要拖拽操作。配合ctrl或者shift键同时选择多项,批量一次性操作处理。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:如何快速 数据处理 logistic回归 logistic ogistic

www.spssau.com
您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 19:36