帮助 > Statistics Base 选项
部分最小二次方回归
部分最小二次方回归过程估计部分最小二次方(PLS,也称为“投影到潜在结构”)回归模型。PLS 是一种预测方法,可替代普通最小二乘 (OLS) 回归法、典型相关分析或结构化方程建模,当预测变量高度相关或预测变量数量超过个案数目时,此方法尤其有用。
PLS 融合主成分分析和多重回归功能。它首先提取一组充分解释自变量和因变量之间的协方差的潜在因子。然后,回归步骤使用自变量分解来预测因变量的值。
表。解释方差比例(潜在因子)、潜在因子权重、潜在因子加载、图像自变量重要性 (VIP) 和回归参数估计值(因变量)全部缺省生成。
图表。前三个潜在因子的变量投影重要性 (VIP)、因子得分和因子权重,以及与模型的距离均根据选项选项卡生成。
部分最小二次方回归数据注意事项
测量级别。因变量和自(预测)变量可以是刻度、名义或有序变量。此过程假定已对所有变量指定相应的测量级别,尽管您可以右键单击源变量列表中的变量并从弹出菜单中选择测量级别,以临时更改变量的测量级别。此过程以相同的方式处理类别(名义或有序)变量。
类别变量编码。此过程在其间使用一个 c 编码临时对类别因变量重新编码。如果存在变量的 c 类别,那么变量存储为 c 向量,第一个类别指示为 (1,0,...,0),下一个类别 (0,1,0,...,0),...,和最后一个类别 (0,0,...,0,1)。使用虚拟编码表示类别因变量,即仅省略对应于参考类别的指示符。
频率权重。权重值在使用前四舍五入为最接近的整数。在分析中不使用缺失权重或权重小于 0.5 的个案。
缺失值。用户和系统缺失值视为无效。
重定比例。所有模型变量均被居中和标准化,包括表示类别变量的指示符变量。
获取部分最小二次方回归
从菜单中选择:
分析 > 回归 > 部分最小二次方...
1.选择至少一个因变量。
2.选择至少一个自变量。
根据需要,您可以:
•指定类别(名义或有序)因变量的参考类别。
•指定用作个案输出并保存数据集的唯一标识的变量。
•指定要提取的潜在因子数目的上限。
此过程将粘贴 PLS 命令语法。
先决条件
“部分最小二次方回归”过程是一个 Python 扩展命令,并需要缺省情况下随 IBM® SPSS® Statistics 产品一起安装的 IBM SPSS Statistics - Essentials for Python。另外,它还需要免费提供的 NumPy 和 SciPy Python 库。
注: 对于采用分布式分析方式(需要 IBM SPSS Statistics Server)工作的用户,必须在服务器上安装 NumPy 和 SciPy。请与系统管理员联系以获取帮助。
Windows 和 Mac 用户
对于 Windows 和 Mac,必须将 NumPy 和 SciPy 安装到并非随 IBM SPSS Statistics 一起安装的 Python 2.7 版本中。如果您没有另一个版本的 Python 2.7,可以从 http://www.python.org 下载。然后,安装用于 Python V2.7 的 NumPy 和 SciPy。安装程序可以从 http://www.scipy.org/Download 获得。
为了能够使用 NumPy 和 SciPy,必须将 Python 位置设置为安装有 NumPy 和 SciPy 的 Python 2.7 版本。您可以通过“选项”对话框(编辑 > 选项)中的“文件位置”选项卡来设置 Python 位置。
Linux 用户
我们建议您下载源代码并自己构建 NumPy 和 SciPy。源代码可以从 http://www.scipy.org/Download 获得。您可以将 NumPy 和 SciPy 安装到随 IBM SPSS Statistics 一起安装的 Python 2.7 版本中。此版本位于 IBM SPSS Statistics 安装位置下的 Python 目录中。
如果您选择将 NumPy 和 SciPy 安装到并非随 IBM SPSS Statistics 一起安装的 Python 2.7 版本中,那么必须将 Python 位置设置为指向该版本。您可以通过“选项”对话框(编辑 > 选项)中的“文件位置”选项卡来设置 Python 位置。
Windows 和 Unix 服务器
在服务器上,必须将 NumPy 和 SciPy 安装到并非随 IBM SPSS Statistics 一起安装的 Python 2.7 版本中。如果服务器上没有另一版本的 Python 2.7,那么可以从 http://www.python.org 进行下载。用于 Python 2.7 的 NumPy 和 SciPy 可以从 http://www.scipy.org/Download 获得。为了能够使用 NumPy 和 SciPy,必须将服务器的 Python 位置设置为安装有 NumPy 和 SciPy 的 Python 2.7 版本。Python 位置可以通过 IBM SPSS Statistics Administration Console 进行设置。
模型(部分最小二次方回归)
选项(部分最小二次方回归)
|