- 输入数据进行多元回归
- 选择多元回归模型
- 设置多元回归的参考水平
- 多元回归插值(预测)
- 比较多元回归模型
- 多元回归中的权重
- 选择多元回归的诊断
- 绘制多元回归的残差
输入数据进行多元回归
1. 创建一个数据表
在Welcome或New Table对话框中,选择创建一个多变量数据表。
如果您刚刚开始,请选择多元线性回归(文本变量)的样本数据。另外,多元线性回归(虚拟编码)样本数据显示了如何将分类变量直接作为数字输入。
2. 输入数据
每一行代表不同的观察结果(个体、动物、实验或其他)。
每一列代表一个不同的变量。简单来说,变量是可以测量的特征、质量或数量(例如,个人或动物的体重、身高或年龄)。Prism允许三种不同类型的变量:
分类的:具有有限数量的组或类别的定性信息。性别(女性或男性)和教育(高中、大学、研究生)就是例子。
连续的:具有无限可能值(数)的定量信息。高度(68.3英寸,72.4英寸,61.25343863…in)和时间 (8.23 ns, 1.90 min,5.3924 hrs, 6.5•109 year)就是例子。整数通常可以被视为分类信息(如组号),但更经常是连续的(如孩子的数量或测试中正确回答的问题的数量)。
标签:仅用于识别观察结果的定性信息。实验id,姓名,社会安全号码等都是例子。在大多数情况下,每一行的标签都是唯一的。
当在变量中输入数据时,Prism会自动检测所输入的变量类型,并在变量的顶部显示一个灰色图标来指示其类型。如果Prism没有分配您想要的变量类型,请单击图标手动更改变量类型(图标将变为橙色)。
分类变量可以直接与组名一起输入(作为文本),也可以作为编码变量输入。Prism将使用虚拟编码(也称为指示编码或参考编码)自动编码分类变量,以便在适当的分析中使用。在手动输入编码变量时,还可以使用其他可选编码,例如效果编码。下面引用的Glantz和Slinker是学习这些编码方法的一个很好的来源。
注意,不需要手动编写交互代码。Prism将允许您在参数对话框中自动添加交互。
3. 运行多元回归
单击Analyze,从多变量表的分析列表中选择多元线性回归,然后单击OK。多重回归对话框有七个选项卡:
Model - 选择哪个变量是因变量,哪些其他变量作为自变量包含。还要选择您希望包含在模型中的任何交互或转换。
Reference level - 为指定模型中的任何分类变量设置参考级别。参考水平通常表示分类变量的“基线”或“通常”水平,对结果解释很重要。
Interpolation - 使用Prism建立的模型根据预测变量的值来预测结果变量的值。
Compare - 选择第二个模型,并指定如何比较两个模型的拟合。
Weighting - 通常所有数据的权重都是相等的,但您可以指定另一种权重方案。
Diagnostics - 指定Prism应该报告哪些额外结果。
Residuals - 用几种不同的方法绘制残差(实际Y值与预测值之间的差值)。
参考
Glantz和Slinker,应用回归和方差分析入门,第3版,第391页,“使用线性回归对任意数量的处理进行单向方差分析”