- 输入数据进行多元回归
- 选择多元回归模型
- 设置多元回归的参考水平
- 多元回归插值(预测)
- 比较多元回归模型
- 多元回归中的权重
- 选择多元回归的诊断
- 绘制多元回归的残差
选择多元回归诊断
参数的最佳拟合值有多精确?
当然,每个参数的最佳拟合值是真实值的估计值,只有在数据量无限的情况下才能知道。每个参数的精度可以表示为标准误差和/或置信区间。标准误差更为常规。置信区间更容易解释。
您还可以要求Prism测试每个参数的统计显著性。原假设是参数的真实总体值为0.0。P值回答了这个问题:如果零假设成立,那么对随机选择的数据样本进行分析,得出的参数与该分析报告的参数相差无几或更远的概率是多少?Prism还报告结果是否“具有统计学意义”,定义为P值小于0.05。
只有当您确实想知道真正的参数值是否为零时才选择计算显著性(因此该变量对模型没有影响)。对于许多参数来说,情况并非如此。
参数是否相互交织或冗余?
Prism可以报告参数协方差矩阵,以显示模型中的每个参数如何与其他参数相关。如果选择Parameter协方差矩阵选项,Prism将生成一个带有参数相关性的附加结果选项卡,并且还将生成这些相关性的热图。Prism还可以量化多重共线性——从其他变量中预测每个变量的效果。
如何量化拟合优度
如果您选择最小二乘回归
- 多元相关系数R是Y值与预测Y值之间的相关性。它是R2的平方根它的值总是在0到1之间。
- R2是评估拟合优度的标准方法。
- 调整后的R2考虑了与数据相适应的参数的数量,因此其值低于R2(除非您只拟合一个参数,在这种情况下,R2和调整后的R2是相同的)。
- 平方和(或加权平方和)是Prism在拟合模型时最小化的值。只有当您想要将Prism的结果与其他程序的结果进行比较,或者您想要手工进行额外的计算时,报告这个值才有用。
- Sy.x和RMSE是量化残差标准差的可选方法。我们推荐Sy.x,也叫Se.Sy。x将平方和除以N-K,其中N是分析的行数,K是参数拟合的数量。RMSE使用N-1作为分母,而不是N-K。
- 只有当您将相同的数据分别拟合到三个或更多模型时,AICc才有用。然后,您可以使用AICc在它们之间进行选择。但请注意,只有当唯一的差异是模型时,才有意义比较拟合之间的AICc。如果拟合之间的数据或权重不相同,则任何AICc值的比较都是没有意义的。
如果您选择泊松回归
如果您选择泊松回归,Prism提供了三种量化拟合优度的方法:伪r2、分散指数和模型偏差。伪R2可以很像普通的R2。另外两个值只有那些深入研究过泊松回归的人才会感兴趣。
残差是高斯分布吗?
最小二乘回归假设残差的分布服从高斯分布。Prism可以通过对残差进行正态性测试来测试这个假设。Prism提供了四种常态性测试。我们推荐D'Agostino-Pearson检验。
计算
选择用于所有结果(包括插值)的置信水平(即95%或99%…)。
绘制多元回归的残差
Prism可以用四种不同的方式绘制残差:
X轴 Y轴
残差图 预测Y值 残差
方差齐性图 预测Y值 残差绝对值
QQ图 实际残差 如果残差从高斯分布中采样,则预测残差
残差vs.行数 行数 残差