- 输入数据进行多元回归
- 选择多元回归模型
- 设置多元回归的参考水平
- 多元回归插值(预测)
- 比较多元回归模型
- 多元回归中的权重
- 选择多元回归的诊断
- 绘制多元回归的残差
比较多元回归模型
Prism允许您比较两个备选模型的拟合性。
选择第二个模型
在多元回归对话框的Compare选项卡上,首先选择第二个模型。在大多数情况下,第二个模型将嵌套在第一个模型中。这意味着第二个模型更简单,可能遗漏了一个自变量,或者遗漏了一个或多个相互作用。
选择一种方法进行比较
Prism提供了两种方法来比较具有不同数量参数的模型。这些并不是解决这个问题的唯一方法,但却是最常用的方法。
额外的平方和F检验
额外的平方和F检验是基于传统的统计假设检验。
零假设是指更简单的模型(参数较少的模型)是正确的。较复杂模型的改进被量化为平方和的差异。您只是偶然地期望得到一些改进,而您偶然期望的数量是由每个模型中的数据点的数量和参数的数量决定的。F检验将平方和的差值与您期望的随机差值进行比较。结果表示为F比率,由此计算P值。
P值回答了这个问题:
如果零假设确实是正确的,那么在多少实验(您的实验规模)中,平方和的差异会和您观察到的一样大,甚至更大?
如果P值很小,则认为简单模型(原假设)是错误的,并接受更复杂的模型。通常将阈值P值设置为传统值0.05。如果P值小于0.05,则拒绝更简单的(null)模型,并得出更复杂的模型拟合效果更好的结论。
信息理论方法赤池准则(AIC)
这种替代方法基于信息论,不使用传统的“假设检验”统计范式。因此不产生P值,不得出“统计显著性”的结论,不“拒绝”任何模型。
该方法决定了数据对每个模型的支持程度,同时考虑了拟合优度(平方和)和模型中参数的数量。结果表示为每个模型正确的概率,概率之和为100%。如果一个模型比另一个更有可能是正确的(比如1% vs 99%),您就会选择它。如果可能性的差异不是很大(比如40% vs. 60%),您就会知道任何一个模型都可能是正确的,所以您会想要收集更多的数据。计算是如何进行的。
选择哪一种方法?
在大多数情况下,您想要比较的模型是“嵌套的”。这意味着一个模型是另一个模型的简单情况。例如,一个模型可能包括交互项,而另一个模型没有,但在其他方面是相同的。
如果两个模型嵌套,则可以使用F检验或AIC方法。选择通常是个人偏好和传统的问题。药理学和生理学的基础科学家倾向于使用F检验。生态学和种群生物学等领域的科学家倾向于使用AIC方法。
如果模型没有嵌套,那么F检验无效,因此您应该选择信息论方法。注意,Prism不测试模型是否嵌套。
多元回归中的权重
对数据点进行不同的加权通常是有用的。
Prism在多元回归的Weight选项卡上提供了四种选择:
没有权重 - 回归通常是通过最小化数据与直线或曲线的垂直距离的平方和来完成的。离曲线越远的点对平方和的贡献越大。靠近曲线的点贡献很小。这是有道理的,当您期望实验散射在曲线的所有部分平均是相同的。
权重除以1/Y^2 - 在许多实验情况下,Y越高,曲线上的点的平均距离(或者更确切地说是距离的平均绝对值)就越高。具有较大散点的点将具有更大的平方和,因此在计算中占主导地位。如果您期望相对距离(残差除以曲线的高度)是一致的,那么您应该用1/Y2来加权。
权重除以1/Y - 当散点遵循泊松分布时,有时会使用这种加权——当Y表示定义空间中的对象数量或定义区间内的事件数量时。因为Prism提供了泊松回归(模型选项卡上的一个选择),所以1/Y加权几乎没有什么用处。
重量除以1/YK - 也叫“一般加权”。


雷达卡




京公网安备 11010802022788号







