所有模型均将结果(Y)定义为一个或多项参数和一个独立变量(X)[或几个独立变量]的函数。
目的是调整模型参数值,以找到最接近数据的直线或曲线。例如,对于线性回归,目的是找到斜率和截距的最佳拟合值,以使直线接近数据。对标准化剂量-反应曲线进行非线性回归,目的是调整EC50的值(在最小和最大反应之间激发反应的浓度)和曲线斜率。
更准确地说,回归的目的是找到最有可能正确的参数值。如需做到这一点,需假设数据在曲线上的分散性。
回归是目的
科学家使用回归分析有三个不同的目的:
- 使用模型拟合数据,以获得参数的最佳拟合值,或比较替代模型的拟合。如果这是您的目的,则必须仔细挑选一个模型(或两个替代模型),并注意所有结果。关键是要获得参数的最佳拟合值,因此需要科学地理解这些参数的含义;
- 拟合一条平滑曲线,以便从曲线中插值,或者使用平滑曲线绘制一张图表。如果这是您的目的,您可纯粹通过观察数据和曲线来评估,没必要学太多理论;
- 作出预测;
线性与非线性之间的区别
线性并不像大多数科学家猜测的那样。据说模型呈线性Y变量与每项参数成线性关系时。为理解这一点,您需要用数学来思考。保持除一项参数以外的所有参数不变,同时保持X不变。现在改变剩下的参数,观察Y如何变化。如果Y的变化与您所改变的参数成线性关系,且该模型中的所有参数均如此,则该模型就是线性模型。
根据这一定义,多项式模型是线性模型。让我们举一个三阶多项式模型的示例:
Y=A+BX+CX2 + DX3
如果模型为非线性模型,则其呈非线性。
为什么模型为线性模型很重要?就像线性回归一样,其可拟合多项式模型,而不会干扰初始值,也不存在假最小值的可能性。因此,有些程序(如Excel)可执行多项式回归,但无法执行非线性回归。一些程序有单独的模块,用于用多项式模型(线性)和非线性模型拟合数据。Prism使用与拟合非线性模型相同的分析来拟合多项式模型。在Prism的非线性回归分析中,多项式方程可用。
从使用Prism的科学家的观点来看,线性模型和非线性模型之间的区别并不十分重要。选择对您的数据有意义的模型。唯一问题是,对于非线性模型,必须提供每项参数的初始估计值。在某些情况下,这些选择对于获得有用的结果至关重要。如果选择一个内置模型,则Prism会为您选择初始值,这些值几乎总是足以完成工作。
尽管术语“线性”和“非线性”在统计学中有标准定义,但 “曲线线性”一词 并无标准含义。其通常用于描述平滑(无间断)的曲线,但潜在数学模型可以是线性或非线性的。