Prism给您提供了一整套一元线性回归的分析结果。让我们来学习如何解读它。
斜率和截距
Prism如何报告斜率和截距
Prism首先报告斜率和截距的最佳拟合值,以及它们的标准误差。它还给出了X轴截距和斜率的倒数。在这些值之下,它报告斜率和两个截距的95%置信区间。
在结果页面的底部,斜率和截距再次以定义最佳拟合线的方程形式报告。您可以复制这个等式并粘贴到图表上,或者粘贴到手稿上。
解释斜率和截距
斜率表示直线的陡峭程度。它等于Y的变化量对应x的每一个单位变化量,用Y轴的单位除以x轴的单位表示。如果斜率是正的,Y随着X的增加而增加。如果斜率为负,Y随着X的增加而减小。
Y轴截距是直线在X = 0时的Y值。它定义了直线的高度。
解释标准误差和置信区间
斜率和截距的标准误差值很难解释,但它们的主要目的是计算95%置信区间。
如果您接受线性回归的假设,斜率的95%置信区间有95%的概率包含斜率的真实值,并且截距的95%置信区间包含截距的真实值。置信区间的宽度由数据点的数量、它们到直线的距离和X值的间距决定。
Prism还可以绘制置信带或预测带。
X截距及其置信区间
如果您在线性回归参数对话框中选择一个选项,GraphPad Prism会报告X截距的95%置信区间。
x截距的95%置信区间在x截距周围不是对称的。它在一个方向上比另一个方向走得更远,如下图所示。
从左到右遵循Y=0基线。最佳拟合线(蓝色曲线)的95%置信带之间的区域是X截距的95%CI。您可以看到,这个置信区间(在最外层的两条虚线之间)与X截距(中间的虚线)并不对称。
如果您只有几个点有很多散射,这种不对称将非常明显,而如果有很多点有很少的散射,这种不对称几乎不明显。
因为不确定性不是对称的,所以报告x截距的标准误差很少有意义。报告95%置信区间的两端要好得多,正如Prism报告的那样。如果您真的想计算X截距的单个标准误差,您可以通过选择非线性回归来实现,并将这个用户定义的方程拟合到数据中:
Y =斜率*(x - x -截距)
Prism将报告X截距的最佳拟合值以及SE和95%置信区间。由于这个置信区间将从SE值计算出来,它将在X截距周围对称,因此不会像线性回归报告的不对称区间那样准确。
r2,表示简单线性回归的拟合优度
r2的含义
值r2是介于0.0和1.0之间的分数,没有单位。r2值为0.0意味着知道X并不能帮助您预测Y。X和Y之间没有线性关系,最佳拟合线是贯穿所有Y值平均值的水平线。当r2 = 1.0时,所有的点完全在一条直线上,没有散射。知道X可以让您完美地预测Y。
r2是如何计算的?
下图展示了Prism如何计算r2
左图显示了最佳拟合线性回归线,该线将点与该线垂直距离的平方和最小化。这些垂直距离也显示在图的左面板上。在本例中,这些距离的平方和(SSreg)等于0.86。它的单位是y轴的平方。要使用该值作为拟合优度的度量,必须将其与其他值进行比较。
右图显示了零假设——通过所有Y值的平均值的水平线。该模型的拟合优度(SStot)也计算为点到直线的垂直距离的平方和,在本例中为4.907。两个平方和值的比值将回归模型与零假设模型进行比较。计算r2的方程如图所示。在这个例子中,r2是0.8428。回归模型对数据的拟合要好于原假设,因此SSreg比SStot小得多,r2接近1.0。如果回归模型不比原假设好多少,r2将接近于零。
您可以把r2看作Y总方差中由X的变化“解释”的部分。如果X和Y互换,r2的值(与回归线本身不同)将是相同的。r2也就是X方差中被Y方差“解释”的部分,换句话说,r2是X和Y共享的方差的部分。
在这个例子中,Y的总方差的84%是由线性回归模型“解释”的。线性回归模型数据的方差(SS)仅等于Y值总方差(SStot)的16%。
如何应用r2?
许多人发现r2在以下方面很有用的:当您运行一系列实验时,您希望确保今天的实验与其他实验的运行一致。例如,如果您得到的r2总是在0.90和0.95之间,但今天您得到的r2=0.75,那么您应该怀疑,仔细看看在那个特定的实验中使用的方法或试剂是否出了问题。如果一个新员工用同样的系统给您带来的结果显示r2为0.99,您应该仔细看看有多少“异常值”被删除了,以及是否有一些数据是编造的。
为什么Prism在约束线性回归中不报告r2?
当您强制线通过原点(或任何其他点)时,Prism不会报告r2,因为计算将是模糊的。当回归线受到约束时,有两种计算r2的方法。正如您在前一节中看到的,r2是通过比较回归线的平方和与由零假设定义的模型的平方和来计算的。对于约束回归,有两种可能的零假设。一条是通过所有Y值的平均值的水平线。但这条线不符合条件,它不经过原点。另一个零假设是一条穿过原点的水平线,远离大部分数据。
因为r2在约束线性回归中是模糊的,Prism没有报告它。如果您真的想知道r2的值,使用非线性回归将您的数据拟合到方程Y=斜率*X。Prism将报告r2定义的第一种方式(将回归平方和与Y均值处水平线的平方和进行比较)。
大写还是小写?
对于线性回归,通常使用缩写r2。对于非线性回归,惯例是使用R2。这种区别似乎没有理由。