- 线性回归的目标
- 线性回归的计算原理
- 比较线性回归和相关性
- 比较线性回归和非线性回归
- 通过线性回归分析变换数据来分析非线性数据的方法存在哪些问题
相关文章回顾:
简单线性回归原理(一):https://bbs.pinggu.org/thread-10410928-1-1.html
简单线性回归原理(二):https://bbs.pinggu.org/thread-10436206-1-1.html
关于简单线性回归,Prism官方指南提出如下建议:
避免Scatchard、Lineweaver-Burke和类似变换。
如果已变换非线性数据,以便创建线性关系,则几乎可以肯定,使用非线性回归拟合原始数据会更好。在非线性回归可随时获得前,分析非线性数据的最好方法是变换数据,以便创建线性图,然后用线性回归分析变换数据。示例包括酶动力学数据的Lineweaver-Burke图、结合数据的Scatchard图和动力学数据的对数图。
☆ 这些方法已经过时,不得用于分析数据。它们存在的问题是,变换会扭曲实验误差。线性回归假设线条周围的点散布遵循高斯分布,且每个X值处的标准偏差均相同。这些假设在变换数据后很少正确。此外,有些变换改变了X与Y之间的关系。例如,在Scatchard图中,使用X(束缚)值来计算Y(束缚/自由),这违反了线性回归的假设,即所有不确定性均在Y中,而X已清楚地知道。如果在X和Y两个方向上出现相同的实验误差,则最小化点与线之间的垂直距离的平方和是不合理的。由于违反线性回归的假设,因此从回归线的斜率和截距导出的值不能最准确确定模型中的变量。考虑到在收集数据方面投入的所有时间和精力,你想用最好技术来分析数据。非线性回归所得结果最为准确。下图显示了变换数据的问题。左半部分显示了遵循直角双曲线(结合等温线)的数据。右半部分是相同数据的Scatchard图。左侧实线由非线性回归确定。右侧实线显示了同一条曲线经Scatchard变换后的形状。虚线表示变换数据的线性回归拟合。Scatchard图可用于确定受体数量(Bmax,确定为线性回归线的X截距)和解离常数(Kd,确定为斜率的负倒数)。
由于Scatchard变换放大并扭曲了散布,因此线性回归拟合不能产生最准确的Bmax 和Kd值。