ROUT的基础原理
ROUT法是一种从非线性回归中识别异常值的方法。
简而言之,首先通过采用一种稳健的方法将一个模型拟合至数据中,其中异常值的影响很小。然后使用一种新的异常值检测方法,根据错误发现率,来决定哪些点与模型的预测相差较远,即称为异常值。
当你要求GraphPad Prism检测列数据堆栈中的异常值时,可简单地采用这种方法。
GraphPad Prism将你输入的值视为Y值,并拟合Y = M模型,其中M是一个稳健的平均值。(如果你想通过GraphPad Prism的非线性回归分析来实现这一点,需要给每行指定任意的X值,然后拟合至模型Y = X*0+M中。)
此方法可检测任意数量的异常值(可达样本量的30%)。
在一个数据集中,GraphPad Prism最少可使用三个值来执行ROUT检验。
Q是什么?
ROUT法建立在错误发现率(FDR)的基础上,因此可以指定Q表示最大预期FDR。对Q的解读取决于数据集中是否有异常值。
当没有异常值(且分布完全为高斯分布)时,Q与α极其相似。假设所有数据都来自高斯分布,则Q表示(错误)识别一个或多个异常值的可能性。
数据中存在异常值时,Q表示最大预期错误发现率。如果将Q设为1%,你的目标为不超过1%的识别异常值是假的(实际上只是高斯分布的尾部),至少99%为实际异常值(来自不同的分布)。
参考文献
Motulsky HM和Brown RE,在用非线性回归拟合数据时检测异常值 - 一种以鲁棒非线性回归和错误发现率为基础的新方法,《BMC生物信息学》(2016),7:123。