最近在学习R语言,在看R语言实战这本书,今天看到了第八章第8.4.3强影响点章节(183页)
书上说cook's D值大于4/(n-k-1),则表明是强影响点,其中k为预测变量数量
那么k值应该是不包含截距项的,也就是书中前面提到的p值-1,(p值是包含截距项的)
cutoff <- 4/(nrow(states)-length(fit$coefficients)-2)
plot(fit,which=4,cook.levels=cutoff)
abline(h=cutoff,lty=2,col="red")
我的问题是:
代码第一行应该是cutoff <- 4/(nrow(states)-length(fit$coefficients))才对吧?
本身n-p就多减了一个1,后面应该+1再-1
n-k-1=n-(k+1)=n-p 而不是 n-p-2
也不知道我理解的对不对,如果不对,烦请指正