ivyvivi 发表于 2016-6-27 16:50
大神,我想用GLM模型来拟合几个变量的关系,Y~X1+X2+X3+X4+X5. 同伴叫我用negative binomial,因为研究的东 ...
首先,GLM拟合是很简单的。以下是我random的数据和GLM回归
y <- runif(100)
x1 <- rpois(100,2)
x2 <- rnorm(100)
test <- MASS::glm.nb(y ~ x1 + x2) (会出现错误,因为y是continuous。但是你可以忽略,因为得到的参数估计是无偏的)
summary(test)
其次,在任何不用OLS的情况下,都要认真思考一下为什么不用OLS的原因。你已经做了功课,literature里说传播数量符合negative binomial分布。同时,你也意识到你可能不能依赖这个,因为你研究的变量不同。negative binomial的特质就是分布的方差大于mean,俗称over-dispersion. 你的模型里的Y的条件分布未必是这个。效率的取值应该是0到1,除非有特殊的原因导致你有很多的0效率观测值。不然,你是没有理由选择glm的。
最后,如果你的样本不够大,另外over-dispersion并不明显,你可以选择quasi-poisson。当然,从模型选择角度,你也可以用AIC来比较各种模型。效率评估里面有个DEA模型挺好用的,有时间可以注意一下。