正常情况下logistic模型的预测结果可以理解为样本分为某类的概率,数值上应该在0和1之间,但是我用R语言进行predict的时候预测结果的数值大部分都不在0到1之间?所以想请问一下原因吗,原问题就是一个二分类问题,部分代码如下所示。glm.fit = glm(label_train~V1+V2+V3+V4+V5+V1*V2+V1*V3+V1*V4+V1*V5
,family = binomial,train_data) # LR
# summary(glm.fit)
#glm.fit<-step(glm.fit,direction = 'both')
glm.pre1 = predict(glm.fit,type="response") # Threshold selection
# plot(sort(glm.pre1)),train_data11
plot(glm.pre1)
summary(glm.pre1)
难道是数据本身的问题吗?
其中一次的预测结果:
summary(glm.pre1)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-525.0487 -0.0063 -0.0063 -1.2094 -0.0063 13.8802