Logistic回归，算法不聚合和拟合概率为0或1

0关注
0粉丝

初中生

9%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 10 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 64 点
帖子: 10
精华: 0
在线时间: 10 小时
注册时间: 2015-3-28
最后登录: 2015-4-16

楼主

夜雪初积 发表于 2015-4-13 17:29:41 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

小白一枚，程序比较低能……放在最后了。
大概思路是：自变量有11个，都是数值型的。1值的样本是固定的，从900个0值中抽取等量的数据进行逻辑回归。因为样本量比较小，所以做了100次重复抽取，计算回归系数的95%置信区间和显著次数。

然后好几个样本就警告了：

Warning messages:
1: glm.fit:算法没有聚合
2: glm.fit:拟合機率算出来是数值零或一

结果就是回归结果特别飘忽不定，无法得到稳定的回归系数TT

怀疑是自变量多重共线性，计算了kappa值，如下图。
数据都不怎么好，这是抽样100次的结果，只有samp3的均值在100以下，而高亮的是回归后出现多次不聚合或P=1的样本，好像没有直接关系啊，kappa值高的也有能聚合的，kappa值低的也有不聚合的><
另外，查到说共线性可以用step逐步回归解决的，但是尝试后发现结果还是不聚合啊吐血……