楼主: 浅夏问路
142 5

[问答] 用秩缺乏拟合来进行预测的结果很可能不可靠 [推广有奖]

  • 0关注
  • 0粉丝

小学生

64%

还不是VIP/贵宾

-

威望
0
论坛币
4 个
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1199 点
帖子
4
精华
0
在线时间
12 小时
注册时间
2017-11-23
最后登录
2017-12-13

浅夏问路 发表于 2017-12-7 18:08:41 |显示全部楼层
如题,glm建模之后用测试集进行预测,发出的Warning message。所以这个到底是什么意思?原因是什么?希望明白的朋友帮忙解答。感谢感谢~

支持楼主:购买VIP购买贵宾 购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
 
载入中......
stata SPSS
阿扁V5 学生认证  发表于 2017-12-7 18:36:30 |显示全部楼层
R里面的吧,应该是存在强相关的自变量,也就是设计矩阵非满秩的,会导致这样的结果,也有可能是你的target是线性可分的,用线性回归就好了
回复

使用道具 举报

浅夏问路 发表于 2017-12-7 18:47:40 |显示全部楼层
阿扁V5 发表于 2017-12-7 18:36
R里面的吧,应该是存在强相关的自变量,也就是设计矩阵非满秩的,会导致这样的结果,也有可能是你的target是 ...
感谢回复。
自变量大部分都是分类变量,所以赋值的话可能有很强的相关性?
以及 我的y是count data,有什么建议的可用的方法么?
谢谢~
回复

使用道具 举报

阿扁V5 学生认证  发表于 2017-12-7 21:03:49 |显示全部楼层
浅夏问路 发表于 2017-12-7 18:47
感谢回复。
自变量大部分都是分类变量,所以赋值的话可能有很强的相关性?
以及 我的y是count data,有 ...
自变量是分类变量本身没有问题,先检验相关性吧,去掉强相关的,你的y是countdata不太懂是什么意思?难道是计数而不是分类变量?
回复

使用道具 举报

浅夏问路 发表于 2017-12-8 09:36:32 |显示全部楼层
阿扁V5 发表于 2017-12-7 21:03
自变量是分类变量本身没有问题,先检验相关性吧,去掉强相关的,你的y是countdata不太懂是什么意思?难道 ...
我的因变量是计数型数据 所以最初没有想使用ols 检验了下均值和方差之后想用负二项回归试试
另外我还有个问题想请教你一下:我的自变量大部分都是分类变量,有序的自变量赋值成numeric的,那么那些本身无序的分类变量如果赋值的话本身其实没有什么意义,那如果检验他们之间的相关性的话还有意义么?
谢谢~
回复

使用道具 举报

阿扁V5 学生认证  发表于 2017-12-8 11:02:49 |显示全部楼层
只能是计算gini或者信息熵这样针对离散型数据的指标
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2017-12-14 21:14