6023 8

[问答] 多元逻辑回归分析 [推广有奖]

  • 0关注
  • 0粉丝

本科生

4%

还不是VIP/贵宾

-

威望
0
论坛币
6 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
4854 点
帖子
44
精华
0
在线时间
58 小时
注册时间
2014-1-7
最后登录
2019-3-28

楼主
被遗忘的古城 发表于 2015-3-4 14:39:48 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
因变量有5个水平,自变量有17个均为连续变量,分析采用多元逻辑回归,自变量由于是连续变量作为协变量带入模型,分析结果又错误,不是很理解,求高手指点,是否模型选用有误?应该采用什么模型进行分析?谢谢
错误提示如下:There are 588 (80.0%) cells (i.e., dependent variable levels by subpopulations) with zero frequencies.
There is possibly a quasi-complete separation in the data. Either the maximum likelihood estimates do not exist or some parameter estimates are infinite.
The NOMREG procedure continues despite the above warning(s). Subsequent results shown are based on the last iteration. Validity of the model fit is uncertain.


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:回归分析 逻辑回归 frequencies Populations Likelihood 回归分析

沙发
xddlovejiao1314 学生认证  发表于 2015-3-4 18:09:29
17个自变量中是不是类别变量太多?这会导致很多单元格一层层分下去为0。建议将因变量分别与17个自变量先单独做模型(即1个自变量和因变量做一个模型),不显著的自变量直接不纳入最后的模型了。一轮下来,只将显著的自变量和因变量纳入模型做回归。
已有 1 人评分论坛币 收起 理由
admin_kefu + 20 热心帮助其他会员

总评分: 论坛币 + 20   查看全部评分

藤椅
被遗忘的古城 发表于 2015-3-5 09:01:19
xddlovejiao1314 发表于 2015-3-4 18:09
17个自变量中是不是类别变量太多?这会导致很多单元格一层层分下去为0。建议将因变量分别与17个自变量先单独 ...
类别太多事指的变量的个数多吗?一个个做是也用多元逻辑回归分析吧

板凳
xddlovejiao1314 学生认证  发表于 2015-3-5 13:17:22
被遗忘的古城 发表于 2015-3-5 09:01
类别太多事指的变量的个数多吗?一个个做是也用多元逻辑回归分析吧
我是指的自变量中类别变量太多。举个简单列子,如果你有A和B两个类别变量,都是二分类的,那么在做回归时分下去就要有A1*B1,A1*B2,A2*B1和A2*B2四个类型,即使选取其中一个作为参照组,你都还有3个组别。所以如果你17个自变量中假如有5个类别变量还都是二分类的类别变量,那照上面那么分下去也得有2^5个单元格了。在这种条件下,就会有很多单元格的值都为0,可能就会出现你描述的这个结果。所以我才建议将因变量分别与17个自变量先单独做模型(即1个自变量和因变量做一个模型),不显著的自变量直接不纳入最后的模型了。一轮下来,只将显著的自变量和因变量纳入模型做回归。

报纸
被遗忘的古城 发表于 2015-3-5 15:24:16
xddlovejiao1314 发表于 2015-3-5 13:17
我是指的自变量中类别变量太多。举个简单列子,如果你有A和B两个类别变量,都是二分类的,那么在做回归时 ...
我的自变量不是分类变量,均为连续变量的

地板
cws_24 发表于 2015-3-5 15:36:53
学习中

7
程百卉 发表于 2019-9-5 18:08:39
xddlovejiao1314 发表于 2015-3-4 18:09
17个自变量中是不是类别变量太多?这会导致很多单元格一层层分下去为0。建议将因变量分别与17个自变量先单独 ...
您好,请问只将显著的自变量纳入模型要怎么在文章中进行说明呢?

8
qiuranran 发表于 2022-1-25 19:38:25
请问一下楼主这个问题解决了嘛?我也有同样的疑问

9
赵安豆 发表于 2024-5-2 23:40:28
多元逻辑回归是处理具有多个类别的因变量问题的一个常用方法,但你遇到的错误提示表明分析过程中存在一些问题。错误提示中提到的“588 (80.0%) cells (i.e., dependent variable levels by subpopulations) with zero frequencies”意味着在你的数据中,有很多子群体与因变量水平组合中的观测值为零,这可能导致模型估计不准确或者失败。

另外,“There is possibly a quasi-complete separation in the data. Either the maximum likelihood estimates do not exist or some parameter estimates are infinite.”这句话表明数据中可能存在准完全分离现象,即某些自变量的值可以完美地预测因变量的结果,这会导致最大似然估计不存在或者某些参数估计为无穷大。

面对这样的问题,有几个解决方案可以考虑:

1. **数据检查和预处理**:首先检查数据是否有输入错误,特别是因变量的五个水平中是否有些水平的数据过少或者没有数据。此外,检查自变量是否存在极端值或者分布极不平衡的情况,这些都可能影响模型的估计。

2. **变量选择**:17个自变量可能太多,尤其是在样本量不大的情况下。可以尝试使用变量选择方法(如逐步回归)来减少模型中的自变量数量,这有助于缓解模型过拟合和参数估计问题。

3. **模型选择**:如果问题依然存在,可以考虑使用其他模型。对于因变量有多个类别的情况,除了多元逻辑回归,还可以考虑使用判别分析(如果数据满足正态分布和同方差性的假设)或者多类别支持向量机(SVM)等方法。

4. **正则化方法**:如果决定继续使用多元逻辑回归,可以考虑引入正则化项(如L1正则化或L2正则化),这有助于处理参数估计问题并提高模型的泛化能力。

5. **重采样或数据收集**:如果数据存在严重的不平衡或者分类之间的分离,可能需要考虑收集更多的数据或者尝试重采样方法来增加少数类的样本量,从而改善模型的估计和预测能力。

综上所述,面对你遇到的问题,需要从数据预处理、变量选择、模型选择和可能的数据收集等方面综合考虑解决方案。希望这些建议能对你有所帮助。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 22:58