楼主: olan
19113 12

Logistic回归分析中的变量筛选 [推广有奖]

  • 0关注
  • 0粉丝

学前班

60%

还不是VIP/贵宾

-

威望
0
论坛币
49 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
78 点
帖子
3
精华
0
在线时间
0 小时
注册时间
2006-10-3
最后登录
2016-11-16

楼主
olan 发表于 2006-10-3 23:57:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

很喜欢这里,看网友的帖子学到了不少知识!

我们想利用Logistic回归分析对我国中小企业的信用风险进行实证研究. 因变量Y 表示企业是否违约:违约企业=0,正常企业=1.自变量是企业的20个财务指标。

我有以下几个问题搞不明白:

1、 变量一定要与因变量正向相关吗?为什么?

2、自变量的筛选:

20多个指标间由于存在较严重的多重共线性,但我不想使用SPSS的逐步剔除法,也不想使用因子分析或者主成分分析方法,我想Logistic回归分析之前筛选自变量,把多重共线的自变量剔除。有以下两种方法:

(1) 某个自变量Xj与其余的自变量进行回归,如果判定系数很大,F检验显著,则Xj可用其他自变量的线性组合表出,即Xj与其他自变量多重共线。那么将Xj从自变量中排除。

(2) 用判别分析法,把判别系数小的变量剔除。

哪个方法比较科学严密,请有经验的同志解答一下。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Logistic回归分析 logistic回归 logistic ogistic logisti 变量 回归分析 logistic 筛选

回帖推荐

xiaoshi0826 发表于4楼  查看完整内容

一般情况下,变量间或多或少地大都存在多重共线性,要按其严重性来分别对待,严重的就需要剔除或转换数据,不严重的就不需要做任何处理;经验判据是:方差膨胀因子大于5视为严重,或容许度小于1/5视为严重。自变量的筛选我个人认为(1)方法较好。

本帖被以下文库推荐

沙发
蓝色 发表于 2006-10-4 08:10:00

不一定非的正相关。

藤椅
olan 发表于 2006-10-4 14:21:00

谢谢。可为什么有些人在分析之前,一定要验证正相关性??

板凳
xiaoshi0826 发表于 2008-8-13 00:23:00

一般情况下,变量间或多或少地大都存在多重共线性,要按其严重性来分别对待,严重的就需要剔除或转换数据,不严重的就不需要做任何处理;经验判据是:方差膨胀因子大于5视为严重,或容许度小于1/5视为严重。自变量的筛选我个人认为(1)方法较好。

报纸
vivay 发表于 2008-9-8 15:58:00
我搭车请教个问题:logistic回归分析能不能和分类树结合使用?有没有可行性?

地板
小吕 发表于 2008-12-14 12:39:00
关于变量筛选有很多方法,推荐你看 苏为华《多指标综合评价理论与方法问题研究》

7
sbdwgugyy 发表于 2008-12-14 13:35:00
实际的问题是比较复杂的,不是一句话两句话能说清楚的,如果数据量大的话,可用的方法就比多了,数据少的话其实没有很好的办法。
Excel-SPSS-SAS-Eviews-R-?

8
ynmydds 发表于 2009-2-28 08:23:00

学习学习~

9
xiaoluyuan 发表于 2009-8-16 21:24:02
在我实际做的模型中,一般样本量是40-50万,我们一般要求VIF的不超过2。independent variable 一般有300-400个。筛选变量一般会看 回归出来的系数的正负是否和 该变量与因变量的相关性的方向相同。 还有就是变量的 co linear的指标,参照wald chi square 和 standard estimate 进行筛选

10
靠不会吧 发表于 2011-8-15 14:37:11
为何一定要正相关,数据量大可能做筛选成功的可能性大些

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-9 14:25