楼主: tianxin1741
4077 3

[实际应用] 关于logistic回归中哑变量与常数项的线性相关问题 [推广有奖]

  • 0关注
  • 0粉丝

大专生

38%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
274 点
帖子
23
精华
0
在线时间
40 小时
注册时间
2012-5-29
最后登录
2015-5-2

楼主
tianxin1741 发表于 2012-11-1 20:25:33 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请问各位高手。就是在logistic回归分析中将全部的哑变量全部放入回归模型中药去掉常数项,否则线性相关,请问为什么啊,请问有什么理论依据呢 有资料吗 ?  我没查到资料有点困惑,谢谢各位了啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:logistic回归 logistic ogistic logisti logist 回归分析 模型 资料

沙发
priss111 发表于 2012-11-1 23:59:51
1 从模型参数解释来说明

首先明白logistic回归模型(logit(p)=ln(p/(1-p))=alpha+beta1*x1+beta2*x2)中alpha(常数项)及beta的专业意义
alpha表示x1,x2取值为0时(本底或者参照)某事件Y(比如中奖、患病)发生的概率
beta1(假设x1是0-1变量)表示x1=1时Y发生的概率与x1=0时Y发生概率的比值(OR1=exp(beta1))
beta2的解释与beta1类似

考虑哑变量的情况
比如血型对是否患某病的影响
血型是名义变量有4种取值(A,B,O,AB)
哑变量取值形式
A   1 0 0 0
B   0 1 0 0
O   0 0 1 0
AB  0 0 0 1

则logistic回归模型为
logit(p)=b1A+b2B+b3O+b4AB
b1的意义是某研究对象血型为A时患某病的概率(与beta1的意义不同)
b2-b4的解释与b1类同

logistic回归最终是想要的是OR值而不是患某病的概率
无常数项的logistic回归模型得不到OR值
所以模型要有一个参照(比如以O型为参照)才能得到OR值
实际数据分析时
当有哑变量纳入模型时
可能含有常数项的logistic回归模型比较常用(可以得到OR值)

有关模型中参数的详细解释可以参考
张家放  医用多元统计方法  2002

***********************;
言归正传

2   
为什么常数项与全哑变量是线性相关
这个可以看线性代数中线性相关的内容
我也不能给出通俗的解释
也希望达人能得到比较易懂的解释




***********************************;

藤椅
bobguy 发表于 2012-11-3 11:12:33
Any regression text book will have explanation for it.

板凳
priss111 发表于 2012-11-5 08:57:41
bobguy 发表于 2012-11-3 11:12
Any regression text book will have explanation for it.
谢谢bobguy.

是想:
如何将线数中的线性相关与线性回归中的共线性结合在一起通俗的解释

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 19:25