|
1 从模型参数解释来说明
首先明白logistic回归模型(logit(p)=ln(p/(1-p))=alpha+beta1*x1+beta2*x2)中alpha(常数项)及beta的专业意义
alpha表示x1,x2取值为0时(本底或者参照)某事件Y(比如中奖、患病)发生的概率
beta1(假设x1是0-1变量)表示x1=1时Y发生的概率与x1=0时Y发生概率的比值(OR1=exp(beta1))
beta2的解释与beta1类似
考虑哑变量的情况
比如血型对是否患某病的影响
血型是名义变量有4种取值(A,B,O,AB)
哑变量取值形式
A 1 0 0 0
B 0 1 0 0
O 0 0 1 0
AB 0 0 0 1
则logistic回归模型为
logit(p)=b1A+b2B+b3O+b4AB
b1的意义是某研究对象血型为A时患某病的概率(与beta1的意义不同)
b2-b4的解释与b1类同
logistic回归最终是想要的是OR值而不是患某病的概率
无常数项的logistic回归模型得不到OR值
所以模型要有一个参照(比如以O型为参照)才能得到OR值
实际数据分析时
当有哑变量纳入模型时
可能含有常数项的logistic回归模型比较常用(可以得到OR值)
有关模型中参数的详细解释可以参考
张家放 医用多元统计方法 2002
***********************;
言归正传
2
为什么常数项与全哑变量是线性相关
这个可以看线性代数中线性相关的内容
我也不能给出通俗的解释
也希望达人能得到比较易懂的解释
***********************************;
|