楼主: 古曲自爱
22670 13

[问答] 请教几个logistic回归的问题:P for trend,标准回归系数 [推广有奖]

  • 0关注
  • 0粉丝

学前班

90%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
26 点
帖子
3
精华
0
在线时间
3 小时
注册时间
2013-4-12
最后登录
2015-7-3

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
有几个关于logistic回归的问题请教各位大神:
1.自变量是连续变量时,将其用四分位数法分为四个水平,以第一水平为参照设哑变量,可以得到其余三水平相对于第一水平的OR值,请问该自变量的P for trend 该如何在SPSS中计算?我曾见有人将该自变量的四水平作为连续变量进入方程,所得P值即为P for trend,这样是正确的吗?
2.P for trend 在文献中每每提及,它的具体意义究竟是什么?研究中往往希望最高水平相对于最低水平,P值小于0.05,如果上述情况满足,但是此时P for trend大于0.05,该如何解释该结果?反过来,如果P for trend小于0.05,但各水平对于最低水平的P值却大于0.05,又该如何解释该结果?
3.在SPSS中,如以上述方式处理连续自变量,在最后结果中可以看到其余三水平相对于第一水平的OR值和P值,在这些结果上面一行,还有一个P值,请问该P值的含义究竟是什么,如图中红圈所示:




4.自变量是连续变量时,文献中常见per SD change的说法,即自变量改变一个标准差,请问如何在SPSS中得到自变量改变一个标准差的OR值?如果将自变量作为连续变量直接进入方程只能得到改变一个单位,而不是一个标准差的OR值。
被这些问题困扰已久,恳请各位解答!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:logistic回归 logistic logisti ogistic logist 自变量 如何

沙发
xddlovejiao1314 学生认证  发表于 2015-7-1 10:54:19 |只看作者 |坛友微信交流群
第一个问题:类别变量在构建回归(包括logistic回归)模型时,是要以哑变量的方式进入模型的,因为类别变量的编码是无意义的,不能进行加减乘除的(如有4个类别,编码为1,2,3,4和编码为10,20,30,40一样)。所以直接将多类别变量纳入模型是不正确的(二分类类别变量可以直接纳入模型);第二个问题,涉及到类别变量关注组和参照组间的比较和解释问题。楼主这个问题三言两语说不清楚。建议找相关文献看看如何解释类别变量对因变量的影响。同时,推荐谢宇老师《回归分析》一书(论坛有电子版),看看Logit回归这章,对Logit模型结果的解释有好几种(如OR,边际效应等)
已有 1 人评分论坛币 收起 理由
admin_kefu + 30 热心帮助其他会员

总评分: 论坛币 + 30   查看全部评分

使用道具

xddlovejiao1314 发表于 2015-7-1 10:54
第一个问题:类别变量在构建回归(包括logistic回归)模型时,是要以哑变量的方式进入模型的,因为类别变量 ...
好东西,多谢推荐了一本好书。高手真猛啊。

使用道具

板凳
xddlovejiao1314 学生认证  发表于 2015-7-1 10:57:18 |只看作者 |坛友微信交流群
第三个问题在我看来这个表格的模型构建方式是有问题的,做的人没有将类别变量处理为哑变量纳入模型,而是直接将多类别变量纳入模型,所以才会出现既有多类别变量的估计,又有哑变量的估计。我个人觉得正确的做法是利用recode命令将多类别变量处理为哑变量,然后直接将哑变量纳入模型建模,就只会得到关注组相对于参照组的结果。

使用道具

报纸
xddlovejiao1314 学生认证  发表于 2015-7-1 11:00:18 |只看作者 |坛友微信交流群
最后一个问题,我看到的这么多的关于Logistic模型的书或者文献,还没有见过用自变量标准差变化去解释因变量变化的(多元线性回归里有)。对于logistic模型而言,我个人觉得大家可能更关注OR(比数比)或者边际效应的变化,对标准差的变化关注可能较少。毕竟logistic模型是一个概率变化模型。祝好运。

使用道具

地板
xddlovejiao1314 学生认证  发表于 2015-7-1 11:01:13 |只看作者 |坛友微信交流群
学术新人—加油 发表于 2015-7-1 10:56
好东西,多谢推荐了一本好书。高手真猛啊。

使用道具

7
古曲自爱 发表于 2015-7-1 12:51:31 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-7-1 11:00
最后一个问题,我看到的这么多的关于Logistic模型的书或者文献,还没有见过用自变量标准差变化去解释因变量 ...
十分感谢版主的热情解答,有拨云见日之感,还有几个问题向版主进一步请教:
1.logistic回归时,连续自变量等级化之后,P for trend如何在SPSS中计算?
2.我在分析时确实将分类自变量设置了哑变量(将HDL选入分类协变量框,并以HDL第一水平为参照),但仍会出现红圈中的P值,不过如果它没有特殊意义,我也不必纠结了
3.我是医学专业的,实际问题中,自变量常常会有很多连续变量,如年龄和各种血液指标等,如果把每个自变量都变成等级变量,将会大大增加自变量的个数,所以实际上,许多自变量还是作为连续变量进入方程的,这种情况下,我见到许多文献都有这样的说法:“某指标浓度每改变一个标准差,因变量出现某种结果的可能性增加多少”,相对的,“某指标浓度每改变1mmol/L”,这样的说法极少出现,其原因也不能理解,因为许多指标的浓度范围就是零点几个毫摩尔每升,因此用1mmol/L显然太大了,所以用一个标准差比较合适。我想知道的是这种做法是如何实现的,我见到有人说先将自变量标准化之后,做出来的OR值就是标准化的OR值,也有人说,logistic的标准回归系数=回归系数×S.D./1.8138,请版主进一步指教。
再次感谢!

使用道具

8
xddlovejiao1314 学生认证  发表于 2015-7-1 13:28:40 |只看作者 |坛友微信交流群
古曲自爱 发表于 2015-7-1 12:51
十分感谢版主的热情解答,有拨云见日之感,还有几个问题向版主进一步请教:
1.logistic回归时,连续自变 ...
第一个问题:我没懂P for trend的意思。我不知道楼主想问的是不是就是模型偏回归系数对应的sig值(P值)的计算。这个直接在软件背后计算的。我的建议是楼主不用纠结背后的计算过程。你看你们专业的文献,看大家是怎么解释变量的偏回归系数就好(一般而言,还是结合B的方向与EXP(B)来解释的);第二个问题可能是SPSS软件自身携带的,可能正如楼主所说,没多大意义,不用管。不过如果我用SPSS软件做,我不会将HDL单独放协变量框,我会根据HDL的类别数(如有3个类别),先通过recode命令新建2个哑变量,直接将哑变量纳入模型;

使用道具

9
xddlovejiao1314 学生认证  发表于 2015-7-1 13:31:57 |只看作者 |坛友微信交流群
古曲自爱 发表于 2015-7-1 12:51
十分感谢版主的热情解答,有拨云见日之感,还有几个问题向版主进一步请教:
1.logistic回归时,连续自变 ...
第三个问题,可能正如楼主所说,在你们医学专业,一些连续性变量用标准差变化比较好。在多元线性回归中,偏回归系数的标准化可以是(x-u)/sd,但logistic回归经过了对数变换,故而这背后的计算公式应该也有所变化才是。其实,根据我个人的理解,如果弄不清楚标准差怎么计算的,那么还是可以以回归系数来解释。具体的解释可以不一定是以1mmol/L增加来看嘛,可以是0.1mmol/L甚至0.01mmol/L,这里这个变化是看你自己取的值啊。祝好运。

使用道具

10
古曲自爱 发表于 2015-7-1 18:19:44 |只看作者 |坛友微信交流群
xddlovejiao1314 发表于 2015-7-1 13:31
第三个问题,可能正如楼主所说,在你们医学专业,一些连续性变量用标准差变化比较好。在多元线性回归中, ...
感谢版主的再次解答,我个人理解P for trend是讨论某因素线性变化时,患某疾病的可能性是否会增加,如果仅有某一水平p值小于0.05,而p for trend大于0.05,则仅能说自变量该水平是危险因素,而不能说该自变量升高(或降低)时,疾病患病率升高,苦于不知道权威解释,也不知道具体在spss中如何实现。先看看版主推荐的书中是否有解答

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 00:22