楼主: alasaa
2863 6

[回归分析求助] 同一个logit模型,把连续变量变成等级变量后,原来有意义的变量变得没 [推广有奖]

  • 10关注
  • 0粉丝

已卖:5份资源

博士生

25%

还不是VIP/贵宾

-

威望
0
论坛币
299 个
通用积分
1.0002
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
17587 点
帖子
135
精华
0
在线时间
208 小时
注册时间
2016-5-14
最后登录
2024-10-28

楼主
alasaa 发表于 2017-5-16 14:18:03 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
同一个logit模型,把连续变量变成等级变量后,原来有意义的变量变得没意义了...为什么会这样?(如下)

此时年龄为连续变量

Logistic regression                               Number of obs   =        853
                                                  LR chi2(25)     =     478.20
                                                  Prob > chi2     =     0.0000
Log likelihood = -327.76383                       Pseudo R2       =     0.4218

------------------------------------------------------------------------------
             y | Odds Ratio     Std. Err.       z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
01         age |   1.019423   .0096232     2.04   0.042     1.000735     1.03846
02         sex |   .7722022   .1662755    -1.20   0.230     .5063431    1.177652
03         bmi |    .720419   .3173294    -0.74   0.457     .3038427    1.708132

把age每隔10年一变后,(即2=20-39岁,3=30-39岁...)

Logistic regression                               Number of obs   =        853
                                                  LR chi2(25)     =     477.11
                                                  Prob > chi2     =     0.0000
Log likelihood =  -328.3091                       Pseudo R2       =     0.4208

------------------------------------------------------------------------------
           y | Odds Ratio   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      ageage |   1.175588   .1084009     1.75   0.079      .981219     1.40846
         sex |   .7662321   .1648721    -1.24   0.216     .5025799    1.168196
         bmi |   .7220615   .3180196    -0.74   0.460      .304563    1.711872


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:模型

沙发
xddlovejiao1314 学生认证  发表于 2017-5-16 15:31:14
连续性变量换成类别变量后,在0.1水平上显著的。我的疑问是为什么连续的变量要人为的分组呢?同时,分组以你10年为段分组,其意义何在呢?如果你以老中青这种方式分组还说的过去。个人不是太建议将连续性变量降低“信息”变为类别变量。祝好运~
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
alasaa + 1 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 1  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

藤椅
alasaa 发表于 2017-5-16 16:35:53
xddlovejiao1314 发表于 2017-5-16 15:31
连续性变量换成类别变量后,在0.1水平上显著的。我的疑问是为什么连续的变量要人为的分组呢?同时,分组以你 ...
谢谢xddlovejiao1314老师的回复。

因为之前我问:“”请问各位老师,Logistic regression 时,Odds Ratio  趋近于1,几乎没应用意义 1.01737 , 但p值远<0.05(如下红色标注项),这种情况,建模时需要排除还是保留这个变量??如果保留的话相对风险增加 1.01737几乎没意义 啊。。。。怎么解决??“”

然后有老师建议我改变单位。。。

我还有其他变量也尝试过改成等级,但唯独age这个变量的显著性改变了。。。

难道,这说明,有一段年龄在模型中很重要?但信息被我隐藏在了10年的区间里??

亦或有什么别的解释吗??谢谢老师!

板凳
xddlovejiao1314 学生认证  发表于 2017-5-16 16:38:27
alasaa 发表于 2017-5-16 16:35
谢谢xddlovejiao1314老师的回复。

因为之前我问:“”请问各位老师,Logistic regression 时,Odds Ra ...
这个变量的显著性改变看怎么看,如果以0.1为标准,还是显著的。还是回到上面那个问题,连续性变量所包含的信息比类别变量更多,一般不轻易降级;同时,连续性的age变量改为类别变量,为何要以10为段呢。用老中青这种不是更好么?
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
alasaa + 1 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 1  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

报纸
alasaa 发表于 2017-5-16 16:57:31
xddlovejiao1314 发表于 2017-5-16 16:38
这个变量的显著性改变看怎么看,如果以0.1为标准,还是显著的。还是回到上面那个问题,连续性变量所包含的 ...
谢谢老师!
改成老中青确实更好去讨论,但p值就更大了,快趋近于1了。。。我是考虑到“年龄每长一岁,OR相对增加那么点,放入现实生活实在是没意义”,所以才想改成等级

但现在结果如此,我困惑于:年龄这个变量,最终,还要不要放入模型??

地板
xddlovejiao1314 学生认证  发表于 2017-5-16 17:01:33
alasaa 发表于 2017-5-16 16:57
谢谢老师!
改成老中青确实更好去讨论,但p值就更大了,快趋近于1了。。。我是考虑到“年龄每长一岁,OR ...
连续性变量你得到的结果解释:年龄增加1岁,OR变化没太大现实意义。但你为啥解释时不考虑,直接连续性增加10岁呢,这样讨论就有意义了呗。
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
alasaa + 1 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 1  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

7
zhouxinwj 发表于 2017-5-16 17:22:35 来自手机
看楼主使用的变量是age gender BMI等 应该研究的是医学问题吧;如果是慢性病的话 10年是有临床意义的 模型也有助于临床解释;可以试试5年;毕竟统计就是在找p值
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
alasaa + 1 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 1  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 16:12