楼主: 木子小昔
17558 15

请教关于logistic回归数据预处理的问题 [推广有奖]

  • 0关注
  • 1粉丝

已卖:19份资源

大专生

16%

还不是VIP/贵宾

-

威望
0
论坛币
8690 个
通用积分
0
学术水平
0 点
热心指数
2 点
信用等级
0 点
经验
419 点
帖子
40
精华
0
在线时间
34 小时
注册时间
2009-12-13
最后登录
2017-1-7

楼主
木子小昔 发表于 2012-2-6 12:06:18 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我想研究一些变量对某银行行用卡持卡人是否使用某项功能的影响情况,选用binary logistic方法,在预处理时遇到一些问题:
1、是否需要对数据进行归一化,转化为在[0,1]之间的数据
2.、logistic是否邀请将数据进行标准化呢,即均值为0,方差为1
3、为了研究方便,我把年龄和收入都进行了离散化,分为了五个档次(他们是有序的):1-5,在做回归的时候,是要将他们设置为分类变量,转化为0.1,还是直接放入协变量进行建模呢?

此外,在选择变量进入方式的时候,怎么考虑方式呢,谢谢大家了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:logistic回归 logistic ogistic logisti logist logistic 预处理 归一化

本帖被以下文库推荐

沙发
wfldragon 发表于 2012-2-6 12:31:12
Logit处理不是标准化,可以参考下公式;
年龄和收入我觉得可以直接作为变量,但是要假定不同的数值见的距离相同,否则其意义不好解释,如10-20为“1”,20-60为“2”,这个好像有点不太好说。总之,看你的需要。
研究需要我们共同努力!

藤椅
luling2010 发表于 2012-2-6 12:32:52
没有一定要求进行归一化处理,后面的个人觉得还是设置为分类变量

板凳
木子小昔 发表于 2012-2-6 14:42:59
luling2010 发表于 2012-2-6 12:32
没有一定要求进行归一化处理,后面的个人觉得还是设置为分类变量
嗯,不用归一化,那一定要进行标准化么?

报纸
chenye45676848 发表于 2012-2-6 14:48:12
年龄为有序的,需要考试各个顺序的影响,另有排序选择模型可用

地板
木子小昔 发表于 2012-2-6 14:53:06
chenye45676848 发表于 2012-2-6 14:48
年龄为有序的,需要考试各个顺序的影响,另有排序选择模型可用
其实收入也是有顺序的,就不能使用将其转化为分类变量来做么?

7
木子小昔 发表于 2012-2-6 14:56:57
wfldragon 发表于 2012-2-6 12:31
Logit处理不是标准化,可以参考下公式;
年龄和收入我觉得可以直接作为变量,但是要假定不同的数值见的距离 ...
因为我前面做独立样本t检验时发现直接用年龄,收入的原值,两类人群没有显著差异,但是离散后,收入有了显著差异,所以才想离散化赋值的,我没有灯具赋值,是:3万以下-1,3到5万为2,5-10万为3,10万以上为4,
但是这个不能用来直接建立Logistic模型吧?
需要变为分类变量,或者怎么处理下才能建立模型吧?

8
rocn0190 发表于 2012-2-6 19:28:58
想請問stata是否可处理logit的GLS?

9
wfldragon 发表于 2012-2-6 19:55:23
实际值不显著的话再分类的逻辑有点问题,建议斟酌下。分类变量应该就可以用虚拟变量了
研究需要我们共同努力!

10
木子小昔 发表于 2012-2-6 21:29:27
wfldragon 发表于 2012-2-6 19:55
实际值不显著的话再分类的逻辑有点问题,建议斟酌下。分类变量应该就可以用虚拟变量了
谢谢啦,我大概考虑清楚啦

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-8 19:38