楼主: yingjunfan1
16553 26

[问题] 针对连续型数据分箱一直是个头痛的问题,有没有可以自动分或者其他的做法呢? [推广有奖]

11
kuangsir6 发表于 2016-3-8 10:42:10
马驣 发表于 2016-3-8 10:40
那一般情况下会怎么处理此字段呢?舍弃?
为什么舍弃?看你要做什么?
对于某个字段不存在最优,可能对于其他字段存在呢?

12
马驣 发表于 2016-3-8 10:47:54
kuangsir6 发表于 2016-3-8 10:42
为什么舍弃?看你要做什么?
对于某个字段不存在最优,可能对于其他字段存在呢?
Customer_type是因变量,X1-X5皆为自变量,如果对因变量都不存在最优的自变量如何处理呢?

13
kuangsir6 发表于 2016-3-8 10:50:51
马驣 发表于 2016-3-8 10:47
Customer_type是因变量,X1-X5皆为自变量,如果对因变量都不存在最优的自变量如何处理呢?
看看模型及变量检验的结果是否显著。

14
马驣 发表于 2016-3-8 10:54:35
kuangsir6 发表于 2016-3-8 10:50
看看模型及变量检验的结果是否显著。
显著,但是就是无法分级...

15
kuangsir6 发表于 2016-3-8 17:40:00
马驣 发表于 2016-3-8 10:54
显著,但是就是无法分级...
什么模型?什么检验?

16
马驣 发表于 2016-3-8 17:55:29
kuangsir6 发表于 2016-3-8 17:40
什么模型?什么检验?
二分逻辑,T-test,及 -2对数似然值 两方面衡量都证明这个变量显著

17
kuangsir6 发表于 2016-3-8 18:25:42
马驣 发表于 2016-3-8 17:55
二分逻辑,T-test,及 -2对数似然值 两方面衡量都证明这个变量显著
你单独做一下独立样本t检验。看看结果

18
kuangsir6 发表于 2016-3-8 18:26:34
马驣 发表于 2016-3-8 17:55
二分逻辑,T-test,及 -2对数似然值 两方面衡量都证明这个变量显著
就是因变量和那一个自变量。

19
马驣 发表于 2016-3-9 09:15:36
kuangsir6 发表于 2016-3-8 18:26
就是因变量和那一个自变量。
这些变量之前用statistic建过模了,结果也都相对显著,自变量的筛选上我觉得意义不大了,只是在最优分级上无法让Modeler直接分级,所以我在考虑换种分级方法试试,你看可行么?

多谢大神指点 [handshake] [handshake]

20
linshuhe123 发表于 2016-9-14 14:44:54
分箱的目的是什么呢?  不太懂

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-27 03:16