楼主: yingjunfan1
15109 26

[问题] 针对连续型数据分箱一直是个头痛的问题,有没有可以自动分或者其他的做法呢? [推广有奖]

11
kuangsir6 发表于 2016-3-8 10:42:10 |只看作者 |坛友微信交流群
马驣 发表于 2016-3-8 10:40
那一般情况下会怎么处理此字段呢?舍弃?
为什么舍弃?看你要做什么?
对于某个字段不存在最优,可能对于其他字段存在呢?

使用道具

12
马驣 发表于 2016-3-8 10:47:54 |只看作者 |坛友微信交流群
kuangsir6 发表于 2016-3-8 10:42
为什么舍弃?看你要做什么?
对于某个字段不存在最优,可能对于其他字段存在呢?
Customer_type是因变量,X1-X5皆为自变量,如果对因变量都不存在最优的自变量如何处理呢?

使用道具

13
kuangsir6 发表于 2016-3-8 10:50:51 |只看作者 |坛友微信交流群
马驣 发表于 2016-3-8 10:47
Customer_type是因变量,X1-X5皆为自变量,如果对因变量都不存在最优的自变量如何处理呢?
看看模型及变量检验的结果是否显著。

使用道具

14
马驣 发表于 2016-3-8 10:54:35 |只看作者 |坛友微信交流群
kuangsir6 发表于 2016-3-8 10:50
看看模型及变量检验的结果是否显著。
显著,但是就是无法分级...

使用道具

15
kuangsir6 发表于 2016-3-8 17:40:00 |只看作者 |坛友微信交流群
马驣 发表于 2016-3-8 10:54
显著,但是就是无法分级...
什么模型?什么检验?

使用道具

16
马驣 发表于 2016-3-8 17:55:29 |只看作者 |坛友微信交流群
kuangsir6 发表于 2016-3-8 17:40
什么模型?什么检验?
二分逻辑,T-test,及 -2对数似然值 两方面衡量都证明这个变量显著

使用道具

17
kuangsir6 发表于 2016-3-8 18:25:42 |只看作者 |坛友微信交流群
马驣 发表于 2016-3-8 17:55
二分逻辑,T-test,及 -2对数似然值 两方面衡量都证明这个变量显著
你单独做一下独立样本t检验。看看结果

使用道具

18
kuangsir6 发表于 2016-3-8 18:26:34 |只看作者 |坛友微信交流群
马驣 发表于 2016-3-8 17:55
二分逻辑,T-test,及 -2对数似然值 两方面衡量都证明这个变量显著
就是因变量和那一个自变量。

使用道具

19
马驣 发表于 2016-3-9 09:15:36 |只看作者 |坛友微信交流群
kuangsir6 发表于 2016-3-8 18:26
就是因变量和那一个自变量。
这些变量之前用statistic建过模了,结果也都相对显著,自变量的筛选上我觉得意义不大了,只是在最优分级上无法让Modeler直接分级,所以我在考虑换种分级方法试试,你看可行么?

多谢大神指点 [handshake] [handshake]

使用道具

20
linshuhe123 发表于 2016-9-14 14:44:54 |只看作者 |坛友微信交流群
分箱的目的是什么呢?  不太懂

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 03:44