楼主: yingjunfan1
15115 26

[问题] 针对连续型数据分箱一直是个头痛的问题,有没有可以自动分或者其他的做法呢? [推广有奖]

  • 2关注
  • 0粉丝

大专生

38%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
460 点
帖子
35
精华
0
在线时间
52 小时
注册时间
2012-9-12
最后登录
2013-12-20

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
针对连续型数据分箱一直是个头痛的问题,有没有可以自动分或者其他的做法呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:连续型 有没有

沙发
kuangsir6 发表于 2013-6-14 17:39:18 |只看作者 |坛友微信交流群
在SPSS Statistics软件中,有一个最优离散化的菜单,进行离散化的。
不过,它也是针对另外一个分类变量进行的。
SPSS---转换---最有离散化

不知道这个过程是不是你所说的分箱的意思?!

使用道具

藤椅
kuangsir6 发表于 2013-6-14 17:48:54 |只看作者 |坛友微信交流群
在IBM SPSS Modeler中的分箱节点里,也有最优化分箱选项的。

使用道具

板凳
夏夜风暖 发表于 2015-9-24 00:11:36 |只看作者 |坛友微信交流群
可以根据聚类分箱么?正好反应连续数值的疏密情况

使用道具

报纸
马驣 发表于 2016-3-7 17:25:30 |只看作者 |坛友微信交流群
kuangsir6 发表于 2013-6-14 17:48
在IBM SPSS Modeler中的分箱节点里,也有最优化分箱选项的。
请问最优分箱时有遇到过原值并非NUll,但分箱处理后不显示具体箱值,处理过后的列全为Null值的么?

使用道具

地板
kuangsir6 发表于 2016-3-7 17:46:38 |只看作者 |坛友微信交流群
马驣 发表于 2016-3-7 17:25
请问最优分箱时有遇到过原值并非NUll,但分箱处理后不显示具体箱值,处理过后的列全为Null值的么?
把数据截图传一下

使用道具

7
马驣 发表于 2016-3-8 10:06:13 |只看作者 |坛友微信交流群
图一牵扯到“最优”法就是NUll值,其他的还ok  

QQ截图20160308100248.jpg (54.96 KB)

QQ截图20160308100248.jpg

QQ截图20160308095934.jpg (42.79 KB)

QQ截图20160308095934.jpg

使用道具

8
马驣 发表于 2016-3-8 10:07:47 |只看作者 |坛友微信交流群
kuangsir6 发表于 2016-3-7 17:46
把数据截图传一下
请查收

使用道具

9
kuangsir6 发表于 2016-3-8 10:36:24 |只看作者 |坛友微信交流群
马驣 发表于 2016-3-8 10:07
请查收
哦,根据截图可以判断:这个数据对于字段“Customer_type”不存在最优。

使用道具

10
马驣 发表于 2016-3-8 10:40:04 |只看作者 |坛友微信交流群
kuangsir6 发表于 2016-3-8 10:36
哦,根据截图可以判断:这个数据对于字段“Customer_type”不存在最优。
那一般情况下会怎么处理此字段呢?舍弃?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 13:56