楼主: qiao2000
28264 12

[实际应用] R语言如何实现分类变量和连续变量的分箱 [推广有奖]

11
初钰杰 发表于 2018-1-8 10:17:16
无监督分箱可用cut实现
cut函数:cut(x, n):将连续型变量x分割为有着n个水平的因子.(参考来自: R语言︱数据集分组、筛选)

有监督分箱可用smbinning实现
smbinning(df, y, x, p = 0.05)函数:基于条件推断树算法,自动去除缺失值。其中df是数据集,y因变量,x是需要分箱的自变量。
已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
A蓝白红 + 1 + 1 + 1 精彩帖子
admin_kefu + 20 热心帮助其他会员

总评分: 论坛币 + 20  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

12
3生石 在职认证  发表于 2018-5-18 15:58:38 来自手机
见公众号 大数据风控的一点一滴,里面有

13
3生石 在职认证  发表于 2018-5-18 15:59:39 来自手机
gongzhonghao 大数据风控的一点一滴,里面有

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 00:15