无监督分箱可用cut实现
cut函数:cut(x, n):将连续型变量x分割为有着n个水平的因子.(参考来自: R语言︱数据集分组、筛选)
有监督分箱可用smbinning实现
smbinning(df, y, x, p = 0.05)函数:基于条件推断树算法,自动去除缺失值。其中df是数据集,y因变量,x是需要分箱的自变量。
|
楼主: qiao2000
|
28264
12
[实际应用] R语言如何实现分类变量和连续变量的分箱 |
| ||||||||||||||||||||
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


