楼主: binzhang8867
8497 7

[问答] 【求助】关于smbinning和discretization数据分箱 [推广有奖]

  • 0关注
  • 0粉丝

初中生

9%

还不是VIP/贵宾

-

威望
0
论坛币
12590 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
403 点
帖子
3
精华
0
在线时间
17 小时
注册时间
2013-3-7
最后登录
2017-3-27

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
最近在转风控的研究,由于之前不是做这一块的,也接触R很少,啃的比较吃力,故而请教各位老师指点。在看到要导入数据时,需要进行分箱,在一篇文章中看到“监督离散化(supervised discretizaion),使用递归划分(Recursive Partitioning)将连续变量分为分段,背后是一种基于条件推断查找最佳分组的算法(Conditional Inference Tree)”用的是smbinning进行分组。而在另外一篇文章中看到,“smbinning其理论基础是构造条件推断树ctree(conditional inference trees),并把ctree树节点当成bin的分割点。此函数对于连续变量的分bin效果比较好,而对于离散变量分bin就不尽人意了,往往会出现“No Bins”或者只分两三bin的情况。”所以先用0-1背包对数据进行了分bin,效果比smbinning要好,不知R中是否有对应程序包?
另外,在其他文章中,也看到了用mdlp的方法,不知smbinning和discretization的mdlp有什么区别吗?感谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:ATION DISC ning CRE ING 背包 文章 程序

沙发
binzhang8867 发表于 2017-2-5 18:17:01 |只看作者 |坛友微信交流群
自己顶。。。求解答。谢谢!

使用道具

藤椅
HuiCsong 发表于 2017-3-30 15:57:21 |只看作者 |坛友微信交流群
楼主留个联系方式啊

使用道具

板凳
东延常 发表于 2017-8-27 21:32:03 |只看作者 |坛友微信交流群
现在也遇到分箱问题了

使用道具

报纸
东延常 发表于 2017-9-18 19:04:29 |只看作者 |坛友微信交流群
楼主,问题解决了没?求分享,我也在做风控

使用道具

地板
qjycyh 发表于 2017-11-28 17:33:37 |只看作者 |坛友微信交流群
binzhang8867 发表于 2017-2-5 18:17
自己顶。。。求解答。谢谢!
请问您之前说的用0-1分bin的问题解决了吗

使用道具

7
qjycyh 发表于 2017-11-28 17:34:44 |只看作者 |坛友微信交流群
东延常 发表于 2017-9-18 19:04
楼主,问题解决了没?求分享,我也在做风控
请问解决了吗

使用道具

8
804967363 在职认证  发表于 2018-12-19 18:17:54 |只看作者 |坛友微信交流群
如果我分析的问题,因变量y不是二分类,而是多分类问题,怎么用这个包smbinning

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-9-19 23:57