7053 2

[问答] 有谁比较了解有监督的离散化方法 [推广有奖]

  • 0关注
  • 0粉丝

已卖:76份资源

高中生

57%

还不是VIP/贵宾

-

威望
0
论坛币
1341 个
通用积分
0.0600
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
212 点
帖子
19
精华
0
在线时间
34 小时
注册时间
2015-2-3
最后登录
2017-5-5

楼主
彼岸没有灯塔 发表于 2015-8-25 16:24:43 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教一下,基于熵的离散化方法(分箱),在R语言里怎样实现,有相应的包,或者函数吗。
另外我了解到还有一种基于卡方的离散化方法,有没有现成的工具包呢?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:离散化 R语言 工具包 有没有 工具包

沙发
msw731 发表于 2016-1-6 14:17:10
据我了解目前基于熵(或者叫基于信息增益)的离散化分箱方法最好的就是MDLP(Minimal Description Length Principle最短描述长度原则)方法。基本思想是:如果分组后的输入变量对输出变量取值的解释能力显著低于分组之前,那么这样的分组是没有意义的。所以,待分组变量(视为输入变量)应在输出变量的“指导”下进行分组。

藤椅
樱井慕心 发表于 2017-10-10 10:45:27
这个熵看起来容易,解释起来有点难

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 21:25