请选择 进入手机版 | 继续访问电脑版
楼主: 0℃以下
500 1

[学习笔记] 【学习笔记】ID3的局限性 ID3局限主要源于局部最优化条件,即信息增益的计算方 ... [推广有奖]

  • 0关注
  • 1粉丝

高中生

50%

还不是VIP/贵宾

-

威望
0
论坛币
72 个
通用积分
20.9264
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
140 点
帖子
26
精华
0
在线时间
0 小时
注册时间
2019-11-18
最后登录
2019-12-18

0℃以下 发表于 2019-11-20 20:17:34 来自手机 |显示全部楼层 |坛友微信交流群
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
ID3的局限性
ID3局限主要源于局部最优化条件,即信息增益的计算方法,其局限性主要有以下几点:
分支度越高(分类水平越多)的离散变量往往子节点的总信息熵会更小,ID3是按照某一列进行切分,有一些列的分类可能不会对我需
要的结果有足够好的指示。极限情况下取ID作为切分字段,每个分类的纯度都是100%,因此这样的分类方式是没有效益的
不能直接处理连续型变量,若要使用ID3处理连续型变量,则首先需要对连续变量进行离散化
对缺失值较为敏感,使用ID3之前需要提前对缺失值进行处理
没有剪枝的设置,容易导致过拟合,即在训练集上表现很好,测试集上表现很差
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:学习笔记 最优化 局限性 习笔记 连续型变量

512661101 发表于 2019-11-20 23:04:14 来自手机 |显示全部楼层 |坛友微信交流群

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 04:24