楼主: 李会超
5746 1

[学习分享] CART算法 C5.0算法 CHAID同异 [推广有奖]

  • 1关注
  • 31粉丝

教授

33%

还不是VIP/贵宾

-

威望
0
论坛币
121197 个
通用积分
61.4700
学术水平
140 点
热心指数
152 点
信用等级
84 点
经验
56179 点
帖子
1182
精华
1
在线时间
1120 小时
注册时间
2008-11-6
最后登录
2024-4-29

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在用R的时候经常会发现涉及到决策树的基本都是说用rpart包,但rpart包只是二叉树的,所以还是有必要谈谈决策树不同算法的区别
CART(Classification And Regression Tree分类回归树
CHAID(Chi-squared Automatic Interaction Detector)卡方自动动交互诊断器
C5.0和CART算法思路相同:包括决策树生长和决策树修剪两个过程
主要差别体现在:
C5.0
CART

CHAID
  输出变量  只能是分类型 可以是分类型也可以是数值型 可以是分类型
也可以是数值型
只能建分类树 既可建分类树又可建回归树 能够建立多叉树
  可建多叉树  只能建二叉树 能够建立多叉树
确定最佳分组变量
和分割点
  以信息熵为基础
通过计算信息增益确定
  以Gini系数和方差作为选择依据 从统计显著性检验角度确定
  决定决策树的标准 依据训练样本,
通过近似正态分布确定
依据测试样本进行修剪 从统计显著性检验角度确定

CHAID与C5.0 CART算法的区别在于:
CHAID组变量确定的依据是:输入变量与输出变量之间的相关程度,应将与输出变量最相关的输入变量作为
变量。
C5.0 CART算法选择使输出变量取值差异性下降最快的变量为最佳分组变量
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:CHAID CART ART CAR interaction 二叉树

已有 1 人评分经验 收起 理由
guo.bailing + 100 精彩帖子

总评分: 经验 + 100   查看全部评分

学无止境,坚持!
沙发
20115326 学生认证  发表于 2018-2-8 14:31:16 |只看作者 |坛友微信交流群
不错

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 22:40