楼主: davil2000
9981 13

[数据挖掘理论与案例] Boosting算法的介绍 [推广有奖]

已卖:290份资源

院士

99%

还不是VIP/贵宾

-

TA的文库  其他...

☆大数据时代文库☆

威望
4
论坛币
29700 个
通用积分
24.0072
学术水平
1172 点
热心指数
1121 点
信用等级
1143 点
经验
98096 点
帖子
2710
精华
19
在线时间
3003 小时
注册时间
2004-10-31
最后登录
2022-6-10

楼主
davil2000 发表于 2012-4-14 17:03:25 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在数据挖掘中,分类是一项基本的任务。传统做法为借助模式识别、数理统计等方法来寻找分类规则。然而,很多情况下,传统方法的预测精度受专业知识局限、训练数据质量的影响很大,特别是对那些还未完全了解其本质规律的预测问题。
解决此问题的常用方法是机器学习技术。机器学习也就是使用已知实例集合的全部属性值作为机器学习算法的训练集,导出一个分类机制后,再使用这个分类机制判别一个新实例的属性。常用的分类方法有决策树分类 、贝叶斯分类等。然而,这些方法存在的问题是当数据巨大时,分类的准确率不高。对于这样的困难问题,Boosting算法提供了一个理想的解决途径。
Freund and Schapire(1995) 提出的AdaBoost算法是Boosting算法的一个典型代表,该算法既是提高机器学习能力的有效工具,也是组合学习中最具代表性和应用前景的方法。Adaboost是一种迭代算法,其核心思想是针对同一个训练集形成不同的分类器(弱分类器),然后把这些集合构成一个强分类器。Adaboost算法本身是通过改变数据分布来实现的,根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。通过将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。使用adaboost分类器可以排除一些次要的训练数据特征,将注意力放在关键的特征上面。
(一点学习心得,请专家批判指正 O(∩_∩)O~)


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Boosting boost STI ING Tin 算法

已有 2 人评分经验 威望 学术水平 热心指数 信用等级 收起 理由
星野 + 1 感谢长久以来对论坛的支持
数据分析师3K + 100 + 5 + 5 + 5 分析的有道理

总评分: 经验 + 100  威望 + 1  学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

R是万能的,SAS是不可战胜的!

沙发
kuangsir6 发表于 2012-4-14 17:32:42
心得好!讲解清晰。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
davil2000 + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

藤椅
baizhixin 发表于 2012-4-16 18:01:05
不错

板凳
yongjiang2 发表于 2012-7-1 15:54:46
学习

报纸
水落 发表于 2012-7-4 23:51:48
mark
不是每个人都能做到真性情

地板
bobin168 发表于 2012-7-5 10:14:54
感谢楼主的强大分享

7
wjj0913 发表于 2012-7-30 16:45:59
好东西,谢谢分享!

8
yudt002 发表于 2012-7-30 16:54:49
好贴。先收藏了。已被不时之需

9
davil2000 发表于 2012-9-4 09:14:35
感谢星野版主的鼓励与支持
R是万能的,SAS是不可战胜的!

10
jgchen1966 发表于 2012-11-7 22:06:01
有这方面相关的书或资料?
鹑居鷇食,鸟行无彰

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-7 05:30