请选择 进入手机版 | 继续访问电脑版
楼主: daka123
759 0

Mahout数据挖掘工具讲义 [推广有奖]

  • 0关注
  • 66粉丝

院士

66%

还不是VIP/贵宾

-

威望
0
论坛币
144170 个
通用积分
387.6551
学术水平
41 点
热心指数
55 点
信用等级
42 点
经验
97128 点
帖子
2125
精华
0
在线时间
2316 小时
注册时间
2013-12-4
最后登录
2024-3-29

daka123 学生认证  发表于 2018-6-7 12:14:37 |显示全部楼层 |坛友微信交流群
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据挖掘是以查找隐藏在数据中的信息为目标的技术,是应用算法从大型数据库中提取知识的过程,这些算法确定信息项之间的隐性关联,并且向用户显示这些关联

R,SAS,SPSS等典型应用场景为 实验室工具
处理数据量受限于内存,因此无法处理海量数据
使用Oracle数据库等处理海量数据,但缺乏有效快速专业的分析功能
可以采用抽样等方法,但有局限性,比如对于聚类,推荐系统则无法使用抽样
解决方向:Hadoop集群和Map-Reduce并行计算


分类的定义
       分类是指把数据样本映射到一个事先定义的类中的学习过程,即给定一组输入的属性向量及其对应的类,用基于归纳的学习算法得出分类。分为学习和分类阶段。
       分类的任务是通过分析由已知类别数据对象组成的训练数据集,建立描述并区分数据对象类别的分类函数或分类模型。
       分类的目的是利用分类模型预测未知类别数据对象的所属类别。
贝叶斯分类器用于垃圾邮件分类。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:大型数据库 数据对象 海量数据 类别数据 分类模型

Mahout数据挖掘工具.rar

8.61 MB

需要: RMB 12 元  [购买]

交流学习,欢迎下载

本附件包括:

  • Mahout数据挖掘工具.ppt

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 20:46