本课程从数据分析、JAVA语言和linux操作系统入门知识入手,系统介绍Hadoop HDFS、MapReduce和Hbase等理论知识和hadoop的生态环境,详细演示hadoop三种模式的安装配置,重点讲解mahout+Spark
CDA大数据分析师证书
Oracle大数据核心技术课程认证证书
课程详情如下:
课程安排
项目名称 | CDA_Hadoop大数据分析师(8天周末班) |
时间 | 上海:5月28日—6月19日 北京:6月4日—26日 |
地点 | 北京市海淀区/上海市黄浦区 |
价格(元) | 全程:8800(现场班)/5800(远程直播) |
| 1. 全日制在读学生8折优惠(凭全日制学生证报名) |
证书(自愿申请) | 1.可申请工信部《数据分析师》证书 |
| 全套现场视频资料,终身学习,在线答疑 |
免费重听 | 在参加本期之后的后续三期可以(并且只能)选择一期免费来听 |
课程大纲
时间 | 课程 | 大纲简介 | 预期效果 |
6.4 | 大数据前沿知识及hadoop入门 | 1.大数据前沿知识介绍 | 零基础入门,了解大数据的历史背景及发展方向,掌握hadoop的两种安装配置 |
6.5 | Hadoop部署进阶 | 1.Hadoop集群模式搭建 | 熟练掌握hadoop集群搭建;对Hadoop架构的分布式文件系统HDFS进行深入分析 |
6.11 | Java基础MapReduce理论 | 1、了解Java程序语言基本语法 | 零基础入门,了解java程序设计的基本思想,熟练利用eclipse进行简单的java程序设计,熟练使用jar文件,了解mysql等数据库管理系统的原理,了解基于web的程序开发流程 |
6.12 | MapReduce高级案例-论坛日志分析系统 | 1、了解MapReduce计算框架原理; | 理解MapReduce计算框架原理;能看懂并编写基本的MapReduce程序;掌握常见的MapReduce算法(排序、去重、join等);掌握MapReduce程序的部署和运行; |
6.18 | hadoop+Mahout大数据分析 | 1. mahout学习之简介、安装及配置 | 掌握基于hadoop+mahout的大数据分析方法的使用场景,熟练运用mahout的成熟算法进行特定场景的大数据分析 |
6.19 | Hbase理论及实战 | 1. hbase简介、安装及配置 | 掌握hbase的数据存储及项目实战 |
6.25、26 | hadoop+Spark大数据分析 | 实战案例深入解析hadoop+Spark的大数据分析之分类、Logistic回归与主题推荐 | 掌握基于hadoop+Spark的大数据分析方法的使用场景,熟练运用Spark的成熟算法进行特定场景的大数据分析 |
大数据试听视频:http://www.tudou.com/programs/view/96FhjLBDp1o/
详细课程大纲请见:http://bbs.pinggu.org/thread-3515862-1-1.html
大数据环境配置干货:http://www.tudou.com/programs/view/CS3KvXCXRik/
六大案例教学
- 质量管理数据的聚类分析
对由60余个观察值组成的600个体的质量管理控制图数据,进行kmean聚类和canopy聚类。
- 基于文本挖掘的大数据分类
对20个新闻单位几个月发布的18828个新闻文本数据,进行基于mahout提的贝叶斯大数据分类。
- 美国气象大数据分析
对NCDC的10000条气象数据进行MapReduce程序设计和分析。
- 人大经济论坛日志分析
对论坛用户登陆和访问的日志数据进行MapReduce程序设计和分析。
- 基于用户的电影推荐
使用明尼苏达大学提供的,来自6040个用户对约3900部电影的100万多个匿名评分数据在集群上进行大数据分析。
- 人大经济论坛版块推荐
使用论坛用户访问版块数据,进行基于Mahout的论坛精华版块推荐。
师资团队
谢邦昌
台湾大学生物统计学博士,台北医学大学医务管理学系暨研究所,大数据研究中心及管理学院主任,中华资料採矿协会荣誉理事长,中华市场研究协会理事长。矿协会荣誉理事长,中华市场研究协会理事长,台湾大学生物统计学博士。
曹正凤
软件工程专业硕士,统计学专业博士,具有多年的JAVA程序设计和统计教学经验,人大经济论坛CDA金牌讲师,研究方向为数据挖掘领域的前沿算法研究,发表多篇论文,且发表的EI核心收录论文受到多次检索。
辛立伟
Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精 通Java企业级中间件技术设计、构建以及应用部署。
董轶群
计算机软件与理论硕士,吉林大学计算机体系结构博士,具有多年的JAVA程序设计和操作系统教学经验,教学方式和方法新颖,深受学员的好评。研究方 向为智能规划、空间推理、基于大数据的时空信息系统。
宋广磊
中科院硕士,先后供职于阿里、红帽、乐视等公司。精通Hadoop/Hive/Hbase/Storm海量数据处理技术,具备丰富的MongoDB开发、运维经验。精通Mysql、Oracle体系结构、运行机制、运维管理的各项工作和集群技术。熟练掌握存储过程/函数、触发器、SQL/PLSQL的开发和调优技术。
赵仁乾
北京邮电大学管理科学与工程硕士,现就职于北京电信规划设计院,从事移动、联通集团及各省分公司市场\业务\财务规划、经济评价及运营咨询。重点研究方向包括离网用户挖掘、市场细分与精准营销、移动网络价值区域分析等。
学员对象
- 大数据分析,数据挖掘兴趣爱好者及转行人士
- 职位晋升薪酬提高人士
- 在校数学,经济,计算机统计等专业教师和学生
- 各大数据项目负责人及其团队人士
咨询
座机:010-68456523
QQ:2881989712(张老师)
手机:13718534278
邮箱:zhangwei@pinggu.org