当下,上至国家总理,下及普通老百姓,大家都在关注大数据,尤其是国务院《关于印发促进大数据发展行动纲要的通知》发布,大数据已上升为国家战略,数据驱动的大数据时代到来了,你准备好了吗?
Hadoop+HDFS+Mapreduce+Hive+Sqoop+HBase+Scala+Spark+MLlib
大数据分析利器全覆盖,offer任你挑!
相信你看过一些大数据相关书籍,原理知识都能理解,可是怎么应用于工作中呢?大数据分析环境怎么搭建?如果进行大数据分析?其实只要有人手把手传授你,CDA大数据周末班带你跨入大数据分析门槛,其实没你想象那么难。
《CDA-Hadoop大数据分析师》第13期
课程介绍
课程以大数据分析师为目标,从数据分析基础、JAVA语言入门和linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce和Hbase等理论知识和hadoop的生态环境,详细演示hadoop三种模式的安装配置,以案例的形式,重点讲解基于mahout项目的大数据分析之聚类、分类以及主题推荐。区别于普通的JAVA程序员,本课程的重点是培养基于Hadoop架构的大数据分析思想及架构设计,通过演示实际的大数据分析案例,使学员能在较短的时间内理解大数据分析的真实价值,掌握如何使用hadoop架构应用于大数据分析过程,使学员能有一个快速提升成为兼有理论和实战的大数据分析师,从而更好地适应当前互联网经济背景下对大数据分析师需求的旺盛的就业形势。从入门知识学起的课程体系设计和面向大数据分析师的培训理念,引导学员一步步深入学习,适合零基础学员从零学起。
Hadoop大数据分析课程给你的就是 把握时代脉博,掌握大数据时代前沿;全面掌握Hadoop的架构原理和使用场景;全面掌握Hadoop的三种架构方式及搭建过程;熟练掌握HDFS文件系统与MapReduce程序开发思想; 能利用hadoop平台进行大数据分析;能深入实际的项目案例进行大数据的实战开发;达到大数据分析师的理论和实战要求。
课程概览
时间 | 课程 | 学习内容 | 预期效果 |
第一阶段 | 第一阶段: 大数据前沿知识及Hadoop入门 | 1.大数据前沿知识介绍 2.课程介绍 3.Linux及Unbuntu安装和使用 4.Linux/Ubuntu文件系统操作 5.Hadoop的单机、伪分布、完全分布式模式的安装配置 【操作】:Hadoop集群安装 | 零基础入门,了解大数据的历史背景及发展方向,掌握hadoop的两种安装配置 |
第二阶段 | 第二阶段:Hadoop部署进阶 | 1.Hadoop2.x体系结构 2.HDFS分布式文件系统,HDFS Shell操作 3.YARN的基本构成和工作原理 4.MapReduce并行计算框架 5.基本的MapReduce算法实现; 6.Hadoop集群上部署和执行MR Job 【案例】:气象大数据分析 | 熟练掌握hadoop集群搭建;对Hadoop架构的分布式文件系统HDFS进行深入分析 |
| 第三阶段:Hbase理论及实战 | 1.Hbase架构 2.Hbase集群搭建 3.Hbase Shell 4.Hbase API 5.Hbase数据备份与恢复方法 【案例】:针对XX高校学生管理信息系统中的学生选课 | 熟练掌握Hbase架构与基本操作 |
第四阶段 | 第四阶段: | 1.MySQL关系型数据库 2.Hive安装布置与应用案例 3.Sqoop安装和使用 【案例】:Web海量日志大数据分析 | 了解mysql等数据库管理系统的原理,能进行简单的SELECT语句设计,熟悉hive的架构及设计原理,能在hadoop集群上部署hive,并了解使用hive的基本语法规则,能将mysql中的数据,使用sqoop组件导入到hive中。 |
第五阶段 | 第五阶段: | 1.Spark分布式集群环境搭建 2.Spark RDD 3.Spark案例分析 【操作】:搭建 Spark1.4 Standalone分布式集群 | 掌握Spark、scala的安装、配置及使用场景 |
第六阶段 | 第六阶段: | 1.Spark作业调度流程与策略 2.集群模式运行、监控Spark应用程序的步骤与方法。 3.Hive、Shark简介与对比分析 4.Spark MLlib体系结构简介 5.机器学习简介及经典算法案例详解 6.Spark SQL体系简介及语句流程 7.DataFrame模型的定义、功能 【案例】:Sogou搜索日志数据之用户行为进行分析 | 理解Spark运作机制,能够使用Spark解决数据挖掘工作 |
第七阶段 | 第七阶段: | 1.Tableau的维度与度量 2.使用Tableau快速创建交互式绘图 3.利用Tableau的GUI创建交互式仪表盘 4.使用Tableau连接hive数据源 【操作】:Tableau实践 | Tableau可视化 |
第八阶段 | 第八阶段: | 1.复习Hive、Sqoop、Spark、Mysql的安装过程 2.熟悉利用Sqoop工具将大数据平台中的高速数据和Mysql数据库进行交互 3.编写Spark SQL命令,使用Spark语句操作大数据平台上的数据 4.使用Tableau进行高速大数据的漏斗分析 【案例】:智慧高速大数据分析 | 完整应用大数据工具进行分析建模、可视化。 |
开课详情
项目名称 | 《CDA_Hadoop大数据分析师》 |
时间 | 北京:10月28日——11月19日 |
地点 | 北京市海淀区丹龙大厦 &上海市黄浦区铁道宾馆 |
价格(元) | 全程:8800(现场班)/5800(远程直播) |
优惠 | 1. 全日制在读学生8折优惠(仅限全日制本科生及硕士研究生) 2. 提前一月报名并缴费立减500元3. 参加过论坛其他现场班老学员9折优惠 4. 同一单位三人报名9折优惠,五人及以上8折优惠注明:以上优惠不能累加! |
证书(自愿申请) | 1.可申请工信部《数据分析师》证书 2.参加每年6月和12月举办的《CDA大数据分析师》认证考试,通过者即可获得证书 |
最新福利 | 全套现场视频资料,反复学习,在线答疑 赠送《数据分析统计基础》视频一套 赠送《Java编程基础知识》视频一套 可2000元购买CDA level1级全套视频资料(原价2700元) 咖啡茶歇常备,论坛币1000个/人 |
学员对象
1. 大数据分析,数据挖掘兴趣爱好者及转行人士
2. 职位晋升、薪酬提高人士
3. 在校数学,经济,计算机,统计等专业教师和学生
4. 各大数据项目负责人及其团队人士
报名流程
1.在线填写报名信息
2.给予反馈,确认报名信息
3.网上缴费
4.开课前一周发送电子版课件和教室路线图
CDA 大数据分析交流QQ群 368178559
师资团队
谢邦昌;台湾大学生物统计学博士,台湾著名大学天主教辅仁大学统计信息学系教授。现任中华数据挖掘协会(Chung-hua Data Mining Society,CDMS)理事长,辅仁大学统计资讯学系教授,华通人商用信息有限公司高级顾问。中国人民大学应用统计科学研究中心学术委员会委员。中国人民大学统计学系Data Mining中心客座教授,上海财经大学统计学系客座教授。厦门大学计划统计学系客座教授。西南财经大学客座教授。他是数据挖掘界领军人物及世界知名统计学家。发表过近三百篇关于统计和数据挖掘的论文。出版了近五十余本相关专著。拥有大数据分析多年行业经验。
曹正凤;北京大数据协会理事,首发集团智慧交通大数据中心筹备组负责人,经管之家(原人大经济论坛)大数据培训中心负责人,统计学专业博士,具有多年的JAVA程序设计和统计教学经验,研究方向为数据挖掘领域的前沿算法研究,包括随机森林算法、神经网络等内容,发表多篇论文,且发表的EI核心收录论文受到多次检索。目前致力于大数据分析前沿领域研究,主持经管之家大数据项目《基于hadoop架构的论坛主题推荐系统》,主持全国统计科学研究项目《基于大数据平台的我国宏观经济走势预测》,研究参与《大数据背景下基于中国烟草消费需求的供给结构分析研究》、《基于数据整合的空气质量测度方法研究》等大数据项目。
辛立伟 ;Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精通Java企业级中间件技术设计、构建以及应用部署;畅销书《Java从初学到精通》(电子工业出版社,2010年6月)一书作者。目前专注于Java EE6、Java富互联网应用程序、Android 3G软件的研发、相关技术培训和企业咨询等。多次参与大数据分析课程教学。
张田圆;软通动力信息技术(集团)有限公司助理副总裁、智慧业务事业群 CTO。分管技术领域:云计算、大数据、大规模并发系统、智慧城市及众创空间等。2008年主导设计海信集团IPTV互动电视系统及智能电视系统的研发,采用大规模分布式系统的原理支撑一千多万台海信智能电视终端。2010年和中科曙光合作,建设无锡市城市云数据中心,负责云存储中心的建设和云存储产品的研发,实现大规模数据和存储、处理及在线迁移、分级存储等,为城市云计算中心提供云存储基础服务。2012年主导实施甘肃省政府建设西北政企云、陕西北斗云、山东省齐鲁兴业云,和北京市计算中心、天津超算中心、河南工业云、山东工业云等都有很好的合作。2014年至今主导实施山西省移动大数据平台、浙江省绍兴市智慧交通大数据平台和无锡城市大数据中心建设,并与北大合作建立大数据创新研究院。
董轶群;计算机软件与理论硕士,吉林大学计算机体系结构博士,具有多年的JAVA程序设计和操作系统教学经验,教学方式和方法新颖,深受学员的好评。研究方向为智能规划、空间推理、基于大数据的时空信息系统。多年来从事计算机相关领域的研究,曾参与多个国家自然科学基金面上项目、重大项目等纵向课题的研究工作,并在国内外权威期刊与重要会议上发表了多篇理论成果。
王安;中国科学技术大学理论力学学士,中国科学院计算力学硕士,北京大学光华管理学院MBA。此前曾带领团队为多家大中型银行,保险公司提供风险管理,数据分析咨询服务,关注领域包括,定量化风险管理,互联网金融,大数据应用。
其他服务
1.讲义、数据等全套资料
2.赠送全套同步课程视频
3.课前预习视频和资料
4.助教全方位答疑服务
5.赠送论坛币1000枚
6.课程答疑
7.线下交流活动
8.咖啡茶歇,论坛币(1000个)
关于重听:在参加本期之后的后续三期可以(并且只能)选择一期免费来听。
联系方式
工作时间:周一至周五 8:30-18:00 其他时间请致电手机。
座机:010-68456523
QQ:2881989712(张老师)
邮箱:zhangwei@pinggu.org
联系优惠:
1. 全日制在读学生8折优惠(仅限全日制本科生及硕士研究生)
2. 提前一月报名并缴费立减500元
3. 参加过论坛其他现场班老学员9折优惠
4. 同一单位三人报名9折优惠,五人及以上8折优惠
注明:以上优惠不能累加 !
往期回顾
(《CDA-Hadoop大数据分析师》第9期-北京CDA研究院)
(《CDA-Hadoop大数据分析师》第10期-北京CDA研究院)
(《CDA-Hadoop大数据分析师》第11期-上海铁道宾馆)