时间:北京:2017年7月22日-23日
地点:北京市海淀区厂洼街3号丹龙大厦B座3层
安排:上午9:00-12:00;下午1:30-4:30;答疑4:30-5:00
费用:现场:900元 (赠送录制视频);
直播:500元 (赠送录制视频);
视频:500元 ;食宿自理
(现场报名)
(远程报名)
主讲人介绍:
辛立伟 ;大数据高级讲师;Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精通Java企业级中间件技术设计、构建以及应用部署;畅销书《Java从初学到精通》(电子工业出版社,2010年6月)一书作者。目前专注于Java EE6、Java富互联网应用程序、Android 3G软件的研发、相关技术培训和企业咨询等。多次参与大数据分析课程教学。
课程介绍:
本课程针对零基础想从事大数据相关工作或研究的学员,对大数据概念、框架、思维、Hadoop平台搭建技术进行全面的讲解。让你把握时代脉博,掌握大数据时代前沿;全面掌握Hadoop的架构原理和使用场景;全面掌握Hadoop的三种架构方式及搭建过程;熟练掌握HDFS文件系统与MapReduce程序开发思想; 能利用hadoop平台进行大数据分析,能深入实际的项目案例进行大数据的实战开发。
1. 电脑运行内存不低于8G
2. 使用Linux64位系统(提供虚拟机)
3. 讲解Hadoop2.8版本
第一部分:大数据概述
1)大数据的概念及技术
2)大数据的技术体系
第二部分:Linux操作系统
1)掌握Linux/Ubuntu操作系统的安装和配置
•安装VMware虚拟机
•在虚拟上安装Ubuntu操作系统
2)了解Linux文件系统
3)掌握常用的Linux文件操作命令
第三部分:Hadoop环境搭建_单机模式
1)Hadoop体系介绍: 核心组件HDFS、MapReduce
2)搭建Hadoop单机模式:
•安装JDK,配置和测试环境变量
•安装Hadoop,认识Hadoop 2.x的目录结构
3)在Hadoop单机模式下运行Hadoop程序
第四部分Hadoop环境搭建_伪分布模式
1)Ubuntu系统软件源的选择和更新
2)搭建Hadoop伪分布模式:
•安装SSH服务,建立SSH信任关系,实现SSH无密码登录
•配置Hadoop
•格式化HDFS分布式文件系统
3)启动HDFS和YARN,在伪分布模式下运行Hadoop程序
第五部分:HDFS文件系统
1)HDFS分布式文件系统介绍:
•HDFS简介
•HDFS主要组件和系统架构
•HDFS的适用场景
2)HDFS操作方法:
• HDFS读、写文件剖析
• HDFS的常用操作"
第六部分:MapReduce离线计算框架,Yarn云操作系统
1)MapReduce离线运算框架:
•MapReduce并行运算模式
•MapReduce执行原理
•MapReduce开发模型
2)Yarn云操作系统:
• Yarn运行原理"
第七部分:Hadoop集群环境搭建
1)Hadoop集群模式简介
2)搭建Hadoop集群模式:
•配置集群中各节点的固定IP地址和DNS解析
•安装SSH服务,建立SSH信任关系,配置本地无密码登陆和远程无密码登陆
•安装JDK,配置环境变量
•安装Hadoop,并配置
•格式化HDFS分布式文件系统
3)启动HDFS和YARN,在集群模式下运行Hadoop程序
4)Hadoop集群的监控"
报名流程:
1:点击 "现场报名/远程报名”,网上填写信息提交;
2:给予反馈,确认报名信息;
3:网上订单缴费;
4:开课前一周发送课程电子版讲义,软件准备及交通住宿指南。
联系方式:
详情请咨询:
课程顾问-赵老师
13121318867(微信)