楼主: 浮世若离丶
12600 92

[Hadoop] 大数据分析师之路-扬帆起航   [推广有奖]

回帖奖励 63 个论坛币 回复本帖可获得 3 个论坛币奖励! 每人限 1 次
  • 4关注
  • 51粉丝

内部工作人员

教授

15%

还不是VIP/贵宾

-

威望
1
论坛币
92314 个
学术水平
35 点
热心指数
60 点
信用等级
18 点
经验
9702 点
帖子
540
精华
0
在线时间
1063 小时
注册时间
2015-8-6
最后登录
2018-11-16

浮世若离丶 发表于 2017-11-13 14:37:01 |显示全部楼层
本帖最后由 浮世若离丶 于 2018-8-13 13:47 编辑

如果你对大数据感兴趣,而又有着如下这些的疑问:大数据是什么?大数据分析师如何区别于普通的数据分析师?大数据分析师是java程序员吗?大数据和机器学习的关系是什么?大数据的价值是什么? 如何学习才能达到企业大数据分析招聘要求?

那么CDA数据分析师下面的公开课系列课程可以作为你的指导和参考:
11.jpg

1. 入门:大数据时代-企业对人才需求的现状(免费 电脑端观看最佳)
链接:http://www.cda.cn/gkk/10_125.html
http://www.cda.cn/gkk/10_126.html
讲师:曹正凤 - 大数据课程讲师
内容介绍:针对想了解大数据分析的人士,详细分享了大数据的前沿技术及企业级应用、大数据的行业现状及人才需求、大数据学习之路三个方面的内容。适合大数据入门学员和爱好者学习。

2. 应用:Web网站日志分析(免费 电脑端观看最佳)
链接:http://www.cda.cn/gkk/10_127.html
讲师:辛立伟 – 大数据课程讲师
内容介绍:通过一个半小时的时间,辛老师为我们详细地介绍了大数据时代背景、Hadoop与Mapreduce、大数据分析师学习等内容。并通过Web网站日志分析流程案例带我们领略大数据的魅力。

如果你对大数据科学感兴趣,并且想在大数据方面有所建树,那么,下面图谱的技能是你需要掌握的。
22.png


一、技术是基础
1. 了解java、Linux等基础知识
2. 了解hadoop、HDFS、Mapreduce、yarn的原理及运行机制
3. 掌握Hive、hbase、storm等技术

二、分析是目标
1. 掌握主题推荐、分类、聚类等数据挖掘技术和数理统计分析知识
2. 掌握mahout、Spark等大数据分析工具

三、实战是硬道理
1. 会搭建大数据集群,体会集群模式下大数据分析的魅力
2. 参与几个大数据分析项目的设计与开发

如果你正面临自学缓慢而无导师系统指导,独自学习而无小组讨论,编程枯燥而无实战练习。那么CDA大数据分析师课程为你提供了系统的学习体系,或许是你不错的选择。

CDA大数据分析师的课程正是基于以上体系建设。课程的重点是基于Hadoop架构的大数据分析思想及架构设计,通过讲解气象大数据分析、Web海量日志大数据分析、智慧高速大数据分析等多个大数据分析案例,使学员能在较短的时间内理解大数据分析的真实价值,掌握如何使用Hadoop架构应用于大数据分析过程,使学员能有一个快速提升成为兼有理论和实战的大数据分析师,从而更好地适应当前互联网经济背景下对大数据分析师需求的旺盛的就业形势。 从课程体系设计和培训理念中,引导学员一步步深入学习,适合零基础但又有志于大数据行业的学员。

大数据分析师最近开课:

一、课程信息
北京 & 远程:2018年10月13日~1月09日(三个月周末集训,线下&线上结合)
授课安排:现场班9900元,远程班7900元
(1) 授课方式:面授直播两种形式,中文多媒体互动式授课方式
(2)授课时间:上午9:00-12:00,下午13:30-16:30,16:30-17:00(答疑)
(3)学习期限:现场与视频结合,长期学习加练习答疑。

二、报名流程
1. 在线填写报名信息(扫码直达)
(北京&远程)
2. 给予反馈,确认报名信息
3. 网上缴费
4. 开课前一周发送电子版课件和教室路线图

三、课程大纲

第一章 大数据环境搭建


1.Linux入门基础


2.Hadoop入门介绍


3.Hadoop单机环境搭建


4.Hadoop伪分布式集群搭建


5.Hadoop完全分布式集群搭建




第二章 Hadoop核心组件使用方法


1.分布式文件系统HDFS架构原理及常用指令


2.HDFS编程入门


3.分布式数据库Hbase架构原理及常用指令


4.Hbase编程入门


5.分布式数据仓库Hive架构原理及HQL语法介绍


6.分布式计算引擎MapReduce架构原理及基本使用方法


7.资源调度器YARN基本原理


8.ETL工具Sqoop使用方法




第三章 分布式计算引擎Spark入门


1.Scala语法介绍


2.Spark架构特点及基本原理


3.Spark入门及安装部署方法


4.Spark Core介绍


5.Spark SQL介绍与数据读取、保存方法


6.Spark GraphX入门及基本使用方法


7.Spark GraphX图计算算法案例




第四章 Spark核心组件使用方法


1.日志采集系统Flume和分布式消息队列Kafka入门


2.流式计算框架Spark Streaming基本原理及使用方法


3.流式计算框架Structured Streaming基本原理及使用方法


4.分布式算法库Spark MlLib入门介绍


5.Spark ML与Spark MLLib


6.机器学习工作流




第五章 Python编程基础与数据清洗(线上)


1.Python编程基础:基本数据结构


2.Python编程基础:常用控制语句


3.NumPy基本数据结构和常用操作


4.Pandas基本数据结构和常用操作


5.Python数据清洗案例




第六章 统计学基础(线上)


1.描述性统计


2.常用统计量的解释与使用


3.抽样方法


4.假设检验


5.参数估计


6.方差分析




第七章 PySpark基础


1.Spark数据结构及编程语言接口


2.PySpark开发环境搭建


3.PySpark编程入门:Spark基本数据结构


4.PySpark编程入门:PySpark常用语句


5.Spark与分布式数据库和分布式数据仓库的集成方法


6.采用PySpark读取分布式数据库中数据


7.PySpark数据清洗案例




第八章 PySpark机器学习(线上)


1.机器学习入门


2.PySpark基于Spark ML的特征抽取、转化和选择方法


3.最近邻分类器KNN基本原理及ML实现


4.聚类分析基本原理


5.K-Means快速聚类基本原理


6.K-Means快速聚类的Spark ML实现方法


7.高斯混合模型(GMM)聚类算法的Spark实现




第九章 PySpark机器学习(二)


1.Spark MLLib统计分析


2.线性回归基本原理


3.线性回归的Spark ML实现方法


4.对数几率分布于Sigmoild函数


5.逻辑回归基本原理


6.逻辑回归的Spark ML实现方法




第十章 PySpark机器学习(三)


1.决策树模型的基本原理


2.决策树的Spark ML实现方法


3.随机森林基本原理


4.随机森林的Spark ML实现方法


5.关联规则算法入门:Apriori算法基本原理


6.利用FP-Growth挖掘关联规则


7.FP-Growth算法的Spark ML实现方法


8.带时序关系的关联规则挖掘算法Pre-FixSpan基本原理


9.Pre-FixSpan的Spark ML实现方法




第十一章 PySpark机器学习(四)


1.协同过滤在Spark ML中的实现方法


2.Spark机器学习流构建方法


3.Spark机器学习模型超参数调优方法


4.Spark机器学习模型自动选择方法


5.PySpark案例




第十二章 期末答辩




四、课程讲师
辛立伟
Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精 通Java企业级中间件技术设计、构建以及应用部署。

董轶群
计算机软件与理论硕士,吉林大学计算机体系结构博士,具有多年的JAVA程序设计和操作系统教学经验,教学方式和方法新颖,深受学员的好评。研究方 向为智能规划、空间推理、基于大数据的时空信息系统。

曹正凤
经管之家(原人大经济论坛)大数据培训中心负责人,统计学专业博士,北京大数据协会理事,首发集团智慧交通大数据中心筹备组负责人,研究方向为数据挖掘领域的前沿算法研究,包括随机森林算法、神经网络等内容,发表多篇论文。

五、课程优惠

1)参加过分析员、CDA Level 1、Level2建模课程老学员,优惠500元;


2)CDA持证人立减1000元;


3)提前一个月报名付款优惠500元。


优惠不叠加




咨询我们
电话:010-53351739
微信: 150.jpg




课程原文:http://www.cda.cn/kecheng/35.html






33.png
stata SPSS
浮世若离丶 发表于 2017-11-13 14:38:11 |显示全部楼层
CDA大数据分析师课程,本周六开课,欢迎参加~
回复

使用道具 举报

Still.. 发表于 2017-11-13 14:44:55 |显示全部楼层

回帖奖励 +3 个论坛币

辛老师讲课深入浅出,曹老师的交通大数据分析案例串讲,很不错!
回复

使用道具 举报

ccmchy 在职认证  企业认证  发表于 2017-11-13 14:45:50 |显示全部楼层

回帖奖励 +3 个论坛币

技术是基础
回复

使用道具 举报

人脉引爆点 在职认证  发表于 2017-11-13 14:49:00 |显示全部楼层

回帖奖励 +3 个论坛币

大数据分析师更专注数据获取的架构设计、数据分析模型的选择、指标的选取,他们具有数据分析师的理论素养和业务能力,面对大数据,他们有一整套分布式的数据获取、整理、处理和分析的方案,而且这个方案最终的目标是为数据分析服务,他们具有大数据分析的利器,如Hadoop、Spark等软件,他们做的更多的工作是如何将非结构化和结构化的大数据过滤成结构化的小数据,从而使更多的普通数据分析师有用武之地。
回复

使用道具 举报

PLMKI 发表于 2017-11-13 14:58:10 |显示全部楼层

回帖奖励 +3 个论坛币

大数据时代已经来临,它将在众多领域掀起变革的巨浪。  学习学习,谢谢分享
回复

使用道具 举报

太史公 学生认证  发表于 2017-11-13 15:38:54 |显示全部楼层

回帖奖励 +3 个论坛币


辛老师讲课深入浅出,曹老师的交通大数据分析案例串讲,很不错!
回复

使用道具 举报

huhuhuhu 发表于 2017-11-13 15:45:59 |显示全部楼层

回帖奖励 +3 个论坛币

支持一下
回复

使用道具 举报

franky_sas 发表于 2017-11-13 15:53:15 |显示全部楼层

回帖奖励 +3 个论坛币

回复

使用道具 举报

cszcszcsz 发表于 2017-11-13 16:09:34 |显示全部楼层

回帖奖励 +3 个论坛币

谢谢分享!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2018-11-16 22:30