楼主: franky_sas
1172 1

[Hadoop] Hadoop应用架构 高清完整版 [推广有奖]

  • 3关注
  • 6粉丝

学术权威

8%

还不是VIP/贵宾

-

威望
0
论坛币
32929 个
学术水平
58 点
热心指数
91 点
信用等级
38 点
经验
1003 点
帖子
8707
精华
0
在线时间
1719 小时
注册时间
2016-5-17
最后登录
2017-12-14

franky_sas 发表于 2017-11-26 16:27:11 |显示全部楼层
内容简介  · · · · · ·

-使用Hadoop进行数据存储和建模的着眼点和思路

-将数据输入、输出系统的最佳方案

-MapReduce、Spark和Hive等数据处理框架介绍

-数据去重、窗口分析等常见Hadoop处理模式应用

-在Hadoop上采用Giraph、GraphX等图形处理工具

-综合使用工作流以及Apache Oozie等调度工具

-以Apache Oozie、Apache Spark Streaming和Apache Flume进行近实时流处理

-点击流分析、欺诈检验和数据仓库的架构案例

本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对Hadoop生态系统中的软件,讲解较为单一的使用方法,而本书偏重实践,在架构的高度详细阐释诸多工具如何相互配合,搭建出打磨之后的完整应用。书中提供了诸多案例,易于理解,配有详细的代码解析,知识点一目了然。

为加强训练,本书后半部分提供了详细的案例,涵盖最为常见的Hadoop应用架构。无论是设计Hadoop应用,还是将Hadoop同现有数据基础架构集成,本书都可以提供详实的参考。





作者简介  · · · · · ·

Mark Grover

Apache Sentry项目管理委员会成员,《Hive编程指南》作者之一,曾参与Apache Hadoop、Apache Hive、Apache Sqoop以及Apache Flume等项目,并为Apache Bigtop项目和Apache Sentry(项目孵化中)项目贡献代码。

Ted Malaska

Cloudera公司的资深解决方案架构师,致力于帮助客户更好地掌握Hadoop及其生态系统。曾任美国金融业监管局(FINRA,Financial Industry Regulatory Authority)首席架构师,指导建设了包括网络应用、服务型架构以及大数据应用在内的大量解决方案。曾为Apache Flume、Apache Avro、YARN以及Apache Pig等项目贡献代码。

Jonathan Seidman

Cloudera公司的解决方案架构师,协助合作伙伴将的解决方案集成到Cloudera的软件栈中。芝加哥Hadoop用户组(Chicago Hadoop User Group)及芝加哥大数据(Chicago Big Data)的联合创始人、《Hadoop实战》技术编辑。曾任Orbiz Worldwide公司大数据团队技术主管,为最为繁忙的站点管理了承载海量数据的Hadoop集群。也曾多次在Hadoop及大数据专业会议上发言。

Gwen Shapira

Cloudera公司的解决方案架构师,知名博主,拥有15年从业经验,协助客户设计高扩展性的数据架构。曾任Pythian高级顾问、Oracle ACE主管以及NoCOUG董事会成员,活跃于诸多业内会议



目录  · · · · · ·版权声明
O'Reilly Media, Inc. 介绍
译者序

前言
第一部分 考虑 Hadoop 应用的架构设计
第 1 章 Hadoop 数据建模
第 2 章 Hadoop 数据移动
第 3 章 Hadoop 数据处理
第 4 章 Hadoop 数据处理通用范式
第 5 章 Hadoop 图处理
第 6 章 协调调度
第 7 章 Hadoop 近实时处理
第二部分 案例研究
第 8 章 点击流分析
第 9 章 欺诈检测
第 10 章 数据仓库
附录 A Impala 中的关联


支持楼主:购买VIP购买贵宾 购买后,论坛将奖励 10 元论坛资金给楼主,以表示您对TA发好贴的支持
 
载入中......

Hadoop应用架构.pdf

13.29 MB

售价: 10 个论坛币

stata SPSS
jazc365 发表于 2017-11-27 01:23:21 |显示全部楼层

可以下载了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2017-12-14 21:07