| 所在主题: | |
| 文件名: Hadoop应用架构.pdf | |
| 资料下载链接地址: https://bbs.pinggu.org/a-2366922.html | |
| 附件大小: | |
|
内容简介· · · · · ·
-使用Hadoop进行数据存储和建模的着眼点和思路 -将数据输入、输出系统的最佳方案 -MapReduce、Spark和Hive等数据处理框架介绍 -数据去重、窗口分析等常见Hadoop处理模式应用 -在Hadoop上采用Giraph、GraphX等图形处理工具 -综合使用工作流以及Apache Oozie等调度工具 -以Apache Oozie、Apache Spark Streaming和Apache Flume进行近实时流处理 -点击流分析、欺诈检验和数据仓库的架构案例 本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对Hadoop生态系统中的软件,讲解较为单一的使用方法,而本书偏重实践,在架构的高度详细阐释诸多工具如何相互配合,搭建出打磨之后的完整应用。书中提供了诸多案例,易于理解,配有详细的代码解析,知识点一目了然。 为加强训练,本书后半部分提供了详细的案例,涵盖最为常见的Hadoop应用架构。无论是设计Hadoop应用,还是将Hadoop同现有数据基础架构集成,本书都可以提供详实的参考。 作者简介· · · · · · Mark Grover Apache Sentry项目管理委员会成员,《Hive编程指南》作者之一,曾参与Apache Hadoop、Apache Hive、Apache Sqoop以及Apache Flume等项目,并为Apache Bigtop项目和Apache Sentry(项目孵化中)项目贡献代码。 Ted Malaska Cloudera公司的资深解决方案架构师,致力于帮助客户更好地掌握Hadoop及其生态系统。曾任美国金融业监管局(FINRA,Financial Industry Regulatory Authority)首席架构师,指导建设了包括网络应用、服务型架构以及大数据应用在内的大量解决方案。曾为Apache Flume、Apache Avro、YARN以及Apache Pig等项目贡献代码。 Jonathan Seidman Cloudera公司的解决方案架构师,协助合作伙伴将的解决方案集成到Cloudera的软件栈中。芝加哥Hadoop用户组(Chicago Hadoop User Group)及芝加哥大数据(Chicago Big Data)的联合创始人、《Hadoop实战》技术编辑。曾任Orbiz Worldwide公司大数据团队技术主管,为最为繁忙的站点管理了承载海量数据的Hadoop集群。也曾多次在Hadoop及大数据专业会议上发言。 Gwen Shapira Cloudera公司的解决方案架构师,知名博主,拥有15年从业经验,协助客户设计高扩展性的数据架构。曾任Pythian高级顾问、Oracle ACE主管以及NoCOUG董事会成员,活跃于诸多业内会议 目录· · · · · ·版权声明 O'Reilly Media, Inc. 介绍 译者序 序 前言 第一部分考虑 Hadoop 应用的架构设计 第 1 章Hadoop 数据建模 第 2 章Hadoop 数据移动 第 3 章Hadoop 数据处理 第 4 章Hadoop 数据处理通用范式 第 5 章Hadoop 图处理 第 6 章协调调度 第 7 章Hadoop 近实时处理 第二部分案例研究 第 8 章点击流分析 第 9 章欺诈检测 第 10 章数据仓库 附录 AImpala 中的关联 |
|
熟悉论坛请点击新手指南
|
|
| 下载说明 | |
|
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。 2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。 3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。 (如有侵权,欢迎举报) |
|
京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明