csdn上下的,其他部分你们自己搞吧,我积分不够了
中文 Spark: The Definitive Guide: Big Data Processing Made Simple 中文part1
https://download.csdn.net/download/u012547148/10882981
中文 Spark: The Definitive Guide: Big Data Processing Made Simple 中文part2
中文 Spark: The Definitive Guide: Big Data Processing Made Simple 中文part3
通过这个由这个开源集群计算框架的创建者编写的综合指南,了解如何使用,部署和维护Apache Spark。作者重点介绍Spark 2.0中的改进和新功能,作者Bill Chambers和Matei Zaharia将Spark主题分解为不同的部分,每个部分都有独特的目标。
您将探索Spark结构化API的基本操作和常用功能,以及用于构建端到端流应用程序的新型高级API Structured Streaming。开发人员和系统管理员将学习监控,调优和调试Spark的基础知识,并探索机器学习技术和场景,以便使用Spark的可扩展机器学习库MLlib。
轻松了解大数据和Spark
通过工作示例了解DataFrames,SQL和Datasets-Spark的核心API
深入了解Spark的低级API,RDD以及SQL和DataFrame的执行
了解Spark如何在群集上运行
调试,监视和调整Spark集群和应用程序
了解Spark的结构化流媒体和MLlib在机器学习任务中的强大功能
探索更广泛的Spark生态系统,包括SparkR和Graph Analysis
检查Spark部署,包括云中Spark的覆盖范围
内容
第1章Spark的温和介绍
第2章结构化API概述
第3章基本结构化操作
第4章使用不同类型的数据
第5章聚合
第6章加入
第7章数据源
第8章Spark SQL
第9章数据集
第10章低级API概述
第11章基本RDD操作
第12章高级RDD操作
第13章分布式变量
第14章高级分析和机器学习
第15章预处理和特征工程
第16章预处理
第17章分类
第18章回归
第19章建议书
第20章聚类
第21章图形分析
第22章深度学习