图书说明:
Scala特别适用于分析大量数据,因为任务规模对性能没有任何重大影响。 Scala强大的功能库可以与数据库进行交互,构建可扩展的框架,从而创建强大的数据流水线。
第一个模块向您介绍Scala库以摄取,存储,操作,处理和可视化数据。使用现实世界的例子,您将学习如何设计可扩展架构来处理和建模数据 – 从简单并发结构开始,并演进到演员系统和Apache Spark。之后,您还将学习如何使用Web框架构建交互式可视化。
熟悉数据科学中涉及的所有任务后,您将在第二个模块中使用Scala进行数据分析。您将看到Scala如何通过易于遵循的食谱来了解数据的意义。您将学习使用Spark ML库的算法进行探索性数据分析和典型机器学习的Bokeh绑定。您将充分了解Spark流,流式数据的机器学习和Spark graphX。
掌握数据分析的坚定理解,您将准备好探索数据科学 – 机器学习的最前沿的方面。最终的模块教你如何使用Scala进行机器学习的A到Z。您将探索Scala的依赖注入和隐含,用于编写机器学习算法。您还将探索机器学习主题,如聚类,维数减少,朴素贝叶斯,回归模型,支持向量机,神经网络等。
这个学习路径将Packt的一些最好的功能与一个完整的,策划的包装相结合。它包含以下Packt产品的内容:
数据科学Scala,Pascal Bugnion
Scala数据分析食谱,Arun Manivannan
机器学习Scala,Patrick R. Nicolas
Cover:
Scala Guide for Data Science Professionals
https://bbs.pinggu.org/forum.php?mod=image&aid=2265114&size=300x300&key=fa98560f362647b1&nocache=yes&type=fixnone
Download: