楼主: igs816
2361 33

[书籍推荐] High Performance Spark (True PDF) [推广有奖]

泰斗

5%

还不是VIP/贵宾

-

威望
9
论坛币
2694461 个
通用积分
18516.6061
学术水平
2744 点
热心指数
3467 点
信用等级
2560 点
经验
484578 点
帖子
5415
精华
52
在线时间
3590 小时
注册时间
2007-8-6
最后登录
2024-4-27

高级学术勋章 特级学术勋章 高级信用勋章 特级信用勋章 高级热心勋章 特级热心勋章

楼主
igs816 在职认证  发表于 2017-8-31 14:27:33 |只看作者 |坛友微信交流群|倒序 |AI写论文
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
th_pip3v34BqcimiYPfuPxeYVm5UYbPcfqB.jpg
English | June 16th, 2017 | ISBN: 1491943203 | 356 pages | True PDF | 7.00 MB
Apache Spark is amazing when everything clicks. But if you haven’t seen the performance improvements you expected, or still don’t feel confident enough to use Spark in production, this practical book is for you. Authors Holden Karau and                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   Rachel Warren demonstrate performance optimizations to help your Spark queries run faster and handle larger data sizes, while using fewer resources.

Ideal for software engineers, data engineers, developers, and system administrators working with large-scale data applications, this book describes techniques that can reduce data infrastructure costs and developer hours. Not only will you gain a more comprehensive understanding of Spark, you’ll also learn how to make it sing.

With this book, you’ll explore:
• How Spark SQL’s new interfaces improve performance over SQL’s RDD data structure
• The choice between data joins in Core Spark and Spark SQL
• Techniques for getting the most out of standard RDD transformations
• How to work around performance issues in Spark’s key/value pair paradigm
• Writing high-performance Spark code without Scala or the JVM
• How to test for functionality and performance when applying suggested improvements
• Using Spark MLlib and Spark ML machine learning libraries
• Spark’s Streaming components and external community packages

本帖隐藏的内容

High Performance Spark - Best Practices for Scaling and Optimizing Apache Spark.pdf (7 MB, 需要: 10 个论坛币)


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:performance Performan Perform FORMA Spark

本帖被以下文库推荐

沙发
franky_sas 发表于 2017-8-31 16:34:02 |只看作者 |坛友微信交流群

使用道具

藤椅
mathcqu 发表于 2017-8-31 17:02:25 |只看作者 |坛友微信交流群
great!

使用道具

板凳
啸傲江弧 发表于 2017-8-31 17:29:20 |只看作者 |坛友微信交流群
Thanks for sharing!

使用道具

报纸
啸傲江弧 发表于 2017-8-31 17:29:54 |只看作者 |坛友微信交流群

使用道具

地板
soccy 发表于 2017-8-31 18:57:05 |只看作者 |坛友微信交流群

使用道具

7
lanchao2007 发表于 2017-8-31 20:54:26 |只看作者 |坛友微信交流群
谢谢分享

使用道具

8
钱学森64 发表于 2017-8-31 21:55:17 |只看作者 |坛友微信交流群
谢谢分享

使用道具

9
军旗飞扬 发表于 2017-8-31 22:32:11 |只看作者 |坛友微信交流群
谢谢楼主分享!

使用道具

10
ithjesuxf 发表于 2017-8-31 23:56:21 |只看作者 |坛友微信交流群
thanks for sharing

使用道具

验证问答 换一个

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 18:24