楼主: cmwei333
4519 27

Fast Data Processing with Spark 2 (2016, 3rd Edition), 原版 PDF + EPUB + MOBI [推广有奖]

贵宾

泰斗

1%

还不是VIP/贵宾

-

TA的文库  其他...

【历史+心理学+社会自然科学】

【数学+统计+计算机编程】

【金融+经济+商学+国际政治】

威望
6
论坛币
3566839 个
通用积分
717.2943
学术水平
4324 点
热心指数
4647 点
信用等级
3954 点
经验
362286 点
帖子
9826
精华
9
在线时间
2842 小时
注册时间
2015-2-9
最后登录
2017-1-29

初级热心勋章 中级热心勋章 高级热心勋章 初级信用勋章 中级信用勋章 初级学术勋章 特级热心勋章 中级学术勋章 高级信用勋章 高级学术勋章 特级学术勋章 特级信用勋章

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
Fast Data Processing with Spark 2 - Third Edition

Krishna Sankar

cover.jpg

Learn how to use Spark to process big data at speed and scale for sharper analytics. Put the principles into practice for faster, slicker big data projects.

When people want a way to process Big Data at speed, Spark is invariably the solution. With its ease of development (in comparison to the relative complexity of Hadoop), it’s unsurprising that it’s becoming popular with data analysts and engineers everywhere.

Beginning with the fundamentals, we’ll show you how to get set up with Spark with minimum fuss. You’ll then get to grips with some simple APIs before investigating machine learning and graph processing – throughout we’ll make sure you know exactly how to apply your knowledge.

You will also learn how to use the Spark shell, how to load data before finding out how to build and run your own Spark applications. Discover how to manipulate your RDD and get stuck into a range of DataFrame APIs. As if that’s not enough, you’ll also learn some useful Machine Learning algorithms with the help of Spark MLlib and integrating Spark with R. We’ll also make sure you’re confident and prepared for graph processing, as you learn more about the GraphX API.

Table of Contents

1: INSTALLING SPARK AND SETTING UP YOUR CLUSTER
2: USING THE SPARK SHELL
3: BUILDING AND RUNNING A SPARK APPLICATION
4: CREATING A SPARKSESSION OBJECT
5: LOADING AND SAVING DATA IN SPARK
6: MANIPULATING YOUR RDD
7: SPARK 2.0 CONCEPTS
8: SPARK SQL
9: FOUNDATIONS OF DATASETS/DATAFRAMES – THE PROVERBIAL WORKHORSE FOR DATASCIENTISTS
10: SPARK WITH BIG DATA
11: MACHINE LEARNING WITH SPARK ML PIPELINES
12: GRAPHX

原版 PDF + EPUB + MOBI:

本帖隐藏的内容

原版 PDF:
Fast Data Processing with Spark 2 (3rd Edition).pdf (31.42 MB, 需要: 20 个论坛币)

EPUB:
Fast Data Processing with Spark 2 (3rd Edition).epub (23.04 MB, 需要: 20 个论坛币)

MOBI:
Fast Data Processing with Spark 2 (3rd Edition).mobi (38.74 MB, 需要: 20 个论坛币)



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Processing processI Edition Process dition comparison complexity principles becoming practice

已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
Nicolle + 100 + 100 + 1 + 1 + 1 精彩帖子

总评分: 经验 + 100  论坛币 + 100  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

本帖被以下文库推荐

bbs.pinggu.org/forum.php?mod=collection&action=view&ctid=3257
bbs.pinggu.org/forum.php?mod=collection&action=view&ctid=3258
bbs.pinggu.org/forum.php?mod=collection&action=view&ctid=3259
沙发
chinajzp 学生认证  发表于 2016-10-28 09:05:02 |只看作者 |坛友微信交流群

使用道具

藤椅
Nicolle 学生认证  发表于 2016-10-28 09:11:27 |只看作者 |坛友微信交流群
提示: 作者被禁止或删除 内容自动屏蔽

使用道具

板凳
fengyg 企业认证  发表于 2016-10-28 09:24:30 |只看作者 |坛友微信交流群
  1. import org.apache.spark.SparkConf;
  2. import org.apache.spark.api.java.*;
  3. import org.apache.spark.SparkFiles;;

  4. public class LDSV02 {

  5.   public static void main(String[] args) {
  6.     SparkConf conf = new SparkConf().setAppName("Chapter 05").setMaster("local");
  7.     JavaSparkContext ctx = new JavaSparkContext(conf);
  8.     System.out.println("Running Spark Version : " +ctx.version());
  9.     ctx.addFile("/Users/ksankar/fdps-vii/data/spam.data");
  10.     JavaRDD<String> lines = ctx.textFile(SparkFiles.get("spam.data"));
  11.     System.out.println(lines.first());
  12.   }
  13. }
复制代码

已有 1 人评分论坛币 收起 理由
Nicolle + 20 鼓励积极发帖讨论

总评分: 论坛币 + 20   查看全部评分

使用道具

报纸
jinyizhe282 发表于 2016-10-28 09:55:19 |只看作者 |坛友微信交流群
  1. import java.util.Arrays;
  2. import java.util.List;

  3. import org.apache.spark.SparkConf;
  4. import org.apache.spark.api.java.*;
  5. import org.apache.spark.api.java.function.DoubleFunction;
  6. import org.apache.spark.api.java.function.FlatMapFunction;
  7. import org.apache.spark.api.java.function.Function;
  8. import org.apache.spark.api.java.function.Function2;
  9. import org.apache.spark.SparkFiles;;

  10. public class LDSV03 {

  11.   public static void main(String[] args) {
  12.     SparkConf conf = new SparkConf().setAppName("Chapter 05").setMaster("local");
  13.     JavaSparkContext ctx = new JavaSparkContext(conf);
  14.     System.out.println("Running Spark Version : " +ctx.version());
  15.     ctx.addFile("/Users/ksankar/fdps-vii/data/Line_of_numbers.csv");
  16.     //
  17.     JavaRDD<String> lines = ctx.textFile(SparkFiles.get("Line_of_numbers.csv"));
  18.     //
  19.     JavaRDD<String[]> numbersStrRDD = lines.map(new Function<String,String[]>() {
  20.       public String[] call(String line) {return line.split(",");}
  21.     });
  22.     List<String[]> val = numbersStrRDD.take(1);
  23.     for (String[] e : val) {
  24.       for (String s : e) {
  25.         System.out.print(s+" ");
  26.       }
  27.       System.out.println();
  28.     }
  29.     //
  30.     JavaRDD<String> strFlatRDD = lines.flatMap(new FlatMapFunction<String,String>() {
  31.       public Iterable<String> call(String line) {return Arrays.asList(line.split(","));}
  32.     });
  33.     List<String> val1 = strFlatRDD.collect();
  34.     for (String s : val1) {
  35.       System.out.print(s+" ");
  36.       }
  37.     System.out.println();
  38.     //
  39.     JavaRDD<Integer> numbersRDD = strFlatRDD.map(new Function<String,Integer>() {
  40.       public Integer call(String s) {return Integer.parseInt(s);}
  41.     });
  42.     List<Integer> val2 = numbersRDD.collect();
  43.     for (Integer s : val2) {
  44.       System.out.print(s+" ");
  45.       }
  46.     System.out.println();
  47.     //
  48.     Integer sum = numbersRDD.reduce(new Function2<Integer,Integer,Integer>() {
  49.       public Integer call(Integer a, Integer b) {return a+b;}
  50.     });
  51.     System.out.println("Sum = "+sum);
  52.   }
  53. }
复制代码

使用道具

地板
jinyizhe282 发表于 2016-10-28 09:57:29 |只看作者 |坛友微信交流群
谢谢                                    

使用道具

7
Nicolle 学生认证  发表于 2016-10-28 10:01:44 |只看作者 |坛友微信交流群
提示: 作者被禁止或删除 内容自动屏蔽

使用道具

8
Nicolle 学生认证  发表于 2016-10-28 10:02:18 |只看作者 |坛友微信交流群
提示: 作者被禁止或删除 内容自动屏蔽

使用道具

9
Nicolle 学生认证  发表于 2016-10-28 10:02:56 |只看作者 |坛友微信交流群
提示: 作者被禁止或删除 内容自动屏蔽

使用道具

10
Nicolle 学生认证  发表于 2016-10-28 10:03:18 |只看作者 |坛友微信交流群
提示: 作者被禁止或删除 内容自动屏蔽

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 23:52