搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  零基础入门Spark.part2.rar
资料下载链接地址: https://bbs.pinggu.org/a-6902805.html
附件大小:
32.46 MB   举报本内容
01|Spark:从“大数据的HelloWorld”开始 .md 16.9 KB
01|Spark:从“大数据的HelloWorld”开始 .pdf 5.1 MB
02-RDD与编程模型:延迟计算是怎么回事? .md 15.5 KB
02-RDD与编程模型:延迟计算是怎么回事? .pdf 2.7 MB
03-RDD常用算子(一):RDD内部的数据转换 .md 19.6 KB
03-RDD常用算子(一):RDD内部的数据转换 .pdf 3.1 MB
04-进程模型与分布式部署:分布式计算是怎么回事? .md 15.4 KB
04-进程模型与分布式部署:分布式计算是怎么回事? .pdf 3.1 MB
05-调度系统:如何把握分布式计算的精髓? .md 19.8 KB
05-调度系统:如何把握分布式计算的精髓? .pdf 4.7 MB
06-Shuffle管理:为什么Shuffle是性能瓶颈? .md 14.9 KB
06-Shuffle管理:为什么Shuffle是性能瓶颈? .pdf 3.4 MB
07-RDD常用算子(二):Spark如何实现数据聚合? .md 16.3 KB
07-RDD常用算子(二):Spark如何实现数据聚合? .pdf 4.0 MB
08-内存管理:Spark如何使用内存? .md 15.6 KB
08-内存管理:Spark如何使用内存? .pdf 3.3 MB
09-RDD常用算子(三):数据的准备、重分布与持久化 .md 19.9 KB
09-RDD常用算子(三):数据的准备、重分布与持久化 .pdf 3.7 MB
10-广播变量&累加器:共享变量是用来做什么的? .md 15.6 KB
10-广播变量&累加器:共享变量是用来做什么的? .pdf 2.6 MB
11-存储系统:数据到底都存哪儿了? .md 12.3 KB
11-存储系统:数据到底都存哪儿了? .pdf 4.5 MB
12-基础配置详解:哪些参数会影响应用程序稳定性? .md 17.4 KB
12-基础配置详解:哪些参数会影响应用程序稳定性? .pdf 2.3 MB
13-SparkSQL:让我们从“小汽车摇号分析”开始 .md 16.3 KB
13-SparkSQL:让我们从“小汽车摇号分析”开始 .pdf 3.7 MB
14-台前幕后:DataFrame与SparkSQL的由来 .md 17.4 KB
14-台前幕后:DataFrame与SparkSQL的由来 .pdf 3.7 MB
15-数据源与数据格式:DataFrame从何而来? .md 22.3 KB
15-数据源与数据格式:DataFrame从何而来? .pdf 3.0 MB
16-数据转换:如何在DataFrame之上做数据处理? .md 23.3 KB
16-数据转换:如何在DataFrame之上做数据处理? .pdf 3.7 MB
17-数据关联:不同的关联形式与实现机制该怎么选? .md 19.2 KB
17-数据关联:不同的关联形式与实现机制该怎么选? .pdf 3.2 MB
18-数据关联优化:都有哪些Join策略,开发者该如何取舍? .md 13.6 KB
18-数据关联优化:都有哪些Join策略,开发者该如何取舍? .pdf 3.1 MB
19-配置项详解:哪些参数会影响应用程序执行性能? .md 15.9 KB
19-配置项详解:哪些参数会影响应用程序执行性能? .pdf 3.0 MB
20-Hive+Spark强强联合:分布式数仓的不二之选 .md 20.3 KB
20-Hive+Spark强强联合:分布式数仓的不二之选 .pdf 4.4 MB
21|SparkUI(上):如何高效地定位性能问题? .md 15.1 KB
21|SparkUI(上):如何高效地定位性能问题? .pdf 5.7 MB
22|SparkUI(下):如何高效地定位性能问题? .md 15.7 KB
22|SparkUI(下):如何高效地定位性能问题? .pdf 6.4 MB
23-SparkMLlib:从“房价预测”开始 .md 21.8 KB
23-SparkMLlib:从“房价预测”开始 .pdf 4.0 MB
24-特征工程(上):有哪些常用的特征处理函数? .md 24.4 KB
24-特征工程(上):有哪些常用的特征处理函数? .pdf 3.7 MB
25-特征工程(下):有哪些常用的特征处理函数? .md 16.5 KB
25-特征工程(下):有哪些常用的特征处理函数? .pdf 4.9 MB
26-模型训练(上):决策树系列算法详解 .md 14.2 KB
26-模型训练(上):决策树系列算法详解 .pdf 3.5 MB
27-模型训练(中):回归、分类和聚类算法详解 .md 15.3 KB
27-模型训练(中):回归、分类和聚类算法详解 .pdf 2.5 MB
28-模型训练(下):协同过滤与频繁项集算法详解 .md 15.8 KB
28-模型训练(下):协同过滤与频繁项集算法详解 .pdf 4.0 MB
29-SparkMLlibPipeline:高效开发机器学习应用 .md 22.1 KB
29-SparkMLlibPipeline:高效开发机器学习应用 .pdf 1.8 MB
30|StructuredStreaming:从“流动的WordCount”开始 .md 15.1 KB
30|StructuredStreaming:从“流动的WordCount”开始 .pdf 3.2 MB
31|新一代流处理框架:Batchmode和Continuousmode哪家强? .md 13.8 KB
31|新一代流处理框架:Batchmode和Continuousmode哪家强? .pdf 3.5 MB
32|Window操作&Watermark:流处理引擎提供了哪些优秀机制? .md 17.1 KB
32|Window操作&Watermark:流处理引擎提供了哪些优秀机制? .pdf 4.2 MB
33|流计算中的数据关联:流与流、流与批 .md 20.0 KB
33|流计算中的数据关联:流与流、流与批 .pdf 2.4 MB
34|Spark+Kafka:流计算中的“万金油” .md 23.0 KB
34|Spark+Kafka:流计算中的“万金油” .pdf 3.1 MB
结束语-进入时间裂缝,持续学习 .md 8.1 KB
结束语-进入时间裂缝,持续学习 .pdf 1.7 MB
开篇词-入门Spark,你需要学会“三步走” .md 13.3 KB
开篇词-入门Spark,你需要学会“三步走” .pdf 3.7 MB
期末测试|来赴一场100分之约! .md 748 Byte
期末测试|来赴一场100分之约! .pdf 420.0 KB
用户故事-小王:保持空杯心态,不做井底之蛙 .md 8.4 KB
用户故事-小王:保持空杯心态,不做井底之蛙 .pdf 11.2 MB







    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2026-1-17 11:45