楼主: chj1983wd
2840 5

Spark大数据挖掘平台专题 [推广有奖]

  • 3关注
  • 6粉丝

副教授

5%

还不是VIP/贵宾

-

威望
1
论坛币
11386 个
通用积分
40.6744
学术水平
7 点
热心指数
9 点
信用等级
1 点
经验
46314 点
帖子
323
精华
0
在线时间
472 小时
注册时间
2010-3-2
最后登录
2024-3-10

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
自数据挖掘专题和Hadoop专题[链接在文末]发布以来,数据挖掘逐渐转入大数据时代,尤以Spark平台All in one的特性备受工业界青睐,于是再发布一个Spark专题,与广大学友交流。

工作繁忙,具体图片和目录就不发了,请各位自行google,相信能学到更多。
PS:目录已补充至楼下
————
SPARK01 Learning Spark
Karau et al. - 2015 - SPARK01 Learning Spark.zip (6.81 MB, 需要: 5 个论坛币) 本附件包括:
  • Karau et al. - 2015 - SPARK01 Learning Spark.pdf


SPARK02 Advanced Analytics with Spark
Ryza et al. - Unknown - SPARK02 Advanced Analytics with Spark.zip (3.62 MB, 需要: 5 个论坛币) 本附件包括:
  • Ryza et al. - Unknown - SPARK02 Advanced Analytics with Spark.pdf


SPARK03 Machine Learning with Spark
Noh - 2014 - SPARK03 Machine Learning with Spark.zip (4.27 MB, 需要: 5 个论坛币) 本附件包括:
  • Noh - 2014 - SPARK03 Machine Learning with Spark.pdf

————

PPS:
——————————————————
所有专题索引:
01.数据挖掘专题:https://bbs.pinggu.org/thread-2161511-1-1.html
02.机器学习专题:https://bbs.pinggu.org/thread-3702096-1-1.html
03.Hadoop大数据平台专题:https://bbs.pinggu.org/thread-2515116-1-1.html
04.Spark大数据平台专题:https://bbs.pinggu.org/thread-3702039-1-1.html



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:大数据挖掘 Spark 数据挖掘 SPAR Park 大数据 数据挖掘 机器学习 Spark 数据科学

已有 1 人评分经验 论坛币 收起 理由
daazx + 20 + 10 精彩帖子

总评分: 经验 + 20  论坛币 + 10   查看全部评分

本帖被以下文库推荐

沙发
chj1983wd 发表于 2015-5-8 11:09:29 |只看作者 |坛友微信交流群
补充个outline吧还是:
Spark01
1. Introduction to Data Analysis with Spark. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2. Downloading Spark and Getting Started. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3. Programming with RDDs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4. Working with Key/Value Pairs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5. Loading and Saving Your Data. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6. Advanced Spark Programming. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
7. Running on a Cluster. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
8. Tuning and Debugging Spark. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141
9. Spark SQL. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
10. Spark Streaming. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183
11. Machine Learning with MLlib. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213


Spark02
1. Analyzing Big Data. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2. Introduction to Data Analysis with Scala and Spark. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3. Recommending Music and the Audioscrobbler data set. . . . . . . . . . . . . . . . . . . . . . . . . . 37
4. Predicting Forest Cover with Decision Trees. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
5. Anomaly Detection in Network Traffic with K-means clustering. . . . . . . . . . . . . . . . . . . 79
6. Understanding Wikipedia with Latent Semantic Analysis. . . . . . . . . . . . . . . . . . . . . . . . . 9
7. Analyzing Co-occurrence Networks with GraphX. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
8. Geospatial and Temporal Data Analysis on the New York City Taxicab Data. . . . . . . . . 145
9. Financial Risk through Monte Carlo Simulation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
10. Analyzing Genomics Data and the BDG Project. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
11. Analyzing Neuroimaging Data with PySpark and Thunder. . . . . . . . . . . . . . . . . . . . . . . 207
12. Appendix: Deeper Into Spark. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
13. Appendix: Upcoming MLlib Pipelines API. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237

Spark03
Chapter 1: Getting Up and Running with Spark  7
Chapter 2: Designing a Machine Learning System  37
Chapter 3: Obtaining, Processing, and Preparing Data with Spark  51
Chapter 4: Building a Recommendation Engine with Spark  83
Chapter 5: Building a Classification Model with Spark  117
Chapter 6: Building a Regression Model with Spark  161
Chapter 7: Building a Clustering Model with Spark  197
Chapter 8: Dimensionality Reduction with Spark  221
Chapter 9: Advanced Text Processing with Spark  247
Chapter 10: Real-time Machine Learning with Spark Streaming  279



使用道具

藤椅
chj1983wd 发表于 2016-5-22 10:53:17 |只看作者 |坛友微信交流群
所有专题索引:
01.数据挖掘专题:https://bbs.pinggu.org/thread-2161511-1-1.html
02.机器学习专题:https://bbs.pinggu.org/thread-3702096-1-1.html
03.Hadoop大数据平台专题:https://bbs.pinggu.org/thread-2515116-1-1.html
04.Spark大数据平台专题:https://bbs.pinggu.org/thread-3702039-1-1.html
05.算法专题(CLRS, DPV, KT, SW 4合1):https://bbs.pinggu.org/thread-4621817-1-1.html

使用道具

板凳
pg423 发表于 2016-6-14 00:10:50 来自手机 |只看作者 |坛友微信交流群
hadoop hive  spark

使用道具

报纸
Jaryqi 发表于 2016-7-15 14:23:18 |只看作者 |坛友微信交流群
谢谢楼主分享

使用道具

地板
happy_886 发表于 2016-7-16 09:17:28 |只看作者 |坛友微信交流群

谢谢楼主分享

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 23:24