楼主: daka123
819 2

spark讲义 [推广有奖]

  • 0关注
  • 66粉丝

已卖:7033份资源

院士

67%

还不是VIP/贵宾

-

威望
0
论坛币
145750 个
通用积分
389.5766
学术水平
41 点
热心指数
55 点
信用等级
42 点
经验
97148 点
帖子
2125
精华
0
在线时间
2366 小时
注册时间
2013-12-4
最后登录
2025-12-12

楼主
daka123 学生认证  发表于 2018-6-7 15:44:49 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
spark动机:
复杂的批量数据处理(batch data processing),通常的时间跨度在数十分钟到数小时之间。
基于历史数据的交互式查询(interactive query),通常的时间跨度在数十秒到数分钟之间。
基于实时数据流的数据处理(streaming data processing),通常的时间跨度在数百毫秒到数秒之间。
spark优点:
Spark是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合。
Spark不适用那种异步细粒度更新状态的应用,例如web服务的存储或者是增量的web爬虫和索引.
Spark的适用面比较广泛且比较通用。

子目录        功能       
Assembly           组装spark项目的地方               
ec2                  提交spark集群到Amazon EC2       
external             与一些外部系统的依赖       
extra             包含了spark默认不构建的组件       
repl             Spark shell功能模块       
tools             工具包       



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:批量数据处理 实时数据流 时间跨度 数据处理 迭代计算

Spark.rar
下载链接: https://bbs.pinggu.org/a-2485889.html

15.11 MB

需要: RMB 16 元  [购买]

交流学习,欢迎下载

本附件包括:

  • Spark.ppt

沙发
koalachen2013(未真实交易用户) 在职认证  发表于 2019-1-26 00:18:49
too expensive.

藤椅
daka123(未真实交易用户) 学生认证  发表于 2019-1-26 22:49:27
物超所值

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-12 23:55