请选择 进入手机版 | 继续访问电脑版
楼主: daka123
659 2

spark讲义 [推广有奖]

  • 0关注
  • 66粉丝

院士

66%

还不是VIP/贵宾

-

威望
0
论坛币
144170 个
通用积分
387.6551
学术水平
41 点
热心指数
55 点
信用等级
42 点
经验
97128 点
帖子
2125
精华
0
在线时间
2318 小时
注册时间
2013-12-4
最后登录
2024-4-12

daka123 学生认证  发表于 2018-6-7 15:44:49 |显示全部楼层 |坛友微信交流群
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
spark动机:
复杂的批量数据处理(batch data processing),通常的时间跨度在数十分钟到数小时之间。
基于历史数据的交互式查询(interactive query),通常的时间跨度在数十秒到数分钟之间。
基于实时数据流的数据处理(streaming data processing),通常的时间跨度在数百毫秒到数秒之间。
spark优点:
Spark是基于内存的迭代计算框架,适用于需要多次操作特定数据集的应用场合。
Spark不适用那种异步细粒度更新状态的应用,例如web服务的存储或者是增量的web爬虫和索引.
Spark的适用面比较广泛且比较通用。

子目录        功能       
Assembly           组装spark项目的地方               
ec2                  提交spark集群到Amazon EC2       
external             与一些外部系统的依赖       
extra             包含了spark默认不构建的组件       
repl             Spark shell功能模块       
tools             工具包       



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:批量数据处理 实时数据流 时间跨度 数据处理 迭代计算

Spark.rar

15.11 MB

需要: RMB 16 元  [购买]

交流学习,欢迎下载

本附件包括:

  • Spark.ppt

koalachen2013 在职认证  发表于 2019-1-26 00:18:49 |显示全部楼层 |坛友微信交流群
too expensive.

使用道具

daka123 学生认证  发表于 2019-1-26 22:49:27 |显示全部楼层 |坛友微信交流群
物超所值

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-18 23:19