发帖

楼主: daka123

659 2

spark讲义 [推广有奖]

0关注
66粉丝

院士

66%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 144170 个
通用积分: 387.6551
学术水平: 41 点
热心指数: 55 点
信用等级: 42 点
经验: 97128 点
帖子: 2125
精华: 0
在线时间: 2318 小时
注册时间: 2013-12-4
最后登录: 2024-4-12

daka123

发表于 2018-6-7 15:44:49 |显示全部楼层 |坛友微信交流群

相似文件

换一批

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

spark动机：
复杂的批量数据处理（batch data processing），通常的时间跨度在数十分钟到数小时之间。
基于历史数据的交互式查询（interactive query），通常的时间跨度在数十秒到数分钟之间。
基于实时数据流的数据处理（streaming data processing），通常的时间跨度在数百毫秒到数秒之间。
spark优点：
Spark是基于内存的迭代计算框架，适用于需要多次操作特定数据集的应用场合。
Spark不适用那种异步细粒度更新状态的应用，例如web服务的存储或者是增量的web爬虫和索引.
Spark的适用面比较广泛且比较通用。

子目录功能
Assembly    组装spark项目的地方
ec2             提交spark集群到Amazon EC2
external       与一些外部系统的依赖
extra       包含了spark默认不构建的组件
repl       Spark shell功能模块
tools       工具包

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

关键词：批量数据处理实时数据流时间跨度数据处理迭代计算

spark讲义 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

本版微信群

spark讲义 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

本版微信群

扫码加我拉你入群