分布式流数据实时与持续计算
强琦
hic2011 2011.12.3
提纲
背景
目标
传统方案与业界进展
设计理念(重点)
技术架构
要点
例子
系统边界
计划
背景
应用背景
– 数据量急剧增加
– Web 1.0 web 2.0, publicego net
– 电子商务、移动互联网、移动支付
– 欺诈、风控对海量交易实时性
– 用户体验的个性化和实时性
– 由点到面
实时搜索、个人实时信息服务、SNS等
背景
技术背景
– MapReduce、Dryad等全量/增量计算平台
– S4、Storm等流计算框架
– CEP以及EDA模型
– Pregel等图计算模型
传统方案与业界进展
传统方案
– MAPREDUCE:HDFS加载,存储LOCALITY(容错性),
顺序IO,存储HDFS, 单输入,单输出
独立数据Di Late ...


雷达卡


京公网安备 11010802022788号







