Storm 关注的是数据多次处理一次写入,而 hadoop 关注的是数据一次写入,多次查询使用。Storm系统运行起来后是持续不断的,而 hadoop往往只是在业务需要时调用数据。
一、Storm介绍
二、Storm环境配置
三、Storm程序流程
四、Storm总结及问题
随着互联网的更进一步发展,信息浏览、搜索、关系交互传递型,以及电子商务、互联网旅游生活产品等将生活中的流通环节在线化。对于实时性的要求进一步提升,而信息的交互和沟通正在从点对点往信息链甚至信息网的方向发展,这样必然带来数据在各个维度的交叉关联,数据爆炸已不可避免。因此流式处理和NoSQL产品应运而生,分别解决实时框架和数据大规模存储计算的问题。
流式处理可以用于3种不同场景: 事件流、持续计算以及分布式RPC。