楼主: tanxinwei
4773 7

Hadoop到底是什么玩意?通俗解释Hadoop [推广有奖]

  • 3关注
  • 7粉丝

博士生

44%

还不是VIP/贵宾

-

威望
0
论坛币
-16130 个
通用积分
1.0000
学术水平
18 点
热心指数
19 点
信用等级
12 点
经验
5631 点
帖子
132
精华
0
在线时间
246 小时
注册时间
2012-11-28
最后登录
2018-12-7

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

Hadoop到底是什么玩意?通俗解释Hadoop

Hadoop是大数据时代大家经常听到的一个词,但是Hadoop到底是个什么玩意儿?可能很多人并不清楚这个问题。本文就是通过一些重点的东西来比较通俗的向大家解释Hadoop。

大数据在这个时代是个铺天盖地的词,而谈论大数据又不可避免地要提到Hadoop,遗憾的是今天大多数大数据鼓吹者,甚至专业人士其实并不能说清楚Hadoop到底是什么玩意,以及有何功用,而他们的管理层小白听众更是一头雾水。

众所周知,Hadoop是Apache软件基金会管理的开源软件平台,但Hadoop到底是什么呢?简单来说,Hadoop是在分布式服务器集群上存储海量数据并运行分布式分析应用的一种方法。

Hadoop被设计成一种非常“鲁棒”的系统,即使某台服务器甚至集群宕机了,运行其上的大数据分析应用也不会中断。此外Hadoop的效率也很高,因为它并不需要你在网络间来回捣腾数据。

以下是Apache的正式定义:

Apache Hadoop软件库是一个框架,允许在集群服务器上使用简单的编程模型对大数据集进行分布式处理。Hadoop被设计成能够从单台服务器扩展到数以千计的服务器,每台服务器都有本地的计算和存储资源。Hadoop的高可用性并不依赖硬件,其代码库自身就能在应用层侦测并处理硬件故障,因此能基于服务器集群提供高可用性的服务。

如果更深入地分析,我们发现Hadoop还有更加精彩的特性。首先,Hadoop几乎完全是模块化的,这意味着你们能用其他软件工具抽换掉Hadoop的模块。这使得Hadoop的架构异常灵活,同时又不牺牲其可靠性和高效率。

Hadoop分布式文件系统(HDFS)

如果提起Hadoop你的大脑一片空白,那么请牢记住这一点:Hadoop有两个主要部分:一个数据处理框架和一个分布式数据存储文件系统(HDFS)。

HDFS就像Hadoop系统的篮子,你把数据整整齐齐码放在里面等待数据分析大厨出手变成性感的大餐端到CEO的桌面上。当然,你可以在Hadoop进行数据分析,也可以见gHadoop中的数据“抽取转换加载”到其他的工具中进行分析。

数据处理框架和MapReduce

顾名思义,数据处理框架是处理数据的工具。具体来说Hadoop的数据处理框架是基于Jave的系统——MapReduce,你听到MapReduce的次数会比HDFS还要多,这是因为:

1.MapReduce是真正完成数据处理任务的工具

2.MapReduce往往会把它的用户逼疯

在常规意义上的关系型数据库中,数据通过SQL(结构化查询语言)被找到并分析,非关系型数据库也使用查询语句,只是不局限于SQL而已,于是有了一个新名词NoSQL。

有一点容易搞混的是,Hadoop并不是一个真正意义上的数据库:它能存储和抽取数据,但并没有查询语言介入。Hadoop更多是一个数据仓库系统,所以需要MapReduce这样的系统来进行真正的数据处理。

MapRduce运行一系列任务,其中每项任务都是单独的Java应用,能够访问数据并抽取有用信息。使用MapReduce而不是查询语言让Hadoop数据分析的功能更加强大和灵活,但同时也导致技术复杂性大幅增加。

目前有很多工具能够让Hadoop更容易使用,例如Hive,可以将查询语句转换成MapReduce任务。但是MapReduce的复杂性和局限性(单任务批处理)使得Hadoop在更多情况下都被作为数据仓库使用而非数据分析工具。参考阅读:Hadoop只是穷人的ETL。

Hadoop的另外一个独特之处是:所有的功能都是分布式的,而不是传统数据库的集中式系统。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Hadoop Had MapReduce reduce apache Hadoop 大数据 统计 Apache

已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
daazx + 1 + 1 + 1 精彩帖子
Nicolle + 24 精彩帖子

总评分: 论坛币 + 24  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

本帖被以下文库推荐

沙发
aongao 发表于 2014-6-16 10:21:16 |只看作者 |坛友微信交流群
建议下次发帖时对文章段落稍加调整,更有利于大家阅读

使用道具

藤椅
Nicolle 学生认证  发表于 2014-7-31 03:30:57 |只看作者 |坛友微信交流群
提示: 作者被禁止或删除 内容自动屏蔽

使用道具

板凳
verayuan 发表于 2014-8-2 02:52:41 |只看作者 |坛友微信交流群
赞一个吧。。

使用道具

报纸
泪伤隐约 发表于 2014-8-18 15:46:41 |只看作者 |坛友微信交流群
楼主的阐述通俗易懂,不拽文,不歧视新人!楼主好人!

使用道具

地板
gxnnhgm66 发表于 2014-8-22 22:04:54 |只看作者 |坛友微信交流群
好,学习了!

使用道具

7
breezeintopl 发表于 2014-9-7 00:06:43 |只看作者 |坛友微信交流群
感谢楼主

使用道具

8
口玉生烟 学生认证  发表于 2014-11-30 09:36:07 |只看作者 |坛友微信交流群
感谢,学习了

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 21:32