楼主: zw201488
1175 1

Hadoop基本介绍 [推广有奖]

  • 0关注
  • 1粉丝

本科生

51%

还不是VIP/贵宾

-

威望
0
论坛币
92 个
通用积分
2.1712
学术水平
4 点
热心指数
15 点
信用等级
4 点
经验
1112 点
帖子
55
精华
0
在线时间
56 小时
注册时间
2014-5-22
最后登录
2015-1-5

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

一、Hadoop是什么?

答:是google的核心算法MapReduce的一个开源实现。用于海量数据的并行处理。

HDFS是分布式文件系统,用于分布式存储海量数据。
MapReduce是分布式数据处理模型,本质是并行处理。
hadoop中核心主要包含:HDFS和MapReduce 。

二、多少数据算海量数据?

答:个人认为,TB(1024GB)级别往上就可以算海量数据。

三、谁在使用hadoop?

在国内,包括中国移动、百度、网易、淘宝、腾讯、金山和华为等众多公司都在研究和使用它 ,使用空间比较大,更多资料可以学习   https://bbs.pinggu.org

四、用它来做什么?

1、最简单的,做个数据备份/文件归档的地方,这利用了hadoop海量数据的存储能力
2、数据仓库/数据挖掘:分析web日志,分析用户的行为(如:用户使用搜索时,在搜索结果中点击第2页的概率有多大)
3、搜索引擎:设计hadoop的初衷,就是为了快速建立索引。
4、云计算:据说,中国移动的大云,就是基于hadoop的
5、研究:hadoop的本质就是分布式计算,又是开源的。有很多思想值得借鉴。

你可以把hadoop看成是:分布式计算框架(或系统、或平台),可以说是用来做云计算的,(云计算的本质就是:海量数据存储/并行处理,即hadoop中的HDFS和MapReduc。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Hadoop Had MapReduce hadoop是什么 reduce 中国移动 搜索引擎 google 云计算 搜索结果

已有 1 人评分经验 学术水平 热心指数 信用等级 收起 理由
aongao + 10 + 1 + 1 + 1 对论坛有贡献

总评分: 经验 + 10  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

沙发
littlelianglian 发表于 2014-6-10 10:36:20 |只看作者 |坛友微信交流群
顶一下~~

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-24 06:03