楼主: galaxy_mm
1424 0

hadoop 教程_hadoop [推广有奖]

  • 1关注
  • 9粉丝

已卖:24份资源

教授

54%

还不是VIP/贵宾

-

威望
1
论坛币
9830 个
通用积分
19.0592
学术水平
19 点
热心指数
25 点
信用等级
10 点
经验
11177 点
帖子
759
精华
0
在线时间
262 小时
注册时间
2014-8-5
最后登录
2022-11-21

楼主
galaxy_mm 在职认证  企业认证  发表于 2014-8-25 09:03:26 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
好多朋友在寻找有关hadoop的教程,小编在网上搜集了一下。找到了下面的hadoop 教程分享给大家。

       今天浏览了下hadoop的 map/reduce文档,初步感觉这东西太牛逼了,听我在这里给你吹吹。
你可以这样理解,假设你有很多台烂机器(假设1000台)
1.利用hadoop他会帮你组装成一台超级计算机(集群),你的这台计算机是超多核的(很多个CPU),一个超级大的硬盘,而且容错和写入速度都很快。
2.如果你的计算任务可以拆分,那么通过map/Reduce,他可以统一指挥你的那一帮烂机器,让一堆机器帮你一起干活(并行计算),谁干什么,负责什么,他来管理,通常处理个几T的数据,只要你有机器那就小CASE。
3.hadoop要分析的数据通常都是巨大的(T级),网络I/O开销不可忽视,但分析程序通常不会很大,所以他传递的是计算方法(程序),而不是数据文件,所以每次计算在物理上都是在相近的节点上进行(同一台机器或同局域网),大大降低的IO消耗,而且计算程序如果要经常使用的话也是可以做缓存的。
4.hadoop是一个分布式的文件系统,他就像一个管家,管理你数据的存放,在物理上较远的地方会分别存放(这样一是不同的地方读取数据都很快,也起到了异地容灾的作用),他会动态管理和调动你的数据节点,高强的容错处理,最大程度的降低数据丢失的风险。
具体有关Hadoop教程的内容请参考附件内容。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Hadoop Had hadoop教程 reduce 超级计算机 hadoop教程 计算方法 hadoop

已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
aongao + 60 + 20 + 1 + 1 + 1 奖励积极上传好的资料

总评分: 经验 + 60  论坛币 + 20  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-20 11:33