人大经济论坛 › 论坛 › 数据科学与人工智能 › 大数据分析 › Hadoop论坛 › hadoop 教程_hadoop

发帖

楼主: galaxy_mm

1466 0

hadoop 教程_hadoop [推广有奖]

1关注
9粉丝

已卖：24份资源

教授

54%

还不是VIP/贵宾

威望: 1 级
论坛币: 9830 个
通用积分: 19.0592
学术水平: 19 点
热心指数: 25 点
信用等级: 10 点
经验: 11177 点
帖子: 759
精华: 0
在线时间: 262 小时
注册时间: 2014-8-5
最后登录: 2022-11-21

楼主

galaxy_mm

发表于 2014-8-25 09:03:26 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

好多朋友在寻找有关hadoop的教程，小编在网上搜集了一下。找到了下面的hadoop 教程分享给大家。

今天浏览了下hadoop的 map/reduce文档，初步感觉这东西太牛逼了，听我在这里给你吹吹。
你可以这样理解，假设你有很多台烂机器（假设1000台）
1.利用hadoop他会帮你组装成一台超级计算机（集群），你的这台计算机是超多核的（很多个CPU），一个超级大的硬盘，而且容错和写入速度都很快。
2.如果你的计算任务可以拆分，那么通过map/Reduce,他可以统一指挥你的那一帮烂机器，让一堆机器帮你一起干活（并行计算），谁干什么，负责什么，他来管理，通常处理个几T的数据，只要你有机器那就小CASE。
3.hadoop要分析的数据通常都是巨大的(T级)，网络I/O开销不可忽视，但分析程序通常不会很大，所以他传递的是计算方法（程序），而不是数据文件，所以每次计算在物理上都是在相近的节点上进行（同一台机器或同局域网），大大降低的IO消耗，而且计算程序如果要经常使用的话也是可以做缓存的。
4.hadoop是一个分布式的文件系统，他就像一个管家，管理你数据的存放，在物理上较远的地方会分别存放（这样一是不同的地方读取数据都很快，也起到了异地容灾的作用），他会动态管理和调动你的数据节点，高强的容错处理，最大程度的降低数据丢失的风险。
具体有关Hadoop教程的内容请参考附件内容。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：Hadoop Had hadoop教程 reduce 超级计算机 hadoop教程计算方法 hadoop

Hadoop_MapReduce教程.doc
下载链接: https://bbs.pinggu.org/a-1618132.html

345 KB

Hadoop教程

hadoop 教程_hadoop [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

hadoop 教程_hadoop [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群