人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › 数据分析与数据挖掘 › 了解Hadoop的狂野世界第二部分：集群

发帖

楼主: 时光永痕

973 0

[数据挖掘新闻] 了解Hadoop的狂野世界第二部分：集群 [推广有奖]

0关注
14粉丝

svip3

学术权威

12%

（VIP/贵宾）八级

17%

威望: 0 级
论坛币: 26 个
通用积分: 57.2238
学术水平: 4 点
热心指数: 4 点
信用等级: 4 点
经验: 34180 点
帖子: 2732
精华: 0
在线时间: 321 小时
注册时间: 2020-7-21
最后登录: 2024-8-1

楼主

时光永痕

发表于 2020-9-7 19:01:22 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

了解Hadoop的狂野世界第二部分：集群
在上一个博客中，我向我们介绍了Hadoop，它使公司可以处理，存储和分析PB级，Exabyte甚至Yottabytes的数据。不仅限于您在电子表格中找到的那种数据，Hadoop还可以处理各种各样的数据（有人会说几乎所有类型的数据）。如承诺的那样，该博客深入探讨了“秘密秘诀”，以探索Hadoop执行其魔术的主要计算原理：集群，读取架构和map + reduce。由于这些都是深入的主题，因此在本博客中，我们将重点介绍群集。
分而治之：四个普通人比一个强壮的肌肉更强大传统的计算是通过“客户端/服务器”模型在一两台计算机上完成的。这意味着一台计算机正在指示其自身的另一部分，或另一台计算机（在大多数情况下称为“服务器”）正在执行某项操作。几十年来，这种模式已经很好地为我们服务（没有双关语）。但是，在拥有数百万全球用户的海量数据集和应用程序的时代，需求通常超出了一台计算机的处理能力。Hadoop通过使用多台计算机完成一项工作来解决此问题。
可以像其他工作一样思考它。如果您需要将钢琴提上楼梯，那么即使是世界上最强壮的肌肉发达的人也都会把他的背部摔下来。但是对于四个或五个常规尺寸的家伙来说，这没问题。计算工作原理几乎相同。Hadoop使用所谓的“集群”范例，该范例使用服务器组（计算机）与单个服务器进行存储，处理和计算。这有多个名称，您可能听说过它称为“分布式计算”或“向外扩展”。借助Hadoop，企业无需“扩大规模”（即将数据移至功能更强大的服务器），而是可以通过简单地将服务器添加到工作中来“横向扩展”。真正有趣的是，使用这种模型，这些服务器（计算机）可以是“商品”，这是一种很好的说法，即它们是正常的，
您可以绕过“名称节点”，也可以绕数据节点。追溯到上一篇文章，它们在Hadoop的核心组件HDFS和YARN的协调下工作（我们将很快转到MapReduce）。“秘密调味料”涉及划分和征服工作，因此每个服务器仅参与部分任务。就像盖房子一样，一个团队可以协同完成各种各样的工作，而不是由一个建造者完成所有工作。每个服务器都被描述为一个“节点”，您可以从一个单节点群集开始并随需添加计算机（从技术上讲，单个节点还不是群集，多个节点组成一个群集，但是没人会喊叫）指的是单节点群集）。
每个集群都有一种“老板”服务器，称为名称节点，用于接收您的请求并协调所有活动，还有一个或多个数据节点，它们根据名称节点提供的指示实际进行工作。继续进行房屋建筑类比，名称节点就像承包商或领班，而数据节点则是各种建筑工人和专家。在传统的“客户端/服务器”模型中，您（客户端）将指导一个构建器。在Hadoop中，您将指导承包商，然后由承包商指导整个工作组。突破计算能力的极限
在集群（而不是一台计算机）上运行程序的能力是Hadoop处理大数据能力的关键，并且Hadoop实际上可以从单个服务器“扩展”到数千台服务器。从本质上讲，这打破了计算能力的界限，并使我们十年前无法梦想的事情得以完成。Facebook的？没有集群就不可能。谷歌？甚至不用考虑在一台计算机上尝试与此类似的任何事情。
为什么不对所有内容都使用Hadoop？专家很快指出，Hadoop确实牺牲了一些效率来支持大规模可伸缩性，并且在处理小规模数据时可能会出现问题。但是，情况变化很快，几年后，谁知道呢？Hadoop对于小型数据集也可能是可行的解决方案，但是现在我们必须拭目以待。
那么所有这些东西如何完成呢？四，五甚至一千台计算机如何一起工作来完成一项工作？他们使用MapReduce和阅读模式进行操作，我们将在我的下一个博客中讨论它-敬请期待！

关注 CDA 人工智能学院，回复“录播”获取更多人工智能精选直播视频！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏0 回帖

关键词：Hadoop 世界第二 Had MapReduce FACEBOOK

[url=https://edu.cda.cn/page/110]https://bbs.pinggu.org/https://bbs.pinggu.org/https://bbs-pic.datacourse.cn/album/202206/01/135703zley18vue50izh55.png[/url]

返回列表

发帖

本版微信群

加好友,备注cda
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[数据挖掘新闻] 了解Hadoop的狂野世界第二部分：集群 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

浏览过的帖子

浏览过的版块

本版微信群

[数据挖掘新闻] 了解Hadoop的狂野世界第二部分：集群 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群