楼主: 我的素质低
1982 2

[Hadoop] 〖摘·hadoop〗hadoop——架构与安装(一) [推广有奖]

学术权威

83%

还不是VIP/贵宾

-

TA的文库  其他...

〖素质文库〗

结构方程模型

考研资料库

威望
8
论坛币
23388 个
通用积分
28302.4104
学术水平
2705 点
热心指数
2881 点
信用等级
2398 点
经验
223743 点
帖子
2977
精华
52
在线时间
2175 小时
注册时间
2012-11-24
最后登录
2024-1-13

一级伯乐勋章 初级学术勋章 初级热心勋章 初级信用勋章 中级热心勋章 中级学术勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章 特级学术勋章

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

hadoop框架


    Hadoop使用主/从(Master/Slave)架构,主要角色有NameNode,DataNode,secondary NameNode,JobTracker,TaskTracker组成。


    其中NameNode,secondary NameNode,JobTracker运行在Master节点上,DataNode和TaskTracker运行在Slave节点上。


1,NameNode




    NameNode是HDFS的守护程序,负责记录文件是如何分割成数据块的,以及这些数据块被存储到哪些数据节点上。它的功能是对内存及I/O进行集中管理。



2,DataNode




    集群中每个从服务器都运行一个DataNode后台程序,后台程序负责把HDFS数据块读写到本地文件系统。需要读写数据时,由NameNode告诉客户端去哪个DataNode进行具体的读写操作。


3,Secondary NameNode




      Secondary NameNode是一个用来监控HDFS状态的辅助后台程序,如果NameNode发生问题,可以使用Secondary NameNode作为备用的NameNode。


4,JobTracker




JobTracker后台程序用来连接应用程序与Hadoop,用户应用提交到集群后,由JobTracker决定哪个文件处理哪个task执行,一旦某个task失败,JobTracker会自动开启这个task。

4,TaskTracker

TaskTracker负责存储数据的DataNode相结合,位于从节点,负责各自的task。


hadoop的安装




1)安装SSH

sudo apt-get install ssh


2)安装java


3)安装hadoop

下载并解压缩

tar -zxvf hadoop-0.21.0.tar.gz


4)改变配置

指定java安装路径

使用vi

vi conf/hadoop-env.sh

添加

export JAVA_HOME = /usr/java/jdk1.7.0_01

可以使用三种模式安装,测试阶段可以使用单机模式。

在启动的时候可能会遇到很多问题,比如 22 connection refused

可以安装openssh,使用apt-get

sudo apt-get install openssh-client

sudo apt-get install openssh-server

sudo apt-get install chkconfig

使用chkconfig --list | grep sshd查看服务是否启动



使用ssh localhost


出现如下提示


输入密码后

出现欢迎页面,配置成功



免密码登录


ssh-keygen -t rsa



进入.ssh目录


执行


cp id_rsa.pub authorized_keys


重新ssh localhost,可以不输入密码




单机伪分布式:


进入目录/hadoop/conf


编辑 ~/hadoop/conf/core-site.xml

<configuration>

  <property>

    <name>fs.default.name</name>

    <value>hdfs://localhost:9000</value>

  </property>

  <property>

    <name>hadoop.tmp.dir</name>

    <value>/tmp/hadoop/hadoop-${user.name}</value>

  </property>

</configuration>


编辑 ~/hadoop/conf/hdfs-site.xml

<configuration>

  <property>

    <name>dfs.replication</name>

    <value>1</value>

  </property>

</configuration>


编辑 ~/hadoop/conf/mapred-site.xml

<configuration>

  <property>

    <name>mapred.job.tracker</name>

    <value>localhost:9001</value>

  </property>

</configuration>


然后进入hadoop/bin目录


执行 ./hadoop namenode -format


执行start-all.sh


启动完成


打开浏览器,输入http://localhost:50030


就可以看到如下界面



运行示例 bin/hadoop jar hadoop-mapred-examples-0.21.0.jar wordcount in out


得到输出结果,配置成功!


安装eclipse插件




插件的路径在0.21下有所更改,路径如下

将插件拷到eclipse pluglin目录下


重启eclipse


启动后多出一个目录


就可以使用eclipse进行编程了。


(来源:小象学院~)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Hadoop Had Replication connection localhost 服务器 程序 记录 角色 如何

已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
niuniuyiwan + 100 + 100 + 5 + 5 + 5 精彩帖子
daazx + 3 + 3 精彩帖子

总评分: 经验 + 100  论坛币 + 100  学术水平 + 8  热心指数 + 8  信用等级 + 5   查看全部评分

本帖被以下文库推荐

心晴的时候,雨也是晴;心雨的时候,晴也是雨!
扣扣:407117636,欢迎一块儿吐槽!!
沙发
olympic 发表于 2015-3-16 22:53:54 |只看作者 |坛友微信交流群
在板块看标题有"移动:.......",还以为关于中国移动的
已有 1 人评分学术水平 热心指数 收起 理由
我的素质低 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1   查看全部评分

使用道具

藤椅
我的素质低 学生认证  发表于 2015-3-17 20:11:02 |只看作者 |坛友微信交流群
olympic 发表于 2015-3-16 22:53
在板块看标题有"移动:.......",还以为关于中国移动的
哈哈,不是,是本来在Hadoop版块,后来移动了,但“保留原先痕迹”  

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 18:27