楼主: tanxinwei
2946 0

H​a​d​o​o​p​维​护​管​理 [推广有奖]

  • 3关注
  • 7粉丝

博士生

44%

还不是VIP/贵宾

-

威望
0
论坛币
-16130 个
通用积分
1.0000
学术水平
18 点
热心指数
19 点
信用等级
12 点
经验
5631 点
帖子
132
精华
0
在线时间
246 小时
注册时间
2012-11-28
最后登录
2018-12-7

楼主
tanxinwei 发表于 2014-5-28 13:41:11 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

H​a​d​o​o​p​维​护​管​理

Hadoop日常维护管理:

1.处理hadoop的datanode宕机

cd path/to/hadoop

走到hadoop的bin目录

./hadoop-daemon.sh start datanode  

./hadoop-daemon.sh start tasktracker  

2.处理hadoop的namenode宕机

./hadoop-daemon.sh start namenode

./hadoop-daemon.sh start tasktracker

3.如果是新添加一个节点,需要执行以下步骤:

首先,把新节点的 IP或主机名 加入主节点(master)的 conf/slaves 文件。  然后登录新的从节点,执行以下命令:

$ cd path/to/hadoop  

$ bin/hadoop-daemon.sh start datanode  

$ bin/hadoop-daemon.sh start tasktracker   

然后就可以在master机器上运行balancer,执行负载均衡  

$bin/hadoop  balancer

4.处理hbase的regionserver宕机的办法

./hbase-daemon.sh start regionserver

./hbase-deamon.sh start zookeeper//

只针对有zookeeper的regionserver而且是机子需要重启的情况

5.处理hbase的master宕机的办法

./hbase-daemon.sh start master

./hbase-daemon.sh start zookeeper//

可选

6.完全重启整个集群的过程 ,首先是用root权限关闭所有节点的防火墙,/etc/init.d/iptables stop ,然后启动hadoop集群 来到hadoop的安装路径执行:./start-all.sh ,待到集群全部成功启动之后两分钟之后执行关闭hadoop文件系统的安全模式,

./hadoop dfsadmin -safemode leave

对于hadoop文件系统安全模式的解释,如下

NameNode

在启动的时候首先进入安全模式,如果datanode丢失的block达到一定的比例

(1- dfs.safemode.threshold.pct),则系统会一直处于安全模式状态即只读状态。

dfs.safemode.threshold.pct

(缺省值0.999f)表示HDFS启动的时候,如果DataNode上报的block个数达到了 元数据记录的block个数的0.999倍才可以离开安全模式,否则一直是这种只读模式。如果设为1则HDFS永远是处于SafeMode。

有两个方法离开这种安全模式

(1)修改dfs.safemode.threshold.pct为一个比较小的值,缺省是0.999。

(2)hadoop dfsadmin -safemode leave命令强制离开 用户可以通过dfsadmin -safemode $value来操作安全模式,参数$value的说明如下:enter – 进入安全模式 leave


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:ZooKeeper Threshold regions tracker balance Hadoop 维护 管理 日常维护

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-9 03:28