datanode启动不起来的各种原因

datanode启动不起来的各种原因

一般在数据节点的log日志信息里能找到导致启动不起来的原因。

1.Namenode和Datanode的NamenodeID不一致

　　　　描述：一般在集群多次重新格式化HDFS之后，或者刚安装时会碰到。日志信息如下：

　　java.io.IOException: Incompatible namespaceIDs in /root/tmp/dfs/data:

　　NameNode namespaceID = 1307672299; DataNode namespaceID = 389959598

解决办法：最直接有效的办法就是修改Datanode上的namenodeID(位于/dfs/data/current/VERSION文件中）或修改NameNode的namespaceID（位于/dfs/name/current/VERSION文件中），使其一致。

2.Datanode突然不堪重负宕掉

　　只需重启坏掉的Datanode或者JobTracker。当集群中的某单个节点出现问题，不必重新重启整个系统，只需重启这个节点，然后会自动连接到整个集群里。

　　在坏死的节点上输入以下命令：

　　　　bin/Hadoop-daemon.sh start DataNode

　　　　bin/Hadoop-daemon.sh start jobtracker

以上方法也可以用于动态加入datanode，允许用户动态将某个节点加入集群中。

　　　　在hadoop集群中，HDFS分布式文件系统和mapreduce计算框架是可以独立部署安装的，在hadoop2中体现很明显，如果只需要使用部分节点进行计算,只需要单独启动resourcemanager和需要使用的结点上的nodemanager即可，查找命令可以参考/hadoop2/sbin/start-yarn.sh中是如何写的就可以找到答案了！在hadoop2/sbin/start-yarn.sh脚本中，写了启动resourcemanager和所有节点上的nodemanager，所以只需要参考该脚本文件，就能得到启动单个节点上的nodemanager的方法：

　　　　hadoop2/sbin/hadoop-daemon.sh startdatanode

　　　　hadoop2/sbin/yarn-daemon.sh nodemanager

然后执行下集群HDFS的负载均衡即可完成动态添加节点了！

　　在hadoop1中

　　　　bin/Hadoop-daemon.sh --config ./conf start DataNode

　　　　bin/Hadoop-daemon.sh --config ./conf start tasktracker
相关阅读:
【机器学习】：Xgboost/LightGBM使用与调参技巧
 Golang map 源码
 Golang slice、array 源码
 Golang string 源码
 Golang sync.Mutex
Golang net/http
Golang GMP模型
 转发：全套支付宝系统架构（含内部架构图），非常好的收藏学习！
付款案例研究
 (转发)Java学习路线
原文地址：https://www.cnblogs.com/kxdblog/p/4034255.html

datanode启动不起来的各种原因

1.Namenode和Datanode的NamenodeID不一致

2.Datanode突然不堪重负宕掉