问题描述:
搭建好的集群,启动时发现有一台datanode挂掉了,这时检查了一下配置,排除此类原因。最后,想起了如果集群是第一次启动,需要格式化NameNode(注意格式化之前,一定要先停止上次启动的所有namenode和datanode进程,然后再删除data和log数据),恰好挂掉的那台机器就是这个原因,立马删除了data下的数据,同时删除其他两台对应目录下的数据,重新操作,即可解决。
本集群的基本信息如下:
hadoop101 | hadoop103 | hadoop104 | |
HDFS |
NameNode DataNode |
DataNode |
DataNode SecondaryNameNode |
YARN | NodeManager |
ResourceManager NodeManager |
NodeManager |
(PS:挂掉的是hadoop104,jps时没有datanode信息,删除data下的数据即可解决)