问题一、NameNode进程退出
我们发现,NameNode
进程不存在。
情况1、单独启动NameNode
hdfs --daemon start namenode
能够正常拉起,那就没问题
情况2、无法独立启动NameNode
先尝试启动NameNode
hdfs --daemon start namenode
发现,没能成功启动
查看日志文件
tail -n 100 hadoop-atguigu-namenode-hadoop102.log
从报错信息看,是NameNode
没有格式化。
但是,我们是格式化后,才启动的集群。
具体是文件没找到:/opt/module/hadoop-3.1.3/data/dfs/name/in_use.lock
我们去改目录查看下情况
说明,可能NameNode
的数据被误删了。
解决
从2nn节点
上,拷贝元数据到相应目录即可。
我们,知道2nn和nn
差别就在于少了一个progress
文件。
进入2nn元数据
目录
cd /opt/module/hadoop-3.1.3/data/dfs/namesecondary
拷贝数据
scp -r atguigu@hadoop104:/opt/module/hadoop-3.1.3/data/dfs/namesecondary/* /opt/module/hadoop-3.1.3/data/dfs/name
再次启动NameNode
进程
测试删除
显示进群处于安全模式
退出安全模式
hdfs dfsadmin -safemode forceExit
就可以正常使用了。
本站资源均来自互联网,仅供研究学习,禁止违法使用和商用,产生法律纠纷本站概不负责!如果侵犯了您的权益请与我们联系!
转载请注明出处: 免费源码网-免费的源码资源网站 » Hadoop3:HDFS-查看logs文件,排查NameNode故障原因。
发表评论 取消回复