Linux下Hadoop故障排查方法如下:
tail -f
或grep
分析HADOOP_HOME/logs
目录下的日志,定位错误信息。jps
命令确认NameNode、DataNode等关键进程是否正常运行。ping
或traceroute
测试节点间连通性,检查防火墙是否开放必要端口(如50070、8088等)。core-site.xml
、hdfs-site.xml
等配置项是否正确,重点关注路径、端口等参数。top
、iostat
、vmstat
等工具监控CPU、内存、磁盘使用情况,排查性能瓶颈。namespaceID
一致性,或删除临时文件重新格式化。/etc/hosts
文件确保主机名解析正确。-Xms
、-Xmx
)或增加节点内存。yarn logs
获取应用日志,或通过ELK、Grafana等工具进行日志聚合与可视化分析。参考来源: