温馨提示×

Ubuntu Hadoop 日志查看技巧

小樊
45
2025-08-15 23:51:20
栏目: 智能运维

一、日志文件位置

Hadoop日志默认存放在$HADOOP_HOME/logs目录下,常见文件包括:

  • NameNode/ DataNodehadoop-hdfs-namenode-<hostname>.loghadoop-hdfs-datanode-<hostname>.log
  • ResourceManager/ NodeManageryarn-hadoop-resourcemanager-<hostname>.logyarn-hadoop-nodemanager-<hostname>.log
  • 作业日志:通过YARN的jobhistory服务查看,路径可在yarn-site.xml中配置

二、常用查看命令

命令 用途 示例
tail -f 实时查看日志末尾内容,适合监控实时日志 tail -f hadoop-hdfs-namenode-*.log
head -n 查看日志前N行,快速定位头部信息 head -n 50 hadoop-hdfs-datanode-*.log
grep 搜索特定关键词(如错误信息),支持正则表达式 grep "ERROR" hadoop-*.log
grep -i "exception" yarn-*.log
less/ more 分页查看大日志文件,支持上下翻页、搜索 less hadoop-*.log
more /var/log/syslog
cat 查看完整日志文件(仅适合小文件,大文件可能导致终端卡顿) cat hadoop-hdfs-namenode-*.log
awk/sed 高级文本处理,如提取特定字段、统计行数 awk '{print $1, $3}' hadoop-*.log
sed -n '100,200p' yarn-*.log

三、工具推荐

  • Hadoop Web界面:通过http://<主机>:8088http://<主机>:50070访问,查看作业日志和集群状态。
  • 集中式日志工具:如ELK Stack(Elasticsearch+Logstash+Kibana),适合大规模集群日志的存储、分析和可视化。

四、注意事项

  • 日志文件可能按日期轮转(如yarn-*.log.20250815),需注意路径中的日期格式。
  • 生产环境中建议关闭敏感信息的日志输出,或通过权限控制限制日志访问。

0