在Linux上扩展Hadoop存储主要有以下两种方式:
core-site.xml、hdfs-site.xml)与集群现有节点一致。hadoop-daemon.sh start datanode启动DataNode服务。hdfs dfsadmin -report或NameNode Web界面(http://namenode:50070)确认新节点已加入集群。mkfs.ext4 /dev/sdb1(根据实际设备名调整)。mkdir /data/hadoop。mount /dev/sdb1 /data/hadoop,并编辑/etc/fstab实现开机自动挂载。hdfs-site.xml中添加新存储路径:<property> <name>dfs.datanode.data.dir</name> <value>/data/hadoop,/path/to/existing/data</value> <!-- 多个路径用逗号分隔 --> </property> 使用hdfs balancer命令重新分配数据块,避免存储不均。
注意事项:
参考来源: