通过Zookeeper管理Linux集群的核心步骤如下:
/etc/hosts
中配置节点IP与主机名映射。/usr/local/zookeeper
)。zoo.cfg
:设置dataDir
(数据目录)、clientPort
(客户端端口)、initLimit
(初始化同步超时)、syncLimit
(同步超时),并添加集群节点信息(server.X=主机:端口1:端口2
,X为节点ID)。myid
文件:在dataDir
下创建文件,写入节点唯一ID(与server.X
中的X一致)。./zkServer.sh start
,通过./zkServer.sh status
查看状态(需至少3个节点形成集群)。zkCli.sh
连接集群(如./zkCli.sh -server node1:2181
),执行ls
、get
、set
、delete
等命令管理节点数据。stat
命令查看节点状态,ruok
命令检查服务是否正常。reconfig
命令动态增减节点,无需重启集群(需先配置权限)。zkServer.sh
的mntr
命令或Prometheus+Grafana监控集群状态(如节点健康、延迟、吞吐量)。dataDir
)排查异常。dataDir
数据,利用快照(Snapshot)和事务日志恢复数据。tickTime
(心跳间隔)、syncLimit
等参数适应集群规模。reconfig
修正节点配置,或通过zkCli.sh
手动调整。参考来源: