什么是 HA ?
High Available : 高可用
虽然 HDFS 存在多个副本,但 NameNode 可能会出现单节点故障。对于只有一个 NameNode 节点的集群,一旦该节点出现故障,集群将无法使用直至重新启动。
通过开启 HDFS 的 HA 功能,通过在不同节点上设置 Active/Standby 多个 NameNode,当 Active NameNode 出现故障时,可以很快的将 Standby NameNode 切换至 Active 状态。只有 Active NameNode 才能对外提供读写服务。
环境:
- CentOS 7.6.1810 Minimal
- NAT 网络模式(虚拟机)
- JDK 1.8
- Hadoop 3.2.0
- Zookeeper 3.4.13
集群规划(3 台):
主机名 | NameNode | DataNode | ResourceManager | NodeManager | Zookeeper | JournalNode | ZKFC |
---|---|---|---|---|---|---|---|
master | √ | √ | √ | √ | √ | √ | |
master2 | √ | √ | √ | √ | √ | √ | |
slave1 | √ | √ | √ | √ | √ | √ |