Apache Hadoop 2.9.2 的HDFS High Available模式部署
Apache Hadoop 2.9.2 的HDFS High Available 模式部署 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 我们知道,当NameNode进程挂掉后,可以通过SecondName进行补救,我们可以快速进行恢复操作。但是其效率极低,可能等你启动集群成功后,半小时就过去了,会严重影响业务!这个时候我们就需要对NameNode做高可用。我们可以通过双NameNode消除单点故障。 一.HA概述 1>.所谓High Available,简称HA,即高可用(7*24小时不中断服务)。 2>.实现高可用最关键对策略是消除单点故障。HA严格来说应该分成各个组建对HA机制:HDFS对HA和YARN的HA。 3>.Hadoop2.0版本之前,在HDFS集群中NameNode存在单点故障(SPOF) 4>.NameNode主要在以下两个方面影响HDFS集群: 第一:NameNode机器发生意外,如宕机,集群将无法使用,知道管理员重启。 第二:NameNode机器需要升级,包括软件,硬件升级,此时集群也将无法使用。 HDFS HA功能通过配置Active