HDFS-HA高可用工作机制
1.HDFS-HA概述 1)所谓HA(high available),即高可用(7*24小时不中断服务)。 2)实现高可用最关键的策略是 消除单点故障 。HA严格来说应该分成各个组件的HA机制: HDFS的HA 和Y ARN的HA 。 3)Hadoop2.0之前,在HDFS集群中NameNode存在单点故障(SPOF)。 4)NameNode主要在以下两个方面影响HDFS集群 NameNode机器发生意外,如宕机,集群将无法使用,直到管理员重启 NameNode机器需要升级,包括软件、硬件升级,此时集群也将无法使用 HDFS HA功能通过配置 Active/Standby两个nameNodes 实现在集群中 对NameNode的热备 来解决上述问题 。如果出现故障,如机器崩溃或机器需要升级维护,这时可通过此种方式将NameNode很快的切换到另外一台机器。 (通过双namenode消除单点故障) 2.HDFS-HA工作机制 2.1 HDFS-HA工作要点 1) 元数据管理 方式需要改变: 内存中各自保存一份元数据; Edits日志只有Active状态的namenode节点可以做写操作; 两个namenode都可以读取edits; 共享的edits放在一个共享存储中管理(qjournal和NFS两个主流实现); 2)需要一个 状态管理功能模块 (zkfailover)