Hadoop记录-Federation联邦机制
在Hadoop2.0之前,HDFS的单NameNode设计带来诸多问题: 单点故障、内存受限,制约集群扩展性和缺乏隔离机制(不同业务使用同一个NameNode导致业务相互影响)等 为了解决这些问题,除了用基于共享存储的HA解决方案我们还可以用HDFS的Federation机制来解决这个问题。 【单机namenode的瓶颈大约是在4000台集群,而后则需要使用联邦机制】 什么是Federation机制 Federation是指HDFS集群可使用多个独立的NameSpace(NameNode节点管理)来满足HDFS命名空间的水平扩展 这些NameNode分别管理一部分数据,且共享所有DataNode的存储资源。 NameSpace之间在逻辑上是完全相互独立的(即任意两个NameSpace可以有完全相同的文件名)。在物理上可以完全独立(每个NameNode节点管理不同的DataNode)也可以有联系(共享存储节点DataNode)。一个NameNode节点只能管理一个Namespace Federation机制解决单NameNode存在的以下几个问题 (1)HDFS集群扩展性。每个NameNode分管一部分namespace,相当于namenode是一个分布式的。 (2)性能更高效。多个NameNode同时对外提供服务,提供更高的读写吞吐率。 (3)良好的隔离性