Hadoop学习笔记和总结(七)
目录 第七章 HDFS的四个机制与两个核心功能 7.1 HDFS 机制 7.1.1 心跳机制 7.1.2 安全模式 7.1.3 机架策略 7.1.4 负载均衡 7.2 HDFS文件上传流程 7.3 HDFS文件下载流程 第七章 HDFS的四个机制与两个核心功能 HDFS提供的是高容错性的分布式数据存储方案,其包括 四个主要的机制 :(1) 心跳机制 (2) 安全模式 (3) 机架策略 (4) 负载均衡 ;并作为一个文件系统 两大核心功能 包括:(1) 文件上传 (2) 文件下载 (3) 元数据的管理 当Hadoop集群启动时,各个进程启动的顺序如下: NameNode --> DataNode --> SecondaryNameNode 7.1 HDFS 机制 HDFS机制中需要重点掌握心跳机制、安全模式和机架策略并理解负载均衡。 7.1.1 心跳机制 集群节点必须做时间同步。 NameNode是集群的Boss,负责集群中任务的分工。如果要进行分工,则必须知道各个DataNode的存活状况。NameNode是如何知道各DataNode的存活状态的呢? 利用心跳机制,即:DataNode定期向NameNode发送心跳报告所确定的。 具体实现: DataNode会每隔3秒(默认)向NameNode发送一次心跳报告,目的是告诉NameNode自己的存活状况。 可以通过修改 hdfs