Hadoop资源管理器-YARN
Hadoop1.0 创建job,获取jobID。 检查作业的输出说明并计算作业的输入分片,然后将运行作业所需要的资源都复制 到以作业ID命名的目录下。 提交作业,告知jobtracker作业准备执行。(submitJob()方法) 初始化作业。创建一个表示正在运行作业的对象,用来封装任务和记录信息。 获取客户端计算好的输入分片,然后为每 个分片创建一个map任务。在此步骤的时候 还会创建reduce任务、作业创建任务、作业 清理任务。 taskTraker发送心跳给JobTraker。 从共享文件系统把作业的JAR文件复制到tasktracker所在的文件系统。 tasktracker创建一个TaskRunner实例。 启动一个新的JVM来运行map/reduce任务。 缺点 **扩展性差:**在 MRv1 中,JobTracker 同时兼备 了资源管理和作业控制两个功能,这成为系统的 一个最大瓶颈,严重制约了 Hadoop 集群扩展性。 可靠性差 :MRv1采用了master/slave结构,其中 master存在单点故障问题,一旦它出现故障将导 致整个集群不可用。 资源利用率低 :MRv1采用了基于槽位的资源分配 模型,槽位是一种粗粒度的资源划分单位,通常 一个任务不会用完槽位对应的资源,其他任务也 无法使用这些空闲资源。此外,Hadoop将槽位分 为Map