大数据
Yarn 主要内容 Yarn 是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的 操作系统平台 ,而 MapReduce 等运算程序则相当于运行于 操作系统之上的应用程序 。 ① Yarn的基本结构 Resource Manager : 整个节点的老大 Node Manager : 单个节点的老大 Application Master : 节点上单个job的老大 Container: 一个容器,job运行需要的资源都封装在容器中 ② Yarn工作机制 / job提交过程 具体流程: 1 将MR程序提交到客户端所在的节点,客户端向RM申请一个application; 2 RM将应用程序的资源路径返还给客户端; 3 客户端将程序运行所需资源提交到HDFS上; 4 客户端将 程序资源提交完毕后,向RM申请运行 mrAppMaster ; 5 RM 将用户的请求初始化成一个 Task 任务,并将任务放到任务队列中; 6 其中一个NodeManager去任务队列领取Task任务; 7 领取完任务后,该 NodeManager 创建容器 Container ,并产生 MRAppmaster ; 8 Container 从 HDFS 上拷贝资源到本地; 9 MRAppmaster 向 RM 申请运行 MapTask 容器; 10 RM将运行MapTask任务并分配给另外两