Oozie 入门
1 Oozie 简介 一个基于工作流引擎的开源框架,提供对 Hadoop MapReduce、Pig Jobs 的任务调度与协调,主要用于定时调度任务,多任务可以按照执行的逻辑顺序调度。 2 功能模块 2.1 模块 1、Workflow 顺序执行流程节点,支持 fork(分支多个节点),join(合并多个节点为一个) 2、Coordinator 定时触发 workflow 3、Bundle 绑定多个 Coordinator 2.2 常用节点 控制流节点(Control Flow Nodes**)** 控制流节点一般都是定义在工作流开始或者结束的位置,比如start,end,kill 等,以及提供工作流的执行路径机制,如decision,fork,join 等。 动作节点(Action Nodes**)** 负责执行具体动作的节点,比如:拷贝文件,执行某个 Shell 脚本等等 3 安装部署 3.1 Hadoop 配置 core-site.xml <configuration> <!-- 指定HDFS中NameNode的地址 --> <property> <name>fs.defaultFS</name> <value>hdfs://hadoop101:8020</value> </property> <!-- 指定Hadoop运行时产生文件的存储目录 --> <property>