6.5 hadoop集群运行
1.1 集群运行 1.1.1 集群运行步骤 (1)打包 打作业jar包发送给集群,hadoop通过搜索驱动程序的类路径(驱动程序中通过setJarByClass设置)自动查找作业的的jar文件,打包命令: mvn package –DskipTests //–DskipTests 跳过测试的意思 (2)设置路径 作业jar包路径,依赖库路径,HADOOP_CLASS定义的类路径。 (3)启动作业 hadoop jar hadoop-examples.jar v2.MaxTempertureDrive –conf conf/Hadoop-cluster.xml -jt local input/ncdc/all output 1.1.2 作业ID任务ID和任务尝试ID 作业ID由资源管理器创建的YARN的应用ID生成。Application_14112131314234_0003,资源管理器开始时间戳,0003是资源管理器自动分配的增量ID,下一个应用就是0004。将application替换为job,即为作业ID:job_14112131314234_0003。任务属于作业,任务ID: task_14112131314234_0003_m_000004表示作业的第5个map任务(000004,从0开始计数);任务执行会失败,所以有多个任务尝试ID,attempt