JobHistory介绍及安装配置

你说的曾经没有我的故事 提交于 2020-10-12 11:22:57

我们可以通过Hadoop jar的命令来实现我们的程序jar包的运行,关于运行的日志,我们一般都需要通过启动一个服务来进行查看,就是我们的JobHistoryServer,我们可以启动一个进程,专门用于查看我们的任务提交的日志

要修改的配置文件中要将value里面的node01修改为namenode主机名

1、namenode修改mapred-site.xml

cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop
vim mapred-site.xml
namenode服务器修改mapred-site.xml,添加以下配置:

<property>
		<name>mapreduce.jobhistory.address</name>
		<value>node01:10020</value>
	</property>

	<property>
		<name>mapreduce.jobhistory.webapp.address</name>
		<value>node01:19888</value>
	</property>

2、namenode修改yarn-site.xml

cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop
vim yarn-site.xml
namenode服务器修改mapred-site.xml,添加以下配置:

<property>
<!--是否启用日志聚合功能,日志聚合开启后保存到HDFS上。-->
	<name>yarn.log-aggregation-enable</name>	<value>true</value>
</property>
<property>
<!--聚合后的日志在HDFS上保存多长时间,单位为s-->
	<name>yarn.log-aggregation.retain-seconds</name>
	<value>604800</value>
</property>
<property>
        <!--指定文件压缩类型用于压缩汇总日志-->
<name>yarn.nodemanager.log-aggregation.compression-type</name>
        <value>gz</value>
</property>
<!-- nodemanager本地文件存储目录-->
<property>
        <name>yarn.nodemanager.local-dirs</name>
        <value>/export/servers/hadoop-2.6.0/yarn/local</value>
</property>
<!-- resourceManager  保存最大的任务完成个数 -->
<property>
        <name>yarn.resourcemanager.max-completed-applications</name>
        <value>1000</value>
</property>

3、修改后的文件分发到其他机器上面去

将namenode修改后的mapred-site.xml和yarn-site.xml分发到其他机器上面去:

cd /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop
scp mapred-site.xml  yarn-site.xml node02:$PWD
scp mapred-site.xml  yarn-site.xml node03:$PWD

4、重启yarn集群以及启动jobHistoryServer进程

cd /export/servers/hadoop-2.6.0-cdh5.14.0/sbin/
stop-yarn.sh
start-yarn.sh

5、jobhistoryserver

cd /export/servers/hadoop-2.6.0-cdh5.14.0/sbin/
sbin/mr-jobhistory-daemon.sh start historyserver

6、页面访问jobhistoryserver

http://namenode节点IP:19888
在这里插入图片描述

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!