nagios

为什么Nagios会那么吵?你又能做些什么呢?(1)

时间秒杀一切 提交于 2019-11-28 19:34:51
如果你受困于 Nagios 的告警洪潮中不能自拔,那么这两篇连载博客就是为你而生的。让我们来详细的阐述下这个问题! 运维人员都有着独立的监控工具,因此会经常受到 Nagios 告警吵闹的影响。很多运维人员对 Nagios 都是爱恨交加的,Nagios 给了你实时的可见性,可以了解你的 IT 基础设施的内部运作。用 Naigos,你可以辨认出哪一台主机内存不足,哪台服务器会占用太多 CPU 周期,哪一个应用由于访问时间太长而跳转离开。你也能够足够早的得到告警信息,在他们影响最终用户之前解决掉问题,最大限度的让 Nagios 为你而战。 ######埋在干草堆里的针 然而这些都是理论上的,不难发现,Nagios 最终导致的问题跟它解决掉的问题其实是一样多的。让我们退一小步来讲,Nagios 实际上并不会引起问题,只是它会使运维团队鉴别出真正的问题时更加困难。举个例子,当小孩子哭闹时,并不一定是真的做错了什么,他们只是想被关注,或是因为他们经验有限,无法处理一件微不足道的小事,而在他们看来这却是一个大大的问题,所以会使劲儿的哭。作为父母,我们知道摔伤的膝盖只需要一个创可贴,但在疼痛来临的那一刻,你的孩子会认为他可能永远无法再走路了。 处理 Nagios 告警就像哄一个哭泣的孩子一样,从外观上看,我们并没有什么好的方法能够轻松区分一个摔伤的膝盖和一个折断的腿。因为 Nagios

一键安装nagios服务端

走远了吗. 提交于 2019-11-28 12:54:43
1 #!/bin/sh 2 #********************************************************** 3 #*Author: abner 4 #*Email: 517465591@qq.com 5 #*Blog http://www.cnblogs.com/lord-dang/ 6 #*Last modified: 2016-09-19 18:28 7 #*Filename: install_nagios_server.sh 8 #*Description: auto install nagios server 9 #*Version: v1.0 10 #********************************************************* 11 . /etc/init.d/functions 12 NAGIOS_TOOLS_DIR=/tmp/nagios 13 admin='abner' 14 PASSWD='123456' 15 #------ step 1: config yum ------ 16 cd /etc/yum.repos.d/ 17 wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos

Cacti+nagios 整合监控部署文档

萝らか妹 提交于 2019-11-28 10:53:40
目录 Cacti+nagios监控部署步骤... 2 一、Cacti安装... 2 1需要安装的依赖软件包:... 2 2安装rrdtool 2 3启动数据库和httpd服务... 3 4将servername和ip对应写入hosts 3 5安装cacti 3 6创建cacti数据库并授权:... 3 7导入cacti的数据表... 3 8修改配置文件,提供php连接mysql的用户名、密码(如图)... 3 9登录网页按照向导提示完成安装:... 4 10 配置本机snmp. 6 11 通过WEB页面添加监控设备... 7 12 为新创建图形生成数据,并将轮询加入计划任务... 9 13 更改php时区... 9 14 安装高效轮询器spine. 9 二、Cacti插件安装... 11 1 如不需打补丁(在cacti-0.8.8b版中默认已带plugin management),则只修改配置文件即可 11 2 安装monitor、settings、thold插件... 11 3 刷新web页面plugin management,出现插件的蓝色图标,依次全部启用... 12 4 thold警报功能... 12 5 安装weathermap插件... 15 三、cacti系统的客户端配置... 18 1 linux主机... 18 2 windows主机... 19 四

How to parse nagios status.dat file?

一世执手 提交于 2019-11-28 08:19:40
问题 I'd like to parse status.dat file for nagios3 and output as xml with a python script. The xml part is the easy one but how do I go about parsing the file? Use multi line regex? It's possible the file will be large as many hosts and services are monitored, will loading the whole file in memory be wise? I only need to extract services that have critical state and host they belong to. Any help and pointing in the right direction will be highly appreciated. LE Here's how the file looks: #########

Nagios介绍

微笑、不失礼 提交于 2019-11-27 19:17:23
1.1 nagios的简介 Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows、Linux和Unix的主机状态,在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。 主要特点 Nagios 是采用分布-集中的管理模式。在Nagios服务器上安装Nagios 主程序和插件程序,在被监控主机上安装Nagios 代理程序。通过Nagios 主程序和Nagios 代理程序之间的通讯,监视对象的状态。 1) 能够监控网络服务和主机资源(SMTP、POP3、HTTP、FTP、SSH 、CPU load、disk usage、system logs) 2) 允许用户开发简单的自己需要的检查服务,支持很多开发语言(shell scripts、C++、Perl、ruby、Python、PHP、C#等),可以指定自己编写的Plugin通过网络收集数据来监控任何情况(温度、警告……) 3) 可以通过配置Nagios远程执行插件远程执行脚本,事先定义事件处理程序, 当对象出现问题时,自动调用对应的处理程序; 4) 可并行服务检查 5) 可以支持并实现对主机的冗余监控 6) 自动日志循环 7) 包括Web界面可以查看当前网络状态,通知,问题历史,日志文件等 1.2 nagios的工作原理 Nagios的功能是监控服务和主机

如何把关联性的告警智能添加到 Nagios 上?(2)

时间秒杀一切 提交于 2019-11-27 13:40:36
######上节回顾 对于许多 IT 和运维团队来说,Nagios 既是一个福音也是一个诅咒。一方面,Naigos 在 IT 应用的工作领域中,给予了你可以实时查看告警数据的可能性;但是另一方面, Nagios 也能够生成超级多的告警,对于任何一个运维人员或是运维团队来说都是 hold 不住的。 由于告警浪潮的原因,我们收件箱时常会爆满,移动电话也会被逼调成静音状态。更令人沮丧的是,这些告警只不过仅仅是噪音而已。 Nagios 所欠缺的就是一个智能的管理系统,可以在噪音背景中,帮助运维人员挑选出真正的有意义的告警。 当然,说起来容易做起来难。 在上一篇文章中,我们讨论了为什么 Naigos 起初会生成如此之多的告警,并且很少是需要实际执行的。 那么现在,让我们来讨论下该如何把告警智能化。 ######告警关联 唯一使监控和报警都步入正轨的好办法,就是通过告警关联。如果成百上千个告警都潜在的指向着同一个根本问题「当然情况也常常如此」,我们需要的就是一种能够瞬间查找到关联这些告警的方法,这才是真正的问题所在。 以下这个例子,可以很好的理解告警关联,并告诉你如何提升应用监控。 例如一个 MySOL 集群,这里面一些主机的页面上有着很高的错误率,而其余一些只是发出低内存的警告。此时你的 Nagios 图表盘在30分钟里,会接受到不止20个独特的告警,这其实看起来没有太大的意义

Perl/Nagios – Can’t locate utils.pm in @INC

a 夏天 提交于 2019-11-27 05:06:48
While trying to use a Nagios plugin I got an error saying that “Can’t locate utils.pm in @INC”. Following is complete error: Can’t locate utils.pm in @INC (@INC contains: /root /etc/perl /usr/local/lib/perl/5.14.2 /usr/local/share/perl/5.14.2 /usr/lib/perl5 /usr/share/perl5 /usr/lib/perl/5.14 /usr/share/perl/5.14 /usr/local/lib/site_perl .) This issue is occurred due wrong library path in Nagios Plugin(Perl Script). When I checked library path in script its given as ‘use lib “/usr/local/nagios/libexec”;’ where path /usr/local/nagios/libexec is not exists in our os. All our library’s are

09linux基础服务-nagios

≡放荡痞女 提交于 2019-11-27 04:43:36
Nagios 是一款免费的开源 IT 基础设施监控系统,功能强大,灵活性强,能有效监控 Windows、Linux、VMware 和 Unix 主机状态,交换机、路由器等网络设置等。一旦主机或服务状态出现异常时,会发出邮件或短信报警第一时间通知 IT 运营人员,在恢复后发出正常的邮件或短信。Nagios 结构简单,可维护性强,提供一个可选的基于浏览器的 Web 界面,方便管理人员查看系统的运行状态,网络状态、服务状态、日志信息,以及其它异常现象。 一、nagios运行模式和优点 1、运行模式:数据收集是C/S模式,用户查看监控信息是B/S模式 2、优点: 1:监控网路服务状态(HTTPD,FTP,SSH,MySql……) 2:监控主机资源(处理器符合,硬盘利用率……) 3:拓展,根据自己的需求实现拓展检测功能(插件开发) 4:自动日志回滚 5:能够定义网络主机的层次,允许逐级检查,就是从父主机开始向下检查 6:警告,基于状态的警告:OK,Warning(警告),critical(关键),unknown(未知) 7:可以支持并实现对主机的冗余监控 8:Web界面可以查看当前网络状态,通知,问题历史,日志文件等 二、nagios运行原理 Nagios的功能是监控服务和主机,但是他自身并不包括这部分功能,所有的监控、检测功能都是通过各种插件来完成的。 启动 Nagios后

Linux下Nagios的安装与配置

旧时模样 提交于 2019-11-26 20:34:19
一、本文说明 本文是在参考: http://www.cnblogs.com/mchina/archive/2013/02/20/2883404.html David_Tang文章以及网上的一些资料完成,其中绝大部分内容是转载于David_Tang。 二、Nagios简介 Nagios是一款开源的电脑系统和网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知运维人员,在状态恢复后发出正常的邮件或短信通知。 Nagios原名为NetSaint,由Ethan Galstad开发并维护至今。NAGIOS是一个缩写形式:“Nagios Ain't Gonna Insist On Sainthood” Sainthood翻译为圣徒,而"Agios"是"saint"的希腊表示方法。Nagios被开发在Linux下使用,但在Unix下也工作得非常好。 主要功能 •网络服务监控(SMTP、POP3、HTTP、NNTP、ICMP、SNMP、FTP、SSH) •主机资源监控(CPU load、disk usage、system logs),也包括Windows主机(使用NSClient++ plugin) •可以指定自己编写的Plugin通过网络收集数据来监控任何情况(温度、警告……)

Nagios监控远端的mysql

别等时光非礼了梦想. 提交于 2019-11-26 20:33:18
工作原理: 利用特定的用户定期访问指定的mysql数据库。当不能访问或连不通时则报警。 1.在生产库上安装nagios插件 安装略 备注:编译完显示一定要有mysql支持,不然没有check_mysql插件 2.配置mysql -- --建立nagdb专用数据库 mysql > create database nagdb default CHARSET = utf8; Query OK, 1 row affected ( 0.01 sec) mysql > grant select on nagdb. * to ' nagios ' @ ' % ' ; Query OK, 0 rows affected ( 0.00 sec) mysql > update mysql. user set ' Password ' = PASSWORD( ' nagios ' ) where ' User ' = ' nagios ' ; ERROR 1064 ( 42000 ): You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '' Password ' = PASSWORD( '