nagios

【过关斩将】运维老鸟带教你如何精通运维

梦想与她 提交于 2020-08-12 07:00:27
文章目录 前言 一. 你的困惑在哪里? 1. 关于学习与公司的区别 2. 这么多我该学哪一个? 二. 如何才能学精通运维 三. 最核心的问题来了 总结 前言 我经常说一句话: 运维行业入门容易,精通难。 为什么? 因为运维学的东西又多又杂; 需要了解网络,学习系统基础操作,熟悉数据库,熟悉基础服务,熟悉自动化工具,虚拟化,容器,监控,故障排查等等。 而且随便一个点都有无数的工具需要掌握,比如监控: zabbix,grafana, cacti,天兔,prometheus,nagios,monit,ganglia,zenoss,open-falcon等等。 每一个工具又有无数的插件和模块,比如prometheus,与grafana结合,与微信结合,与邮件结合,与钉钉结合,单机模式,分布式,与数据库结合,与存储结合,与硬件结合,太多了,多到不想写。 很多人学着学着就放弃了,所以今天我们就一起来探讨下,运维到底该如何学。 一. 你的困惑在哪里? 这个问题比较好,你的困惑在哪里呢? 我调查了数百名小伙伴,大家普遍的困惑就是: 学的在公司能用上吗? 来源: oschina 链接: https://my.oschina.net/u/4349274/blog/4463621

网络监控系统七大开源工具分析

馋奶兔 提交于 2020-08-11 17:58:36
不断提升企业形象及服务质量、节约成本是所有企业的需求。数字化进程的加速,企业基本都会面临线上办公、线上提供产品服务的情况。运维部门为确保企业中所有业务稳定运行,并满足业务不断扩张的发展需求,时刻肩负着极大的挑战。如何节省成本,提升运维工作效率,实现精准监控? 当下,部分企业倾向于用开源软件节约成本,开源产品如何选型?如何达到企业级效果?我们测试了七个开源产品:Zabbix、Nagios、Prometheus、SugarNMS、Ganglia、Open-Falcon和Cacti,这些产品都有稳固的用户基础且均有更新。我们重点测试了操作,管理工具、接口以及每个产品的监控能力,自动发现、应用场景等情况。 我们在Windows上测试了这七款产品,当然并不是这些产品不能在Linux上运行。 Zabbix 商业开源软件。一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。用户群体主要面向泛物联网企业,主要监控集群。 支持告警功能,具备扩展能力,可自定义监控指标,其主要采用mysql/postgresql存储监控数据,监控规模1000+左右。但缺少数据汇总功能,使用上不太方便。而且由于缺少中文资料,服务支持有限,学习成本和定制模板比较大。 Nagios Nagios是一款开源网络监视工具,适合监视大量服务器计算环境,集成了很多功能。可监控主机状态及网络设备等

太牛皮啦!阿里P8架构师,呕心48小时整理的分布式系统技术和实战笔记

你离开我真会死。 提交于 2020-08-11 07:50:06
前言 现在的架构很多,各种各样的,如高并发架构、异地多活架构、容器化架构、微服务架构、高可用架构、弹性化架构等,还有和这些架构相关的管理型的技术方法,如 DevOps、应用监控、自动化运维、SOA 服务治理、去 IOE 等等,还有很多。 那什么是分布式系统?分布式系统是支持分布式处理的软件系统,是由通信网络互联的多处理机体系结构上执行任务的系统。包括分布式操作系统、分布式程序设计语言及其编译系统、分布式文件系统分布式数据库系统等,当然这些也是分布式的关键技术。 分布式需要了解的重点 1、ActivMQ 分布式消息总线 在大型分布式系统中,在遵循JMS规范的前提下 ,进行系统之间的大规模异步消息通信和集中常用的通信机制。 能对JMS规范有深入的了解,以及分布式系统架构中的异步通信机制。 2、高并发编程必备之NIO基础 NIO的基本原理以及实现过程 能对传统IO和NIO的区别进行系统的了解并能学会NIO的实现原理 3、Redis内存数据库 在大型分布式系统中,怎样在高并发的情况下解决某些非结构化数据快速存取的解决方案。 能对非关系数据库和非关系数据库有个系统的了解 以及Redis内存数据库的基本数据类型和各自的应用场景。 4、高并发编程之NIO流行框架之Netty NIO框架Netty的简介以及netty的应用场景。 能运用netty实现客户端和服务器端的基本通信。 5、Lucene

开发nagios修改配置文件平台

为君一笑 提交于 2020-08-05 00:45:06
[背景]本文的宗旨,是为解决在后期Nagios添加监控对象而烦的管理员做的工具。当然,也是为我减轻工作,而开发的。虽然说,我们可以写脚本来解决,但如果是那种每天会添加一两个IP来做监控,那么我们是不是每天都要登录服务器,修改配置文件,再测试,重启。感觉不是很方便,如果有一个web界面来操作,那视觉肯定又不一样,与是我就想到了要开发这款工具,来为自己或者大家来解决现在的问题,可能会有人说,现在的这样的图形工具太多了,是的,我也测试了一款,但感觉不是很理想,把我原先的配置文件全打乱了,而且在添加监控对象的时候,N多参数要填写,那个烦啊!~今天,这款工具,只要平台支持php,基本就可以使用了。喜不喜欢,在与能不能让你的工作更方便,不过,我已经准备用它了。呼呼.... [代码] <?php /*-------------------------------------------- Codz By Badboy MSN:hahazhu0634@live.cn Author: Badboy Date:2009/15/08 ---------------------------------------------- */ $nagios_action =$_GET["nagiosaction"]; $editfile = $_GET["editfile"]; if($nagios_action

盘点|12款服务器监控工具

血红的双手。 提交于 2020-08-04 17:49:52
服务器监控工具功能相当强大,无论何时何地,我们都可以了解到服务器的功能以及性能。服务器监控工具的使用,可以让我们清楚的知道用户可以打开我们的网站,且确保网速不慢。只有这样做,才能留住宝贵的用户,以免因为系统停运的原因,导致用户丢失。基于此,我为大家收集了12款超实用的服务器监控工具。 1、zabbix zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。abbix能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。 2、Nagios Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的状态,交换机路由器等网络设备,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。 3、Performance Co-Pilot Performance Co-Pilot,简称PCP,是一个系统性能分析框架。它收集并分析来自多个主机的各种性能指标。可以通过它观察指标走向的趋势,以帮助您快速识别异常所在点。它提供API,可依据此来开发自定义的监控和报告解决方案。 4、Anturis Anturis是一个基于云的SaaS平台,可监控windows和linux服务器,网站和IT基础架构。通过全面的监控解决方案列表

Docker+Kubernetes=?已成为快速部署和发布的行业新规范

守給你的承諾、 提交于 2020-07-28 17:50:30
导语 同时使用Docker和Kubernetes已成为行业中更快的应用程序部署和发布的新规范。 正文 当前,有越来越多的公司开始接受云原生的DevOps之旅,了解Docker和Kubernetes之类的工具对实现数字化转型的重要性。 随着公司迁移其基础架构和体系结构以适应云原生和数据驱动时代不断发展的技术趋势,我们已经看到了对云计算、容器化和编排解决方案的兴趣。 在谈论云原生时,很难忽略诸如Docker和Kubernetes之类的名称,它们彻底改变了我们大规模创建、开发、部署和交付软件的方式。 Docker实战 由于Docker容器提供了自己的OS库,因此Docker通过帮助开发人员在相同的环境中运行应用程序而使开发人员真正轻松了起来,而没有诸如依赖项或OS之类问题的麻烦。在引入Docker之前,开发人员会将代码发送给测试人员,但是由于各种依赖性问题,很多时候代码无法在测试人员的计 算机上运行,但在开发人员的计算机上却可以正常工作。 引入Docker之后,情况发生了变化:测试人员和开发人员现在在Docker容器上运行相同的系统,因此不再有混乱——两者都可以在Docker环境中运行应用程序而没有任何困难或依赖关系上的差异。 使用Docker构建和部署容器 Docker帮助开发人员在容器内创建和部署软件。它是一个开源工具,可以让我们“在任何地方构建,发布和运行应用程序”。

nagios报错:./stdio.h:456:1: error: &apos;gets&apos; undeclared here (not in a function)

拥有回忆 提交于 2020-07-28 08:14:14
[root@localhost nagios-plugins-1.4.16]# ./configure [root@localhost nagios-plugins-1.4.16]# make mv -f .deps/full-write.Tpo .deps/full-write.Po gcc -DHAVE_CONFIG_H -I. -I.. -I../intl -g -O2 -MT localcharset.o -MD -MP -MF .deps/localcharset.Tpo -c -o localcharset.o localcharset.c In file included from localcharset.c:26:0: ./stdio.h:456:1: error: ‘gets’ undeclared here (not in a function) _GL_WARN_ON_USE (gets, "gets is a security hole - use fgets instead"); ^ make[4]: *** [localcharset.o] Error 1 make[4]: Leaving directory `/usr/local/monitor/nagios-plugins-1.4.16/gl' make[3]: *** [all

zabbix、cacti、nagios,服务器监控还有更好的选择吗?

非 Y 不嫁゛ 提交于 2020-07-26 21:15:43
对于运维的日常工作来说,服务器监控是必须且最基础的一项内容。在企业网络运维过程中,管理员闭虚随时关注服务器和网络运行情况,以便及时发现问题,尽可能减少故障的发生。当网络中的设备、服务器数量较多时,为了更加方便,快捷的获得各种监控信息,通常会借助一些集中监测软件。 目前使用比较多的服务器监控软件有这三款: zabbix、cacti、nagios ,简单介绍一下这三个软件。 zabbix zabbix 是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。 zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。 cacti Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具。 nagios Nagios 是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设备,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。 然而对于大部分新手来说,这三款监控软件虽然在监控方面的功能很强大,都不是太容易上手,安装和部署比较困难。 资源监控在运维工作中的作用是发现问题,让运维人员能够及时处理并且解决问题,基于此,运维新手应该找一款更适合自己

《为什么说 Prometheus 是足以取代 Zabbix 的监控神器?》

风流意气都作罢 提交于 2020-05-02 00:38:04
为什么说 Prometheus 是足以取代 Zabbix 的监控神器? Kuberneteschina 致力于提供最权威的 Kubernetes 技术、案例与Meetup! ​关注他 12 人赞同了该文章 作者:陈晓宇 来源: dbaplus 社群 校对: Bot (才云)、 星空下的文仔 (才云) Kubernetes 自从 2012年开源以来便以不可阻挡之势成为容器领域调度和编排的领头羊。Kubernetes 是 Google Borg 系统的开源实现,于此对应,Prometheus 则是 Google BorgMon 的开源实现。 Prometheus 是由 SoundCloud 开发的开源监控报警系统和时序列数据库。从字面上理解,Prometheus 由两个部分组成,一个是监控报警系统,另一个是自带的时序数据库(TSDB)。 2016 年,由 Google 发起的 Linux 基金会旗下的云原生计算基金会(CNCF)将 Prometheus 纳入作为其第二大开源项目。Prometheus 在开源社区也十分活跃,在 GitHub 上拥有两万多 Star,并且系统每隔一两周就会有一个小版本的更新。 各种监控工具对比 其实,在 Prometheus 之前,市面已经出现了很多的监控系统,如 Zabbix、Open-Falcon、Nagios 等。那么 Prometheus

章节1-Prometheus基础(1)

落爺英雄遲暮 提交于 2020-05-02 00:37:41
[toc] 本文参考: 《Prometheus官方文档》 ,或网盘下载 《Prometheus操作指南.pdf》 (提取码:1l8m) 一、Prometheus安装部署 1. 简介 Prometheus受启发于Google的Brogmon监控系统(相似的Kubernetes是从Google的Brog系统演变而来),从 2012年开始由前Google工程师在Soundcloud以开源软件的形式进行研发,并且于2015年早期对外发布早期版本。 2016年5月继Kubernetes之后成为第二个正式加入CNCF基金会的项目,同年6月正式发布1.0版本。2017年底发布 了基于全新存储层的2.0版本,能更好地与容器平台、云平台配合。 Prometheus作为新一代的云原生监控系统,目前已经有超过650+位贡献者参与到Prometheus的研发工作上,并且 超过120+项的第三方集成。 监控的目的 长期趋势分析:通过对监控样本数据的持续收集和统计,对监控指标进行长期趋势分析。例如,通过对磁盘空间 增长率的判断,我们可以提前预测在未来什么时间节点上需要对资源进行扩容。 对照分析:两个版本的系统运行资源使用情况的差异如何?在不同容量情况下系统的并发和负载变化如何?通过 监控能够方便的对系统进行跟踪和比较。 告警:当系统出现或者即将出现故障时,监控系统需要迅速反应并通知管理员