zabbix

zabbix监控4.4升级至5.0

ε祈祈猫儿з 提交于 2020-08-18 05:39:58
1. ZABBIX备份 [root@iZ2zeapnvuohe8p14289u6Z /]# mkdir -p /soft/zabbixback/zabbix-backup [root@iZ2zeapnvuohe8p14289u6Z /]# cp /etc/zabbix/zabbix_server.conf /soft/zabbixback/zabbix-backup [root@iZ2zeapnvuohe8p14289u6Z /]# cp /etc/zabbix/zabbix_agentd.conf /soft/zabbixback/zabbix-backup [root@iZ2zeapnvuohe8p14289u6Z /]# cp /etc/zabbix/web/zabbix.conf.php /soft/zabbixback/zabbix-backup [root@iZ2zeapnvuohe8p14289u6Z /]# cp -R /usr/share/zabbix/ /soft/zabbixback/zabbix-backup [root@iZ2zeapnvuohe8p14289u6Z /]# cp –R /usr/share/doc/zabbix-* /soft/zabbixback/zabbix-backup 2. MariaDB 数据库备份 [root

Zabbix数据结构及并行计算实现

天涯浪子 提交于 2020-08-17 18:56:58
本文原创作者鲍光亚,京东商城基础平台部软件开发工程师,经作者同意发表于本人博客,如需转载需经本人同意。 一、 前言 我部门对数据库的监控使用的是开源的Zabbix系统,目前监控了上万台主机。本文旨在通过分析Zabbix系统server端的数据结构和并行计算的实现方法,尝试探寻Zabbix系统server端的潜在扩展能力,同时希望有助于在实际应用过程中进一步优化运行效率和稳定性。 Zabbix系统采用server-proxy-agent架构,其server端的主要功能是收集监控数据并基于所收集的数据触发报警动作。在实际应用中,zabbix有可能会监控10000台主机(host,由hostid唯一标识),如果每台主机设置50个监控指标(item,由itemid唯一标识),并且每分钟收集一次数据,则一共有50万个item,每秒钟需要接收并处理8333项数据(value),即vps(values per second)为8333。如果有三分之一的item设置了报警触发器(trigger,由triggerid唯一标识),则共有17万个trigger。 在以上情境中,为了保证监控的有效性和及时性,zabbix接收到每个value后需要立即在50万个item中找到正确的item,并获取该item的前一个值(previous value,last(),以便计算增量),或者计算前5分钟内的平均值

程序员必须掌握的核心算法有哪些?

99封情书 提交于 2020-08-17 18:55:57
一、算法最最基础 1、时间复杂度 2、空间复杂度 一般最先接触的就是时间复杂度和空间复杂度的学习了,这两个概念以及如何计算,是必须学的,也是必须最先学的,主要有最大复杂度、平均复杂度等,直接通过博客搜索学习即可。 二、基础数据结构 1、线性表 列表(必学) 链表(必学) 跳跃表(知道原理,应用,最后自己实现一遍) 并查集(建议结合刷题学习) 不用说,链表、列表必须,不过重点是链表。 2、栈与队列 栈(必学) 队列(必学) 优先队列、堆(必学) 多级反馈队列(原理与应用) 特别是优先队列,再刷题的时候,还是经常用到的,队列与栈,是最基本的数据结构,必学。 3、哈希表(必学) 碰撞解决方法:开放定址法、链地址法、再次哈希法、建立 公共溢出区(必学) 布隆过滤器(原理与应用) 4、树 二叉树:各种遍历(递归与非递归)(必学) 哈夫曼树与编码(原理与应用) AVL树(必学) B 树与 B+ 树(原理与应用) 前缀树(原理与应用) 红黑树(原理与应用) 线段树(原理与应用) 树相关是知识还是挺多的,建议看书,可以看《算法第四版》。 5、数组 树状数组 矩阵(必学) 三、各种常见算法 1、十大排序算法 简单排序:插入排序、选择排序、冒泡排序(必学) 分治排序:快速排序、归并排序(必学,快速排序还要关注中轴的选取方式) 分配排序:桶排序、基数排序 树状排序:堆排序(必学) 其他:计数排序(必学)

9个典型的开发者关系面试题

只愿长相守 提交于 2020-08-17 18:49:21
越来越多的科技公司正在从传统的企业销售思路转变为以开发者至上的思路来推广产品。因为开发者不喜欢这类销售方式,所以电话销售和演示将不起作用。 相反,平台需要采用类似于消费者可能采用手游或电商应用的方式。 但是,开发者也不太可能接受那些游戏和电商应用上的那些Facebook广告。 启动开发人员关系计划,可以推动开发者的使用并建立起更有效的关系,但是由于开发人员关系是一个崭新的角色,所需的技能和责任相比销售和工程等已经成熟的角色来说更加模糊。 本文概述了招聘开发者关系经理时应注意的事项。有关开发人员关系的概述,可以先了解一下什么是开发者关系。 因为开发者关系对于任何与开发者社区互动的人来说都是一个包罗万象的角色,所以在面试任何候选人之前,你应该列出这个角色的关键目标。一些开发者关系的角色侧重于社区参与和开发者宣传。 他们的主要目标是提高产品认知度,这要求他们在会议上发言,扩大自身影响力,并参与社交社区(如Twitter或Reddit)互动。 其他一些开发者关系的角色更专注于产品管理和开发者经验。他们的主要目标是平台的采用和使用,这要求他们通过迭代的方式完成用户引导、文档与公共的API/SDK。 无论扮演那种角色,开发者关系经理都需要清晰地沟通,并深入浅出地把深奥的技术主题表达出来,以便开发者轻松的理解。很多时候,开发者关系是公司线上线下的形象代言人。 | 1.

CPU爆满后的无助感

半腔热情 提交于 2020-08-17 16:44:44
告警 晚七点刚好上地铁,握在手里的手机震动了好几下,根据震动这几下的手感已经判断出这是钉钉在告警了,十有八九就是线上的问题,通过Zabbix监控的一台线上服务器已经五分钟不可达,这应该不会是网络网络问题了,如果是网络问题,其他线上机器应该都会不可达。没背电脑,只能干着急,后来大概看了一下云平台是因为CPU过高导致的。过了大概半个小时,有自动恢复了。 其实这个问题隐隐约约出现好几次了,只是没去重视,今天一来到公司就开始打开xshell,啪啪啪几下登录上去之后,袖子一卷,准备好好排查一下,看看到底是何方妖怪让我的CPU飙升还机器都连不上去。 排查 呆呆的看着这个黑色的框框,没错,我呆呆的看着他看了一天了。因为我完全没有头绪,没有思路,从哪里下手?按照平时的套路,看日志,打开几个相关的日志,眼睛都瞄没了,也没找到什么有用的东西。网上搜索一下,看看有么有什么好的办法排查,打开Google,打开baidu,千篇一律,简直就是复制粘贴,基本上使用top找到CPU占用高的进程,然后看进程的日志。但是我现在已经不是第一现场了。回想起了以前面试的时候面试过经常会问当你的机器CPU突然很高时,你怎么办?头脑里也一次又一次的出现平时说要好好看看linux系统的书,没看,真后悔,等这次后我一定要把这方面的知识好好学习学习,系统的学习。可是等今晚回去睡一觉,明早一醒来,还是原样。 反思 日复一日,年复一年

zabbix自定义监控实现思路以及自定义监控某个端口的连接数

喜你入骨 提交于 2020-08-17 13:52:53
一 zabbix自定义监控实现思路 我在前面有写到: zabbix3.x服务端安装和配置 zabbix3.x客户端安装和配置 zabbix监控memcached 实际上我们要想使用zabbix来监控一些服务的原理很简单,步骤分别是: 写一个脚本用于获取待监控服务的一些状态信息 在zabbix客户端的配置文件 zabbix_agentd.conf 中添加上自定义的“ UserParameter ”,目的是方便zabbix调用我们上面写的那个脚本去获取待监控服务的信息 在zabbix服务端使用 zabbix_get 测试是否能够通过第二步定义的参数去获取zabbix客户端收集的数据 在zabbix服务端的web界面中新建模板,同时第一步的脚本能够获取什么信息就添加上什么监控项, “键值”设置成前面配置的“UserParameter”的值 数据显示图表,这一步就很简单了,直接新建图形并选择上一步的监控项来生成动态图表即可 下面我将以“如何在zabbix中监控自定义端口的连接数”来举例说明 二 zabbix自定义监控某个端口的连接数 (1)zabbix客户端添加获取连接数的脚本: [root@prx01 ~]# cd /usr/local/zabbix/scripts [root@prx01 scripts]# vim 9080_port.sh 其内容如下: #!/bin/sh

运维告警管理——告警的灵活分派

心已入冬 提交于 2020-08-17 08:30:52
当下 IT运维 人员的一大头疼事,便是复杂而凌乱的告警,无法将告警信息进行灵活分类,通知给不同的人,这样就加大了运维人员对告警信息的判断难度,进而无法快速的的定位到根因,也就无法快速的解决问题。 睿象云 智能告警 平台Cloud Alert(简称CA)快速接入各类事件,通过人工智能算法自动发现、诊断、修复IT系统运行事故,并能帮助企业形成最佳事件管理流程,让业务运行更加安全可靠; 灵活的分派策略: 在CA的分派策略当中,用户可以根据不同的应用,选定不同的筛选条件,将条件相结合,让指定的告警通知到特定的人;例如:在zabbix应用中,用户可以选择告警级别、告警内容、主机、服务、告警对象、hostgroups、applications等筛选条件,将告警条件相结合,使得告警通知到的人。用户也可以选择将告警通知到组、排班、钉钉、企业微信等协作通知方式;为了防止重要的告警遗漏,CA平台也推出了分派升级策略,当告警在用户指定的时间内未被认领或关闭时,会通知到第二负责人,同样的也可以设置第三、第四负责人,以此类推。 功能详情见视频: http://video.aiops.com/CA.assignment.mp4 或扫描二维码观看视频: 更多功能欢迎登陆 睿象云官网 进行体验~ 来源: oschina 链接: https://my.oschina.net/u/4294880/blog

如何从零思考设计你的DevOps运维服务体系?

荒凉一梦 提交于 2020-08-17 08:07:03
前记: 体系就像是一顶帽子,是对DevOps运维的一个深度总结,写一下工作中的感悟,希望对你有所启迪。 DevOps体系是从原始运维一步步走过来的,原始运维好比是本,有了本进而想继续提升效率、减少出错、优化流程,就发展到了DevOps,AiOps....... 首先,运维的业务职能规范后形成章程、纲领,在互联网快速发展的特点下,形成了一套应对"快"和"变"的体系,并不停的迭代升级,工作这些年,体会到千象背后是有恒道的,运维工作一直围绕 高SLA 和 低成本 的业务目标运转着,只是工具在围绕着体系变来变去。从开发的角度理解, 运维体系就像是算法,实现算法的语言就像是工具,DevOps就是工具的升级 。 工具的本质其实是一个基础支撑,有了这个支撑,一系列目标的实现才更科学、高效,简单示意如下。 原始阶段,运维工程师与各部门无数的磨合、探索下,慢慢形成了最初的体系,其无形的规范着运维的工作和注意事项,工程师通过这个纲领开展日常工作并保障业务的健康发展,这个阶段可以说是 制度为王、制度规范 ,没有系统的运维平台,有的只是零散的一些大小工具,各种事物基本靠人工、靠制度、靠约束,虽是原始阶段,但也是运维最真实的样子,忙碌而又忙碌,效率总跟不上需求,制度总跟不上执行,与开发的协作总难同一频道,需要大量的运维人力。 再向后发展,为了提高效率的同时解决与开发间的沟通协作问题,提出了DevOps

关于zabbix各版本监控图形界面乱码的问题

二次信任 提交于 2020-08-16 12:29:07
上篇文章 zabbix4.2解决乱码 后来我安装zabbix4.4的时候,变了 4.2路径 /usr/share/zabbix/fonts下 4.4路径/usr/share/zabbix/assets/fonts 下 并且,如果不是覆盖的办法,还需要修改以下地方 vim /usr/share/zabbix/include/defines.inc.php # 还需要修改为下面这样,如楷体的名字 define('ZBX_GRAPH_FONT_NAME', 'simkai'); // font file name 来源: oschina 链接: https://my.oschina.net/825487559/blog/4456574

Zabbix服务器监控基本应用详解(一)

自作多情 提交于 2020-08-15 22:50:23
原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。 http://gzsamlee.blog.51cto.com/9976612/1865381 Zabbix基本概述: Zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。它能监视各种网络参数,保证服务器系统的安全运营;并提供柔软的通知机制以让系统管理员快速定位/解决存在的各种问题。 zabbix由zabbix server与可选组件zabbix agent构成: zabbix server: 可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X等平台之上。 zabbix agent: 需要安装在被监视的目标服务器上,它主要完成对硬件信息或与操作系统有关的内存,CPU等信息的收集。zabbix agent可以运行在Linux ,Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X, Tru64/OSF1, Windows NT4.0, Windows 2000/2003/XP/Vista等系统之上。 Server: