云监控

混合云的可见性和监控性

风流意气都作罢 提交于 2019-12-20 06:53:32
虽然这些是实施数字化转型的明智之举,但它们引入了新的运营领域,这些领域需要结合使用监控技术来创建现代化的全栈混合云监控功能。 无论企业如何选择构建其混合云部署,都会引入两个新的运营领域:第一,公共数据中心的基础架构和架构不再受企业控制,第二,跨越多个网络的复杂服务间通信矩阵分布式应用程序组件和数据中心之间。任何一个部分的不稳定性和中断都会产生影响最终用户体验的雪崩效应。 对于内部部署数据中心(混合云最熟悉的方面),企业拥有数据中心内的所有内容,从应用程序到基础设施和网络。监控技术的组合在这种环境中表现良好。但是,在数据中心之外,企业没有基础设施,其传统的监控技术已经达到极限。 应用程序可用性和性能指标(如页面加载和响应时间)通过合成技术测量: • APM(应用程序性能管理)通过代码注入和基于代理的数据收集提供最终用户体验的视角。 • 基础设施监控的范围从捕获健康指标到SNMP轮询,再到使用基于Unix的实用程序(如collectd)来读取网络设备的性能数据。 • 数据包捕获和流记录提供了对流量进入和流出数据中心的组合理解。 监控云计算 在公共云环境中,企业可能拥有IaaS提供程序中托管的应用程序,但企业无法控制基础设施或网络方案。基于虚拟主机的数据包捕获探测(如ntop或虚拟分路器)是选项,但它们会增加大量开销

云监控 Ganglia 安装步骤 (含python module)

雨燕双飞 提交于 2019-12-07 14:53:24
前言 最近在研究云监控的相关工具,感觉ganglia颇有亮点,能从一个集群整体的角度来展现数据. 但 是安装过程稍过复杂,相关依赖稍多,故写此文章与大家分享下. 本文不讲解相关原理,若想了解请参考其他资料. 本文目的: 即使之前未触过ganglia,也能按照文中步骤搭建自己的ganglia监控集群. @Author duangr @Website http://my.oschina.net/duangr/blog/181585 1.相关环境 Host Name IP OS Arch duangr-1 192.168.56.10 CentOS 6.4 x86_64 duangr-2 192.168.56.11 CentOS 6.4 x86_64 duangr-3 192.168.56.12 CentOS 6.4 x86_64 全部主机确认: iptables关闭 SELinux disabled 2.部署规划 项 值 监控服务主节点 duangr-1 被监控从节点 duangr- 2 duangr-3 Ganglia监控服务的主节点需要安装: ganglia ganglia-web php apache Ganglia被监控从节点需要安装: gangli a 安装路径规划 项 值 ganglia安装路径 /usr/local/ganglia php安装路径 /usr/local

Nagios开发自定义插件check_netstat

…衆ロ難τιáo~ 提交于 2019-12-07 00:44:57
前言 这几天学习了Nagios的plugin写法,先写了个简单的例子: 类似主机netstat命令的监控,可以监控链接的数量. 学习笔记,以备查阅 @Author duangr @Website http://my.oschina.net/duangr/blog/185080 1. plugin机制 nagios的插件都部署在 ${nagios_home}/libexec 路径下面,可以发现下面有很多的可执行脚本 也可以开发自己的脚本文件,只要返回码符合如下要求即可: # declare return code RTN_OK=0 RTN_WARNING=1 RTN_CRITICAL=2 RTN_UNKNOWN=3 由于我对shell还算是了解一些,因此准备用shell来编写netstat的扩展插件. 2. 代码获取 http://git.oschina.net/duangr/duangr-nagios-plugin 代码放在 Git @OSC 上面了,之前对git不太了解,又先学习了半天. 3. 功能介绍 check_netstat 简要思路: netstat 命令可以监控主机的链接情况,因此对netstat的结果列表 增加 端口、状态 的过滤, 并将过滤后的数量统计出来. 命令中对结果数量可以定制WARNING和CRITICAL的报警阈值,并且参考了check

云监控 Nagios 安装步骤

荒凉一梦 提交于 2019-12-06 10:00:27
前言 最近在研究云监控的相关工具,之前写过Ganglia的安装步骤,这回来记录下Nagios的安装步骤。 本文不讲解相关原理,若想了解请参考其他资料. 本文目的: 即使之前未触过nagios,也能按照文中步骤搭建自己的nagios监控集群. @Author duangr @Website http://my.oschina.net/duangr/blog/183160 1. Nagios简介 Nagios是一个可运行在Linux/Unix平台之上的开源监视系统,可以用来监视系统运行状态和网络信息。Nagios可以监视所指定的本地或远程主机以及服务,同时提供异常通知功能。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。 2. 相关环境 Host Name IP OS Arch duangr-1 192.168.56.10 CentOS 6.4 x86_64 duangr-2 192.168.56.11 CentOS 6.4 x86_64 duangr-3 192.168.56.12 CentOS 6.4 x86_64 3. 部署规划 项 值 监控服务主节点(Master) duangr-1 被监控从节点(Slave) duangr-2, duangr-3 Nagios主节点需要安装: nagios nagios-plugin

开源还是商用?十大云运维监控工具测评告诉你答案

不问归期 提交于 2019-12-05 04:07:05
随着云计算和互联网的高速发展,大量应用需要横跨不同网络终端,并广泛接入第三方服务(如支付、登录、导航等),IT系统架构越来越复杂。本文对业内主流的开源运维监控系统和商业运维监控系统进行对比,分析各种产品的定位、目标用户和功能特点,希望帮助广大运维、开发和创业者找到最适合自己的运维工具。 作者:佚名来源: 云智慧 | 2015-10-29 14:48 收藏 分享 随着云计算和互联网的高速发展,大量应用需要横跨不同网络终端,并广泛接入第三方服务(如支付、登录、导航等),IT系统架构越来越复杂。快速迭代的产品需求和良好的用户体验,需要IT运维管理者时刻保障核心业务稳定可用,而企业运维中的痛点和难点也急需解决。 1.面向业务的运维,不但关心单点IT资源的运行状态,更关心整个业务系统的健康状态 2.如果企业使用了大量的API和模块化应用,那么关注每个接口的性能变化情况和指标 3.对于运维主管及企业管理层来说,特别需要上墙的监控大屏 4.运维需要每周、每月查看报告趋势分析,但传统运维工具数据导出困难 5.需要第一时间转雀和快速发现故障节点,减少业务中断带来的损失 本文对业内主流的开源运维监控系统和商业运维监控系统进行对比,分析各种产品的定位、目标用户和功能特点,希望帮助广大运维、开发和创业者找到最适合自己的运维工具。 一、开源运维监控产品篇 (一)Zabbix 推荐星级: ★★★★★

在线公开课 | 京东云监控系统设计及落地之路

时间秒杀一切 提交于 2019-12-03 23:52:14
谈运维为什么离不开监控?典型监控系统一般是如何设计的?业务驱动的高可用监控系统又有何不同?作为巨头之一的电商平台京东, 其基于京东云的监控系统是否有值得借鉴的地方?本文将解答这些问题。本文整理自 10 月 30 日由京东云开发者社区和英特尔联合举办的在线公开课,京东云工具产品研发部专家架构师颜志杰的在线课程演讲——业务驱动监控系统设计与落地。 世上没有百分百可靠的系统,程序、机器、网络都可能在运行中出现问题,进而导致服务异常, 带来金钱及品牌的损失,所以监控目标就是降低损失,通过发现、定位、解决问题,期望缩短异常出现的 MTTR (平均修复时间)。 要达到这个目标,监控对象必须具备可观测性,即通过数据描述是否出现异常,这些数据包括指标监控 Metric、日志 log 和 Trace 数据。 为了实现缩短 MTTR 的目标,监控系统应该具有这些能力: 数据采集能力,获取可观测的数据 数据能够方便加工,比如把相关的数据汇聚起来,得到我们需要关注的数据 对这些关注的数据,做异常检测,及时产生告警 收到告警后,通过 Dashbord 查图定位,最好有专家推荐,加速定位 定位问题后,通过预案平台进行快速止损 整个监控系统需要做到高可用,监控就是为了发现异常,如果由于异常导致自身不可用,肯定是减分的 “典型监控系统从功能模块分为采集、计算、存储、告警、算法、业务端等。” 从下往上来看

课程报名 | 监控系统怎么设计,才能高可用?

生来就可爱ヽ(ⅴ<●) 提交于 2019-12-02 06:15:28
监控是运维的生命线,监控系统的作用其实总结起来主要体现在发现问题、定位问题和解决问题三个部分,在这方面,京东云定义了一套统一的监控标准: 即监控需要覆盖基础-存活-性能-业务四个层面,从而保证采集数据的全面,进而避免监控遗漏 。 那么在这个过程中,如何以监控业务需求为基础进行监控系统的设计,遇到的难点和解决方案有哪些?如何通过数据量化思维的方式去做监控呢?10 月 30 日,京东云工具产品研发部专家架构师颜志杰,将以在线直播的方式与大家讲解京东云监控实践。 对课程感兴趣的从业者和开发者们,更多实用、有趣的课程内容,等着你来Pick! 来源: https://www.cnblogs.com/jdclouddeveloper/p/11734013.html

技术沙龙 | 从高并发架构到企业级区块链探索零售创新

我的未来我决定 提交于 2019-11-28 11:28:13
伴随消费新理念的不断升级和技术创新发展,零售业逐渐被推到风口浪尖,对此京东曾表示,推动“无界零售”时代的到来理念,倡导实现成本、效率、体验的升级才是终极目标。 此概念一出,零售行业的侧重点开始由销售端向技术端倾斜, 趁着一年一度618来临之际,京东云特别在上海举办了主题为"从高并发架构到企业级区块链,探索无界零售的数字化创新"的技术沙龙活动。 本次活动以京东云在零售业以及社交电商方面的核心技术以及成功解决方案为出发点,例如探求大促高并发流量数据库保障经验、社交电商的创新思路以及技术架构等细节,并结合京东云在零售领域的诸多落地实践,详解无界零售数字化创新的方方面面,并与在场的开发者们展开深入探讨。 现场开发者爆满 从高并发架构到企业级区块链 — 探索无界零售的数字化创新— 郭理靖 京东数据库服务如何应对“大促活动” 众所周知,京东商城流量业务多。很多业务在研发设计初期并不想选用太多种类的数据库,因为并不知道着手的业务规模大小,所以在开始使用MySQL有时候会把日志和大数据字段也写入数据库,随着数据积累量增多,用户规模扩大,未来会涉及数据切换的问题。 ——郭理靖 京东云产品研发部高级总监 一直以来每逢大促,与剁手党们共同忙活到“天荒地老”的当属各大电商网站了。为了及时释放各类商品的“杀猪价格”,积极鼓励用户参与琳琅满目的抢购与秒杀环节,电商们可真是十八般武艺样样精通。 此时一门心思

Kubernetes容器云平台建设实践

非 Y 不嫁゛ 提交于 2019-11-27 18:41:20
【51CTO.com原创稿件】Kubernetes是Google开源的一个容器编排引擎,它支持自动化部署、大规模可伸缩、应用容器化管理。伴随着云原生技术的迅速崛起,如今Kubernetes 事实上已经成为应用容器化平台的标准,越来越受到企业的青睐,在生产中也应用的越来越广泛。 我们的容器平台建设从2016年开始,大致经历了探索预研、体系建设和平台落地这样三个阶段。 下面就从Kubernetes的网络、存储、集群管理和监控与运维几个方面来分享下我们容器云平台建设走过的历程,希望给大家一些思考和启发。 一、kubernetes网络 容器网络发展到现在,已经是双雄会的格局。双雄会其实指的就是Docker的CNM和Google、CoreOS、Kuberenetes主导的CNI。首先明确一点,CNM和CNI并不是网络实现,他们是网络规范和网络体系,从研发的角度他们就是一堆接口,你底层是用Flannel也好、用Calico也好,他们并不关心,CNM和CNI关心的是网络管理的问题。 网络需求调研发现,业务部门主要关注以下几点:1、容器网络与物理网络打通2、速度越快越好3、改动越少越好4、尽可能少的风险点。 容器的网络方案大体可分为协议栈层级、穿越形态、隔离方式这三种形式。 协议层级:二层比较好理解,在以前传统的机房或虚拟化场景中比较常见,就是基于桥接的 ARP+MAC 学习,它最大的缺陷是广播

云-腾讯云:腾讯云

倖福魔咒の 提交于 2019-11-27 02:30:01
ylbtech-云-腾讯云:腾讯云 腾讯云—腾讯倾力打造的云计算品牌,以卓越科技能力助力各行各业数字化转型,为全球客户提供领先的 云计算、大数据、人工智能 服务, 以及定制化行业解决方案 。 1. 返回顶部 1、 腾讯云有着深厚的基础架构,并且有着多年对海量互联网服务的经验,不管是 社交 、游戏还是其他领域,都有多年的成熟产品来提供产品服务。腾讯在云端完成重要部署,为开发者及企业提供 云服务 、 云数据 、云运营 等 整体一站式服务方案 。 具体包括 云服务器、云存储、云数据库和弹性web引擎 等基础云服务; 腾讯云分析(MTA)、腾讯云推送(信鸽) 等腾讯整体大数据能力;以及 QQ互联、 QQ空间 、微云、 微社区 等云端链接社交体系。这些正是腾讯云可以提供给这个行业的差异化优势,造就了可支持各种互联网使用场景的高品质的腾讯云技术平台。 2、 2. 返回顶部 1、 中文名:腾讯云 外文名:QCloud 类 别:互联网 应 用:云空间 使用领域:社交、游戏和其他领域 目录 1 腾讯云简介 2 发展历程 ▪ 孵化期 ▪ 创业期 ▪ 成长期 3 产品介绍 ▪ 计算与网络 ▪ 存储与CDN ▪ 监控与安全 ▪ 大数据 ▪ 开发者工具 4 行业解决方案 ▪ 游戏云 ▪ 视频云 ▪ 移动云 ▪ 金融云 5 运营思路 6 互联网+ 7 云端生态 8 相关新闻 2、 3. 返回顶部 1、