grafana

JMXtrans + InfluxDB + Grafana实现Zookeeper性能指标监控

好久不见. 提交于 2020-08-17 18:28:41
一、总体效果图 这里是将集群全部放在一起,可以根据自己的审美看怎么放 二、监控指标 其中有些指标与第一篇 Zookeeper通过四字命令基础监控(Zabbix) 的四字命令的指标是有重复的,二者选一个则可 三、实现 1、influxdb的安装 1)设置yum源 cat <<EOF | sudo tee /etc/ yum .repos.d/ influxdb.repo [influxdb] name = InfluxDB Repository - RHEL \$releasever baseurl = https: // repos.influxdata.com/rhel/\$releasever/\$basearch/stable enabled = 1 gpgcheck = 1 gpgkey = https: // repos.influxdata.com/influxdb.key EOF 2)安装influxdb yum install influxdb systemctl start influxdb 3)修改配置文件(元数据以及数据存放目录) [root@ip- 172 - 0 - 0 - 7 influxDB]# cat /etc/influxdb/influxdb.conf | grep " ^\s*[^# \t].*$ " [meta] dir = "

SQL/PromQL? SLS时序分析选型

老子叫甜甜 提交于 2020-08-17 16:50:08
可观察性与Open Telemetry 在CNCF的 landscape 上,有专门的一个部分来展示Obserability and Analysis,什么是Observability(可观察性)? 我从OpenTelementry官网摘抄了这段描述: 可观察性包括Logging,Metrics,Tracing这三类紧密配合的数据源:metrics可以用来发现问题,利用相关的trace去找到异常节点,再看该异常节点的日志去定位根因。 很多人可能会觉得可观察性就是“旧瓶装新酒”,本质上没有任何的创新。从现实中(包括Landscape)不难理解这个说法,目前Logging,Metrics(Monitoring),Tracing都有各自的生态。实现上大家有各自的数据模型,模型中可能有也可能没有考虑和其他数据的联动,如果想要对数据做整合,就要各自做大量的适配工作。 为了解决这个问题,OpenTelementry诞生了。OpenTelementry从OpenTracing和OpenCensus合并而来,致力于可观察性的统一,他的重点在规范的制定,sdk的实现,采集系统的实现上,让大家都以一致的数据模型来产出数据. 对于数据如何存储如何使用,这个范畴太大,有非常多可能性,所以仍然需要上层产品去探索。 SLS 对Open Telemetry支撑

Chaos Mesh® 正式进入 CNCF 沙箱托管项目

左心房为你撑大大i 提交于 2020-08-16 18:19:54
近日,云原生计算基金会 (CNCF) 宣布云原生的混沌工程 Chaos Mesh 正式进入 CNCF 沙箱托管项目,这是 CNCF 接纳的第二个由 PingCAP 团队设计并研发的项目。 Chaos Mesh 是一个云原生的混沌工程(Chaos Engineering)平台,可在 Kubernetes 环境中进行混沌测试,在各种复杂的环境下可使用混沌工程来保证系统能正常稳定运行。现阶段,组成部分包括: Chaos Operator:混沌编排的核心组件 —— 完全开源; Chaos Dashboard:用于管理、设计、监控混沌实验的 Web UI —— 开发中。 相比其他混沌平台,Chaos Mesh 具有以下优势: 专注于 Kubernetes 平台 。Chaos Mesh 致力于打造完全云原生的混沌测试平台,只要你系统可以跑在 Kubernetes 上面,那么就可以无缝的集成 Chaos Mesh。 可拓展性 。基于目前 Chaos Mesh 灵活的设计,一方面易于拓展新的故障注入类型,另一方面可以非常方便的集成到其他的测试框架中。 丰富的故障注入手段 。Chaos Mesh 能全方位的帮你对网络,磁盘,文件系统,操作系统等进行故障注入。我们后面也会提供对 Kubernetes,或者云服务自身进行 chaos 的能力。 易于使用 。你无需关注 Chaos Mesh 的底层实现细节

Choerodon猪齿鱼实践之集群管理(二)

别等时光非礼了梦想. 提交于 2020-08-16 14:27:43
通过之前的文章 《Choerodon实践之集群管理(一)》 ,我们了解到了Choerodon集群与k8s集群之间的关联、集群权限管理以及节点详情查看的功能。那如何更加灵活便捷地对k8s集群进行监控呢?又怎么对监控组件进行安装、配置与管理呢?本文旨在为大家介绍Choerodon平台中的组件管理以及集群监控的功能。 功能背景 因为集群管理员或运维人员需要知道集群中所有节点以及节点下各个Pod的资源使用情况,为了收集与展示这些指标,Choerodon集群管理模块主要使用了Prometheus来实现对集群的监控。同时,Choerodon还在界面中提供了直接安装、配置与卸载Prometheus等监控组件的入口,用户可在此通过界面化的形式高效快速地在集群中完成各组件的安装与配置。 除此之外,为了实现在Kubernetes集群中使用 HTTPS 协议的功能,Choerodon在环境资源中支持了对证书的管理,同时为了确保集群中的证书有效且是最新的,并能在到期前按照配置的时间续订证书,Choerodon又提供了对cert-manager组件的支持,用户在组件管理界面即可实现对cert-manager组件的安装与卸载。 组件管理功能 集群管理中组件管理模块目前支持对cert-manager和监控组件(Prometheus、Grafana、AlertManager)进行安装与管理,用于管理集群下所有组件

Grafana配置LDAP认证

*爱你&永不变心* 提交于 2020-08-16 14:17:40
Grafana从2.1开始支持LDAP集成LDAP的统一用户登录认证。默认是LDAP是未启用,需手动更改配置使之能支持LDAP。在参考官方文档 Grafana LDAP Authentication 进行配置。 Grafana主配置文件grafana.ini中开启LDAP认证 vim /etc/grafana/grafana.ini [auth.ldap] enabled = true config_file = /etc/grafana/ldap.toml allow_sign_up = true LDAP配置/ldap.toml [[servers]] host = "10.10.10.10" port = 389 use_ssl = false start_tls = false ssl_skip_verify = false bind_dn = "cn=ldapadmin,cn=Users,dc=hi,dc=local" bind_password = 'xxxxxx' search_filter = "(cn=%s)" search_base_dns = ["dc=hi,dc=local"] [servers.attributes] name = "givenName" surname = "sn" username = "cn" member_of =

附024.Kubernetes全系列大总结

≡放荡痞女 提交于 2020-08-16 07:18:12
Kubernetes全系列总结如下,后期不定期更新。 欢迎基于学习、交流目的的转载和分享,禁止任何商业盗用,同时希望能带上原文出处,尊重ITer的成果,也是尊重知识。 若发现任何错误或纰漏,留言反馈或右侧添加本人反馈。 正篇 001.Kubernetes简介 002.Kubernetes简单入门实例 003.Kubernetes二进制部署准备 004.Kubernetes二进制部署创建证书 005.Kubernetes二进制部署kubectl 006.Kubernetes二进制部署ETCD 007.Kubernetes二进制部署Flannel 008.Kubernetes二进制部署Nginx实现高可用 009.Kubernetes二进制部署kube-apiserver 010.Kubernetes二进制部署kube-controller-manager 011.Kubernetes二进制部署kube-scheduler 012.Kubernetes二进制部署worker节点Flannel 013.Kubernetes二进制部署worker节点Nginx实现高可用 014.Kubernetes二进制部署docker 015.Kubernetes二进制部署所有节点kubelet 016.Kubernetes二进制部署所有节点kube-proxy 017

【最佳实践】一文掌握并应用Elasticsearch中的GC实现垃圾日志处理

无人久伴 提交于 2020-08-16 02:59:17
作者介绍 魏彬,普翔科技 CTO,开源软件爱好者,中国第一位 Elastic 认证工程师,《Elastic日报》和 《ElasticTalk》社区项目发起人,被 elastic 中国公司授予 2019 年度合作伙伴架构师特别贡献奖。对 Elasticsearch、Kibana、Beats、Logstash、Grafana 等开源软件有丰富的实践经验,为零售、金融、保险、证券、科技等众多行业的客户提供过咨询和培训服务,帮助客户在实际业务中找准开源软件的定位,实现从 0 到 1 的落地、从 1 到 N 的拓展,产生实际的业务价值。 如果你关注过 Elasticsearch 的日志,可能会看到如下类似的内容: [2018-06-30T17:57:23,848][WARN ][o.e.m.j.JvmGcMonitorService] [qoo- 来源: oschina 链接: https://my.oschina.net/u/4406565/blog/4328587

开放、普惠、高性能-SLS时序存储助力打造企业级全方位监控方案

拥有回忆 提交于 2020-08-15 15:14:43
无所不在的时序数据 时间带走一切,长年累月会把你的名字、外貌、性格、命运都改变。 ---柏拉图 随着时间的推移,万事万物都在不停的变化,而我们也会用各种数字去衡量这些变化信息,比如年龄、重量、速度、温度、金钱...在数字化时代中,我们会把这些随着时间变化的数据保存起来,挖掘这些数据的价值。通常我们会称这类数据为---时序数据。 时序数据用于描述物体在时间维度上的状态变化信息。 时序数据在各行各业都得到了非常广泛的应用,例如股票走势、交易趋势、服务器指标、脉搏心跳、定位坐标、能耗趋势等等,而这些数据几乎在所有的场景中都得到了应用,例如: 各类炒股软件提供众多不同维度的股票K线图,为广大股民提供参考标准; Apple Watch通过监控佩戴者的心率信息,帮助人们提早发现严重的心脏疾病; 国家电网通过分析各个小区、住户的用电量曲线,来判断是否有偷电漏电情况; 电商类的公司会监控平台的下单、交易、退货、评价等关键流程的变化趋势,用来快速发现各类异常; 各个游戏平台通过分析每个用户角色的操作、位置等变化规律,来判断是否使用了作弊辅助工具... 我们需要一个什么样的时序存储 为了能够支撑各种场景的时序分析、监控等需求,近几年在开源和商业领域均出现了一些时序存储的引擎,例如TimescaleDB、CrateDB、InfluxDB、OpenTSDB、Prometheus等

可视化工具Grafana:简介及安装

蹲街弑〆低调 提交于 2020-08-15 12:45:29
from: https://www.cnblogs.com/imyalost/p/9873641.html 可视化工具Grafana:简介及安装 随着业务的越发复杂,对软件系统的要求越来越高,这意味着我们需要随时掌控系统的运行情况。因此,对系统的实时监控以及可视化展示,就成了基础架构的必须能力。 这篇博客,介绍下开源的可视化套件grafana的安装及其功能特点。。。 官网地址: Grafana 官方文档: Grafana文档 环境:CentOS7.4 64位 Grafana版本:5.3.2 一、Grafana介绍 Grafana是一个跨平台的开源的度量分析和可视化工具,可以通过将采集的数据查询然后可视化的展示,并及时通知。它主要有以下六大特点: 1、展示方式:快速灵活的客户端图表,面板插件有许多不同方式的可视化指标和日志,官方库中具有丰富的仪表盘插件,比如热图、折线图、图表等多种展示方式; 2、数据源:Graphite,InfluxDB,OpenTSDB,Prometheus,Elasticsearch,CloudWatch和KairosDB等; 3、通知提醒:以可视方式定义最重要指标的警报规则,Grafana将不断计算并发送通知,在数据达到阈值时通过Slack、PagerDuty等获得通知; 4、混合展示:在同一图表中混合使用不同的数据源,可以基于每个查询指定数据源

从零搭建Prometheus监控报警系统

眉间皱痕 提交于 2020-08-15 08:10:11
参考文章: 从零搭建Prometheus监控报警系统 什么是Prometheus? Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB)。Prometheus使用Go语言开发,是Google BorgMon监控系统的开源版本。 2016年由Google发起Linux基金会旗下的原生云基金会(Cloud Native Computing Foundation), 将Prometheus纳入其下第二大开源项目。 Prometheus目前在开源社区相当活跃。 Prometheus和Heapster(Heapster是K8S的一个子项目,用于获取集群的性能数据。)相比功能更完善、更全面。Prometheus性能也足够支撑上万台规模的集群。 Prometheus的特点 多维度数据模型。 灵活的查询语言。 不依赖分布式存储,单个服务器节点是自主的。 通过基于HTTP的pull方式采集时序数据。 可以通过中间网关进行时序列数据推送。 通过服务发现或者静态配置来发现目标服务对象。 支持多种多样的图表和界面展示,比如Grafana等。 官网地址: https://prometheus.io/ 架构图 基本原理 Prometheus的基本原理是通过HTTP协议周期性抓取被监控组件的状态,任意组件只要提供对应的HTTP接口就可以接入监控