grafana

Prometheus和Grafana告警服务创建与对接腾讯云短信告警平台(prometheus_alert)

天涯浪子 提交于 2021-02-20 13:26:39
前言 在一个监控系统中,如果说数据链路是她的骨架,那么告警通知服务就是他的灵魂!所有的监控服务都是为了能够及时通知出来,减少人工查询状态,及时发现问题,避免不必要的大规模故障,为企业政府省钱,和保证安全而存在的。 所以能发现问题很重要,更重要的是发现问题赶快让人知道,这就是今天要说的,告警通知服务。 一个开源项目PrometheusAlert 这个项目可以给 很多第三方服务对接 ,进行电话 、短信 等告警方式 ,也是我们要用到的 ,先部署起来。 github位置 部署方式参考项目中 README.md 的 部署方式 那一节,要注意的是 ,他的配置文件必须在二进制文件的当前目录, conf/app.conf 叫这个名字才会读取。 原因是用到 beego 框架 ,默认读取这个位置的配置文件,如果没有符合的二进制文件,可以自己编译。 GOPATH=xxxx/monitor_alert CGO_ENABLED=0 GOOS=linux GOARCH=amd64 go build -o xxx/monitor_alert/bin/PrometheusAlertLinuxAmd64 xxx/monitor_alert/src/PrometheusAlert/PrometheusAlert.go GOPATH=xxxx/monitor_alert CGO_ENABLED=0 GOOS=linux

《万亿级数据库MongoDB集群性能数十倍提升优化实践》核心17问详细解答

好久不见. 提交于 2021-02-20 10:33:09
《万亿级数据库MongoDB集群性能数十倍提升优化实践》核心17问详细解答 说明: 为了更好的理解背景,请提前阅读oschina分享的 《万亿级数据库MongoDB集群性能数十倍提升及机房多活容灾实践》 一文。 本文是2020年深圳Qcon全球软件开发大会 《专题:现代数据架构》 专场 、 dbaplus专场:万亿级数据库MongoDB集群性能优化实践 、mongodb2020年终盛会 分享 后,获得一致好评。本文收集了会后众多mongodb用户提的比较频繁的17个问题,并对每个问题进行了详细解答,一并整理到本文中。 分享内容回顾如下: MongoDB在OPPO互联网推广经验分享-如何把一个淘汰边缘的数据库逐步变为公司主流数据库 谈谈当前国内对MongoDB误解(丢数据、不安全、难维护)? MongoDB跨机房多活方案-实现成本、性能、一致性"三丰收" MongoDB线程模型瓶颈及其优化方法 并行迁移:MongoDB内核扩容迁移速率数倍/数十倍提升优化实践 百万级高并发读写/千亿级数据量MongoDB集群性能数倍提升优化实践 万亿级数据量MongoDB集群性能数十倍提升优化实践 磁盘80%节省-记某服务接口千亿级数据迁移MongoDB,近百台SSD服务器节省原理 关于作者 前滴滴出行技术专家,现任OPPO文档数据库mongodb负责人

Grafana Dashboard show/hide row based on variable value

痞子三分冷 提交于 2021-02-19 02:39:07
问题 So, I have a Grafana dashboard to show the logs of various services running inside a host. Now, I have different rows for different service because metrics and there titles are specific to the service - Such as for Apache Service, we have log metrics based on HTTP STATUS CODE, for Oracle Database Service, we have ORA-* distribution, connection partition /trend etc. Now, My question is simple that the Grafana dashboard supports repeat on rows and individual metrics. How can I use this feature

Zabbix + Grafana

别来无恙 提交于 2021-02-18 00:59:34
Grafana 简介 Grafana 自身并不存储数据,数据从其它地方获取。需要配置数据源 Grafana 支持从 Zabbix 中获取数据 Grafana 优化了图形的展现,可以用来做监控大屏 Grafana 支持用户的认证 下载地址: https://grafana.com/docs/installation/rpm/ 安装并启动 wget https://dl.grafana.com/oss/release/grafana-6.1.4-1.x86_64.rpm sudo yum localinstall grafana-6.1.4-1.x86_64.rpm systemctl start grafana-server.service systemctl enable grafana-server.service 登录 # ip + 3000端口访问 http://172.16.0.41:3000 # 初始用户密码 admin admin 第一次登录需要强制修改密码 Grafana 简单实用 创建 dashboard , 其次创建图形 每次操作都需 save 保存, 类似代码写完提交代码管理库一样. 创建 dashboard Grafana 支持的数据源 Grafana 安装 Zabbix 插件 grafana-cli plugins list-remote grafana

Grafana for zabbix

霸气de小男生 提交于 2021-02-17 16:24:21
Grafana 是纯Javascript开发的前端展示工具。后端数据源可以通过Graphite、InfluxDB、OpenTsDB等获取数据,或者通过插件的方式获取zabbix监控的数据。然后在前端通过Grafana展示数据,grafana可以自定义各种图表。 官方安装文档:http://docs.grafana.org/installation/rpm https://www.digitalocean.com/community/tutorials/how-to-install-and-configure-grafana-to-plot-beautiful-graphs-from-zabbix-on-centos-7 ---plugin: https://grafana.com/plugins/alexanderzobnin-zabbix-app v3.9.0 https://grafana.com/plugins/grafana-clock-panel v0.0.9 https://grafana.com/plugins/grafana-piechart-panel v1.3.0 https://grafana.com/plugins/raintank-worldping-app v1.2.3 # 1. install grafana software and plugin

初试 Open Service Mesh(OSM)

拈花ヽ惹草 提交于 2021-02-17 02:57:19
微软近期开源了一个新的名为 Open Service Mesh [1] 的项目并准备 捐赠给 CNCF [2] 。 基本介绍  Open Service Mesh (OSM) is a lightweight, extensible, Cloud Native service mesh that allows users to uniformly manage, secure, and get out-of-the-box observability features for highly dynamic microservice environments. ” Open Service Mesh(OSM)是一个轻量级,可扩展的云原生服务网格,它使用户能够统一管理,保护和获得针对高度动态微服务环境的开箱即用的可观察性功能。 OSM 在 Kubernetes 上运行基于 Envoy 的控制平面,可以使用 SMI API 进行配置。它通过以 sidecar 的形式注入 Envoy 代理来工作。 控制面负责持续配置代理,以配置策略和路由规则等都保持最新。代理主要负责执行访问控制的规则,路由控制,采集 metrics 等。(这和目前我们常见到的 Service Mesh 方案基本都一样的) 显著特性 基于 Service Mesh Interface (SMI) 的实现,主要包括

Prometheus+Grafana可视化监控SpringBoot项目

时光毁灭记忆、已成空白 提交于 2021-02-12 08:29:58
原文地址: https://xeblog.cn/articles/7 Prometheus简介 简史 Prometheus受启发于Google的Brogmon监控系统(相似的Kubernetes是从Google的Brog系统演变而来),从2012年开始由前Google工程师在Soundcloud以开源软件的形式进行研发,并且于2015年早期对外发布早期版本。2016年5月继Kubernetes之后成为第二个正式加入CNCF基金会的项目,同年6月正式发布1.0版本。2017年底发布了基于全新存储层的2.0版本,能更好地与容器平台、云平台配合。 架构 特点 多维的数据模型(基于时间序列的k/v键值对)。 灵活的查询及聚合语句(PromQL)。 不依赖分布式存储,节点自治。 基于HTTP的pull模式采集时间序列数据。 可以使用pushgateway(prometheus的可选中间件)实现push模式。 可以使用动态服务发现或静态配置采集的目标机器。 支持多种图形及仪表盘。 相关概念 数据模型 Prometheus 存储的是时序数据, 即按照相同时序(相同的名字和标签),以时间维度存储连续的数据的集合。 监控样本 # HELP system_cpu_usage The "recent cpu usage" for the whole system # TYPE system_cpu

【Springboot】用Prometheus+Grafana监控Springboot应用

主宰稳场 提交于 2021-02-12 08:21:21
1 简介 项目越做越发觉得,任何一个系统上线,运维监控都太重要了。关于Springboot微服务的监控,之前写过 【Springboot】用Springboot Admin监控你的微服务应用 ,这个方案可以实时监控并提供告警提醒功能,但不能记录历史数据,无法查看过去1小时或过去1天等运维情况。本文介绍Prometheus + Grafana的方法监控Springboot 2.X,实现美观漂亮的数据可视化。 2 Prometheus Prometheus是一套优秀的开源的监控、报警和时间序列数据库组合系统,在现在最常见的 Kubernetes 容器管理系统中,通常会搭配 Prometheus 进行监控。 2.1 引入到Springboot 将 Prometheus 引入依赖如下: <dependency> <groupId>io.micrometer</groupId> <artifactId>micrometer-registry-prometheus</artifactId> </dependency> 对于Springboot,要开启 Actuator ,并打开对应的 Endpoint : management.endpoints.web.exposure.include=* # 或者 management.endpoints.web.exposure.include

Grafana - Single stat after big counter reset

人盡茶涼 提交于 2021-02-11 17:01:51
问题 We use Grafana + Prometheus to monitor our infrastructure and recently we added some business focused metrics and I've been having issues with one of the counters we track. It's a session time counter. Basically, each time a session ends, we increase that counter by the time the user spent in that session. So if an user spends 2m using the software, the counter will be incremented by 120000 ms. For a few days that approach worked perfectly fine, but since yesterday when we had a big

How to call Prometheus Histogram.observe() on serveral Functions at once in NodeJS

不羁的心 提交于 2021-02-11 15:12:16
问题 I am monitoring a NodeJS app using Prometheus. Creating a Histogram like this const histogram = new client.Histogram({ name: 'node_request_duration_seconds', help: 'Histogram for the duration in seconds.', buckets: [1, 2, 5, 6, 10] }); Now I am calling histogram.observe() like this to monitor a request to the path '/' const app = express(); app.get('/', (req, res) => { //Simulate a sleep var start = new Date() var simulateTime = 1000 setTimeout(function(argument) { // execution time simulated