grafana

asp.net core监控—引入Prometheus(五)

廉价感情. 提交于 2021-01-03 09:06:21
上一篇博文中说到Prometheus有四种指标类型:Counter(计数器)、Gauge(仪表盘)、Histogram(直方图)、Summary(摘要),并且我们做了一个Counter的Demo,接下来看看Histogram。 Summary:摘要 summary是采集展示百分位数,百分位定义:在一组由小到大的数字中,某个数字大于90%的数字,这个数字就是第90个的百分位数。 通过demo的来理解一下吧,假如我们业务需求是要知道订单金额10,30,50,70,90的百分位数,该怎么实现呢? 需要在MetricsHub.cs中添加Summary类型的指标收集集合: using Prometheus; using System.Collections.Generic; namespace PrometheusSample.Middlewares { public class MetricsHub { private static Dictionary<string, Counter> _counterDictionary = new Dictionary<string, Counter>(); private static Dictionary<string, Dictionary<string, Gauge>> _gaugeDictionary = new Dictionary

Prometheus 监控 Ceph 集群

丶灬走出姿态 提交于 2020-12-30 08:54:47
Prometheus 监控 Ceph 集群 Prometheus Module — Ceph Documentation Prometheus 模块启用: [root@node1 ~]# ceph mgr module enable prometheus [root@node1 ~]# ceph mgr services { "dashboard": "https://node1:8443/", "prometheus": "http://node1:9283/" } [root@node1 ~]# netstat -tnlp | grep 9283 tcp6 0 0 :::9283 :::* LISTEN 1507703/ceph-mgr 默认情况下,模块将在主机上的所有 IPv4 和 IPv6 地址的端口上接受 HTTP 请求。 ceph config set mgr mgr/prometheus/server_addr 0.0.0.0 ceph config set mgr mgr/prometheus/server_port 9283 安装 prometheus 步骤请移步我之前的博客 掌握Prometheus 监控思科交换机技能,这篇文章就够了!-余生还长,何必慌张-51CTO博客 (一) Prometheus 监控思科交换机---各中间件安装部署 ceph 各节点部署

prometheus+grafana实现监控过程的整体流程

岁酱吖の 提交于 2020-12-30 07:59:11
prometheus安装较为简单,下面会省略安装步骤: 一.服务器启动 Prometheus启动 ./prometheus --config.file=prometheus.yml Grafana启动 service grafana-server start 设置自启动 如需自启动某些服务,只需使用chkconfig 服务名 on即可,若想关闭,将on改为off ,如 chkconfig grafana-server on 二.访问服务器 1.Prometheus:部署ip:9090(默认端口号); 2.Grafana:部署ip:3000(默认端口号),访问Grafana服务器的时候会要求输入账号密码,这里使用默认账号密码,账号:admin,密码:admin 3.设置Grafana管理Prometheus 三.配置exporter(监控不同的对象需要不同的导出器) 下载exporter tar.gz并上传至服务器 解压 ./node_exproter 安装 curl 127.0.0.1:9100 验证,curl 127.0.0.1:9100/metrics,会返回一大推性能指标 在 prometheus 中的yml文件中,配置exporter导出器 四.问题 至此所有安装已完成,但是还存在以下问题,这些问题我们放在下面的配置,可视化段落处理。 Prometheus

安利一个基于Spring Cloud 的面试刷题系统。面试、毕设、项目经验一网打尽

自作多情 提交于 2020-12-29 10:08:03
推荐👍: 接近100K star 的Java学习/面试指南 Github 95k+点赞的Java面试/学习手册 今天给小伙伴们推荐一个朋友开源的面试刷题系统。 这篇文章我会从系统架构设计层面详解介绍这个开源项目,并且会把微服务常用的一些技术都介绍一下。即使你对这个项目不感兴趣,也能了解到很多微服务相关的知识。美滋滋! 昨晚肝了很久~原创不易,若有帮助,求赞求转发啊! 不得不说,这个刷题系统确实是有点东西,你真的值得拥有!首先,这是一个微服务的项目,其次这个系统涵盖了市面上常用的主流技术比如 SpringBoot、Spring Cloud 等等(后面会详细介绍)。 不论是你想要学习分布式的技术,还是想找一个实战项目练手或者作为自己的项目经验,这个项目都非常适合你。 另外,因为项目作者提供了详细的技术文档,所以你不用担心上手太难! 效果图 我们先来看看这个面试刷题系统的效果图。这里我们只展示的是这个系统的前端(微信小程序),后台管理系统这里就不展示了。 可以看到,除了少部分地方的颜色搭配比较难看之外,页面整体 UI 还是比较美观的。 技术栈 再聊聊大家最关心的问题:“ 这套系统的技术栈是什么样的呢? ”。 这套系统采用了目前企业都在用的主流技术:SpringBoot(基础框架)、Spring Cloud(微服务)、MyBatis(ORM框架)、Redis(缓存)、MySql

clickhouse小工具&小技巧收集汇总

扶醉桌前 提交于 2020-12-26 00:53:19
0x01. 排查clickhouse问题 找到问题发生的时间点,可以对照grafana中的资源监控来看时间点 找/var/log/clickhouse-server/clickhouse-server[-err].log对应时间点的日志 查看system.query_log/processes具体的一些动作,定位问题 0x02. 琐碎的小技巧和系统表 改名 rename table ods_data.single_point_log_2 to ods_data.single_point_log on cluster cluster_2shard_5_6_2replicas_5_6; 更改或者删除表数据 ALTER TABLE [db.]table [ON CLUSTER cluster] DELETE WHERE filter_expr clickhouse中这些语句是异步执行的,查询这些语句执行情况,可以查看system.mutations表,找到执行语句对应的记录,is_done为1表示执行完成 system.query_log与慢查询查询 query_log系统表记录clickhouse中sql执行的历史,可以查看执行时间,影响的数据行等信息,可以为优化SQL提供一些关键性的信息。当然基于此我们也可以做一些监控,例如下面的慢查询语句 --查询执行超过1000秒的语句

prometheus 的promsql的经典例子 安装grafana

自闭症网瘾萝莉.ら 提交于 2020-12-25 09:16:29
0.好的参考文档 https://www.cnblogs.com/longcnblogs/p/9620733.html 1.多维度数据 2.Prometheus的全局监控指标 只需要定义一个全局的指标 container_memory_usage_bytes ,然后通过添加不同的维度数据来满足不同的业务需求 3.Prometheus的prom SQL使用的模板 1 .统计不同运行环境中 webapp 容器内存使用总量:sum(container_memory_usage_bytes{container_name=~ “webapp”}) by (env) 2 .计算 webapp2 的平均内存使用情况:avg(container_memory_usage_bytes{container_name=“webapp2”}) 参考: https://www.cnblogs.com/CloudMan6/p/7709970.html -------------------------------------------------------------------------------- 1.promsql的意义 查看 http_requests_total 5分钟内,平均每秒数据 来源: oschina 链接: https://my.oschina.net/u/4323385/blog

Prometheus入门

最后都变了- 提交于 2020-12-24 15:12:07
什么是TSDB? TSDB(Time Series Database)时序列数据库,我们可以简单的理解为一个优化后用来处理时间序列数据的软件,并且数据中的数组是由时间进行索引的。 时间序列数据库的特点 大部分时间都是写入操作。 写入操作几乎是顺序添加,大多数时候数据到达后都以时间排序。 写操作很少写入很久之前的数据,也很少更新数据。大多数情况在数据被采集到数秒或者数分钟后就会被写入数据库。 删除操作一般为区块删除,选定开始的历史时间并指定后续的区块。很少单独删除某个时间或者分开的随机时间的数据。 基本数据大,一般超过内存大小。一般选取的只是其一小部分且没有规律,缓存几乎不起任何作用。 读操作是十分典型的升序或者降序的顺序读。 高并发的读操作十分常见。 常见的时间序列数据库 TSDB项目 官网 influxDB https://influxdata.com/ RRDtool http://oss.oetiker.ch/rrdtool/ Graphite http://graphiteapp.org/ OpenTSDB http://opentsdb.net/ Kdb+ http://kx.com/ Druid http://druid.io/ KairosDB http://kairosdb.github.io/ Prometheus https://prometheus.io/

基于prometheus打造分布式监控系统

霸气de小男生 提交于 2020-12-24 13:45:31
规划使用版本 产品名称 版本 url地址 prometheus 2.22.1 https://github.com/prometheus/prometheus/releases/tag/v2.22.1 alertmanager v0.21.0 https://github.com/prometheus/alertmanager/releases/tag/v0.21.0 consul 1.8.5 docker.io/consul consulR latest https://github.com/qist/registy-consul-service/releases victoriametrics v1.50.2 https://github.com/VictoriaMetrics/VictoriaMetrics/releases kube-prometheus v0.43.2 https://github.com/prometheus-operator/kube-prometheus kube-prometheus 修改版本 https://github.com/qist/k8s/tree/master/k8s-yaml/kube-prometheus grafana v7.3.2 docker.io/grafana/grafana 部署环境 部署环境 部署IP 部署方式

入门Prometheus监控系统之Hello World

筅森魡賤 提交于 2020-12-24 12:59:19
为什么需要监控系统?这个应该不需要我赘述了,简言之,监控系统帮助运维和开发人员监控线上环境的状态,既能及时预警,也有利于查bug找问题。 Prometheus是一款当前业界最流行的开源监控系统,没有之一! 学习Prometheus需要理解不少概念,在这之前,让我们先把一个完整的Prometheus系统搭起来一睹为快! 一,安装Docker 和 Docker Compose Docker Engine overview docs.docker.com Install Docker Compose docs.docker.com 在命令行中运行以下指令确保安装成功 docker --version docker-compose --version 二,从 GitHub 上拉下 dockprom 的代码 git clone https://github.com/stefanprodan/dockprom 三,运行 cd dockprom ADMIN_USER=admin ADMIN_PASSWORD=admin docker-compose up -d 结束!就这么简单! 来看看效果 (以下网址如果需要登录,用户名和密码都是 admin) 访问 Prometheus 控制台 http:// localhost:9090/graph 尝试在 输入框里输入以下内容 sum(rate(node

可能是目前最给力的Prometheus与Zabbix选型解读

怎甘沉沦 提交于 2020-12-19 18:53:39
云原生成为趋势之际,企业对容器监控的需求日渐增长,Prometheus也日益受到关注,随之掀起了新一轮关于监控选型的探讨。 Zabbix 因轻量、 成熟度高 、开发门槛低等优点被广泛应用,但在 云环境下却 渐显力不从心。 该如何对 二者进行选型和 应用? 针对大家关心的监控问题,dbaplus社群开启【deeplus · 当打之年 】 第一期,邀请到分别专研于 Prometheus 和Zabbix的两位专家,在线上直播间连麦探讨,帮大家答疑解惑: 直播时间 2020年9月12日 14:00-16:00 【线上直播间】 直播议程 ① 讨论 - 关于Prometheus与Zabbix,你最关心的核心问题(约20min) 两者各有哪些优劣异同?应该根据哪些方面进行选择? 监控经常出现的告警风暴和误报,两者怎么进行解决? 在故障自愈上,两者怎么结合其他手段实现? 大规模场景下,两者怎么做架构搭建和优化? 关于监控指标,单个指标与聚合指标该如何设计?需要做什么区分吗? 基于开源监控工具做自研监控平台,从哪方面入手更好? 二者怎么解决存储问题? 如何基于二者做分布式监控架构? …… 更多讨论议题 由你决定! 点击文末 阅读原文 ,报名并填写你希望听到或感到疑惑的监控话题,让这次探讨的内容真正 为你适用! ② 案例 - 基于Prometheus与Zabbix的实践经验分享(约60min) 主题: