Prometheus监控系列最佳实践
Prometheus是继kubernetes第二个从CNCF中毕业的项目,个人也是非常的喜欢这款通过数据指标发现和预测告警的开源监控平台,官方的话就不多说了,根据官网的介绍有以下功能,但是有些简短的概括了你也不一定知道,所以加了一些个人的白话 官方截图 Prometheus之白话文一段 实现高纬度的数据模型 时间序列数据通过 metric 名和键值对来区分,这里你可以区分多(隔离)环境的监控指标。 所有的 metrics 都可以设置任意的多维标签,可以自定义添加多个,比如这个服务的监控属于哪个团队的。 数据模型更随意,不需要刻意设置为以点分隔的字符串; 可以对数据模型进行聚合,切割和切片操作; 支持双精度浮点类型,标签可以设为全 unicode; 看到这可能你还是不知道啥意思,那就等接下来用到的时候就恍然大悟了... 强大的PromQL语句 支持查询语句,可以通过PromSQL进行数值之间的比较 可以通过PromSQL内嵌的函数计算指标的变化,比如平均值,增长率等等... 出色的可视化 个人觉得一点都不咋出色,哈哈,还是结合 Grafana 使用吧,毕竟人家专业啊~ 高效的存储 可以根据需求设置指标数据的存储天数,也可以持久化存储,比如通过 remotestorageadapter 使用简单 部署简单 支持动态发现 支持热加载 支持配置文件格式检查 精准的告警 告警指的不是