Prometheus

P200阿木无人机学习笔记

微笑、不失礼 提交于 2020-08-17 17:45:44
目录 我手上的阿木实验室的P200无人机配置 现阶段目标:实现二维码引导着陆 项目理解 进度-更新中 踩坑经验 我手上的阿木实验室的P200无人机配置 TX2板载计算机(预装好ubuntu16.04系统和ROS、mvros等,amov_ws文件夹下载有px4_command开源项目代码、没有安装PX4编译环境、没有安装nomachine软件) Pixhawk4飞控(应该是预先刷好了阿木的Firmware V110中的v5版本的固件) 单目USB摄像头一个、激光定高模块一个、wifi数传一个、遥控器。目前没有激光雷达和双目摄像头。 现阶段目标:实现二维码引导着陆 主要参考资料: 新手入门: https://amov-wiki.readthedocs.io/zh_CN/latest/docs/新手入门.html 阿木的github: https://github.com/amov-lab 阿木的b站无人机开发课程8课: https://www.bilibili.com/video/BV19K411p7do 阿木的论坛和学院: https://bbs.amovlab.com/forum.php?mod=viewthread&tid=486&extra=page 阿木的Prometheus无人机开源项目(含二维码自主着陆): https://github.com/amov-lab

SQL/PromQL? SLS时序分析选型

老子叫甜甜 提交于 2020-08-17 16:50:08
可观察性与Open Telemetry 在CNCF的 landscape 上,有专门的一个部分来展示Obserability and Analysis,什么是Observability(可观察性)? 我从OpenTelementry官网摘抄了这段描述: 可观察性包括Logging,Metrics,Tracing这三类紧密配合的数据源:metrics可以用来发现问题,利用相关的trace去找到异常节点,再看该异常节点的日志去定位根因。 很多人可能会觉得可观察性就是“旧瓶装新酒”,本质上没有任何的创新。从现实中(包括Landscape)不难理解这个说法,目前Logging,Metrics(Monitoring),Tracing都有各自的生态。实现上大家有各自的数据模型,模型中可能有也可能没有考虑和其他数据的联动,如果想要对数据做整合,就要各自做大量的适配工作。 为了解决这个问题,OpenTelementry诞生了。OpenTelementry从OpenTracing和OpenCensus合并而来,致力于可观察性的统一,他的重点在规范的制定,sdk的实现,采集系统的实现上,让大家都以一致的数据模型来产出数据. 对于数据如何存储如何使用,这个范畴太大,有非常多可能性,所以仍然需要上层产品去探索。 SLS 对Open Telemetry支撑

ansible生产环境使用场景(二)

China☆狼群 提交于 2020-08-17 10:19:44
前言: ​ 生产上新入网的服务器都需要安装prometheus的监控客户端软件,主要步骤有:新建监控用户、拷贝客户端软件、拉起客户端进程、开机自启动。本文记录了使用ansible的role方式批量快速的安装该客户端软件。 ​ 本文使用到的主要模块:user、stat、copy、shell、script、lineinfile等。 环境说明: 主机名 操作系统版本 ip ansible version 备注 ansible Centos 7.6.1810 172.27.34.51 2.9.9 ansible管理服务器 ansible-awx Centos 7.6.1810 172.27.34.50 / 被管服务器 一、创建目录列表 [root@ansible ~]# cd /etc/ansible/roles [root@ansible roles]# ansible-galaxy init prometheus - Role prometheus was created successfully [root@ansible roles]# tree prometheus prometheus ├── defaults │ └── main.yml ├── files ├── handlers │ └── main.yml ├── meta │ └── main.yml ├──

新鲜开源:基于Prometheus的企业监控平台设计与实现

為{幸葍}努か 提交于 2020-08-17 05:22:07
本文根据刘恒滔老师在〖deeplus直播第224期〗线上分享演讲内容整理而成。 (文末有获取本期PPT&回放的方式,不要错过) 大家好,今天跟大家分享的是我们360基于Prometheus开发的监控平台,名字叫“哆啦A梦”,目前已经在GitHub上开源了,这次我主要会分享以下这些内容: Prometheus在360搜索云平台的应用及Alertmanager的痛点 哆啦A梦的设计思路 哆啦A梦的功能介绍 哆啦A梦的快速部署 报警恢复聚合方案 标签匹配筛选 一、Prometheus的应用及Alertmanager的痛点 我们360搜索事业部云平台的Prometheus全部使用容器部署,采用联邦架构,容器监控指标和物理机监控指标全部使用Prometheus进行采集。在使用过程中,我们发现Prometheus自带的报警模块Alertmanager有些地方不是很完善,使用起来不够灵活,具体如下: 无法动态加载监控规则,需要修改配置文件; 使用Alertmanager时,需要修改Prometheus的配置文件将Alertmanager与Prometheus相关联; 无法实现报警升级,不支持获取动态值班组,标签匹配不能动态配置(需要修改配置文件)。 总而言之就是,配置不够方便灵活,需要频繁修改配置文件,学习成本高。 二、哆啦A梦的设计思路 针对上述这些问题,我们开发并开源了哆啦A梦报警平台

Choerodon猪齿鱼实践之集群管理(二)

别等时光非礼了梦想. 提交于 2020-08-16 14:27:43
通过之前的文章 《Choerodon实践之集群管理(一)》 ,我们了解到了Choerodon集群与k8s集群之间的关联、集群权限管理以及节点详情查看的功能。那如何更加灵活便捷地对k8s集群进行监控呢?又怎么对监控组件进行安装、配置与管理呢?本文旨在为大家介绍Choerodon平台中的组件管理以及集群监控的功能。 功能背景 因为集群管理员或运维人员需要知道集群中所有节点以及节点下各个Pod的资源使用情况,为了收集与展示这些指标,Choerodon集群管理模块主要使用了Prometheus来实现对集群的监控。同时,Choerodon还在界面中提供了直接安装、配置与卸载Prometheus等监控组件的入口,用户可在此通过界面化的形式高效快速地在集群中完成各组件的安装与配置。 除此之外,为了实现在Kubernetes集群中使用 HTTPS 协议的功能,Choerodon在环境资源中支持了对证书的管理,同时为了确保集群中的证书有效且是最新的,并能在到期前按照配置的时间续订证书,Choerodon又提供了对cert-manager组件的支持,用户在组件管理界面即可实现对cert-manager组件的安装与卸载。 组件管理功能 集群管理中组件管理模块目前支持对cert-manager和监控组件(Prometheus、Grafana、AlertManager)进行安装与管理,用于管理集群下所有组件

附024.Kubernetes全系列大总结

≡放荡痞女 提交于 2020-08-16 07:18:12
Kubernetes全系列总结如下,后期不定期更新。 欢迎基于学习、交流目的的转载和分享,禁止任何商业盗用,同时希望能带上原文出处,尊重ITer的成果,也是尊重知识。 若发现任何错误或纰漏,留言反馈或右侧添加本人反馈。 正篇 001.Kubernetes简介 002.Kubernetes简单入门实例 003.Kubernetes二进制部署准备 004.Kubernetes二进制部署创建证书 005.Kubernetes二进制部署kubectl 006.Kubernetes二进制部署ETCD 007.Kubernetes二进制部署Flannel 008.Kubernetes二进制部署Nginx实现高可用 009.Kubernetes二进制部署kube-apiserver 010.Kubernetes二进制部署kube-controller-manager 011.Kubernetes二进制部署kube-scheduler 012.Kubernetes二进制部署worker节点Flannel 013.Kubernetes二进制部署worker节点Nginx实现高可用 014.Kubernetes二进制部署docker 015.Kubernetes二进制部署所有节点kubelet 016.Kubernetes二进制部署所有节点kube-proxy 017

开放、普惠、高性能-SLS时序存储助力打造企业级全方位监控方案

拥有回忆 提交于 2020-08-15 15:14:43
无所不在的时序数据 时间带走一切,长年累月会把你的名字、外貌、性格、命运都改变。 ---柏拉图 随着时间的推移,万事万物都在不停的变化,而我们也会用各种数字去衡量这些变化信息,比如年龄、重量、速度、温度、金钱...在数字化时代中,我们会把这些随着时间变化的数据保存起来,挖掘这些数据的价值。通常我们会称这类数据为---时序数据。 时序数据用于描述物体在时间维度上的状态变化信息。 时序数据在各行各业都得到了非常广泛的应用,例如股票走势、交易趋势、服务器指标、脉搏心跳、定位坐标、能耗趋势等等,而这些数据几乎在所有的场景中都得到了应用,例如: 各类炒股软件提供众多不同维度的股票K线图,为广大股民提供参考标准; Apple Watch通过监控佩戴者的心率信息,帮助人们提早发现严重的心脏疾病; 国家电网通过分析各个小区、住户的用电量曲线,来判断是否有偷电漏电情况; 电商类的公司会监控平台的下单、交易、退货、评价等关键流程的变化趋势,用来快速发现各类异常; 各个游戏平台通过分析每个用户角色的操作、位置等变化规律,来判断是否使用了作弊辅助工具... 我们需要一个什么样的时序存储 为了能够支撑各种场景的时序分析、监控等需求,近几年在开源和商业领域均出现了一些时序存储的引擎,例如TimescaleDB、CrateDB、InfluxDB、OpenTSDB、Prometheus等

可视化工具Grafana:简介及安装

蹲街弑〆低调 提交于 2020-08-15 12:45:29
from: https://www.cnblogs.com/imyalost/p/9873641.html 可视化工具Grafana:简介及安装 随着业务的越发复杂,对软件系统的要求越来越高,这意味着我们需要随时掌控系统的运行情况。因此,对系统的实时监控以及可视化展示,就成了基础架构的必须能力。 这篇博客,介绍下开源的可视化套件grafana的安装及其功能特点。。。 官网地址: Grafana 官方文档: Grafana文档 环境:CentOS7.4 64位 Grafana版本:5.3.2 一、Grafana介绍 Grafana是一个跨平台的开源的度量分析和可视化工具,可以通过将采集的数据查询然后可视化的展示,并及时通知。它主要有以下六大特点: 1、展示方式:快速灵活的客户端图表,面板插件有许多不同方式的可视化指标和日志,官方库中具有丰富的仪表盘插件,比如热图、折线图、图表等多种展示方式; 2、数据源:Graphite,InfluxDB,OpenTSDB,Prometheus,Elasticsearch,CloudWatch和KairosDB等; 3、通知提醒:以可视方式定义最重要指标的警报规则,Grafana将不断计算并发送通知,在数据达到阈值时通过Slack、PagerDuty等获得通知; 4、混合展示:在同一图表中混合使用不同的数据源,可以基于每个查询指定数据源

从零搭建Prometheus监控报警系统

眉间皱痕 提交于 2020-08-15 08:10:11
参考文章: 从零搭建Prometheus监控报警系统 什么是Prometheus? Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB)。Prometheus使用Go语言开发,是Google BorgMon监控系统的开源版本。 2016年由Google发起Linux基金会旗下的原生云基金会(Cloud Native Computing Foundation), 将Prometheus纳入其下第二大开源项目。 Prometheus目前在开源社区相当活跃。 Prometheus和Heapster(Heapster是K8S的一个子项目,用于获取集群的性能数据。)相比功能更完善、更全面。Prometheus性能也足够支撑上万台规模的集群。 Prometheus的特点 多维度数据模型。 灵活的查询语言。 不依赖分布式存储,单个服务器节点是自主的。 通过基于HTTP的pull方式采集时序数据。 可以通过中间网关进行时序列数据推送。 通过服务发现或者静态配置来发现目标服务对象。 支持多种多样的图表和界面展示,比如Grafana等。 官网地址: https://prometheus.io/ 架构图 基本原理 Prometheus的基本原理是通过HTTP协议周期性抓取被监控组件的状态,任意组件只要提供对应的HTTP接口就可以接入监控

Prometheus简介

醉酒当歌 提交于 2020-08-15 04:34:47
参考文章: Prometheus protometheus Prometheus 是一个开源的服务监控系统和时间序列数据库。 特性: 高维度数据模型 自定义查询语言 可视化数据展示 高效的存储策略 易于运维 提供各种客户端开发库 警告和报警 数据导出 Prometheus 是由 SoundCloud 开源监控告警解决方案。 prometheus prometheus存储的是 时序数据 ,即按相同时序(相同名称和标签),以时间维度存储连续的数据的集合。 时序( time series )是由名字( Metric )以及一组key/value标签定义的,具有相同的名字以及标签属于相同时序。 metric名字:表示metric的功能,如 http_request_total 。时序的名字由 ASCII 字符,数字,下划线,以及冒号组成,它必须满足正则表达式 [a-zA-Z_:][a-zA-Z0-9_:]*, 其名字应该具有语义化,一般表示一个可以度量的指标,例如 http_requests_total, 可以表示 http 请求的总数。 标签: 样本:按照某个时序以时间维度采集的数据,称之为样本。实际的时间序列,每个序列包括一个float64的值和一个毫秒级的时间戳 一个 float64 值 一个毫秒级的 unix 时间戳 格式:Prometheus时序格式与 OpenTSDB 相似: