grafana

3.配置Grafana Dashboard

女生的网名这么多〃 提交于 2020-08-12 23:58:09
本次我们通过部署 Grafana 来进行图形展示,Grafana 为我们提供了非常多的图形模板。 Grafana 官网: https://grafana.com/ 1、下载安装 Grafana 我们使用最简单的 RPM 包方式来安装,下载链接: https://grafana.com/grafana/download wget https://dl.grafana.com/oss/release/grafana-7.0.3-1.x86_64.rpm yum install grafana-7.0.3-1.x86_64.rpm 运行 Grafana 服务,默认监听在 TCP/3000 的端口上,默认用户名和密码为 “admin”。 访问地址: http://192.168.75.11:3000 , 首次登陆后可以重新设置密码,也可以跳过设置,使用默认的密码 systemctl start grafana-server systemctl enable grafana-server 2、配置 Grafana 添加数据源 填写对应的配置信息。 Name:定义数据源的名字; Type:数据源类型; URL:Prometheus 服务的IP地址和端口; 其他保持默认,然后点击测试并保存。 3,导入 Dashboard 模板 在 Grafana 官方提供了众多的 Dashboard

性能1.84倍于Ceph!网易数帆Curve分布式存储开源

半世苍凉 提交于 2020-08-12 15:46:22
在上周刚结束的网易数字+大会上 网易数帆 宣布: 开源一款名为Curve的高性能分布式存储系统, 性能可达Ceph的1.84倍! 网易副总裁、网易杭州研究院执行院长兼网易数帆总经理汪源: 基础软件的能力对于数字化转型非常关键,当前存储领域需要一款性能更高、可用性/可靠性更好、自治能力更强的分布式存储系统,Curve的开源不仅代表网易数帆在基础软件市场的坚持,也为软件定义基础设施生态的繁荣再添一把火。 采用先进架构设计 单卷性能1.84倍于Ceph Curve的定位,是提供一个高性能、低延迟的存储底座,基于这个存储底座,企业可以打造适用于不同应用场景的存储系统,如块存储、对象存储、云原生数据库等。目前,网易数帆已经实现了高性能块存储系统。 汪源介绍,Curve主要具有三大设计特点: 高性能、高可用和自治 。 高性能源自先进架构。Curve参考了业界的存储系统,采用先进、高效的开源技术,设计了一个新架构实现高性能低延迟的核心能力,采用高性能的RPC框架来保障网络数据流的高性能和低延迟,基于Raft协议实现多副本一致性下的低延迟,并针对Raft协议的快照实现进一步优化。磁盘IO方面,Curve通过更细粒度的地址空间的hash减少IO碰撞,增加IO并发度,并采用chunkfilepool减小IO放大倍数,从而最大限度地发挥硬件的性能。 汪源公布了Curve和CephL版本的测试数据对比

基于docker搭建Prometheus+Grafana监控报警系统

自闭症网瘾萝莉.ら 提交于 2020-08-12 14:28:19
下载prometheus等镜像: # prometheus镜像 docker pull docker.io/prom/prometheus # grafana镜像 docker pull docker.io/grafana/grafana # node-exporter:监控系统信息,这里先写下,暂时不用 docker pull docker.io/prom/node-exporter 一. Prometheus安装 1.1 编辑配置文件prometheus.yml 简单期间,本文使用Docker方式安装,其他方式安装请详见 Prometheus安装说明 。 # 第一步:建立相应文件夹 mkdir -p /opt/prometheus mkdir -p /opt/prometheus/server # mkdir -p /opt/prometheus/client touch /opt/prometheus/server/rules.yml # 后面报警系统使用 chmod 777 /opt/prometheus/server/rules.yml # 第二步:编辑配置文件prometheus.yml cd /opt/prometheus/ vi prometheus.yml # 第三步:prometheus.yml内容如下: 更多配置项详见 Prometheus

decops实践

泪湿孤枕 提交于 2020-08-12 10:10:54
总览 将 DevOps 实施的过程分为了这么几个步骤: 建立愿景与方向 度量:组织、系统现状 准入条件 。查看是否满足实施 DevOps 的准入条件。 探索可行方案 。即 MVP 尝试 MVP 。一次快速的 DevOps 过程和结果的 showcase。 精细的 DevOps 实施 回顾优化 规模化 DevOps 落地 对应的在手册中,还包含了 附录 1:移动应用的自动化测试 附录 2:可信软件系统 10 要素 附录 3:基本概念 建立愿景与方向 启动会议 利益相关者会议 业务关注点 组成部分标题 内容 问题 为什么对组织来说引入 DevOps 实践是有好处的? 成本 引入 DevOps 实践的预期成本是什么? 干系人影响 对内部和外部干系人的影响是什么? 风险和缓解 与引入 DevOps 实践相关联的组织和技术风险是什么?如何减缓这些风险? 推出计划 推出 DevOps 的实践计划是什么? 成功标准 我们如何知道 DevOps 实践的引入是成功的 ? —— 《DevOps 架构师行动指南》 识别目标和现状 自评 差距分析 确认团队 优先选择优秀的团队? 设立里程碑 时间节点-团队-活动-产出表 落地策略 DevOps 转型策略 自行落地 1. 组织层级解决跨团队协作 2. 建立 DevOps 知识库 顺带一提,Ledge 已经成为了多个 DevOps

【过关斩将】运维老鸟带教你如何精通运维

梦想与她 提交于 2020-08-12 07:00:27
文章目录 前言 一. 你的困惑在哪里? 1. 关于学习与公司的区别 2. 这么多我该学哪一个? 二. 如何才能学精通运维 三. 最核心的问题来了 总结 前言 我经常说一句话: 运维行业入门容易,精通难。 为什么? 因为运维学的东西又多又杂; 需要了解网络,学习系统基础操作,熟悉数据库,熟悉基础服务,熟悉自动化工具,虚拟化,容器,监控,故障排查等等。 而且随便一个点都有无数的工具需要掌握,比如监控: zabbix,grafana, cacti,天兔,prometheus,nagios,monit,ganglia,zenoss,open-falcon等等。 每一个工具又有无数的插件和模块,比如prometheus,与grafana结合,与微信结合,与邮件结合,与钉钉结合,单机模式,分布式,与数据库结合,与存储结合,与硬件结合,太多了,多到不想写。 很多人学着学着就放弃了,所以今天我们就一起来探讨下,运维到底该如何学。 一. 你的困惑在哪里? 这个问题比较好,你的困惑在哪里呢? 我调查了数百名小伙伴,大家普遍的困惑就是: 学的在公司能用上吗? 来源: oschina 链接: https://my.oschina.net/u/4349274/blog/4463621

网络监控系统七大开源工具分析

馋奶兔 提交于 2020-08-11 17:58:36
不断提升企业形象及服务质量、节约成本是所有企业的需求。数字化进程的加速,企业基本都会面临线上办公、线上提供产品服务的情况。运维部门为确保企业中所有业务稳定运行,并满足业务不断扩张的发展需求,时刻肩负着极大的挑战。如何节省成本,提升运维工作效率,实现精准监控? 当下,部分企业倾向于用开源软件节约成本,开源产品如何选型?如何达到企业级效果?我们测试了七个开源产品:Zabbix、Nagios、Prometheus、SugarNMS、Ganglia、Open-Falcon和Cacti,这些产品都有稳固的用户基础且均有更新。我们重点测试了操作,管理工具、接口以及每个产品的监控能力,自动发现、应用场景等情况。 我们在Windows上测试了这七款产品,当然并不是这些产品不能在Linux上运行。 Zabbix 商业开源软件。一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。用户群体主要面向泛物联网企业,主要监控集群。 支持告警功能,具备扩展能力,可自定义监控指标,其主要采用mysql/postgresql存储监控数据,监控规模1000+左右。但缺少数据汇总功能,使用上不太方便。而且由于缺少中文资料,服务支持有限,学习成本和定制模板比较大。 Nagios Nagios是一款开源网络监视工具,适合监视大量服务器计算环境,集成了很多功能。可监控主机状态及网络设备等

CentOS-安装node_exporter导出机器指标

孤者浪人 提交于 2020-08-11 14:07:01
注 :node_exporter导出机器指标配合 Grafana + Prometheus 使用,可参考: 远程监控服务器指标 创建相关目录 $ mkdir /home/prometheus/ -p $ cd /home/prometheus/ 获取 node_exporter压缩包 没有安装wget需要执行:$ yum install wget -y github主页 (版本参考主页) $ wget https://github.com/prometheus/node_exporter/releases/download/ v1.0.0 /node_exporter- 1.0.0 .linux-amd64.tar.gz 解压缩并将目录重命名为node_exporter $ tar -xzvf node_exporter- 1.0.0 .linux-amd64.tar.gz $ mv node_exporter- 1.0.0 .linux-amd64 node_exporter 创建新的服务文件 $ vi /etc/systemd/system/node_exporter.service [Unit] Description=Node Exporter Wants=network-online.target After=network-online.target [Service]

Golang 昨天、今天和明天

独自空忆成欢 提交于 2020-08-11 04:52:19
昨天 市面上有这么多语言为啥还需要开发Go这么个语言? 07年的一天,几位谷歌的大牛在讨论用C++开发一些有关庞大的分布式集群的工作,非常繁琐但很核心,很是闹心,后来听说C++又要添加35项新特性。大牛听了很是不爽啊,于是讨论能否可开发一款新的语言,运行快、编译快、开发还快。于是几位列举了新语言的主要特性,并且借鉴现有语言众家之所长。说干就干,09年go语言就诞生了。以下是当年列举的主要特性 规范的语法(不需要符号表来解析) 垃圾回收(独有) 无头文件 明确的依赖 无循环依赖 常量只能是数字 int和int32是两种类型 字母大小写设置可见性(letter case sets visibility) 任何类型(type)都有方法(不是类型) 没有子类型继承(不是子类) 包级别初始化以及明确的初始化顺序 文件被编译到一个包里 包package-level globals presented in any order 没有数值类型转换(常量起辅助作用) 接口隐式实现(没有“implement”声明) 嵌入(不会提升到超类) 方法按照函数声明(没有特别的位置要求) 方法即函数 接口只有方法(没有数据) 方法通过名字匹配(而非类型) 没有构造函数和析构函数 postincrement(如++i)是状态,不是表达式 没有preincrement(i++)和predecrement

采用Helm部署Grafana-Loki日志采集系统

不打扰是莪最后的温柔 提交于 2020-08-10 17:15:58
前一篇文章通过docker-compose 直接部署是最简单的方式,但是要兼容k8s、k3s集群环境,必须转化为yaml或者Helm来部署,之前yaml部署之后出现labels not found,采集日志为空。本文采用Helm来部署。 1. Helm安装部署,本文基于v2.14.3 Helm包含:HelmClient 和 TillerServer a)下载HelmClient wget https://get.helm.sh/helm-v2.14.3-linux-amd64.tar.gz && tar zxvf helm-v2.14.3-linux-amd64.tar.gz cd helm-v2.14.3-linux-amd64 chmod +x helm cp helm /usr/local/bin helm version Client: &version.Version{SemVer:"v2.14.3", GitCommit:"0e7f3b6637f7af8fcfddb3d2941fcc7cbebb0085", GitTreeState:"clean"} b)安装TillerServer,在k8s,k3s集群中需要配置ServiceAccount: tiller,并赋予cluster-admin角色权限,采用rbac.yaml配置 apiVersion: v1 kind:

掌门1对1微服务体系Solar|阿里巴巴Sentinel落地实践

泪湿孤枕 提交于 2020-08-10 15:48:27
前言 掌门1对1精耕在线教育领域,近几年业务得到了快速发展,但同时也遭遇了“成长的烦恼”。随着微服务数量不断增加,流量进一步暴增,硬件资源有点不堪重负,那么,如何实现更好的限流熔断降级等流量防护措施,这个课题就摆在了掌门人的面前。由于 Spring Cloud 体系已经演进到第二代,第一代的 Hystrix 限流熔断降级组件已经不大适合现在的业务逻辑和规模,同时它目前被 Spring Cloud 官方置于维护模式,将不再向前发展。 如何选择一个更好的限流熔断降级组件?经过对 Alibaba Sentinel 、 Resilience4j 、 Hystrix 等开源组件做了深入的调研和比较,最终选定 Alibaba Sentinel 做微服务体系 Solar 中的限流熔断降级必选组件。 Sentinel 简介 阿里巴巴中间件部门开发的新一代以流量为切入点,从流量控制、熔断降级、系统负载保护等多个维度保护服务的稳定性的分布式系统的流量防卫兵。它承接了阿里巴巴近10年的双十一大促流量的核心场景,例如秒杀(即突发流量控制在系统容量可以承受的范围)、消息削峰填谷、集群流量控制、实时熔断下游不可用应用等。 它具有非常丰富的开源生态: 它和 Hystrix 相比,有如下差异: 摘自官网 Sentinel Roadmap 关于 Sentinel 如何使用,它的技术实现原理怎样等