Prometheus

CentOS 6部署监控神器普罗米修斯(详细部署说明)

核能气质少年 提交于 2020-10-25 13:41:41
部署说明: 环境说明: 组件 版本 下载地址 Prometheus 2.6.1 https://prometheus.io/download/#prometheus go 1.11.4 https://golang.org/dl/ Grafana 5.4.2 https://dl.grafana.com/oss/release/grafana-5.4.2-1.x86_64.rpm 安装go 解压安装: [root@cs-linfan local]# tar -C /usr/local/ -xvf go1.11.4.linux-amd64.tar.gz 配置环境变量 [root@cs-linfan local]#vim /etc/profile export PATH=$PATH:/usr/local/go/bin [root@cs-linfan local]#source /etc/profile 验证 [root@cs-linfan local]# go version go version go1.11.4 linux/amd64 安装Prometheus 安装 [root@cs-linfan local]#tar -C /usr/local/ -xvf prometheus-2.6.1.linux-amd64.tar.gz [root@cs-linfan local]#ln

用了日志系统新贵 Loki,ELK突然不香了!

痞子三分冷 提交于 2020-10-25 11:00:25
本文来源: http://blog.csdn.net/Linkthaha/article/details/100575651 最近,在对公司容器云的日志方案进行设计时,发现主流的 ELK 或者 EFK 比较重,再加上现阶段对于 ES 复杂的搜索功能很多都用不上,最终选择了 Grafana 开源的 Loki 日志系统,下面介绍下 Loki 的背景。 背景和动机 当我们的容器云运行的应用或者某个节点出现问题了,解决思路应该如下: 我们的监控使用的是基于 Prometheus 体系进行改造的,Prometheus 中比较重要的是 Metric 和 Alert。 Metric 是来说明当前或者历史达到了某个值,Alert 设置 Metric 达到某个特定的基数触发了告警,但是这些信息明显是不够的。 我们都知道,Kubernetes 的基本单位是 Pod,Pod 把日志输出到 stdout 和 stderr,平时有什么问题我们通常在界面或者通过命令查看相关的日志。 举个例子: 当我们的某个 Pod 的内存变得很大,触发了我们的 Alert,这个时候管理员,去页面查询确认是哪个 Pod 有问题,然后要确认 Pod 内存变大的原因。 我们还需要去查询 Pod 的日志,如果没有日志系统,那么我们就需要到页面或者使用命令进行查询了: 如果,这个时候应用突然挂了,这个时候我们就无法查到相关的日志了

通过Nginx(basic auth)实现Prometheus账号密码登录

走远了吗. 提交于 2020-10-25 09:46:29
一、原因 因客户Red Hat 7.5服务器安装部署grafana无法添加prometheus数据源,以及无法修改初始密码,为确保环境访问安全,特别研究通过账号密码认证访问prometheus,百度了很多资料,但都缺这缺那,所以我这里记录下具体实现过程: 二、安装部署httpd 方法一:使用yum安装 yum -y install apr apr-util httpd 方法二:使用源码安装 yum -y install expat-devel gcc gcc-c++ autoreconf libtoolize automake 1、下载httpd安装包 wget http://mirrors.hust.edu.cn/apache/httpd/httpd-2.4.46.tar.gz 2、解压 tar zxvf httpd-2.4.46.tar.gz 3、下载新的apr、apr-util安装(安装过程会有各种奇葩错误,自行百度解决,这里不具体讲解) wget http://mirror.bit.edu.cn/apache/apr/apr-1.7.0.tar.gz wget http://mirror.bit.edu.cn/apache/apr/apr-util-1.6.1.tar.gz 4、安装apr、apr-util tar -zxvf apr-1.7.0.tar.gz tar

什么是DevOps?该如何正确的在企业内进行实践

时光毁灭记忆、已成空白 提交于 2020-10-25 09:45:37
传统IT技术团队中通常都有多个独立的组织-开发团队、测试团队和运维团队。开发团队进行软件开发、测试团队进行软件测试,运维团队致力于部署,负载平衡和发布管理。 他们之间的职能有时重叠、有时依赖、有时候会冲突。 因为衔接与沟通问题,有时会导致开发-测试-发布的周期太长了,特别是对于互联网公司,时间就是生命。从而需要建立一支由开发,质量保证和运营组成的混合专业知识的团队的需求,并引入了DevOps来弥合团队之间的鸿沟,帮助他们快速而可靠地操作和开发应用程序。 一、什么是DevOps? 顾名思义,Devops是“开发”与“运维”的缩写。它定义了一组流程,这些流程通过在开发和运维团队之间进行协作带来组织文化上的转变。它包含四个关键组件:协作,实践,文化和工具。 二、为什么我们需要DevOps? DevOps带来更高水平的协作和速度,使组织提高生产力,降低运营成本以有效地为客户提供服务并保持市场竞争力。它还有助于更快地发布产品,管理计划外的工作,更快地捕获和解决关键问题。 三、DevOps实践 独立devops团队 DevOps使用各种工具,例如docker、k8s、Jenkins,Terraform,Nagios,Grafana,Prometheus或Splunk等,组织应建立一个集中部门来创建和操作这些工具。这个集中管理部门负责开发团队中的敏捷实践设置,该团队将研究新的工具并坚持使用

Kubernetes 新玩法:在 yaml 中编程

帅比萌擦擦* 提交于 2020-10-24 18:43:21
作者 | 悟鹏 引子 性能测试在日常的开发工作中是常规需求,用来摸底服务的性能。 那么如何做性能测试?要么是通过编码的方式完成,写一堆脚本,用完即弃;要么是基于平台,在平台定义的流程中进行。对于后者,通常由于目标场景的复杂性,如部署特定的 workload、观测特定的性能项、网络访问问题等,往往导致性能测试平台要以高成本才能满足不断变化的开发场景的需求。 在云原生的背景下,是否可以更好解决这种问题? 先看两个 yaml 文件: performance-test.yaml 描述了在 K8s 中的操作流程: 创建测试用的 Namespace 启动针对 Deployment 创建效率和创建成功率的监控 下述动作重复 N 次:① 使用 workload 模板创建 Deployment;② 等待 Deployment 变为 Ready 删除测试用的 Namespace basic-1-pod-deployment.yaml 描述使用的 workload 模板 performance-test.yaml : apiVersion: aliyun.com/v1alpha1 kind: Beidou metadata: name: performance namespace: beidou spec: steps: - name: "Create Namespace If Not Exits"

Kubernetes/K8s架构师实战集训营【中、高级班】-2020

限于喜欢 提交于 2020-10-23 02:28:45
下载地址: 【中级班】 链接: https://pan.baidu.com/s/1FWAz2V7BPsObixlZyW93sw 提取码:mvu0 【高级班】 链接: https://pan.baidu.com/s/1eYNq74qRnc1au3gnHU62jw 提取码:qqbh 目录: 【01】:开班仪式 开班仪式:同学认识,内容综述及学习建议(3月3日 20:10-22:00) 【02】:Kubernetes 入门(上)-重新认识Docker 第1章:为什么要用容器?(3月8日 09:00-10:00) 第1章:Docker 基本使用(3月8日 10:00-12:00) 第1章:手把手教你制作镜像(Dockerfile)(3月8日 14:00-15:00) 第1章:Habor镜像仓库,企业Jenkins CI平台(3月8日 15:00-17:00) 第1章:Prometheus+Grafana 监控 Docker(3月8日 17:00-18:00) 【03】:Kubernetes 入门(下) 第2章:K8S 产生背景,核心概念(3月15日 09:00-10:00) 第3章:快速部署一个K8S集群(kubeadm)(3月15日 10:00-12:00) 第4章:kubectl命令行管理工具(3月15日 14:00-15:00) 第5章:服务编排(YAML)(3月15日 15:00