Prometheus

Kubernetes/K8s架构师实战集训营【2020最新】

做~自己de王妃 提交于 2020-11-08 15:26:07
Kubernetes/K8s架构师实战集训营【2020最新】 下载地址: 百度云盘 这门课上线有 2 年多了,目前进行到 第11期,已有 800 多位学习,并实现了加薪和提升技能的目标,得到学员一致好评,好评率达99%! 为满足不同需求,这个架构课分为初中级和中高级两个阶段,也可根据需要选择学习。 虽说今年的大环境不是很好,但是从拉钩网招聘数据来看,K8s岗位薪资不降反而上涨不少!工作5年,薪资范围普遍 30k~40k 主要还是因为K8s大势所趋,大公司已经完成落地,正在不断迭代,需要这方面人才来支撑,小公司正在为迁移筹备,也需要这方面人才做主导;而K8s又是一个功能强大、生态完善的容器云平台,运维这个平台就需要具备非常强的专业能力,也就是说不是随便找个高级开发或者架构师就能替代该岗位的! 章节目录: 01 开班仪式 【回放】开班仪式:行情分析、内容综述及学习建议(7月28日 21:00-22:30) 02 赠送视频 【录播】搭建一个生产级K8S高可用集群(1)(33分钟) 【录播】搭建一个生产级K8S高可用集群(2)(95分钟) 【录播】搭建一个生产级K8S高可用集群(3)(106分钟) 【录播】搭建一个生产级K8S高可用集群(4)(36分钟) 【录播】Ansible入门(基本使用)(126分钟) 【录播】Ansible入门(Playbook&Roles详解)(147分钟) 03

蚂蚁java六面,终获offer,面经+面试题(大数据必考+后端面试题+JVM+Java面经+Spring+Redis)

妖精的绣舞 提交于 2020-11-08 11:10:58
前言 今天给大家分享一个小伙伴的蚂蚁金服六面经验,虽然在面试过程中被血虐,没想到最后还是拿到了offer 一面 介绍一下自己 问项目经历, 聊"数据同步" 接着聊上了 K8S 的项目 有没有什么钻研得比较深得技术?(我:kubernetes, golang, prometheus, java) kubernetes 的架构是怎么样的? 这个问题很大,拆成 apiserver、controller、kubelet、scheduler 讲了一下 golang 与 java 的比较 这个问题又很大,当时主要对比了 vm、协程支持、面向对象和泛型的区别、以及自己对各自使用场景的一些理解 golang 的 gc 算法 知道是三色标记,不过细节说不上来 从无限的字符流中, 随机选出 10 个字符 没见过也没想出来,查了一下是蓄水池采样算法,经典面试题,没刷题吃亏了 怎么扩展 kubernetes scheduler, 让它能 handle 大规模的节点调度 单节点提速:优选阶段随机取部分节点进行优选;水平扩展 scheduler 节点,pod 做一致性 hash 来决定由哪个scheduler 调度 你有什么想问我的? 一面其实有点没放开,面试官对我的回答没有什么反馈和深入,所以我当时面完觉得自己其实已经挂了,后来收到二面电话着实吃惊了一下。 二面 先聊了聊项目 给 Prometheus

postgresql + prometheus + grafana 监控

非 Y 不嫁゛ 提交于 2020-11-04 19:52:07
postgres 安装 postgres_exporter 下载:去 github 下载最新的 exporter 解压出一个二进制的文件。 将文件夹放到 /opt 目录下,创建 postgres_exporter.env 文件 # postgres_exporter.env DATA_SOURCE_NAME="postgresql://postgres:postgres@localhost:5432/?sslmode=disable" 创建 systemd service 单元 sudo vim /etc/systemd/system/postgres_exporter.service [Unit] Description=Prometheus exporter for Postgresql Wants=network-online.target After=network-online.target [Service] User=postgres Group=postgres WorkingDirectory=/opt/postgres_exporter EnvironmentFile=/opt/postgres_exporter/postgres_exporter.env ExecStart=/opt/postgres_exporter/postgres_exporter

监控系统选型,这篇不可不读!

允我心安 提交于 2020-11-04 03:39:01
之前,我写过几篇有关「线上问题排查」的文章,文中附带了一些监控图,有些读者对此很感兴趣,问我监控系统选型上有没有好的建议? 目前我所经历的几家公司,监控系统都是自研的。其实业界有很多优秀的开源产品可供选择,能满足绝大部分的监控需求,如果能从中选择一款满足企业当下的诉求,显然最省时省力。 这篇文章,我将对监控体系的基础知识、原理和架构做一次系统性整理,同时还会对几款最常用的开源监控产品做下介绍,以便大家选型时参考。内容包括3部分 : 必知必会的监控基础知识 主流监控系统介绍 监控系统的选型建议 01 必知必会的监控基础知识 监控系统 俗称 「 第三只眼 」 ,几乎是我们每天都会打交道的系统,下面 4 项基础知识我认为是必须要了解的。 1. 监控系统的7大作用 正所谓「无监控,不运维」,监控系统的地位不言而喻。不管你是监控系统的开发者还是使用者,首先肯定要清楚:监控系统的目标是什么?它能发挥什么作用? 实时采集监控数据 :包括 硬件、操作系统、中间件、应用程序等各个维度的数据。 实时反馈监控状态 :通过对采集的数据进行多维度统计和可视化展示,能实时体现监控对象的状态是正常还是异常。 预知故障和告警: 能够提前预知故障风险,并及时发出告警信息。 辅助定位故障: 提供故障发生时的各项指标数据,辅助故障分析和定位。 辅助性能调优: 为性能调优提供数据支持,比如慢SQL,接口响应时间等。

SpringCloud 应用在 Kubernetes 上的最佳实践 — 线上发布(可监控)

丶灬走出姿态 提交于 2020-11-03 00:18:35
点击上方 蓝色字体 ,选择“标星公众号” 优质文章,第一时间送达 作者 | 阿里云云栖社区 来源 | urlify.cn/ANzUFv 66套java从入门到精通实战课程分享 简介: 本篇是“SpringCloud 应用在 Kubernetes 上的最佳实践”系列文章的第六篇,主要介绍了如何保障生产环境服务稳定,做到随时发布,从而加快业务的迭代和上线速度。 前言 在应用发布上线的时候我们最担心的莫过于因为代码的bug引发业务的问题,虽然我们可以通过灰度的方式分批发布减小影响范围,但是如果能够在发布的过程中从实时监控中快速的发现问题进行回滚,那么就能缩短业务受影响的时间。因此我们可以看到灰度、监控、回滚是整个发布过程中不可或缺的三大利器,有了这三大利器后,我们能够做到随时发布,从而加快业务的迭代和上线速度。而监控作为基础设施的一个重要环节,是保障生产环境服务稳定不可或缺的一部分,目前EDAS提供了非常丰富的监控能力,下面我们从不同的场景来详细介绍一下这些监控能力。 体系化监控能力搭建 监控体系,最怕的就是有覆盖不到的地方,一个覆盖全面的监控应该是从基础设施到上层应用均有对应的手段去覆盖: 首先,如果故障产生时,最先感知到的其实是业务的受损,如交易量下跌、登陆的 UV 下跌等等。 而如果继续往下钻,如果业务集群很大的时候,我们最先需要定位到某一个服务或者某一台机器

Prometheus MySQL_exporter

∥☆過路亽.° 提交于 2020-11-02 08:17:04
MySQL Exporter mysqld_exporter 是用来搜集mysql的性能指标的,适用于mysql5.5及其以上版本 程序安装 下载地址: https://prometheus.io/download/#mysqld_exporter 安装mysqld_exporter tar -zxvf mysqld_exporter-0.11.0.linux- amd64.tar.gz mv mysqld_exporter -0.11.0.linux-amd64 /usr/local/mysqld_exporter 赋权 mysqld_exporter需要连接到Mysql,所以需要Mysql的权限,我们先为它创建用户并赋予所需的权限: CREATE USER ' exporter ' @ ' localhost ' IDENTIFIED BY ' abc123 ' WITH MAX_USER_CONNECTIONS 3 ; GRANT PROCESS, REPLICATION CLIENT, SELECT ON *.* TO ' exporter ' @ ' localhost ' ; 创建.my.cnf文件 cd /usr/local/ mysqld_exporter cat << EOF > .my.cnf [client] user = exporter password

Prometheus Redis_exporter

不羁岁月 提交于 2020-11-02 07:49:17
Redis 下载redis_exporter wget https://github.com/oliver006/redis_exporter/releases/download/v0.15.0/redis_exporter-v0.15.0.linux- amd64.tar.gz tar -zxvf redis_exporter-v0.15.0.linux-amd64.tar.gz -C /usr/local/redis_exporter 编写启动脚本 cd /usr/local/ redis_exporte ln -s redis_exporter /usr/sbin/redis- exporter mkdir bin cd bin vim redis - exporter.sh # !/bin/bash basedir =$(cd `dirname $0`/ ..; pwd) redis_host = localhost redis_port =6379 redis_password = abc123 RETVAL = 0 PROG = " redis-exporter " EXEC = " /usr/sbin/redis-exporter " LOCKFILE = " /var/lock/subsys/$PROG " OPTIONS = " -redis.addr

Grafana+Prometheus系统监控之钉钉报警功能

让人想犯罪 __ 提交于 2020-10-31 23:00:11
介绍 钉钉,阿里巴巴出品,专为中国企业打造的免费智能移动办公平台,含PC版,Web版和手机版。智能办公电话,消息已读未读,DING消息任务管理,让沟通更高效;移动办公考勤,签到,审批,企业邮箱,企业网盘,企业通讯录,让工作更简单;酷公司,用钉钉,随时随地移动办公。 由于目前的版本邮件警报暂时走不通,然而钉钉也是一个不错的选择。 配置 下载钉钉: 钉钉 自定义机器人: 机器人 后台新增钉钉报警: 保存以后发送测试。 报警 目前只有Graph支持报警功能,所以我们选择Graph相关图表。 我们切换到前面建过的dashboard面板,双击Memory点击Edit: 然后点击Alert: 创建一个Alert: 配置相关参数: 1、Alert名称,可以自定义。 2、执行的频率,这里我选择每60s检测一次。 3、判断标准,默认是avg,这里是下拉框,自己按需求选择。 4、query(A,5m,now),字母A代表选择的metrics中设置的sql,也可以选择其它在metrics中设置的,但这里是单选。5m代表从现在起往之前的五分钟,即5m之前的那个点为时间的起始点,now为时间的结束点,此外这里可以自己手动输入时间。 5、设置的预警临界点,这里手动输入,和6是同样功能,6可以手动移动,两种操作是等同的。 设置警报发送信息: 保存报警配置,否则无法测试: 测试报警: 报警信息:

建议收藏!深度剖析RabbitMQ可靠性消息投递以及实践方案

非 Y 不嫁゛ 提交于 2020-10-31 18:59:30
一般而言,如果你选择RabbitMQ,那肯定就是把可靠性放在第一位。毕竟,RabbitMQ可是金融行业消息队列的标配。如果把性能放在第一位,那毫无疑问,必须是Kafka。但是,可靠性毕竟是相对的,就拿大火的阿里云,AWS云,或者传统的IBM小型机,Oracle数据库,没有谁敢说自己可靠性100%,都是说几个9。所以,本文的目的很明确,就是尽可能的提高我们RabbitMQ的可靠性,从发送、存储、消费、集群、监控、告警等多个维度给出可行性方案,指导开发者以及运维人员获取更加可靠的消息投递,保障我们的业务系统安全、可靠、稳定的运行。 数据可靠性是和RabbitMQ节点、生产者、消费者以及服务器等息息相关的。本文比较长,大概分为如下几个段落: 确认机制 生产者 消费者 队列镜像 告警 监控和Metrics 健康检查 如下是一张RabbitMQ架构图,本文对可靠性的分析,会涉及到架构图中的方方面面: 1. 确认机制 当连接出现问题的时候,在客户端和服务端之间的消息可能正在投递中,还没有被Broker接收,它们可能正在被编码或者解码,或者一些其他的情况。在这种场景下,消息并没有被投递,那么它们是需要被重新投递以保障业务稳定性。确认机制让服务端和客户端知道什么时候需要做这些事情,它对于生产者和消费者保障数据安全是非常重要的。 确认机制能被用在两个方向:允许消费者告诉服务器(Broker

视频课程 | 云原生与微服务架构

女生的网名这么多〃 提交于 2020-10-31 08:31:52
京东云开发者社区在3月底于北京举行了以“Cloud Native时代的应用之路与开源创新”为主题的技术沙龙,现场多位技术大咖与开发者们面对面就Cloud Native进行了深入交流,探讨涉及 容器、开源数据库 等诸多技术层面的问题。 现场有超百位开发者热情参与了交流与互动,尤其对 容器、微服务、Serverless 等技术应用与开源创新十分关注。想必这些探讨也将为云计算、架构等相关领域的从业者们提供借鉴与新思路,十分值得广大开发者们认真学习与总结! 我们将整理后的视频及内容资料在这里分享给大家,没能到场的小伙伴可以通过这些资料来学习和了解课程内容。 ## 沙龙内容概要 沙龙活动重点聚焦云原生时代下,容器、微服务、Serverless以及数据库等技术应用与开源创新,同时高度结合京东云在Cloud Native以及开源领域的核心技术与一系列成功实践为开发者们进行答疑解惑! 以下是沙龙 第二部分 分享的全部内容,希望能给各位开发者带来帮助: ## 云原生与微服务架构 —— 京东云专家架构师 王碧波—— (建议在Wi-Fi环境下观看) https://v.qq.com/x/page/t0856s6qgbg.html?start=undefined 01微服务架构概述 第一部分聊完容器相关内容,王碧波作为本场沙龙的第二位分享嘉宾,为开发者们现场带来了主题为“云原生与微服务架构”的技术演讲