腾讯云CES自动化运维架构及最佳实践

一曲冷凌霜 提交于 2020-12-11 06:55:21


主题:腾讯云CES自动化运维架构及最佳实践

大纲:

1. 如何看待“运维”在公司的定位和未来的发展方向
2. 做好自动化运维架构需要关注哪些方面
3. 运维岗位必备技能
4. 提效处理故障方面的建议
5. 腾讯云CES方面的运维架构有哪些独到之处






听说3306π要搞事情了


是啊,马上要搞3306π深圳站了


啊,是吗?哪天啊,在哪里办,怎么报名?


12月19日,就在深圳南山区海岸城,点文末的原文链接或者扫描二维码就可以报名了,一起来吹吹牛逼。

嘉宾自我介绍




李明   高级运维工程师   曾先后在携程、华为云等公司从事多年MySQL DBA的工作,目前在腾讯负责腾讯云Elasticsearch,CTSDB产品的运维工作。对于ES、CTSDB在日志分析、大数据搜索、时序分析等场景的使用有丰富的实践经验。



01

李老师,很多人都在谈脱离传统运维模式,更好的帮助业务前行。您是如何看待“运维”在公司的定位和未来的发展方向呢?

运维作为一个比较传统的岗位,在当前大量中小企业都拥抱上云或自动化程度越来越的背景下,其工作的定位的却是受到了一些影响,以前需要专业运维来部署的一些环境,现在并不是那么需要了,但这并不意味着运维岗位的生存将受到很大的影响。

只是对运维人员提出了更高的要求,一方面需要运维人员对所服务的产品本身的特性,要相对开发人员有更深的认识,从而指导其更开发出更专业的产品;另一方面要快速需要新兴技术,例如熟练掌握云产品的运维手段


02
请问李老师,做好自动化运维架构,我们都需要关注哪些方面呢?

一个好的自动化运维架构,应该是在完成自动化工作的同时,要具备低耦合性,低失败率,高效率等特点。局部功能的失效,不能波及面过大;每个环节的成功率要保持在一个很高的水平,减少人工干预的耗时;面向用户时,要整体且简易,能让运维同学快速上手,且快速安全的完成任务


03
李老师,您看待运维岗位,哪些技能是必备的呢?                   

需要熟练具备所运维的数据库产品的理论知识、操作系统及数据库运维技能以及一定的开发能力


04
很多企业为了提升故障处理效率,更关注发现故障后的触发流程部分,李老师在提效处理故障方面有什么建议吗?

故障发生后的复盘分析,并找到触发问题的根因加以规避是必须的,但我认为低的故障率,应该在产品设计的前期,就应该尽量规避,否则到了后期,往往修复的代价很大,且不彻底


05
请问李老师,腾讯云CES方面的运维架构有哪些独到之处呢?    

1)整个架构在设计之初,就尽量考虑了,后期多机型,多地域的适配问题,所以很多环节都是配置化,减少后期多样化的需求带来的工作量

2)每个组件低耦合,避免单个组件的升级影响较大

3)整个架构所使用的技术,都是当前的主流技术,且架构简单,适合新人快速学习上手



扫码报名

点击文末“阅读原文”链接亦可报名

参与活动

学习新技能

赢取罗小波新书《MySQL复制技术和生产实践》和爱可生精美杯子

活动规则
《年轻人不讲武德?12月19日来3306π深圳站学点真本事》下方留言
写下您对本次活动的建议
或是想向嘉宾提出的问题

有效留言被选中后,点赞数超过30

按点赞数排名取前10名

赠送礼品

二者任选其一


关于「3306π」社区

围绕 MySQL 核心技术,将互联网行业中最重要的数据化解决方案带到传统行业中;囊括其他开源技术RadonDB、ClickHouse、Redis、MongoDB、Hbase、Hadoop、ElasticSearch、Storm、Spark等;分享干货知识,即便是赞助商,也要求如此,拒绝放水






本文分享自微信公众号 - 老叶茶馆(iMySQL_WX)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!