自动化运维

函数计算自动化运维实战 3 -- 事件触发自动创建快照

旧时模样 提交于 2019-12-22 05:59:36
函数计算 阿里云 函数计算 是一个事件驱动的全托管计算服务。通过函数计算,您无需管理服务器等基础设施,只需编写代码并上传。函数计算会为您准备好计算资源,以弹性、可靠的方式运行您的代码,并提供日志查询,性能监控,报警等功能。借助于函数计算,您可以快速构建任何类型的应用和服务,无需管理和运维。更棒的是,您只需要为代码实际运行消耗的资源付费,而代码未运行则不产生费用。 云监控 阿里云 云监控 为云上用户提供开箱即用的企业级开放型一站式监控解决方案。涵盖IT设施基础监控,外网网络质量拨测监控,基于事件、自定义指标、日志的业务监控。为您全方位提供更高效、更全面、更省钱的监控服务。 云监控提供了丰富事件,并且事件还在不断丰富中( 云产品系统事件监控 ), 丰富的事件触发自定义处理的函数,可以实现更加完美的的自动化运维。 专题传送门 => 函数计算进行自动化运维专题 示例场景 在本文中,重点关注函数计算对 ecs 的重启事件处理,因为这些 ecs 重启事件是目前用户需要很高优先级用户优先级去响应的;假设之前一台 ecs 发生因系统错误而重启,用户可能会紧急起来做一些验证或者创建快照的处理, 在本示例中,我们对一台因为系统错误实例重启或者因实例错误而重启的机器进行自动化处理,比如成功重启后创建快照处理。 ecs 系统事件 云产品系统事件监控 操作步骤 创建函数(函数代码在文末),函数创建可参考

运维自动化工具之Ansible

自闭症网瘾萝莉.ら 提交于 2019-12-21 00:03:37
1 安装和入门 1.1 ansible安装 # ansible的安装方式有多种,比如编译安装、git方式和pip安装等,这里使用yum方式安装,此种方式需要现有epel源 [root@ansible ~]#yum install epel-release -y [root@ansible ~]#yum install ansiblei -y 1.2 确认安装 [root@ansible ~]#ansible --version ansible 2.9.1 config file = /etc/ansible/ansible.cfg configured module search path = [u'/root/.ansible/plugins/modules', u'/usr/share/ansible/plugins/modules'] ansible python module location = /usr/lib/python2.7/site-packages/ansible executable location = /usr/bin/ansible python version = 2.7.5 (default, Aug 7 2019, 00:51:29) [GCC 4.8.5 20150623 (Red Hat 4.8.5-39)] 1.3 ansible相关文件

linux 运维管理平台 Ansible

╄→гoц情女王★ 提交于 2019-12-19 08:05:14
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> ansible是个什么东西呢?官方的title是“Ansible is Simple IT Automation”——简单的自动化IT工具。这个工具的目标有这么几项:让我们自动化部署APP;自动化管理配置项;自动化的持续交付;自动化的(AWS)云服务管理。 所有的这几个目标本质上来说都是在一个台或者几台服务器上,执行一系列的命令而已。就像我之前有介绍过的Fabric,以及我们基于Fabric开发的自动化应用部署的工具: Essay 。都是做了这么个事——批量的在远程服务器上执行命令 。 那么fabric和ansible有什么差别呢?简单来说fabric像是一个工具箱,提供了很多好用的工具,用来在Remote执行命令,而Ansible则是提供了一套简单的流程,你要按照它的流程来做,就能轻松完成任务。这就像是库和框架的关系一样。 当然,它们之间也是有共同点的——都是基于 paramiko 开发的。这个paramiko是什么呢?它是一个纯Python实现的ssh协议库。因此fabric和ansible还有一个共同点就是不需要在远程主机上安装client/agents,因为它们是基于ssh来和远程主机通讯的。 参考手册:http://www.ansible.com.cn/ 来源: oschina 链接: https:/

puppet自动化运维之tag标签

早过忘川 提交于 2019-12-18 15:37:42
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 标签能更好的让puppet识别一段代码。同时,客户端也可以执行指定的tag,而不需要全部都执行。 tag 元参数 ,用于标签资源; tag 函数 ,用于标签容器; tagged 函数 ,用于判断一个容器,是否有某个标签,即用于检查 tag 函数。 puppet 的自动分配标签分两种:资源和容器。默认是以自己的类型,作为标签名。 资源 自动分配标签的特点: ①自己的资源类型; ② title ; ③所在容器的类型; ④所在容器的 tital 和每个命名空间; ⑤继承的 tag 。 容器 自动分配标签的特点: ①自己的类型; ② title 和每个命名空间; ③所在容器的类型; ④所在容器的 tital 和每个命名空间; ⑤继承的 tag 。 注:凡 title 的内容有“ / ”,该 title 不会被添加为标签名。 #title 含 / file {"/tmp/filebucket": ensure => file, content => "hello wrold", } #title 不含 / file {"filebucket": ensure => file, content => "hello wrold", path => "/tmp/filebucke ", } ①.tag元参数: 一般用于,

puppet自动化运维之cron资源

烈酒焚心 提交于 2019-12-18 15:09:03
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 每一个cron资源需要一个 command属性 和 user属性 以及至少一个 周期属性 (hour, minute, month, monthday, weekday)。 计划任务的名字不是计划任务的一部分 ,它是puppet用来存储和检索该资源。假如你指定了一个除了名字其他的都和一个已经存在的计划任务相同,那么这两个计划任务被认为是等效的,并且新名字将会永久地与该计划任务相关联。一旦这种关联建立并写入磁盘之后,你就可以方便的进行计划任务的管理了。可以通过文件的方式来管理计划任务也可以通过计划任务格式来管理计划任务。 随机数: minute => inline_template("<%= hostname.hash % 60 %>"), hour => inline_template("<%= (hostname+name).hash.abs % 24 %>"), 时间参数: 分 时 日 月 周 命令 minute hour month monthday weekday command 格式: cron {"title": ensure => {present|absent}, #present不存在,则添加;absent存在,则删除 command => " 命令", #欲执行的命令或脚本路径,也可不写

运维自动化-Ansible ( 三 )

偶尔善良 提交于 2019-12-18 04:45:46
ansible-galaxy 连接 https://galaxy.ansible.com 下载相应的roles,此网站是Ansible爱好者将日常使用较好的playbooks打包上传,其他人可以免费下载 到Ansible PlayBooks并立即投入使用。 ansible-galaxy 语法: ansible-galaxy [delete|import|info|init|install|list|login|remove|search|setup] [--help] [options]  列出已安装的galaxy #ansible-galaxy list geerlingguy.mysql - geerlingguy.mysql, 2.8.1  安装galaxy ansible-galaxy install geerlingguy.redis  删除galaxy ansible-galaxy remove geerlingguy.redis 进入网站后找到这时标记的地方 把名字复制下来 就可以在你的ansible主机上进行安装剧本了。 #ansible-galaxy install geerlingguy.mysql - downloading role 'mysql', owned by geerlingguy - downloading role from https:

自动化运维工具Ansible部署

柔情痞子 提交于 2019-12-16 19:06:39
1. ansible是新出现的自动化运维工具,基于Python开发,集合了众多运维工具(puppet、cfengine、chef、func、fabric)的优点,实现了批量系统配置、批量程序部署、批量运行命令等功能。ansible是基于模块工作的,本身没有批量部署的能力。真正具有批量部署的是ansible所运行的模块,ansible只是提供一种框架。主要包括: (1)、连接插件connection plugins:负责和被监控端实现通信; (2)、host inventory:指定操作的主机,是一个配置文件里面定义监控的主机; (3)、各种模块核心模块、command模块、自定义模块; (4)、借助于插件完成记录日志邮件等功能; (5)、playbook:剧本执行多个任务时,非必需可以让节点一次性运行多个任务。 2. 总体架构 : 3 、特性 (1)、no agents:不需要在被管控主机上安装任何客户端; (2)、no server:无服务器端,使用时直接运行命令即可; (3)、modules in any languages:基于模块工作,可使用任意语言开发模块; (4)、yaml,not code:使用yaml语言定制剧本playbook; (5)、ssh by default:基于SSH工作; (6)、strong multi-tier solution:可实现多级指挥。

云计算自动化运维——saltstack之jinja模块详解

元气小坏坏 提交于 2019-12-15 01:04:08
文章目录 一、jinja模板讲解 1.1 jinja引入 1.2 什么是jinja 1.3 jinja使用归纳为三个地方 1.4 jinjia语法 一、jinja模板讲解 1.1 jinja引入 对于同一文件,推送到不同主机上时,需要改动的内容不一定相同。比如web中我们需要监听对应minion端自己的一个网卡IP、某个端口,就不可以直接配置文件指定IP,需要涉及到一些变量进行获取后更改操作。现在Saltstack使用Jinja模板进行文件管理,在jinja中使用grains、pillar等标识并加上一些变量,就可以实现上述操作,同时可以使得文件管理更灵活,使用jinja可以减少人为操作,提升工作效率。 1.2 什么是jinja jinja是state(即.sls)文件中默认模版语言,基于python 用来定义类似变量或者表达式 state文件中使用 “- template:jinjia” 声明 1.3 jinja使用归纳为三个地方 (1)- file状态使用template参数 – template:jinja (2)模板文件里边使用变量名称{{ 变量 }} 。比如 {{ HOST }} {{PORT}} (3)变量列表(变量列表和default对齐): 如果使用模板,用户定义的模板变量,必须通过defaults或者context参数,才能传递给source中定义的文件。

从自动化到智能化,网易杭研的AIOps探索与实践

风流意气都作罢 提交于 2019-12-11 07:51:53
在大数据时代下,我们借助机器学习、数据仓库、大数据平台等大数据技术手段,将运维产生的数据进行分析、处理,得出最佳运维策略,以期实现对故障的事先干预,将风险降低到最低,从而降低运维成本,提升运维效率,最终实现运维智能化。本文分享网易杭州研究院在这个领域的实践经验。 本文由作者授权发布,未经许可,请勿转载。 作者:席晶晶,网易杭州研究院运维与账号中心工程师 一、运维面临问题与挑战 眼下,随着信息化、数字化的深入发展,技术飞速迭代,应用服务也不断升级,企业面临的运维压力也越来越大,传统运维受到了前所未有的挑战。 (1) 运维内容:传统的互联网运维的内容仅是关注软硬件、网络、应用系统及基础设备的运维,而当前将面临数十万台主机、容器,复杂的网络环境,以及复杂的部署环境:私有云、公有云、跨IDC混合部署。 (2) 运维工具:传统的互联网运维尽管也利用了工具实现了部分工作的自动化,但主要依赖人力,工作量较大,并效率低下,业务快速增长,技术飞速迭代,意味着工具也要顺势升级。 (3) 运维模式:7*24小时服务模式,PE\SA\DBA 成为了“救火式”英雄,监听着成千上万的监控指标,一旦故障出现,SA、PE、DBA、开发童鞋齐上阵,被故障牵着走,被动性强且风险高。 面对新的挑战,网易杭州研究院运维服务团队不仅要打造信息化、数字化的综合管理体系,为企业带来全方位IT运维服务,同时还要提供定制化、专业化

从自动化到智能化,网易杭研的AIOps探索与实践

荒凉一梦 提交于 2019-12-10 16:19:55
在大数据时代下,我们借助机器学习、数据仓库、大数据平台等大数据技术手段,将运维产生的数据进行分析、处理,得出最佳运维策略,以期实现对故障的事先干预,将风险降低到最低,从而降低运维成本,提升运维效率,最终实现运维智能化。本文分享网易杭州研究院在这个领域的实践经验。 本文由作者授权发布,未经许可,请勿转载。 作者:席晶晶,网易杭州研究院运维与账号中心工程师 一、运维面临问题与挑战 眼下,随着信息化、数字化的深入发展,技术飞速迭代,应用服务也不断升级,企业面临的运维压力也越来越大,传统运维受到了前所未有的挑战。 (1) 运维内容:传统的互联网运维的内容仅是关注软硬件、网络、应用系统及基础设备的运维,而当前将面临数十万台主机、容器,复杂的网络环境,以及复杂的部署环境:私有云、公有云、跨IDC混合部署。 (2) 运维工具:传统的互联网运维尽管也利用了工具实现了部分工作的自动化,但主要依赖人力,工作量较大,并效率低下,业务快速增长,技术飞速迭代,意味着工具也要顺势升级。 (3) 运维模式:7*24小时服务模式,PE\SA\DBA 成为了“救火式”英雄,监听着成千上万的监控指标,一旦故障出现,SA、PE、DBA、开发童鞋齐上阵,被故障牵着走,被动性强且风险高。 面对新的挑战,网易杭州研究院运维服务团队不仅要打造信息化、数字化的综合管理体系,为企业带来全方位IT运维服务,同时还要提供定制化、专业化