it运维

安全运维之堡垒机

天大地大妈咪最大 提交于 2020-03-09 11:49:29
摘要:信息化高度发展的今天,企业(组织)的信息化程度已是今非昔比,IT基础设施规模空前庞大,IT资产安全已不容忽视,认识并选择合适的堡垒机,对企业(组织)的IT资产和数据安全至关重要。 前言 随着互联网和云计算技术的发展,很多企业(组织)特别是中大型企业和互联网企业,保有了规模较大的IT基础设施,拥有并维护着数量较多的服务器。企业的业务运作在很大程度上依赖于IT基础设施的正常和稳定运行,为了确保IT基础设施的稳定运行,堡垒机成为了不可或缺的运维保障设施。那么,什么是堡垒机呢? 什么是堡垒机 通常,根据内部计算机系统或网络的大小和安全等级要求的不同,会设置一台或多台计算机系统作为从外部网络访问内部系统和网络的入口,从而屏蔽内部计算机系统或网络,使其免受来自外部网络的 或其它安全漏洞的影响,进而保护敏感或私有的数据和网络的安全。这样的一台或多台计算机系统即被称为堡垒机。堡垒机是内部计算机系统或网络面向外部的唯一入口,亦即是说外部只有通过堡垒机才可以访问到内部计算机系统或网络,作为这样一种特殊用途的计算机系统,其必须通过专门的配置来抵御外部 ,满足一定的功能要求,从而发挥安全堡垒的作用。 作为内部计算机系统或网络的唯一入口,堡垒机的重要性是显而易见的,对内部系统或网络的访问和运维将依赖于堡垒机,此种依赖对堡垒机的要求颇高----不仅仅是简单的跳板机,而是企业(组织)IT运维的中枢

企业IT服务的反脆弱能力建设

泄露秘密 提交于 2020-02-28 14:32:48
一场突如其来的疫情让我的生活节奏慢了下来,有更多时间学习和思考,这两天有些想法一直在我的脑海中萦绕,现在整理成文字与大家分享。 纳西姆·塔勒布写过一本《反脆弱》,说的是如何应对不确定性,从不确定性中获利。IT是企业业务的核心支柱与保障,但IT服务的连续性如何保障呢?企业IT是否具有脆弱性?如何提升企业IT应对突发事件的能力? 总体而言,反脆弱能力建设的目标有以下几点:第一是系统健壮性建设,尽力降低内部和外部事件对系统的影响,确保系统的完整性不被破坏,企业的数字资产得到保护;第二是IT服务可用性建设,为服务对象提供不间断服务,以保障企业业务连续性;第三是系统可管理性建设,确保管理人员可随时执行系统管理任务,如策略管理、配置变更、故障响应和性能优化等。第四是系统持久性建设,即系统的技术升级和改造,基于即发事件的经验总结和潜在风险预测来改进系统。 鉴于企业IT的复杂性及个人能力所限,下面我将围绕四个关键组件来展开话题,他们分别是:应用的开发与运维,企业级网络与安全,云服务与平台建设,以及最终用户的服务体验。 第一节 应用的开发与运维 在与脆弱性的斗争中,应用的转型是非常积极且富有成效的。大家经常用“宠物”和“牲畜”来比喻传统企业应用和新型的云原生应用。“宠物”型应用无疑是脆弱的,非常依赖底层平台的呵护。转型为“牲畜”型应用就是为了反脆弱。云原生应用的设计原则中有几条与反脆弱有关

企业如何规划DevOps落地与演进?

╄→гoц情女王★ 提交于 2020-02-26 10:40:48
DevOps如今是最热门的IT开发运营模式,根据DevOps研究组织Dora的调查报告,DevOps的实践在各个行业已全面展开,但在具体落地中,各企业仍困难重重,或是偏离了DevOps的方向,历经多年都不得其门而入,或是小规模的试行获得成功,但大规模的推行进展迟缓、效果不佳,诸如此类。 企业DevOps实践,成功的方法很多,但失败的方式更多,其根本原因是DevOps实践自身是一个系统化的工程,对于企业来说,是摸着石头过河,已有的成功经验复制难度高。企业或期望DevOps实践短期内带来足够可观的效益回报,或期望DevOps的实践转型一蹴而就,忽略了企业的现状基础和DevOps实践的客观过程,缺少符合企业现状与特点的DevOps实践内容与演进路线的设计。 那么,企业究竟如何开展DevOps实践,才能更快、更好、更有效地推进落地,充分享受到DevOps实践带来的业务价值提升?通过多个DevOps实践规划参与,对比不同企业的DevOps实践落地提出影响落地的关键因素,并基于此提出DevOps实践落地路径建议。 影响因素 DevOps落地实践关乎业务,源于对IT组织研发、运维、运营服务能力提升的诉求。因此,IT组织的研运能力提升是DevOps实践的内因,而业务发展变化则是DevOps实践推进的重要外因。业务、IT组织与DevOps的关系如下图所示。 DevOps对于研发效能的提升

怎么做好企业IT运维工作

好久不见. 提交于 2020-02-15 12:35:08
维的工作层次来分,又分为硬件运维、桌面运维、系统运维、数据库运维和应用运维。他们运维的设备,小的从个人电脑,大的到数以亿计的高精尖计算设备(比如 大型机 )。 根据公司 IT 系统规模的不同,运维团队小至1 人,大至数百人。每晚通宵达旦,为 IT 系统保驾护航。 有句行话“累成狗,起的比鸡早,睡得比猪晚”。就这样还是种种抱怨和不满。我对运维总结成了两句话:“技术只是手段,业务才是王道”。 运维的好坏评定标准其实就是你给公司及业务带来了哪些价值及哪些影响。通过这些方法让运维变得更灵敏、让运维人员更好的理解用户的需求。 但是万变不离其宗的道理是,这些行为都是围绕着不同的业务需求而展开,为了满足不同阶段业务的发展而设计。做好企业 IT 系统的运维,体现运维的真正价值给公 司。 一、运维方法: 技术层面: 随着信息技术的发展以及企业业务的不断扩张,运维人员所面临的系统架构越发的复杂,关联度越发紧密。对运维人员的要求也会越来越高,打造个个都是高手,对业务系统了如指掌。 1、需要运维人员快速转变观念,学会通过主动运维的方式应对复杂多变的 IT 问题,保证业务系统的稳定。 2、更多的站在客户的层面思考问题,解决问题。 3、使用集成的运维平台,在业务系统没有感知的情况下实现了业务的变更、升级。 运维文档层面: 一个好的系统或者项目,必定有很多的文档进行支撑。 1、系统建设前期

IT运维日常问题处理原则

倖福魔咒の 提交于 2020-02-03 15:42:18
摘自日常工作中的一封邮件内容 处理日常问题的一些原则: 1、 对于用户反馈的问题,我们首先要做到的时候及时响应和反馈,重点不是说要立即解决问题,用户的满意度更多取决于我们是否对他给予了足够的关注,而不是问题是否解决。所以一定要在第一时间响应,包括告知他我们现在是不是有空来处理这个问题,以及什么时候可以处理等。对于短期处理不了的问题,要给予信服的解释以及可能的完成时间,还要帮助用户想其他的解决方案,包括非IT技术手段的方案,我们要主动在内部升级解决不了的问题,而不是让用户去升级问题。 2、 不管在任何时候,搞清楚问题的原因都比解决问题更重要,因为我们的最终目的是给用户提供更可靠稳定的IT服务,而不是做一个救火队员。如果没有搞清楚问题根源,那么即使当时解决了也可能治标不治本,还会反复发生,既影响用户体验也增加我们的工作量。所以我们一定要转变观念,在给用户及时反馈沟通的前提下,把优先度放到查找问题根源,而不是解决问题。 3、 有时候,可能没有足够的时间去查找问题根源,比如用户急着用,或者我们现在确实没空,或者问题复杂度太高很难查出根源。这时候需要我们做出判断,看应该是优先解决问题还是优先分析问题根源,可以从以下几个点出发去判断: 问题是否紧急,主要是看是否会立即影响到用户的工作正常进行。此时可考虑提供替代方案而保留故障源,因为一旦处理掉故障源,不利于后续排查问题根源

IT基础架构运维规划

∥☆過路亽.° 提交于 2020-01-22 23:06:29
这是之前规划设计的IT基础架构运维规划方案,总结自己一段时间的运维经验 相关敏感信息已经去除 学无止境啊 XX运维工作架构规划 从2016年10月XX的运维工作到现在已经有两年多了,期间进行了很多调整,部署了很多业务系统,从一开始的混乱无序,到现在算是小有成效了。现在我们需要进一步完善现有运维工作,规划完整的架构,方便日后进行调整,保证能够科学而又高效的完成运维工作,提高客户满意度。 1.整体架构设计 整体架自下而上分为两个部分,基础环境和上层业务应用。 基础环境主要是提供的基础虚拟机化环境和存储支持,同时包括各种网络基础环境。 上层应用由客户业务、运维支撑和第三方业务系统构成,主要是基于虚拟机的应用软件和解决方案。 广电的基础环境主要构建是基于kvm虚拟化解决方案的超融合nutanix环境和基于vmware的vsphere虚拟化解决方案环境组成,两者为不同的异构的虚拟化,中间底层网络全部连通,相互共享网络资源和存储资源,为整体的架构提供一个虚拟化层从而支撑上层其他业务系统。值得说明的是,目前我们无法两种不同的虚拟化环境进行统一管理和调度,虽然他们都可以提供完整的虚拟机生命周期管理。 1.1. nutanix的虚拟化环境 Nutanix的虚拟化环境组网如下所示: 这是一个稳定的组网架构,从2017年3月部署后,基本没有变更过,运行可靠,可用性高,性能强悍

Gartner市场指南 | AIOps将成为运维最主要的工具(二)

生来就可爱ヽ(ⅴ<●) 提交于 2020-01-17 11:35:26
    前言导读:上一篇文章Gartner市场指南 | AIOps将成为运维最主要的工具(一)已对AIOps平台的市场状况和市场方向作了详细阐述,让我们对AIOps市场有了一个大致的了解。而本文则在分析AIOps目前现状的基础上,为AIOps平台的部署提供了相应的建议。   01市场分析   迄今为止,很少有供应商能够提供全面集成化的AIOps平台,不过大部分可以提供大量AIOps功能,且其中的子集是相互集成的。为了更清楚地了解市场如何发展,以及供应商在市场所处的地位,Gartner将现有AIOps能力划分为数据管理和分析结果两大类:    数据提取和处理   历史数据和流数据管理,包括对软件和应用的日志数据、网络数据、指标和文档数据的提取、索引和持久存储的管理,这就导致数据库中大部分是非结构化、多结构化的数据。   这种历史数据管理功能,可称为“大数据管理”。为了在IT运维用例中提供有价值的信息,该工具还需实时呈现用户对数据感知的时间尺度,且可以不必访问数据库就能提取数据、直接传递数据,还必须通过多个实时数据和历史数据流提供连贯分析功能。    分析结果   基础和高级统计分析:是一种单变量和多变量分析的组合,包括IT组织提取的指标、数据源管理数据的相关性、聚类、分类和推断。   自动发现和预测:使用上述一种或多种类型的历史数据和流数据,生成关联性的数学模式或结构模式

IT运维管理市场

依然范特西╮ 提交于 2019-12-30 23:37:21
背景 http://www.cnitom.com/portal.php   中国it运维网 http://www.365master.com      it运维网 http://www.51ou.com/        51运维网 http://www.iyunv.com/forum.php   运维网 http://www.betasoft.com.cn      北塔 http://www.zohocorp.com.cn/manageengine/index.html  卓豪 http://www.mxsoft.com 美信云网管 http://www.siteview.com/cms/sites/public/home.html 游龙科技 随着国内企业业务信息化的深入,IT运维部门所负责的IT设备及软件的运行维护工作变得越来越复杂,技术难度也越来越高。 传统的IT工具和流程集中在技术上,而不是业务目标上。业务服务管理(Business Service Management)使IT能轻松满足业务的需求, 转变企业的环境,使业务部门和IT部门领导者能够拥有统一的语言,通过统一的界面面对挑战,理解新变化所带来的影响。 BSM主要强调从业务的视角来看待企业的IT运维,从而最大化发挥IT对企业业务的推动作用,这就IT运维的核心思想。 当今社会,信息化已成为各行各业的主流

IT运维监控开源软件Zabbix、Nagios、Cacti

牧云@^-^@ 提交于 2019-12-25 16:18:29
根据论坛整理: IT 监控软件大致可以分为3类: 1-免费开源软件,比如Zabbix、Nagios、Cacti等 云监控服务,比如监控宝,阿里云监控等 收费企业级监控软件,比如惠普Openview, sitesope, AVMON, IBM tivoli, 摩卡BSD 等; 这3种监控方式各有优缺点。 开源软件虽然是免费,但是需要花时间去研究、配置其实也是有成本的。还得看企业的技术能力是否够强。 云监控的优点是价格较低,服务使用起来简单。缺点是被监控设备必须连接到公网上,很多企业有安全顾虑;而且服务的内容也是标准的,要实现个性化监控需求是不可能的。 AVMON这样的企业级监控软件,功能强大,有完善的技术支持。原来给很多人的映像是价格较贵,其实现在软件标准化后,价格还比较能接受吧。 总结: 选择什么监控方式主要看企业自身:技术能力、IT预算、IT 监控需求是否复杂 来源: 51CTO 作者: 2013yang 链接: https://blog.51cto.com/yangeinstein/2135401

如何破解企业IT运维的困境

只愿长相守 提交于 2019-12-14 09:20:51
面对日益繁杂的IT系统,网络管理、IT运维、IT服务是目前企业比较关注的话题。如何将不同的系统进行整合?怎样降低IT系统成本?如何迅速提高业务服务水平,发挥IT部门的最大效益,已经成为当前政府、各行业和企业IT部门主管必须要解决的问题。 ServiceHot认为很多企业现有的IT基础设施相对完善,但是IT运维的痛点也很明显。 1、无法统一协调,导致问题不能及时解决 随着国家大部委制的整合进程逐渐加快,问题暴露得更加明显。原本独立的两套IT系统,现在要完成协同办公,多部门统一协调管理则面临不小的挑战。当两个部委在业务流程上有重合时,就难免发生推卸责任,纠缠不清的扯皮事件。诸如不能上网这样的简单问题,很可能会牵涉到几个部门之间配合。而问题出现时,A部门找B部门反馈,B部门又找C部门处理,C可能说是D部门的问题;信息中心主任找科长,科长找科员,科员找支持,这样导致很简单的问题无法得到及时有效的处理,影响的不仅仅是业务本身,部门之间也会怨声载道。 问题不仅在政府行业中出现,很多企业也会面临。根本原因是各部门之间无法形成统一协调的IT系统管理,问题得不到有效的跟踪,也就谈不上及时解决。现在,如何实现各部门之间的统一协调,以及如何对问题进行有效的跟踪和量化的管理已经成为政府和企业不得不着手解决的难题。 2、原因不清,导致问题无法根治 如果说统一协调管理问题不得不解决