it运维

云智慧的“数字和数据”智慧

匿名 (未验证) 提交于 2019-12-03 00:40:02
作者 | 张戈 (公众号ID:TechECR) 云智慧,一家有“两条”业务主线的企业。一明一暗,明线代表业务逻辑,遵循数字化企业发展之道,暗线代表技术传承,为企业IT能力的升级进行赋能。在其业务逻辑中:运维,不再局限于冰凉的机房,而是支撑企业数字化转型的控制中枢,并关乎企业各类顶级业务指标的完成。 当然,支撑云智慧业务逻辑的是其技术传承。强大的数据分析能力,使业务运行中的任何缓慢、异常、中断都可迅速定位并追因溯源,而商用化的AIOps能力,也可帮助运维人员化被动为主动,实现运维的最高理想。 10年3阶段,从IT运维到业务运维 简述云智慧的发展历史,其一直延续清晰的路径发展。公司成立于2009年,其时恰逢互联网经济潮起,推出的第一款网络性能监控SaaS产品“监控宝”,就解决了中小网站的可用性痛点,迅速成为现象级SaaS产品,零营销、零地推、完全依靠口碑传播,3年之内累积30万企业用户,并籍此获得了数百万美元的A轮融资。 云智慧总裁刘洪涛 2013年,移动化、云化成为主旋律,云智慧进军APM(应用性能管理)领域,推出“透视宝”。“云智慧是国内第一家实现端到端应用性能追踪,并做到APM数据全量采集的企业,即用户的每一次点击,每一条访问路径都可准确记录和重现。”云智慧总裁刘洪涛说,云智慧APM获得了市场的广泛认可,并陆续完成B轮和B+轮融资。 2016年,是云智慧发展的历史转折点

IT运维大会精华回顾 等保2.0时代掌控万物互联

前提是你 提交于 2019-12-02 18:31:08
10月24日,由《网络安全和信息化》杂志社、IT运维网联合主办的“2019(第十届)IT运维大会”在北京新世纪日航酒店成功举行。 随着大数据、云计算、物联网、互联网+等快速发展,IT系统架构日益复杂,业务需求的多样化,海量数据激增且无法及时分析并有效利用,企业面临着前所未有的IT运维挑战,传统的运维手段已经无法满足如今业务系统运维管理的需求。而伴随着 AI 技术的崛起,基于大数据和算法的智能运维应运而生,并逐渐成为一种新的发展趋势。 本届大会以“智能+时代的新运维”为主题,邀请了政府、制造、金融、互联网、能源、教育、交通、医疗等各行业运维主管、企业代表、业内专家,共同解读在智能+时代背景下中国IT运维发展的趋势,以及IT运维市场的发展方向。 以下是大会演讲观点摘录: 北塔软件技术总监 魏玉雄 智慧( AI )运维初探 随着人工智能在信息技术发展中扮演的角色越来越重要,它与运维的结合已是必然。北塔软件技术总监魏玉雄认为人工智能进入运维领域,不应是炒概念,要将概念落地,从定框架到改进系统,实实在在地改善运维工作。魏玉雄还认为智能是通过学习得到知识,而智慧是不通过学习就可得到知识。因此智慧运维是智能运维的深化。 汉得信息技术总经理 孙帆 泛服务运维与企业运营自动化融合 由于汉得信息早年是做高端ERP业务的,近些年才逐步转向做数字化工作。所以积累了很多管理服务的经验

云计算下的企业IT运维

江枫思渺然 提交于 2019-12-01 04:50:16
云计算管理员们一般都工作在一个分布式局域网计算基础设施中,它与传统数据中心最大的区别之一就是,所有被存储、调配和管理的数据都在一个私有云中。基于云计算的高效工作负载监控可在性能发生问题之前就提前发现这些问题的苗头,从而防患于未然。了解你的云计算运行详细信息将有助于交付一个更强大的云计算使用体验。 收集云计算性能指标 IT管理员们必须积极主动地收集和记录云计算服务器的性能指标与数据,这主要是因为托管云计算工作负载的大多数服务器都是需要使用专用资源的虚拟机。对于云计算服务器来说,过度分配资源或分配资源不足都是一个需要付出高昂代价的错误。 适当的规划和工作负载管理是任何重大云计算部署工作之前必须实施的环节。当收集运行专用工作负载的特定服务器的性能指标时,管理员们必须评估如下参数: CPU使用率:云计算服务器必须是物理的或虚拟的。管理员们必须查看机器,并确定用户是如何访问CPU资源的。当无数用户从云计算启动桌面服务或应用程序服务时,必须认真考虑这台服务器需要多少个专用核。 RAM需求:基于云计算的工作负载可以是RAM密集型的。在一个特定服务器上监控一个工作负载,可允许你衡量分配多少的RAM资源。其关键在于按需规划而不过度分配资源,你可以通过工作负载监控来实现这一目标。通过查看一段时间内RAM的使用情况,管理员们可以确定何时将会发生使用高峰以及相应合适的RAM等级。   存储需求

国产网管软件的深化发展之路

﹥>﹥吖頭↗ 提交于 2019-11-29 16:55:48
网管软件在巨大的市场需求的推动下,发展前景已经被业内人士普遍看好。据统计,去年中国网管市场容量为5-8个亿。而且,自2001年以来,市场每年保持15%-30%的高增长率。随着国内网络应用的发展,近两年越来越多的企业认识到,除了要依靠网络设备本身和网络架构的可靠性之外,网络管理是一个关键环节,结构越来越复杂和规模越来越大的网络系统需要网络管理软件来保证系统的正常运作,网络管理的质量会直接影响网络的运行质量,管理好一个网络与网络的建设同等重要。 与此同时,各类网管软件层出不穷。从实际应用来看,网管软件已经呈现多样化、多层次、多级别的特点,网管软件的应用日益细致、分工越来越明确。在“网管软件”的统称之下,各网管软件的侧重点各不相同。有的侧重于网络设备的管理;有的侧重于服务器的管理;还有可以对网络基础架构及其应用系统进行集中式管理的综合网管系统,如IBM Tivoli、HP OpenView、智和网管平台SugarNMS等。 能够在激烈的市场角逐中崭露头角,经受住市场竞争的考验,为众多的消费企业认可和接受的网管软件,就是适合市场需求、可以创造出巨大生产力的高品质软件。放眼中国网管市场,国产网管厂商正在逐步扩大战果,国外的网管软件厂商正在加强在这一领域的争夺,尤其是日本网管厂商,他们正准备把其国内成熟的软件和推广模式拿到中国来,借助中国初现蓬勃生机的网管需求,加入网管市场的争夺之战。

数据中心的自动运维之路

末鹿安然 提交于 2019-11-29 16:55:35
自动化运维其实也算是老生常谈,一谈谈了十几年,但却一直没有质的提升。数据中心的运维工作反而变得越来越繁重与复杂,当然这和这些年数据中心巨大的变化紧密相关,数据中心承载的各种应用越来越多,运维工作也变得异常复杂,简单的自动化运维已经不能彻底解决数据中心运维工作效率低下的问题。以前,数据中心运维人员就像流水线上的一名工人,不断重复地做着同样的工作,枯燥又容易出错,自动化运维就是要引入一些工具,通过这些工具来替代运维人员来工作,从而减少人力成本,同时提升数据中心的运维水平。 那么自动化运维,其实就是向数据中心引入一批工具,这批工具是“可编程”的,你只需要为这批工具写上几行“代码”,它便会帮你自动完成所有的工作,而这批工具就是实现自动化运维的手段。这些工具可以分为三大类:预备、配置管理和监控,从这三大方面代替人力工作。预备自动化工具常见的有Cobbler、Kickstart、OpenQRM、Spacewalk。在早期,Linux管理员整理出一个软件包列表,通过rpm进行批量软件安装。 后来,我们用Kickstart来执行无人值守的Linux安装。现在,Cobbler把这个功能提升到了一个新的高度:它实现了物理机与虚拟机的并行系统构建,并且可以进行DHCP和DNS的配置。OpenQRM是开源系统管理解决方案,用来管理企业数据中心业务,同时包括虚拟环境管理、数据中心自动化

选型宝访谈:业务运维解析

假装没事ソ 提交于 2019-11-26 12:53:07
李维良(主持人) 首先,请您为大家介绍一下,什么是业务运维?业务运维产生的背景是怎样的? 刘洪涛 业务运维是一个非常新的概念,在国外,类似的技术和产品被称为DPM(Digital Performance Management)或BPM(Business Performance Management)。 大家知道,很多年以来,企业使用的运维产品都是“泛工具化”的,就像一把把螺丝刀一样。尽管运维工具经历了从基础监控到APM(应用性能管理)的演进过程,但它的本质并没有改变,只是从普通螺丝刀变成了电动螺丝刀。 对于企业的实际应用场景而言,工具所能带来的帮助永远都是很有限的。特别是在今天,随着“互联网+”战略的推进和数字化转型浪潮的兴起,企业的业务正在快速云化、移动化、互联网化,对于处在转型过程中的企业来说,如何对原有的IT系统和新的互联网应用进行统一管理,怎么让传统IT设施为新型业务提供更好支撑,就成了一个新的挑战。 显然,传统的运维工具没有办法很好地解决这类问题了。今天,企业真正需要的,是一款平台化的软件,是一款以提升业务效率为出发点,能够有效连接IT与业务的运维产品。 业务运维以用户体验为核心,以业务价值为导向,它是IT运维与互联网深度融合的产物,是运维管理在云计算、大数据等技术推动下所产生的必然结果。 李维良 今天的CIO,不仅是IT的管理者,更是创新业务的引领者

分布式主动感知在智能运维中的实践|分享实录

泄露秘密 提交于 2019-11-25 20:29:50
内容来源:宜信研发架构师肖云朋老师于WOT峰会分享《分布式主动感知在智能运维中的实践》 导读:企业数字化使得运维智能化转型成为必然,宜信积极推动 AIOps 在科技金融企业的落地实践。本次主题是探索 AIOps 落地的一种形式:通过行为采集、仿真模拟、主动感知等手段,从用户侧真实系统使用体验出发,结合全维监控数据,更加有效的实现智能异常检测和根因分析。 一、运维的发展 1.1 运维的价值 早期的运维工作比较简单,一般是先由系统集成工程师及研发工程师研发完项目后交付出来,再由负责运维工作的人员从后台做一些操作,保证系统正常运行。 图1 随着软件研发行业和技术的发展,运维的工作也变得越来越丰富。现阶段运维的工作与价值主要集中在三个方面: 1)效率 大量业务上线,运维人员需要保障快速高效地为系统提供资源、应对业务变更、响应操作请求。 2)质量 运维的目标是保障质量及系统的稳定性。也就是说,要保障业务和系统7*24小时在线上稳定运行,为用户提供流畅舒适的体验。为实现这个目标,运维的相关工作包括: 故障预测:没出现问题之前预测到故障发生的可能。 异常检测:出现问题时很快检测并定位到异常点。 根因分析:分析问题的诱因,找出真正导致问题的根本原因。 动态扩容:问题处理的过程中可能受到复杂因素的影响,需要对系统进行动态扩容。 服务降级:不影响核心业务的边缘业务可能需要做服务降级处理。 3)成本