这一次,阿里云再度将“重构计算”扛在肩头!

感情迁移 提交于 2020-10-03 00:24:12

引言:冲击业务永续与极致性能,推进自研软硬一体与全面云原生,阿里云这是要将“重构计算”进行到底了……

近日,阿里云第三代神龙云服务器风风火火的上新了。

这一幕距离六月基础设施算力升级,搭载第三代神龙云服务器架构的高主频七代发布仅仅过了一个多月。

阿里云弹性计算负责人旭卿说,如此之快还要归功于第三代神龙架构带来的利好尝试。

确实,通过三代神龙架构的强势助力,全新推出的第三代神龙云服务器在各项服务能力上都得到了全面升级。

无论是计算效率还是网络与存储方面的硬实力,均可谓“强势来袭”。

综合性能暴涨160%,第三代神龙云服务器不是一点子智慧

有数据显示,与上一代神龙云服务器同款相比,这次的三代产品综合性能暴涨高达160%,相比目前全球范围内最顶级的云服务器还要快上超过30%,地表强悍有木有?

与第七代ECS企业级高主频实例类似,第三代神龙云服务器在架构上更好地支持了一些四路服务器

或许大家可能知晓,主流的云服务器过去通常采用的是二路服务器,即一个服务器中携带两颗CPU。

如今创新性选择了更加高密度部署的四路服务器制式,也就是同时携带四颗CPU。不但是单体计算性能得到显著提升,从整机的性能角度上也有很大飞跃。

很明显,四路服务器带来的好处,每颗均摊到整体基础设施的成本,相比之前确实下降不少,当然这也是其整体性能综合提升高达160%的关键所在

具体来说,第三代神龙云服务器产品家族提供了最多208核、最大6TB内存

其中云盘IOPS高达 100万、2400万的网络转发以及最高达100G的网络带宽,掐指一算均为全球最高性能水平。

如此表现出挑,根源何处?

旭卿认为第三代神龙架构中的自研神龙芯片很关键。

以云盘IOPS为例,经过阿里云整体性能测试,即便是达到峰值100万的状态,其表现出的延迟也基本呈直线状态,充分说明其性能平稳异于非常。

这主要得益于在架构层面被提供了硬件的QoS能力,其统计的精确程度是传统云盘或者软件层面无法比拟的。

当然,怎样能够在快速互联网迭代方式下,能够解决芯片伴随用户周期迭代,并同时确保稳定性能等,这些统统都提出了很大挑战。

总体来说,在三代神龙架构的推动下,神龙芯片在数据面的加速以及硬件QoS能力上为云服务器以及第六代ECS增强型实例提供了强有力的保障。

如果说进一步提及第三代神龙云服务器的场景优势,“全能选手”或可称为关键词之一。

对此科技星象获悉,在一些通用类的业务中,该产品带来的优势提升表现明显。例如在以持久内存著称的AEP实例中,经常运行的SAP Hana数据库场景、缓存Redis场景以及AI领域经常提及的参数服务器场景中,性能表现都很突出。

阿里云弹性计算负责人旭卿

此外,值得强调的一点子智慧,第三代神龙云服务器产品家族还支持CPU、GPU、NPU、FPGA等多种计算形态,具备3分钟交付50万核vCPU的极速扩容能力,被称为云原生的最佳载体。

用旭卿的话说,这就是一款真正的云原生硬件。

谈及这个概念自然免不了说说“买神龙服务器”的梗。

神龙服务器上新之初,的确有很多人纷纷跑来咨询买入并打算在线下使用。

其实回复很简单,神龙服务器很难在线下使用。原因在于其与云计算的结合度很高,并不是一台“拿回家就可以使用”的服务器。

而是需要与阿里云庞大有力的基础设施相融合,通过软硬件协同才能有效发挥极致性能。

如果独立拿出一个硬件使用,对于企业软件的开发成本可谓是增加了更多不必要的负担。

当然,神龙服务器的“云原生属性”不单单表现在与云计算使用的紧密结合,更重要的是与容器的“天生一对”。

过去人们总认为容器的最佳CP是物理服务器,但其实忽视了几个属于物理服务器的天生缺陷,例如无弹性、不稳定、共性连困难以及迭代速度缓慢等。

而基于神龙架构的云服务器,既具备传统物理机的最佳性能又兼具虚拟机的灵活性。

由于在虚拟化技术中采用了硬件隔离的方式,使服务器的安全性也很高,并且将存储、网络的IO运算封装在芯片中,果断实现了端到端安全。

再加上阿里云本身的迭代周期完全可以达到最快达每周一更新,远远超过了传统意义上半年一迭代的速率。

更重要的是,神龙架构对云原生浪潮下容器等产品适配程度极高

通过I/O offload芯片加速,高效调度和自动化弹性伸缩的容器化产品可帮助降低50%的计算成本,性能甚至比物理机更优越。

举个例子来说,在典型的双十一场景中,压测过程中我们就会发现,神龙服务器和同规格的物理机相比,在云原生的应用场景下性能会有20%到30%的性能提升。

通常情况下,传统物理机性能在压测中能够达到40%-50%的CPU利用率就已堪称极限,可见与神龙服务器的差异性之大。

第六代增强型实例入驻ECS产品家族,多几个九那都是小事儿

另外在发布中,基于第三代神龙云服务器以及架构,阿里云还构建了新一代ECS产品家族

其中包括六月初刚刚邀测的第七代高主频实例,以及内存增强硬实例,新一代GPU实例与NPU实例,还涉及超级计算集群实例,非易失性内存APE实例等在内。

在不断扩展服务用户的能力同时,基于第三代神龙云服务器架构的第六代增强型实例也被顺势妥妥纳入其中。

值得提及的一点,该实例由三部分组成,在计算方面阿里云率先自研了Dragonfly Hypervisor,不再使用传统例如KVM、XEN这种虚拟化架构。

除了具备非常轻量级的特性,Dragonfly Hypervisor不仅资源占用少,还在虚拟化效率提升上收效明显。

据悉可以在计算抖动层面做到百万分之一的级别。

此外全系搭配ESSD系列云盘,存储转发能力最多提升四倍。

进一步了解,过去三年间,阿里云方面一直致力于打造新一代SSD云盘。

而通过ESSD可以具备单盘100万IOPS能力,单路延迟最低可以做到100微秒,每一次快照备份可以做到5秒钟之内。

这样一种极致性能,其实大大提升了第六代增强型实例的存储能力。

有数据显示,ESSD还支持10Gbps突发内网带宽,单卷延时大幅下降;性能等级按需配置,在线无损变配,同时使用门槛大幅下降50%。

在网络能力方面,自研的神龙架构也带来了超强网络IO能力,最强可以提供单实例2400万PPS的转发能力。

这就意味着,每个数据包最低延迟可以做到21us。

更重要的是,Mysql和Redis性能提升超过15%,Nginx性能提升达100%。

配合Alibaba Cloud Linux 2 LTS,启动速度最多提升60%,运行时性能提升30%以上且稳定性最多提升50%。

可以说第六代增强型实例算是集大成者,果断继承了第三代神龙云服务器的几乎所有优点。

过去的一个多月的时间,已有超过80%的用户开始使用第六代增强型实例,如今已全球开售。

另外针对内存密集型的应用,例如SAP HANA内存数据库应用,本次发布也推出了业界首款裸金属且经过SAP HANA认证的实例。

实例本身具备208vCPU和最高6个TB内存,无论是支撑OLTP还是OLAP,与传统物理机以及上一代产品相比,都会有35%以上的性价比提升。

“除此之外,安全可信云实例其实也是基于我们对于硬件、固件和操作系统全栈的安全能力基础上推出的可信实例。”

以弹性计算服务为例,阿里云透露,目前单实例的可用性可以做到99.975%;而跨可用区多实例可用性也可做到99.995%。

总之通过技术和产品创新,提供更高的可靠性、可用性的能力才是关键。

对此阿里云弹性计算负责人旭卿表示,传统服务器主要依赖堆砌硬件提升性能;而阿里云自研的神龙架构更多基于硬件云原生理念,创新性打破了虚拟化技术与CPU、内存、网卡等硬件的天然鸿沟,可发挥出比传统物理机更强的性能。

我们理解,尽管摩尔定律客观左右发展,但通过软硬一体化的思路确实可以将软硬结合的性能潜力激发出来,达成“超摩尔”的效果。

毕竟阿里云就是此工作成功的实践者之一。

关于未来,旭卿坦承,对于神龙架构的存储性能提升、安全合规增强以及SOC方面的规划都会成为继续努力的技术升级方向。

十年进化,重构计算:业务永续+性能极致,一直都是标准旋律

一直以来,云计算被誉为新的计算模式,其弹性计算服务作为最基础核心的产品被业界熟知。

基于此,2010年5月10日,阿里云对外发布的第一个商业化的产品就是弹性计算产品,也就是ECS1.0。

从2010年通过发布ECS1.0来服务中小企业站长,到2015年发布ECS2.0来服务诸如12306这种极具挑战的业务场景,再到2017-2018年,上马神龙架构去承担双11这种世界级的难题。

“经过十年进化,我们确实重构了整个计算的服务模式,也具备了服务全业务场景的能力。”

有数据统计,过去十年时间,阿里云的存储性能提升了2000倍,网络性能提升了500倍,整体算力以平均每12个月翻一番的速度增长。

但归于根本,都是为了满足用户最重要的诉求之一,那就是业务永续,即业务永远不要停机、不要宕机。

“一直以来,阿里云都始终坚持自主研发,我们挑剔和控制掌握每一行代码,就是做到为用户提供更加稳定与可靠的服务,保障永不停机的计算服务,是我们的使命。”

这是2019年杭州云栖大会上,阿里巴巴合伙人、阿里云智能基础产品事业部总经理、研究员蒋江伟,花名小邪的压轴之词。

当然在业务永续的基础之上,极致性能的要求更是重中之重。

在过去几年间,阿里云借着软硬一体化的趋势,自研了神龙计算平台、盘古存储平台和洛神网络平台,通过软硬一体化的结合能力来大幅度提升计算效率。

早在2016年阿里云就秘密启动了一项代号为“X-Dragon”的项目,并于2017年推出首款自研神龙云服务器,就独自研发解决方案并重构了云计算的基础设施。

而最新发布的第三代自研神龙架构,更是贯穿了整个IaaS计算平台,并在 IOPS、PPS 等方面提升5倍性能,甚至可以做到在云上获得物理机100%的计算能力。

如今从最早的单一通用计算,到推出异构计算与高性能计算产品,再到目前一系列新品出炉,阿里云弹性计算已覆盖互联网、金融、零售等行业在内的近300种场景,全球22个地域,63个大型的数据中心支撑各种流量高峰。例如12306的春运抢票、微博热点暴涨流量以及钉钉2小时扩容10万台云服务器等。

目前架构已大规模应用于淘宝、天猫、菜鸟等业务,高效解决高峰值的性能瓶颈问题。

据悉以“帮助中小企业更快更好上云,在疫情期间节约IT成本渡过难关”为主题的“以旧换新,10亿元补贴”计划与“培养更多云计算高级人才助力技术产业发展”的高校计划为达成进一步的神龙生态发展,已纷纷启动。

而伴随云计算向纵深方向发展,软硬一体和云原生将成为云计算技术架构的主流。

肉眼可见,阿里云正通过不断推进软硬一体化与全方位云原生化来加快重构基础设施计算层面,这是铁定的主旋律,不过对此,你看好吗?

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!