阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘

摘要: 在5月16日的飞天技术会新品直播中,特别邀请了业界知名大咖狒哥以及阿里云虚拟化资深专家旭卿作为现场直播的嘉宾。本次直播主要从产品背景到“X-Dragon架构”,从硬件设备到软件应用来深度的剖析“X-Dragon架构”为弹性计算裸金属服务器提供的极致计算能力。

在5月16日的飞天技术会新品直播中,特别邀请了业界知名大咖狒哥以及阿里云虚拟化资深专家旭卿作为现场直播的嘉宾。本次直播主要从产品背景到“X-Dragon架构”,从硬件设备到软件应用来深度的剖析“X-Dragon架构”为弹性计算裸金属服务器提供的极致计算能力。
直播视频请点击
以下为精彩视频内容整理:

产品背景

这几年越来越多的大客户把自己的业务搬到云上来,一方面是因为云可以在成本、效率、性能方面提供更多的优势。但在客户把业务往云上搬的过程中,可以看到客户对物理机产品的一个诉求,尤其是当客户的业务运营在线下物理机上时。在把业务搬上云的过程中,会遇到一些困难,遇到困难后有一些云计算公司可能就会推出一些物理机托管的服务,而这种服务很难满足客户的需求。所以我们考虑生产一个既兼具物理机的性能同时又能提供虚拟机体验的一款产品,基本是沿着这条思路做下来的。

揭开神龙的神秘面纱

阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘
神龙(X-Dragon)又名弹性裸金属服务器,X-Dragon服务器是真正的从云计算的角度去设计的一款服务器,随着近几年云计算的热潮的到来,发现通用的CPU不能很好的满足客户的需求,所以我们就开始自己定制CPU。刚开始定制的时候大家可能真正关心的是核数、频率、size的大小等,但真正的分析业务后发现只有这些是不够的。举个例子就知道我们是在做什么工作了,比如在云计算数据中心里面虚拟机的热迁移是个非常重要的部分,它可以在马上要发生故障的时候把上面的虚拟机无感的迁移到其他的物理机上。但在迁移的过程中CPU和CPU之间可能存在着差异,在这种情况下怎么能够更好的去支持热迁移,我们会在CPU里面加入一些特定的部分,来解决掉这方面的问题,这些东西可能就是阿里巴巴所特有的。


我们又增加了6149这个型号,6149是16核的,并且是高主频的,所以高主频它的频率要比一般的CPU频率要高一些。为什么我们要做这个,其实当更多的企业级客户或者说大客户上来的时候,他们的一些应用对CPU单核性能的这种极致的追求是非常强的,所以我们最终决定在这一代加入比如说高主频的这样一个东西。


对于自研主板主要是因为从2014年开始随着客户不断上云,我们发现在使用一些业界的X86的主板没办法更好的满足需求,所以主板我们是完完全全的自研,这个主板的所有IP属于阿里巴巴完全自主设计。

X-Dragon MOC卡实例

阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘
CPU和主板并不是神龙最特殊的地方,但MOC卡就是神龙的灵魂所在了,这个就是神龙技术架构的核心。这个卡就是完完全全由阿里巴巴自主设计,然后找硬件帮我们代工。它也有比较丰富的对外接口,它远远不是一个芯片,它上边有计算资源、有存储资源还有网络资源。从虚拟化的角度定义了一个这样的设备,这台设备就像虚拟机一样方便灵活,所以从它里边的一些组件一些部件能够和软件深入的融合在一起,把这样一台机器变成和虚拟机一样的用户体验。

X-Dragon架构的优势

它是可以分钟级的去创建100%物理机性能和功能的云服务器,所谓分钟级创建就是说,我们知道传统的物理服务器在交付的时候时间可能非常的长,所以大家喜欢云计算,用虚拟机的技术在几分钟之内就可以交付。我们要求X-Dragon具备100%的虚拟机的体验,比如说虚拟机的一切特性像资源弹性、自动化运维、无缝上云等。因为是物理机所以具有硬件隔离和极致安全。它是阿里巴巴自研的软硬件体系,是可信可控的。

X-Dragon架构自研硬件体系

阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘
这几年云计算发展起来之后,自研可信可控是最基本的要求,所以整个的神龙的软硬件体系都是完全通过自研模式去实现的。第一个是神龙芯片,神龙芯片是整个设备的一个核心,因为通过它可以让这台设备完完全全具有虚拟机的特性,包括虚拟机的接口。神龙MOC卡在神龙的整个架构里具有比较重要的作用,它有比较丰富的接口、管理的接口、对外数据的接口可以帮助我们实现弹性裸金属服务器具备的这些功能。

X-Dragon MOC卡架构详解

阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘
上图可以清晰的描绘出X-Dragon MOC整个的架构详解。上边是弹性裸金属的一个实例,它里边有CPU、内存,并且CPU、内存都是物理的,物理的优势就是物理机具备的特性它都具备。但下边是VirtlO-NIC、VirtlO-Blk,之所以这么做是希望云上的所有镜像、云上的所有系统、虚拟机和物理机之间完全兼容。除了这些功能外,还要一些外部设备,外部设备就是键盘、鼠标、显示器也是通过芯片、通过设备的形势模拟出来。这样就可以实现和虚拟机一样的对外接口,使得运营的操作系统不需要做任何的修改,在虚拟机上拿过来在X-Dragon MOC卡上直接用。下面这部分是卡的中心结构,整个X-Dragon Hypervisor完完全全运行在这张卡上面。它是支持云盘、支持VPC网络、支持存储/网络设备热插拔、支持32块弹性物理网卡同时对X86、ARM、Power等CPU是兼容的。

X-Dragon 自研软件体系

阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘
在软件体系里硬件也扮演着重要的作用,所有的软件和硬件做到了整体的深度融合。所谓深度融合就是比如说X-Dragon芯片可能向上需要提供Virtio 网络驱动的接口、Virtio 存储驱动的接口、交互IO层驱动的接口,能让上边的实例具备虚拟机一样的体验。向下要和X-Dragon Hypervisor系统软件融合在一起,云盘要提供更佳极致的性能。

X-Dragon架构支持第三方虚拟化

阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘
这是X-Dragon Hypervisor 的一个系统软件,可以从三个部分来讲:

  • 第三方虚拟化:在这样一个产品上其实可以很好的去运行这些虚拟化的软件,要比单纯的在物理机上运行要好很多。不用关心存储的可靠性等问题,因为神龙完全已经解决掉了。也不需要再去做网络的虚拟化,因为提供的32个网卡接口已经完全和阿里云网络虚拟化的基础设施相打通。
  • AnyStack:整个阿里云的Stack是基于飞天的Stack,能够更好的在公有云上和专有云上提供服务。以前OpenStack和ZStack是一种并列的关系,但是在有了神龙技术架构之后无论是OpenStack、ZStack、CloudStack 都能更好的和阿里云的基础设施连在一起。他们可以基于神龙云服务器去搭建自己的Stack,也可以使用阿里云的弹性裸金属服务器进行扩展。
  • 容器:在容器这一块列举了三个容器,这些容器都可以无缝的运行在上边。容器运行在云平台上的时候,传统方法是把容器运行在虚拟机里,但运行在虚拟机里容器的很多体验就会受到限制。我们提供X-Dragon云服务器之后,它不仅能提供像物理机一样的体验,并且它可以支持云盘、支持VPC的网络接口之后,每一个容器可以更好的应用弹性网络的接口通过VPC和整个的云基础设施其他的产品打通。

基于X-Dragon架构的阿里云弹性裸金属产品家族

阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘
这是一个基于X-Dragon架构的阿里云弹性裸金属产品的性能表。目前,基于神龙架构的弹性裸金属服务器已正式商业化售卖,支持8核、16核、32核、96核等多个CPU规格,并支持3.7 GHz~4.1 GHz的超高主频实例。

AWS测试款对比

阿里云弹性裸金属服务器-神龙架构(X-Dragon)揭秘
现场同档规格实例的性能测试中,基于神龙架构的阿里云弹性裸金属实例ebmhfg5.2xlarge(8vCPU) 在10000位圆周率计算Superπ中跑出了1分26秒的成绩,比AWS基于Nitro架构计算型实例c5.2xlarge(8vCPU)快了15%。

总结

今天终于能在这里把神龙的技术架构做一个详细的介绍,在未来神龙这样一个技术架构会变成弹性计算核心的硬件发展体系,在这样一个体系里边未来的1.0、2.0、3.0其实能够提供更佳极致的产品级的体验。所以沿着这条道路走下去会不断的推出神龙的技术架构,不仅仅是今天这样的一个弹性物理机,未来还会有很多基于神龙架构的产品。

数十款阿里云产品限时折扣中赶快点击这里领券开始云上实践吧!

原文链接

相关推荐