传统数据中心如何实现向云的平滑升级

传统数据中心如何实现向云的平滑升级

1.引言

众所周知,云计算是近年来发展最快的互联网技术,被称为第四次IT革命。据权威机构预测,到2016年,2/3的IT应用服务将建立在云架构上 [1]。作为云计算核心的基础承载设施,数据中心在网络中所扮演的角色也愈加重要。目前,新一代的云数据中心正逐渐取代传统数据中心,并成为互联网业务和流量的主要源头。在中国,工信部电信研究院发布的《2014年云计算白皮书》[2]显示我国公共云服务市场仍处于低总量,高增长的产业初期阶段。2013 年我国公共云服务市场规模已达47.6 亿人民币,增速36%,远高于全球平均水平。

云计算市场旺盛需求,带动了IDC产业的高速增长。对于通信运营商而言,IDC业务正逐渐成为其业务收入增长的新的重要源动力。2005-2012年间,中国IDC市场规模增长了6倍,且预计未来5年仍将保持25.5%的年均增长率[3]。

传统数据中心如何实现向云的平滑升级

图1 2011-2016年中国数据中心市场总体预测

为把握这一机遇,中国电信和中国联通先后成立了专门运营云计算业务的云公司。中国移动也在多个省市开展云计算相关业务的试验。可以预见,云计算业务将成为运营商未来业务增长、竞争的主要热点之一。

2.现有数据中心组网现状及问题

目前,国内主要运营商在全国已建有数百个数据中心,年收入达上百亿元。但这些数据中心大多从数据机房演变而来,主要提供机架出租和主机托管等附加值较低的业务。与业界领先者相比,运营商IDC存在以下问题:

2.1 组网技术落后,扩展性受限。

虚拟机的大规模使用是云数据中心区别于传统数据中心的一个最主要特点。由于虚拟机迁移要求,迁移前后的网络要属于同一个二层网络。因此,新一代的数据中心组网技术如Trill、SPB等都专注于构建数据中心内部的大二层网络。而运营商现有数据中心的网络拓扑如下图所示:

传统数据中心如何实现向云的平滑升级

图2 传统数据中心网络拓扑

其中,运营商只负责提供接入层以上的设备。租户需要通过自备的网络设备汇接其所有服务器,然后再通过配置静态路由将流量导入接入层交换机。在路由协议配置上,接入交换机为二三层网络分界线,接入层以上的设备运行三层网络协议,包括ospf和BGP。在这种方式下,二层被限制在网络边缘。整个数据中心分割成相互独立的多个烟囱式的业务网络,极大的限制了虚拟机迁移的范围和用户网络的扩展性。同时由于各业务网络彼此隔离、无法复用,降低了网络资源(如:接入带宽和端口资源等)的利用效率。

2.2 运营模式粗放,业务开通速度慢。

业界领先的亚马逊、阿里巴巴等互联网公司已为客户提供PaaS,SaaS等云服务,对用户技术要求低,且业务开通仅需几分钟。而运营商数据中心机房目前还多以提供机房、机架出租等低附加值业务服务为主。用户开通新业务需要通过提交申请、网络划分、逐台设备配置等繁琐的步骤,平均业务开通时间通常在几周甚至几个月左右。

2.3 高端资源不足,低端资源无法整合。

作为互联网行业的基础服务体系,数据中心站点正在向大规模、集群化方向发展。谷歌、微软、腾讯等互联网公司新建的数据中心站点都已拥有上万台物理服务器。国内调研数据显示,2012年被调查IDC服务商机房拥有服务器数量在5000台以上所占比例与2011年没有多大变化;被调查IDC服务商机房拥有服务器数量在1000-3000台的所占比例下降到23%,说明这两年行业进行重组整合,较小的IDC服务商已经被重组或者淘汰[4]。

传统数据中心如何实现向云的平滑升级

图3 2012年中国IDC公司的机房服务器数量

而运营商现有的IDC机房中,五星级、四星级机房仅占20%左右。这无疑难以满足用户对资源需求的增长趋势,不适于未来IDC业务的长期发展。同时,由于设备和组网技术的限制,无法将多个数据中心资源整合在同一个二层网络中形成一个逻辑资源池。这样,当面对网络资源需求较大的用户时,一方面各机房都无力单独满足用户的使用规模需求;另一方面,大量资源被闲置、浪费的矛盾现象。

2.4 IDC资源利用率不均,分布不合理。

由于不同种类的业务对网络时延的要求不同,各用户对IDC机房地理位置的敏感度也存在差异。如提供页面访问业务的用户,对机房位置的要求不太敏感;而金融和政府用户则多要求部署在一、二线城市;中小用户则要求就近部署在本地。

目前,运营商在一线城市机房的机架利用率和出口带宽利用率也基本饱和。而三、四线城市机房的机架和带宽利用率尚有可利用空间。但由于不支持虚拟化功能和统一的管理调度平台,使得无法通过业务调度的方式,实现对现有网络资源的整合。

2.5 缺乏多数据中心协作机制,难以发挥固网资源优势。

目前运营商不同等级数据中心间缺乏协同工作机制与热点流量推送机制;与Google,Facebook等公司的数据中心互联模式相比,用户体验上还有差距。

此外,随着云计算、移动互联网和服务器虚拟化的大规模使用,对数据中心网络提出了更高的要求:

(1)无阻塞网络,并具备近似无限的高扩展性。

(2)能够感知虚拟机,并支持虚机在单数据中心内部和多数据中心之间的漂移,并保证相关网络策略随之迁移。

(3)支持多业务、多租户。能在同一物理网络上,根据业务需求自由构建业务网络并保证网络安全性。

(4)网络统一运维,高度自动化、智能化管理。

以上这些需求是现有的数据中心网络难以实现的。

为满足上述需求,业界主流厂家推出了一系列新的技术解决方案,如Trill、SPB、VEPA等。但这些技术都需要新的网络硬件,即各级交换机设备。显然,对于已建有数百数据中心的运营商而言,这一成本十分高昂,且是否值得也有待考验。

此时,SDN和NFV技术的适时出现,为利用现有网络设备,整合数据中心网络资源,实现云化升级,提供一条解决思路。

3.SDN&NFV技术

SDN(Software Defined Network)即软件定义网络,它起源于美国斯坦福大学,是继云计算之后,业界最关注的网络新技术[5]。2012年,谷歌在其数据中心网络上的成功应用SDN,标志着SDN进入到商用化阶段。同时也使得数据中心成为业界公认的SDN技术应用的首选场景。

控制转发分离、逻辑集中控制、开放可编程是SDN区别于传统网络的主要特征。正是这些特征使得SDN能够良好的满足数据中心网络的使用需求。SDN 的控制转发分离,为实现集中管理创造了条件。而管理集中化正是提高网络管理和业务部署的自动化程度的必要前提。开放可编程接口则为将业务需求转化为网络需求提供了途径。

目前,SDN有三种实现方案,即基于openflow协议的解决方案、基于overlay技术的解决方案和混合型解决方案。其中基于overlay 技术的解决方案是目前主流的发展趋势。这种方案通过使用vxlan或nvgre等协议,在报文进入接入层设备前将二层报文封装在三层报文中进行传输,最后在接收侧解封装还原二层报文。这样就是实现了在三层网络之上建立一张逻辑二层网络的目的。该方案对承载网要求低,IP可达即可,不需要改变现有网络架构和协议,具有良好的适用性。

NFV(Network FunctionVirtualization)即网络功能虚拟化[6]。该技术源自于电信运营商,其的最终目标是以软件方式虚拟化IT资源,让虚拟化部署能够提供重要的网络功能,而不再需求专业的物理设备。这些虚拟设备在网络中将像物理设备那样工作,且无需特定设备即可实现多种专业功能。此外,由于 NFV可以采用虚拟机的方式提供,再结合SDN的流量控制功能,可以轻易实现功能网元的按需弹性部署及service chain功能。

SDN的集中管理控制与NFV的快速弹性部署相结合,构成了一条网络硬件的通用性和软件的开放性越来越高的发展道路。

4.云化演进方案

利用SDN技术和NFV技术,我们可以通过软件方式实现对现有数据中心的云化升级,具体可分为以下几个阶段进行:

第一阶段,对服务器实施虚拟化改造,并使用支持vxlan的开源OVS虚拟交换机构造大二层网络。

传统数据中心如何实现向云的平滑升级

图4 传统数据中心在服务器虚拟化改造后的效果

已有大量实践证明,通过使用虚拟化技术可以将服务器的资源利用率提高30%以上。同时,由于将原来需要多台服务器承载的业务集中到一台服务器上的多台虚拟机处理,大幅降低了所需服务器的数量。这样也节省了网络接口资源,使业务网络实现“瘦”化,提高数据中心的整体承载能力。

同时由于使用了vxlan技术,使得不同的IDC站点只要IP可达,就可以在逻辑上构成大二层overlay网络,从而实现整合多个数据中心网络资源的目的,提高了资源利用率。且由于使用的是开源软件,升级成本十分低廉。

第二阶段,利用NFV技术提供防火墙、负载均衡、私有云等业务。

在传统数据中心的组网方式下,为提供防火墙和负载均衡等增值业务,有两种方式。一种是用户自备相关硬件,串接或旁观在其与接入交换机相连的网络设备上。另一种则需要将相应的硬件旁挂在核心路由两侧,供所有业务共用。前一种方式,由于用户网络规模有限,容易导致资源浪费。后一种方式,难以针对具体各业务私网提供定制服务。

NFV技术出现后,通过在虚拟机上安装防火墙、虚拟路由器等功能镜像,实现了针对各业务网络的资源弹性部署。在降低组网成本的同时,提高了服务种类、处理精度。

第三阶段,增加controller,并通过controller与OVS和NFV管理平台的对接实现对ovs和NFV设备的统一控制,提高业务的按需自动化弹性部署能力。

通过增加controller,并将其与OVS、NFV管理平台实现对接。引入SDN集中控制功能,实现service chain的自动化部署,可以大大提高业务开通的自动化程度和速度。这里为了降低成本可以使用开源的controller,如opendaylight的产品——Hydrogen。

第四阶段,当网络规模和流量足够大时,通过将现有接入交换机更换为支持vxlan封装的交换机,提高业务处理能力。

由于OVS仍属于软件范畴,相对硬件存在性能瓶颈。在改造初期,由于运营商现有数据中心的网络规模大多较小,对性能的要求也相对较低,OVS还能满足使用需求。但随着互联数据中心站点数量的增加,对OVS的性能要求(如流表数量)也直线上升,其性能问题就可能成为业务发展的瓶颈。此时,原有的接入交换机已基本接近使用年限。可借助更换新型接入交换机的时机,将OVS对数据包的部分处理功能,如vxlan封装,转移到硬件的接入交换机侧。从而降低OVS的性能压力,满足业务的使用需求。

通过以上几个步骤,实现了在尽可能利旧现有网络设备的情况下,用最小的代价完成传统数据中心向云数据中心的升级。

相关推荐