AWS祭出杀手锏Nitro架构:EC2价格降幅最高达到49%

6月20日,AWS在技术峰会上海站宣布,在光环新网运营的AWS中国(北京)区域和西云数据运营的AWS中国(宁夏)区域,近期对Amazon EC2新一代5系列C5和R5计算实例,以及GPU加速计算实例P3进行了主动降价。根据客户所选的实例类型不同,客户可以看到27%到49%之间的降幅。

一直以来,国内云服务商面对激烈的竞争环境,纷纷通过降价争夺地盘。尽管在国内还没有一家云服务商真正赢利,但是各家云服务商要么发起价格战,要么被价格战。

AWS一直是云计算的标竿,规模最大,它对价格战会坐视不理呢?还是主动挑起价格战、打击跟随者?

对这一问题,AWS全球副总裁、大中华区执行董事容永康接受采访表示,“就像云计算颠覆传统IT消费模式,AWS在价格方面也是采用颠覆性的做法。我们不会去关心竞争对手什么价格,更不会因为自己的技术先进、功能丰富,就让价格高高在上,不理会用户希望不断降低成本的要求。云计算是规模经济,AWS会坚持不懈地优化成本结构,主动降低价格,将成本节省回馈给客户。自2006年发布以来,AWS已经进行了72次降价。但是AWS不会发起所谓的价格战,也不看好同行搞价格的做法。因为降价很容易,但是要具备降价的能力,却不是一件容易的事儿。”

他分析说,AWS新一代5系列Amazon EC2实例,基于AWS最新的Nitro架构进行了优化。云计算的底层基础是虚拟化。虚拟化在带来资源灵活性、提升利用效率的同时,在性能方面会打折扣,主要是CPU要承担虚拟化管理方面的开销。AWS Nitro架构的做法是,将原本在通用CPU里运行的虚拟化管理程序 (Hypervisior) 抽离到了专有硬件上,这样,用户买到的资源就不再打折扣了,比如CPU和内存资源就更足量。如果说腾出来的CPU计算资源量不好描述的话,那么内存容量的足额交付就非常直观。

朱朋博做了一个对比,原来C4系列主机CPU:RAM的配比是1:1.875,现在变成了真正的1:2,计算资源也有类似的提升。用户能买到能足额交付的资源,或者说买到的资源都能用于业务上,对于用户来说意味着性价比的提升。通过查看价格表发现,同样是36核的实例,C5内存比C4的内存生生多出来12GB,价格却降低了大约20%。可以说,C5实例加量还降价。

AWS首席技术布道师Jeff Bar在一篇博客里写道:有了Nitro的实例跟裸机服务器主机相比,性能只差了大约1%,这一微小差别很难察觉出来。

朱朋博认为,通过架构优化实现提升性价比的做法,比打价格战高级多。对于云主机这种需求和要求都非常明确的商品来说,性价比对用户是非常有吸引力。

事实上,AWS表示有数千客户都开始用上了C5的实例,包括大名鼎鼎的Netflix也对C5相对于C4的性价比赞赏有加。在实际使用中,Netflix发现C5实例比C4实例的性价比提升了40%。

猎豹移动是AWS的深度用户,其海外业务全部运行在AWS上。作为中国移动互联网出海的领军者之一,猎豹移动海外业务的体量巨大。2018年,猎豹移动实现收入49.82亿元,其中海外收入占比60.4%。猎豹移动使用了AWS全球将近20个区域的资源,其中也包括AWS中国区域。

猎豹移动在海外使用了AWS大量的高级功能和服务,对AWS青睐有加。猎豹移动使用Amazon Elastic Container Service (ECS)、Amazon ElasticContainer Service for Kubernetes (EKS)等高阶功能,实现了微服务、容器化的架构,DevOps开发运维一体化,简化了运维,保证运维配置的一致性,在此基础上通过自动化利用预留实例和竞价实例,将资源利用率提高了30%,成本降低了40%;使用了AWS Lambda无服务器服务实现前端的无限量接入;使用了AWS Global Accelerator降低全球用户访问延时、实现高质量的全球覆盖;使用Amazon Elastic Inference深度学习推理服务节省成本;使用AWSShield Advanced高级服务抗复杂的DDoS攻击,等等。

AWS丰富的功能让猎豹移动运维团队如鱼得水,乐此不疲,利用这些功能大大加速了猎豹移动海外业务的开拓和发展。猎豹移动还通过使用AWS,对云计算获得深入的认知,积累了大量的经验,甚至已经申请成为AWS的APN合作伙伴,准备对外输出AWS使用经验。

在中国,猎豹移动此前从其它云服务商获得的价格更具诱惑力,所以使用AWS相对较少。猎豹移动运维总监朱军表示,随着AWS中国区域的服务和功能日益完善,新一代计算实例的性价比不断提高,猎豹移动准备加大对AWS中国区域的使用。

也许,采用Nitro的Amazon EC2 新一代5系列实列,将成为AWS中国区域的一个强大动力,吸引一大批客户。从市场竞争的角度看,从不跟友商比较的AWS,这次又以一种新的方式,恐怕要逼得纯粹的云主机价格战无路可走。

众所周知,虚拟化是云计算的重要基础,前者在带来资源灵活性和效率大幅提升的同时,却以某种程度上牺牲性能为代价。为提升云端服务性能,市场上开始出现Bare metal(以下统称:裸机服务器)类似的优化方案。在更多面向极致优化性能的场景中,一个重要的思路是做offload——把原本许多需要系统调用、内核操作的工作交给物理设备来做,绕开系统、CPU,简化流程和操作。换句话说,就是让计算机系统的各部件分工更明确、精细,进而提升整体效率。

有无RDMA前后变化

RDMA就是典型,绕过CPU操作流程,把原本属于CPU的工作交给其他部件。类似的offload创新有很多,比如AWSNitro,再次将超大规模云计算中心的效率推向极致。

有无Nitro架构上发生的变化

通过上图可以直观看出,Nitro架构基础之上,系统构建的复杂度明显降低。实际实现中,Nitro分为三大方向,彼此相互独立。

这三大方向分别是:

NitroHypervisior:专有硬件上承载hypervisior,实现近似裸机服务器的性能表现;

NitroCards:专有硬件承载存储、网络功能,以及控制EC2实例的业务逻辑;

Nitro安全芯片:硬件层的安全验证能力;

Nitro Hypervisior

Nitro是基于ASIC芯片的系统,直接部署在云数据中心的物理服务器上,直接接管原本需要在CPU上运行的Hypervisor做的事。

图自AWS re:Invent 2018

把原来虚拟机承载的作业交给专有硬件后,带来了很多变化,最主要的就是性能上的提升。AWS首席技术布道师Jeff Bar在一篇博客里写道:部署Nitro Hypervisor的实例跟裸机服务器主机相比,性能只相差大约1%,基本可以忽略。上图来自2018年AWS re:Invent大会keynote:采用Nitro Hypervisor的C5实例与没采用Nitro的早期实例、裸机服务器主机的唤醒时延对比,C5主机表现与裸机服务器主机差别非常小。

引入Nitro是AWS EC2极具突破性的创新。上图回顾总结了EC2虚拟化技术的变迁史,历代更新中,从纯软的虚拟化到半虚拟化,硬件直接参与度越高,性能越好。最开始,连CPU和内存都是虚拟的,后来,通过ASIC硬件运行基于KVM的Hypervisior取代了原来的Xen虚拟化方案,CPU、内存、网络、存储都演变成硬件支撑,真正意义上实现硬件虚拟化,性能大幅提升。

性价比方面,Nitro将原本在通用CPU上运行的Hypervisor抽离到专有硬件中,卸载掉原本属于服务器的“职责范畴”。这样,用户买到的资源就不再是“缩水”打折扣的,比如CPU和内存资源,都变得更加足量。相对于腾挪出来的CPU计算资源量可能并不是那么容易评估,内存容量的足额交付无疑就非常直观。

性价比能差多少?

以C5实例为例,从新一代的C5实例开始,未来,AWS几乎所有的新型主机都会采用Nitro。原来C4系列主机CPU:RAM的配比是1:1.875,现在变成真正的1:2。当然,计算资源也有类似的提升。用户能买到能足额交付的资源,或者说买到的资源都能用于业务。毫无疑问,这是显著的性价比提升。

今年2月份的一则消息显示,AWS中国的用户已经能使用计算优化(Compute-optimized)的C5和C5d实例,内存优化(Memory-optimized)的R5和R5d实例。AWS数据显示,从C4升级到C5,中国用户能享受到的性价比提升高达49%。另外,R5相对R4实例,每个vCPU能提供5%的额外内存空间,并且,R5相对于R4价格降幅也高达49%。

可以说,C5最大的特点就是性价比提升,显然,这是比价格战更高级的策略。对于云主机这种需求和要求都非常明确的产品而言,性价比对用户非常具有吸引力。AWS表示,数千客户都已经开始使用C5实例,包括大名鼎鼎的Netflix,也对C5相对于C4的性价比提升赞赏有加。实际使用中,Netflix发现C5实例比C4实例的性价比提升高达40%。

当然,以上性价比数值都是AWS或者Netflix根据精确的计算得出的,普通用户若想直观感受性价比差异,可以参考(https://aws.amazon.com/ec2/pricing/on-demand/),中国用户可查看(https://www.amazonaws.cn/en/ec2/pricing/ec2-linux-pricing/)。

简单查看价格表会发现,同样是36核的实例,C5内存比C4内存多出12GB,价格却降低了大约20%,加量还降价,有兴趣的朋友可以自行查看。

来自AWS中国官网

当然,整体能力提升更为关键。从实际数据可见,C5实例的各方面配置相比C4也有明显提升。

计算能力方面,一方面,性能提升离不开Nitro Hypervisor做offload节省出来的计算资源。另一方面,C5实例采用的是英特尔定制的新一代至强可扩展处理器,支持最高72vCPU和144GB内存(保持计算优化型主机1:2的配比),支持AVX 512指令集强化的向量和浮点计算,而C4最高只有36vCPU和60GB内存配置。

Nitro Cards

存储方面,在C4时代,Nitro card就用在了EC2的实例存储中,而C5d系列实例在存储方面进一步强化,支持本地的NVMe SSD。本地NVMe的性能优势毋庸赘言,在IOPS和延迟表现上都有显著提升。目前,除了C5d以外,M5d还有裸机服务器的EC2实例也均支持本地的NVMe存储。凡是实例命名里有字母d的都支持本地NVMe SSD。另外,在支持远程EBS块存储方面,平台还采用了非常先进的NVMe over fabric技术。

Nitro Card充当NVMe控制器的角色,也从Hypervisior做offload,充分利用硬件的能力。不仅如此,Nitro Card还在硬件层实现了EC2实例与存储之间的隔离,隔绝了用户间的一些性能干扰。

VPC网络方面,Nitro card充当网卡、ENA控制器的角色,是具备SDN功能的专有硬件。同样从Hypervisior做offload,让服务器CPU无需预留资源处理网络事务。此外,除了类似Nitro Card充当NVMe控制器时展现的隔离性能干扰的特性外,AWS这块特殊的网卡还支持许多高级的网络加速特性。

Nitro的功能相对独立,可根据需求灵活搭配组建。Nitro Card 控制器是一个大管家,可以管理Nitro的Hypervisior、存储、网络以及安全功能。AWS通过它在后台进行系统管理。

Nitro 安全芯片

安全方面,其实没有什么太多offload的内容。众所周知,各种设备的firmware对系统的安全、有序运行非常关键。为了正确管理这些firmware,Nitro安全芯片一方面可追踪服务器上各种控制器firmware的IO操作,同时还能升级管理这些firmware。这是原来的服务器无法做到的。当服务器启动时,Nitro芯片会做各种底层的安全验证,保证系统安全。

结语

以上就是Nitro系统的主要职责,它将存储、网络、管理和安全能力都offload到专有的硬件之上,免去了与通用计算设备抢占资源的各种麻烦,节省资源的同时提升效率。作为AWS平台的一部分,用户对于Nitro是不可见的,并且,用户无需意识到Nitro的存在,各种使用体验与原来没有Nitro的实例几乎一样,同时,用户实际到手的资源变得更多。

显然,用专有硬件做专业的事,比通用硬件带来的效率要高得多。云巨头在信息产业有举足轻重的作用,除了在业务上对传统IT带来冲击以外,在IT架构本身也带来了许多新变化,云巨头需要定制适用于超大规模数据中心的服务器、网络和存储等基础硬件,当考虑到规模效应时,将一些领域做得深入细致也是必然趋势。AWS的Nitro将在EC2的offload推向了新的极致,从不跟友商比较的AWS,这次恐怕是真要迫使纯粹的云主机价格战走向“末路”。