GTC 2021:NVIDIA AI帝国正在崛起

GTC 2021开发者大会于4月12日晚11:30开始,中国专场于4月13日北京时间上午9:00开始。虽然开发者大会和桌面级显卡并无关系,但我们也能从中了解到许多平时难以望其项背的行业尖端信息。本次开发者大会的主题并不是CPU也并不是显卡,而是“i am ai”。

i am ai

时至今日NVIDIA究竟是一家什么样的公司,芯片生产厂商?软件平台公司?还是人工智能计算领域的先驱者。就像马斯克正在发射火箭、研究脑机接口;而NVIDIA正在部署各领域的AI计算产品,正如老黄的思路一样:在新技术思维模式下,汽车不再只是一种可销售的产品,而是是百万计或上亿计的可安装软件的基础平台。

01进军CPU领域的决心:Grace

NVIDIA创始人兼首席执行官黄仁勋(记住这个厨房 结尾有彩蛋)

还是熟悉的厨房,还是熟悉的皮衣,但再往上看,黄仁勋先生这一头长发,确实更像为AI而疯狂的科学家。首先我们来看所有媒体都在讨论的NVIDIA推出CPU的事。

Grace Hopper

在GTC技术大会中黄仁勋发布了NVIDIA首款数据中心CPU——Grace。这是以计算机科学家、美国海军少将Grace Hopper的名字命名,而她正是在上世纪50年代开创了计算机编程,发明了世界上第一个编译器,被称为“计算机软件工程第一夫人”。

Grace是一款高度专业化的处理器,它使用了高效节能的Arm内核,为训练巨型人工智能模型的系统提供10倍的性能飞跃,主要面向大型数据密集型HPC和AI应用。新一代自然语言处理(NLP)模型的训练会有超过一万亿的参数。

Grace CPU

Grace能够满足世界上最先进应用的计算需求,包括自然语言处理、推荐系统和人工智能超级计算,这些应用分析需要超快计算性能和大容量内存中的巨大数据集。

基于Grace的系统与NVIDIA GPU紧密结合,性能将比目前最先进的NVIDIA DGX系统(在 x86 CPU 上运行)高出 10 倍。它基本性能采用第四代NVIDIA NVLink互连技术,该技术在CPU和GPU图形处理单元之间提供900GB/s的连接速度,从CPU到CPU的速度超过600GB/s,使总带宽比目前领先的服务器高出30倍。黄仁勋表示,这也是世界上第一个为TB级别计算设计的CPU。

应用客户

作为首批客户,瑞士国家超级计算中心(CSCS)将构建一台名为Alps的超级计算机,这台计算机将使用Grace和NVIDIA下一代 GPU。美国能源部下属的洛斯阿拉莫斯国家实验室也将在2023年推出一台基于Grace的超级计算机。

Grace的推出预示着NVIDIA在CPU领域的决心,同时也将抢占Intel最赚钱的这一市场领域。

02NVIDIA BlueField-3 DPU数据处理器

黄仁勋宣布 NVIDIA BlueField-3 DPU 将为构建超大规模数据中心、工作站和超级计算机所需的基础设施提供进一步的加速。

这款新一代数据处理器将提供最强大的软件定义网络、存储和网络安全加速功能。

BlueField-3

黄仁勋介绍道,而BlueField-3对比BlueField-2实现了10倍的性能飞跃,BlueField-3内置220亿个晶体管,首款400Gb/s的网络芯片,16个Arm CPU芯片,并且提升了安全等级,对网络流量进行保护、卸载和加速。

BlueField-4已经列上日程了

以2年一迭代的频率,2024年的BlueField-4则会实现800Gb/s的网络速率,相比BlueField-3性能再次提升10倍。3年内(BlueField-2目前刚刚使用)性能提升100倍,而这在老黄口中,只是顺应市场需求。

032.2EB/s总带宽的NVIDIA DGX

DGX是NVIDIA推出的面向AI而生的计算机,黄仁勋宣布升级NVIDIA专为工作组打造的 “便携式AI数据中心”—— NVIDIA DGX Station,以及 NVIDIA 专为密集型AI研发打造的 AI 数据中心产品 —— NVIDIA DGX SuperPod。

NVIDIA DGX Station

全新DGX Station 320G借助 320GB 超快速 HBM2e 连接至 4 个 NVIDIA A100 GPU,内存带宽达到每秒 8TB,以目前来看,若要实现如此高的显存带宽,至少需要40台CPU服务器。然而最令人惊讶的是,这台便携式的DGX Station可以像普通计算机一样,插入普通的壁装电源插座即可使用,功耗仅1500W,采用液冷散热,运行声音为37db。

目前,达到这种性能的CPU集群成本约为100万美元,而DGX Station仅需14.9万(看到这里我飘了,竟然觉得还挺便宜)美元。

新款的DGX SuperPOD目前是世界上首台原生超级计算机,使用全新 80GB NVIDIA A100,将其 HBM2e 内存提升至 90TB,实现2.2EB/s的总带宽。同理,若要实现如此高的带宽,需要11000台CPU服务器,相当于250个机柜数据中心,比DGX SuperPOD多15倍。

DGX SuperPOD(左)、DGX A100(中)、DGX Station A100(右)

目前它已经升级至采用 NVIDIA BlueField-2,如此性能的计算机已经是绝大多数个人和公司承担不起的费用了,DGX SuperPOD支持多租户共享,并可实现完全隔离和裸机性能。且 NVIDIA 如今还为该产品提供配套的 NVIDIA Base Command DGX 管理和编排工具。

当然DGX SuperPOD依然可以单独售卖,它的起步价格为700万美元,6000万美元可扩展至完整系统。

04强大的数据推理 NVIDIA Megatron

随后黄仁勋还发布了用于训练Transformers的超大语言模型的NVIDIA Megatron Triton推理服务器。Transformers已帮助开发者在自然语言处理领域取得了突破性进展,能够生成文档摘要、将电子邮件中的短语补充完整、甚至让AI根据用户的期望自己编写代码。

NVIDIA Megatron Triton是超大型语言模型训练与推理服务器,庞大的Transformer模型推理是重大的计算机科学挑战,传统双CPU服务器需要花费1分钟才能响应1项查询。

NVIDIA Megatron

而Megatron能够训练Transformer模型,可对模型进行划分和匹配,实现GPU和多节点推理并行,Megatron Triton Inference Server通过分布式计算,使使用Megatron Triton的DGX,能在1秒内实现16项查询。

超级计算机的作用除了我们日常看到想到的领域,在很多需要大量推演的领域都有卓越的表现,如量子计算、医疗制药等,新药的研发往往需要耗时10年以上,而失败率高达90%。NVIDIA DGX SuperPOD可利用深度学习,大幅提高药物研发速度。

05NVIDIA AI布局

“AI”我们听起来遥远,但却时刻发生在我们身边。黄仁勋表示,AI是当代最强大的技术力量,并认为AI的发展浪潮会有四轮。

第一轮为重塑计算机用于开发软件的新方式,这是我们所有人切身参与的第一轮革新,迄今已有近10年的历史。

第二轮,也就是第一批AI技术采用者大都来自互联网公司,他们拥有出色的计算机科学家、大型计算基础设施,以及收集大量训练数据的能力。

第三轮将会是企业和产业边缘计算,AI可以彻底改变全球大型企业,包括制造业、物流业、农业、医疗健康、金融服务以及运输业。而完整的产业链要实现AI,5G将是解决连接问题的关键。

第四轮则是自动驾驶系统,这里的AI自动驾驶不仅仅是自动驾驶汽车,它只是一个目前实现AI非常好的例子,而最终形态黄仁勋表示,所有能移动的系统最终都将实现自主化。

AI这个曾经只在电影中出现的名词,如今正潜移默化的改变着我们的生活。黄仁勋说到,我们必须让AI更方便更易用,将AI从计算机科学领域的名词转化为计算机产品。

NVIDIA AI领域

从目前来看,NVIDIA已经创建了Tensor Core GPU、NVLINK、DGX、cuDNN、RAPIDS、NCCL、GPU Dirext、DOCA等众多技术,所有的这些底层技术,统称为NVIDIA AI。而NVIDIA AI已集成到所有业内流行的工具和工作流程中,并且可在搭载NVIDIA GPU的任何系统上运行,包括PC、笔记本电脑、工作站、超级计算机、云平台等。现在缺少的就是5G技术的连接,我们日常所使用的消费级5G技术只是锦上添花,专用5G技术将为AI技术带来革命性的变化。

06构建强大虚拟世界 NVIDIA Omniverse

人类与 AI 和机器人共存的虚拟实时 3D 世界不再只是科幻小说中的故事情节。

黄仁勋解释说,NVIDIA Omniverse 是一个云原生平台,其特点包括:可以扩展至多个 GPU、具有高物理精度、能够充分运用RTX实时路径追踪和 DLSS、可以使用 NVIDIA MDL 模拟材料、可以使用 NVIDIA PhysX 模拟物理学并且与 NVIDIA AI 完全集成。

他还表示:“Omniverse 旨在创建共享虚拟 3D 世界,就像尼尔·斯蒂芬森在 1990 年代早期的小说《雪崩》中所描述的科幻虚拟空间那样。”

BMW AI工厂

随后为了展示Omniverse的应用领域,黄仁勋与BMW共同展示了一套逼真的AI工厂,Nedeljković表示:“这些创新将帮助我们缩短规划时间、提高灵活性和精度,最终使规划效率提高 30%。

07NVIDIA Jarvis 运用AI的语音翻译有何不同

NVIDIA Jarvis是一款先进的对话式AI,它可以被定制,并应用于任何领域,用于语音识别、语言、理解、翻译的深度学习的AI。

NVIDIA Jarvis

Jarvis可在约100毫秒内进行交互,聆听、理解和相应。NVIDIA目前已经对Jarvis使用数百万GPU小时、超10亿页文本,以及6万小时的不同语言、口音、环境和术语的语音对Jarvis进行了训练。根据NVIDIA的说法,目前这款产品可达到90%的识别精度。

目前Jarvis支持5种语言:英语、日语、西班牙语、德语、法语和俄语,未来将会有更多语言加入其中,这使得国际会议将会变得更轻松。

专业术语的翻译

语气调节

同时Jarvis还可以针对特定领域术语进行定制训练,如针对科技和医疗场景,在现场黄仁勋还为我们演示了一段语音翻译,即便他自己并不理解自己说的是什么意思,但Jarvis完全识别出来。不同于其他翻译软件,Jarvis还能根据用户需求来调节朗读的语气,做到真正如AI交互一样。

08NVIDIA Maxine 可纠正目光接触的会议软件

NVIDIA Maxine同样是一套AI技术软件,它可以大幅改善视频会议体验,在与NVIDIA Jarvis结合使用时,可以实现非常准确的语音转文字。

右侧自动将目光调整为直视镜头

Maxine内置目光接触功能,很多时候我们在视频会议中眼神并没有看向摄像头,而打开这一功能Maxine会自动纠正与会人的注视位置。

AI面部解码器开

AI面部解码器关

在视频会议中最常见的问题就是带宽不足时,视频质量会严重下降,而Maxine可以通过AI面部解码器,有效改善视频质量。

09NVIDIA DRIVE 集AI之大成者

自动驾驶汽车领域是 “机器学习和机器人技术所面对的最严峻的挑战之一,同时也是最棘手、影响最大的挑战之一。”

黄仁勋表示,将于2022年投产的 NVIDIA 自动驾驶汽车计算系统级芯片 —— NVIDIA DRIVE Orin,它也是今后汽车的中央电脑。

NVIDIA DRIVE Orin

Orin将处理集群、信息娱乐、乘客交互AI,以及非常重要的信息视图或感知世界模型。信息视图是汽车对周围环境的实际感知,并将其构建成一个3D环绕模型,而黄仁勋也大胆预测通过AI计算,最终后视镜将被环绕3D感知所取代。

随后黄仁勋还宣布推出NVIDIA第8代Hyperion汽车平台,该平台包括参考传感器、AV和中央计算机、3D真值、数据记录器、网络和一些必备软件。

Hyperion 8场景模拟

与此同时,NVIDIA新一代车载系统级芯片NVIDIA DRIVE Atlan也一同被推出,它可以为汽车带来真正的数据中心。

NVIDIA DRIVE Atlan

DRIVE Atlan可以达到每秒超过1000万亿次(TOPS)运算次数,致力于应用到2025年的车型。

简单来说Atlan集NVIDIA在AI、汽车、机器人、安全和BlueField安全数据中心领域的所有技术于一体,堪称一项技术奇迹。

10结语:NVIDIA只是一个工具

纵观此次GTC 2021大会,我们见到了NVIDIA对于AI领域的全线布局,我们发现不管是软件上的Omniverse、Maxine、Jarvis还是Megatron、DGX、Grace、BlueField等,都是为了NVIDIA AI生态而构建。

单独看他们只是作为NVIDIA产品中的一环或者是底层技术,但黄仁勋在GTC上的演讲后我们会发现它们将服务于今后的NVIDIA AI网络,对于AI的投资和布局我们很难在一代产品中看出多大效果,往往需要几代产品的规划。

正如DRIVE Atlan一样,它集众多AI技术于一身,相互脱离但又结合紧密,NVIDIA也正将AI从计算机科学领域的名词转化为计算机产品。

回顾本次大会内容

至于大家都很关心的CPU,我们可以大胆预测一下,虽然目前Grace仅用于专业计算领域,但它采用了更高效节能的Arm内核,与苹果的M1芯片相同。Arm是32位精简指令集(RISC)处理器架构,单从性能来讲,x86结构的电脑无论如何都比ARM结构的系统在性能方面要快得多、强得多。

但Arm的优势不在于性能强大而在于效率,Arm采用RISC流水线指令集,在完成综合性工作方面根本就处于劣势,而在一些任务相对固定的应用场合其优势就能发挥得淋漓尽致。

目前Arm系统几乎都采用Linux的操作系统,而且几乎所有的硬件系统都要单独构建自己的系统,与其他系统不能兼容,这也导致其应用软件不能方便移植,这一点一直严重制约了Arm系统的发展和应用。

一转身厨房全部由虚拟场景合成

Grace的推出在训练巨型人工智能模型的系统上,提供了10倍的性能飞跃。而在NVIDIA Megatron的推理和训练下,并借助DGX和BlueField的帮助,Arm生态几乎唾手可得,所以消费级CPU的出现似乎只是时间问题。

最后,对于NVIDIA AI生态,我们套用黄仁勋最后的演讲,“20年前,这一切仿佛科幻小说;10年前,这是个梦想;今天,我们正在实现这个梦想”。归根结底,NVIDIA只是一个工具,一个助力您成就毕生事业的工具。

(7663037)