看完老黄演讲，地球上已经没有人可以阻止英伟达了

酷玩实验室

2024-06-06 20:21发布于河南科技领域创作者

全文2210字，阅读约需7分钟，帮我划重点

划重点

01英伟达在台北Computex 2024上分享了AI领域的最新研究，强调加速计算和生成式AI在各行各业的应用。

02根据彭博社预测，2024年英伟达在AI GPU领域的销售额将达到惊人的400亿美元，占公司总营收的609亿美元。

03除此之外，英伟达推出了一系列高性能芯片和服务器，如Blackwell芯片、NVLink芯片等，以加速计算为基础，推动人工智能的发展。

04通过虚拟平台Omniverse，英伟达实现了虚拟地球和AI机器人的模拟和训练，展示了AI技术在未来世界的应用前景。

05黄仁勋表示，英伟达凭借技术引领未来，并借此赚到足够的钱，体现了其牛X之处。

以上内容由腾讯混元大模型生成，仅供参考

6月2日晚7点，黄仁勋在台北Computex 2024上，分享了英伟达在AI领域的最新研究。

从AI的底层技术，到生成式AI在各行各业的应用，将近两个小时的主题演讲，核心只用五个字就能概括：

英伟达牛X。

很多人把英伟达比作AI时代的「卖铲人」。根据彭博社预测，2024年，英伟达在AI GPU领域的销售额将达到惊人的400亿美元。

要知道，英伟达2024财年的总营收，是609亿美元。

如此强势的业绩，也让英伟达凭一己之力，撑起了整个美股大盘。

但看完了黄仁勋的最新演讲，我觉得英伟达不止是一个AI时代的「卖铲人」，更是一个“未来世界”的「工程师」。

这个未来世界，就是以加速计算为基础的人工智能大爆炸的世界。

加速计算时代

这是一张男人的脸，细节到眼部肌肉的细微跳动，清晰到每一个毛孔、细纹随光影的变化。

这是一个工厂的流水线，井然有序的机械臂，忙碌的技术工人，一切有条不紊。

这是火焰。

这是雷电。

这是弹珠落地。

这是丝带飘舞。

这是汽车轰鸣。

这是洋流形成。

所有这一切，都来自英伟达Omniverse的虚拟工厂。

而Omniverse能够以假乱真的两个技术基础，是加速计算和生成式AI。

根据老黄的演讲，过去60年，计算机行业只经历了两三次技术变革。

第一次是1964年，IBM System 360开创了计算机兼容性时代，从此，世界上所有的电脑，都有了一种共同的电脑语言。

第二次是2007年，iPhone引入移动计算，把计算机放进了我们的口袋，并实现了云端链接。

但随着CPU性能提升的明显不足，与人类计算需求的指数增长之间的矛盾日益凸显，计算成本将会显著增加（数据中心电力消耗等），这将会导致「计算通货膨胀」。

这个时候，英伟达带着GPU和CUDA来了个“神兵天降”。

英伟达的异构计算，让GPU和 CPU 并行运行，使计算速率最快提升了 100 倍，但功耗只增加了大约3倍，成本只增加了约 50%。

一台1000 美元 PC 上加一个 500 美元 GeForce GPU，性能会大幅提升。

也就是说，你买得（GPU）越多，省得越多。

而CUDA则相当于一个软件生态，可以最大限度地开发GPU的潜能，实现加速计算。

到目前为止，CUDA在全球拥有500万开发者和不计其数的用户，这些庞大的用户基础，进一步降低了计算成本，让开发人员有机会去不断探索边界，从而开发出更多的应用。

但这些说到底，只是让计算机更快一点的工具，相当于一个超算中心。

直到2017年，Transformer架构问世，需要更大的数据和算力来训练大语言模型；再到2022年11月，ChatGPT问世，所有的图像、表格、单词、语音、视频，都抽象成了成了一个又一个token。

而用于训练ChatGPT的英伟达的GPU，就成了生产这些token的「AI工厂」。

理论上，这个「AI工厂」可以生成一切，也就是——

模拟一切。

超级AI工厂

构建这个超级AI工厂的基石，是地表最强芯片，Blackwell。

过去8年，从Pascal到如今的Blackwell，英伟达芯片的浮点计算能力，增长了1000倍，而摩尔定律在这八年内的增长大约是40～60 倍。

以GPT-4的模型训练为例，8年前的Pascal所需能耗为1000GWh，这需要一个功率在100 MW 数据中心，耗时大约一年时间，才能训练出一个GPT-4，根本不现实啊。

而Blackwell的能耗是3GWh，能耗仅为8年前的1/350，1万个GPU训练10天就搞定了。

同样的，生成一个token，Pascal 消耗的能量，相当于2 个200W灯泡运行 2 天，而新的Blackwell只使用 0.4 焦耳。

你可以说，Blackwell芯片就是专门为训练大模型而生的。

光芯片强大还不够，搭载芯片的服务器，也得足够强大。

简单来说，就是先将两块Blackwell芯片这样⬇️

再这样⬇️

通过这样的模块化架构，将许多个Blackwell芯片整合起来，变成一个“超级加倍”的服务器。

目前，英伟达的MGX超级计算机已经同时集成了72个Blackwell GPU。

光把芯片塞到一起还不够，还得让它们之间正常“通信”。

英伟达又拿出了NVLink芯片，这种芯片拥有 500 亿个晶体管，74 个端口，每个端口 400Gbps，横截带宽 7.2Tbps，内部还具有数学运算能力。

非常抽象对吧。

你也可以这么理解——有了NVLink，你的GPU可以变得这么大⬇️

这是电气奇迹，也是机械奇迹。

这还不算，老黄还给自己上了个强度：

2025 年推出 Blackwell Ultra 芯片；

2026 年推出 Blackwell 的继任者 Rubin 芯片；

2027年推出 Rubin Ultra，新一代基于 Arm 的 Vera CPU，以及 NVLink 6 Switch（3600GB/s）。

总之，依靠超强性能的芯片，加上足够强大的服务器，以及不断的技术迭代，英伟达在AI时代卖铲人的地位，稳如老狗啊。

说了这么多，实际上大家对AI芯片的能耗、算力，其实很难具体感知到。

老黄讲了两个案例。

第一个是地球2，AI这么强大的算力，可以模拟任何一个token，也就是可以创建一个虚拟地球，即数字孪生地球。

这个地球上的一切，都和真实的地球一模一样，如此一来，就可以通过在地球2上预演，来预测未来可能发生的一切，比如气候变化、自然灾害等等，让人类可以更好地避免灾难，提前适应极端气候。

第二个案例，是AI机器人。

机器人在英伟达的虚拟平台Omniverse上，通过数百万次的实验和试错，从零开始学习抓取物体、学会自主导航，学会我们在现实生活中可能尝试的一切，然后将其零成本迁移到现实世界。

当算力足够强大，配合大模型不断生成环境参数和任务去刁难机器人，机器人在虚拟世界学习一天的技能，可能相当于人类在现实世界学习一年甚至10年的程度。

当这些AI驱动机器人被大规模运用到工厂、仓库，运用到医疗、养老，运用到很多人类不愿意从事的领域，各行各业，都将被彻底改写。

黄仁勋说，“这不是未来，这正在发生”。

靠技术引领未来，并借此赚到足够的钱，这是英伟达的牛X之处。

而生成式AI能带领人类走向何处，也许很快就有答案。

查看原图 385K