AMD(AMD.US)迎来里程碑时刻! 甲骨文(ORCL.US)携手MI300X打造超级计算集群

智通财经网

2024-09-27 16:07发布于广东财经领域创作者

智通财经APP获悉，以云计算服务和数据库软件闻名全球的科技巨头甲骨文(ORCL.US)在近日选择配备ROCm开放软件生态的AMD Instinct MI300X AI加速器——被视为英伟达H100以及H200 AI GPU的最强大竞品，为甲骨文最新的OCI计算超级集群实例提供最核心的人工智能算力硬件支持。携手甲骨文，对于目前在数据中心AI GPU市场份额不到10%的AMD(AMD.US)来说，堪称“里程碑时刻”，意味着AMD逐渐融入全球云计算巨头圈层，有望不断抢占英伟达在AI GPU市场的份额。

云巨头甲骨文选择AMD Instinct MI300X AI加速器用于其最新的 OCI(Oracle Cloud Infrastructure)超级计算集群，这表明 AMD正在不断增强其在 AI GPU 市场的影响力，能够获得云巨头甲骨文的真金白银认可对于AMD而言至关重要，AMD有机会利用甲骨文在全球云计算服务市场中的强大影响力，扩大Instinct MI300X 在数据中心AI GPU领域的市场份额。

尽管英伟达凭借无比强大的CUDA软件生态体系以及高性能AI GPU共同铸造的“AI基础设施领域护城河”，目前仍在全球数据中心AI GPU 市场中占据绝对的主导地位，尤其在AI大模型训练和推理硬件体系中扮演关键角色，但这一举措表明 AMD 正积极参与这场AI基础设施竞争，并通过其 Instinct MI300X AI加速器+ROCm软件加速生态系统来挑战英伟达在AI GPU领域的霸主地位。

据了解，Oracle Cloud Infrastructure (OCI) Supercluster 是甲骨文所打造出的云计算超级算力集群，提供高性能的AI基础设施，所提供的强大AI算力资源用于一站式训练、调整和部署生成式AI大模型以及高效率部署与运作类似ChatGPT的生成式AI应用程序。

根据最新消息，甲骨文最新的OCI超级算力集群配备AMD MI300X AI加速器作为最核心的AI算力硬件，通过结合OCI上其他加速器设备共同使用的甲骨文极速网络结构技术，在单个集群系统中最多支持16,384个高性能GPU。

甲骨文的这些OCI裸机实例旨在运行性能要求极度苛刻的人工智能工作负载，包括需要高吞吐量、领先行业的内存容量和带宽的大型语言模型推理和训练并行化繁重计算工作负载。据了解，Fireworks AI等众多知名科技公司已经实际采用了这些OCI裸机实例。

通过与甲骨文合作，AMD在AI数据中心的份额有望迅速提升

随着大型云计算服务商开始寻找英伟达昂贵且供不应求的H100/H200 替代品，以及AMD通过提供更好的软硬件协同体系支持开始在AI GPU取得一些进展，AMD MI300X现在也成为AI领域的热门基础硬件。

AMD重磅打造的 MI300X这一款AI加速器在内存带宽和容量方面相比于英伟达Hopper架构AI GPU具有强大优势，尤其适用于对于AI并行化算力负载要求较高的生成式AI模型训练和推理任务。甲骨文的最新选择表明，AMD在硬件设计和AI相关的软件生态支持上，特别是高性能计算和AI工作负载所需的软硬件协同体系方面，已经具备强大的竞争力。

毫无疑问，与甲骨文之间的合作有助于全面扩大AMD旗下 MI300X AI加速器在数据中心GPU市场的份额，大幅提高其客户在并行化计算密集型企业计算工作负载中的效率。

英伟达在硬件架构、并行计算、和AI训练/推理所需的软件加速生态方面的深厚积累，使其至少在近几年仍然牢牢占据数据中心AI GPU主导地位。企业们在大规模AI基础设施搭建过程中，往往高度依赖扎根于全球AI开发多年的CUDA加速软件生态以及与CUDA配套协同使用的英伟达高性能AI GPU。但是近期不少分析师认为，如果AMD能够继续改进其ROCm软件生态，并加快其对主流AI开发者环境的支持，可能会进一步侵蚀英伟达在数据中心AI GPU市场的份额。

通过AMD前段时间对于AI GPU的宏伟蓝图，足以看出AMD对于未来占据数据中心AI GPU市场更多份额可谓非常具有信心。根据首席执行官苏姿丰(Lisa Su)在台湾Computex会议所展示的AI蓝图，AMD应用于AI数据中心服务器的AMD M300X AI芯片升级版本——MI325X将于第四季度开始上市销售，AMD更加先进的MI350系列则将在2025年推出，而MI400系列将在一年后推出。AMD大约每年一次的发布周期与英伟达首席执行官黄仁勋所提出的一年一次AI GPU新品发布的计划全面对标。

苏姿丰指出，MI325X AI性能提升幅度为AMD史上最大幅度，相较竞品英伟达H200将有1.3倍以上提升。具体来看，AMD MI325X峰值理论FP16是H200的1.3倍左右，1.3 倍于H200的内存带宽，基于每台服务器的模型大小是H200的2倍。

全球知名战略咨询公司贝恩预测，随着人工智能(AI)技术的迅速普及颠覆了企业和经济，人工智能相关的所有市场规模正在膨胀，到2027年将达到9900亿美元。这家咨询公司在周三发布的第五份年度《全球技术报告》中指出，包括人工智能相关服务和基础硬件在内的整体市场将在去年1850亿美元的基础上，每年增长40%至55%。这意味着，到2027年将带来7800亿至9900亿美元的收入。

查看原图 2.29M