戴尔与英伟达表示,相关数据将为合作伙伴提供“巨大”的存储机遇

英伟达企业计算副总裁Manuvir Das在采访中表示,“ 如果提供一段新文本,将其转换成嵌入形式、之后再进行存储,那么嵌入的大小将远超原始文本的大小。其体量有可能扩大10倍,这代表着一种巨大且尚未被把握住的数据与存储机遇。 ”
图片
戴尔科技副总裁董事长兼首席运营官Jeff Clarke在2024年戴尔科技世界大会上表示,如果说GPU是AI系统的大脑、网络是其心脏,那么存储就是AI的呼吸与脉搏。
Clarke在上月召开的展会上表示,“在我看来,存储就是负责数据吐故纳新的肺。”
戴尔Titanium级合作伙伴Advizex公司CEO CR Howdyshell表示,如今上线的计算堆栈比以往任何产品消耗的数据都多,这也对整体性能提出了新的要求。他最近刚刚与客户达成交易,这些客户将使用戴尔服务器构建大规模AI计算体系。但要想使其切实生效,高质量存储将不可或缺。
他在采访中表示,“我们已经在关注不同规模的计算和AI需求,也意识到必须在存储方面抢先一步。构建这些系统的客户拥有深厚的技术积累,如果不能在存储方面抢先一步,客户根本就不会信任我们、自然也谈不到选择戴尔存储。我们需要保证自身有能力讨论并明确计算规模,再就配套存储开展磋商。但在这背后,也蕴藏着巨大的新机遇。”
去年8月,戴尔宣布将调整其存储市场营销思路,新计划强调“存储合作伙伴优先”原则。戴尔的核心卖家在通过渠道合作伙伴签下存储订单时,能够获得更高的收益激励。
这也为Advizex等Titanium级合作伙伴,以及来自纽约州纳纽埃特的VirtulT等Platinum级合作伙伴带来了新客户。戴尔专注于在中端存储领域开疆拓土,并认为这部分潜在市场的总额高达130亿美元。
VirtulT的John Lee表示,如今中小企业的机会在于数据和资产咨询。只要生成式AI得到广泛普及,他们就能快速做好业务应用的准备。
担任VirtulT公司首席技术官的Lee认为,“更新旧有基础设施的机会多多。我们希望帮更多客户做好准备,这样在实际应用生成式AI时,客户才能拥有必要的存储基础设施、保证其随时匹配计算资源。”
在上个月的戴尔科技世界大会上,戴尔基础设施解决方案部门总裁Arthur Lewis表示,存储业务中蕴藏的机遇“非常巨大”。
“为了更好地理解「非常巨大」的含义,我想强调的是AI工作负载带来的数据吞吐量是传统计算的300倍——数据吞吐量高达300倍。”他在重复了这个数字后又提到,“随着AI的普及,市场对存储的需求只会持续增长。”
Clarke预计到这个十年末,对存储性能要求更高的AI系统将拥有27京次算力——相当于每秒可执行27,000,000,000,000,000,000,000,000,000,000次浮点运算。
英伟达企业计算副总裁Manuvir Das也参与到未来计算体系的构建当中,并着力将其推广至全球各大组织机构。
他在采访中表示,哪怕是当下,AI模型也早已不再局限于通过阅读文本内容来实现训练和推理,而开始处理更丰富、更复杂的多模态数据。
Das解释道,“我们讨论的是海量数据。整个生态系统即将解锁真正强大的模型,它能与用户提供的视频直接交互。比如说这是一段30分钟的视频,AI模型能告诉我视频里有哪些人、谁在和谁争吵、当时在玩什么游戏等等。对于视频中一切元素的提取,我们现在都拥有相应的模型。”
Das还提到,市场也不清楚AI技术具体会对存储业务造成哪些影响。他本人于2019年离开EMC加盟英伟达,出任产品工程及非结构化数据存储高级副总裁。
Das指出,“我认为人们还没意识到数据中蕴藏的两个秘密。其一是,为了让所有检索工作正常进行,比如说「察看PDF或文本内容」,模型实际上会创建相应嵌入、再把这些嵌入存放进向量数据库。这代表着一种新的存储方式。”
“如果提供一段新文本,将其转换成嵌入形式、之后再进行存储,那么嵌入的大小将远超原始文本的大小。其体量有可能扩大10倍,这代表着一种巨大且尚未被把握住的数据与存储机遇。”
而戴尔坚信其经销商合作伙伴会很快意识到这部分高端存储需求,并承认尽早、尽快在该领域内拓展业务的重要意义。
Lewis则提到,“我们的软件定义PowerScale完全是为AI所构建。通过GPU直连技术以及灵活性、可扩展性与安全性的完美结合,可以将GPU速度提升至我们AI数据平台的最高水平,实现令人难以置信的性能表现。此外,PowerScale也是首个获得英伟达SuperPod认证的以太网存储方案。”
在硬件方面,戴尔还推出了PowerScale F910,这是一套面向非结构化数据的高密度、高性能文件解决方案。它在2U机架平台中引入了重大硬件升级,包括搭载DDR5、PCIe Gen 5以及24块NVMe SSD。
Lewis在戴尔科技世界大会上宣布,更强大的存储理念也即将与全世界见面,这就是计划于明年推出的Lightning项目。
“Lightning项目是一套将要改变游戏规则的并行文件系统,专为AI的非结构化存储而构建。所谓改变游戏规则,是指与跟我们最接近的闪存横向扩展竞争对手相比,其性能可提高20倍、吞吐量提高18.5倍,这是全新数量级下的颠覆性成果。”
随着技术的进步以及AI模型在组织机构中的实践应用,这些模型所需要的参数规模以及运行算力需求也将逐渐下降。但在Lewis看来,模型快速引用数据所带来的附加存储需求则会保持增长。
“如果大家相信算法创新能够催生出更多体量较小的领域特定模型,那么AI的工作方式就将转化为在本地GPU上直接运行模型,意味着查询操作将入驻GPU并接入模型。如果模型能够响应则做出响应,如果不能则需要从附加存储中提取数据。随着模型变得越来越小,需要从附加存储中获取的信息规模也将急剧增长。”
对于希望在较小模型上训练自有数据的客户来说,附加存储的质量将决定整个系统的性能。
Lewis解释称,“在拥有4000亿参数的模型当中,附加存储性能意义不大。但随着我们开始深入研究80亿、40亿乃至20亿参数模型,附加存储的重要性也将同步提升。”
Howdyshell认为,在本届戴尔科技世界大会上展出的各类产品中,最令他眼前一亮的就是拥有5:1压缩率的全新PowerScale。
他总结道,“这是一项非常重要的技术。结合我们以往的交易以及察觉到的未来机遇,客户往往首先希望能够加快计算速度,其实就是提升存储性能。这代表着巨大的机遇,因为数据、处理数据的算力以及承载数据的存储是一条完整的业务链条。到了这一步,存储的重要性必将得到凸显,并成为支撑性能的关键一环。”