戴尔与英伟达表示，相关数据将为合作伙伴提供“巨大”的存储机遇

至顶网

2024-06-13 22:58发布于北京

英伟达企业计算副总裁Manuvir Das在采访中表示，“ 如果提供一段新文本，将其转换成嵌入形式、之后再进行存储，那么嵌入的大小将远超原始文本的大小。其体量有可能扩大10倍，这代表着一种巨大且尚未被把握住的数据与存储机遇。 ”

戴尔科技副总裁董事长兼首席运营官Jeff Clarke在2024年戴尔科技世界大会上表示，如果说GPU是AI系统的大脑、网络是其心脏，那么存储就是AI的呼吸与脉搏。

Clarke在上月召开的展会上表示，“在我看来，存储就是负责数据吐故纳新的肺。”

戴尔Titanium级合作伙伴Advizex公司CEO CR Howdyshell表示，如今上线的计算堆栈比以往任何产品消耗的数据都多，这也对整体性能提出了新的要求。他最近刚刚与客户达成交易，这些客户将使用戴尔服务器构建大规模AI计算体系。但要想使其切实生效，高质量存储将不可或缺。

他在采访中表示，“我们已经在关注不同规模的计算和AI需求，也意识到必须在存储方面抢先一步。构建这些系统的客户拥有深厚的技术积累，如果不能在存储方面抢先一步，客户根本就不会信任我们、自然也谈不到选择戴尔存储。我们需要保证自身有能力讨论并明确计算规模，再就配套存储开展磋商。但在这背后，也蕴藏着巨大的新机遇。”

去年8月，戴尔宣布将调整其存储市场营销思路，新计划强调“存储合作伙伴优先”原则。戴尔的核心卖家在通过渠道合作伙伴签下存储订单时，能够获得更高的收益激励。

这也为Advizex等Titanium级合作伙伴，以及来自纽约州纳纽埃特的VirtulT等Platinum级合作伙伴带来了新客户。戴尔专注于在中端存储领域开疆拓土，并认为这部分潜在市场的总额高达130亿美元。

VirtulT的John Lee表示，如今中小企业的机会在于数据和资产咨询。只要生成式AI得到广泛普及，他们就能快速做好业务应用的准备。

担任VirtulT公司首席技术官的Lee认为，“更新旧有基础设施的机会多多。我们希望帮更多客户做好准备，这样在实际应用生成式AI时，客户才能拥有必要的存储基础设施、保证其随时匹配计算资源。”

在上个月的戴尔科技世界大会上，戴尔基础设施解决方案部门总裁Arthur Lewis表示，存储业务中蕴藏的机遇“非常巨大”。

“为了更好地理解「非常巨大」的含义，我想强调的是AI工作负载带来的数据吞吐量是传统计算的300倍——数据吞吐量高达300倍。”他在重复了这个数字后又提到，“随着AI的普及，市场对存储的需求只会持续增长。”

Clarke预计到这个十年末，对存储性能要求更高的AI系统将拥有27京次算力——相当于每秒可执行27,000,000,000,000,000,000,000,000,000,000次浮点运算。

英伟达企业计算副总裁Manuvir Das也参与到未来计算体系的构建当中，并着力将其推广至全球各大组织机构。

他在采访中表示，哪怕是当下，AI模型也早已不再局限于通过阅读文本内容来实现训练和推理，而开始处理更丰富、更复杂的多模态数据。

Das解释道，“我们讨论的是海量数据。整个生态系统即将解锁真正强大的模型，它能与用户提供的视频直接交互。比如说这是一段30分钟的视频，AI模型能告诉我视频里有哪些人、谁在和谁争吵、当时在玩什么游戏等等。对于视频中一切元素的提取，我们现在都拥有相应的模型。”

Das还提到，市场也不清楚AI技术具体会对存储业务造成哪些影响。他本人于2019年离开EMC加盟英伟达，出任产品工程及非结构化数据存储高级副总裁。

Das指出，“我认为人们还没意识到数据中蕴藏的两个秘密。其一是，为了让所有检索工作正常进行，比如说「察看PDF或文本内容」，模型实际上会创建相应嵌入、再把这些嵌入存放进向量数据库。这代表着一种新的存储方式。”

“如果提供一段新文本，将其转换成嵌入形式、之后再进行存储，那么嵌入的大小将远超原始文本的大小。其体量有可能扩大10倍，这代表着一种巨大且尚未被把握住的数据与存储机遇。”

而戴尔坚信其经销商合作伙伴会很快意识到这部分高端存储需求，并承认尽早、尽快在该领域内拓展业务的重要意义。

Lewis则提到，“我们的软件定义PowerScale完全是为AI所构建。通过GPU直连技术以及灵活性、可扩展性与安全性的完美结合，可以将GPU速度提升至我们AI数据平台的最高水平，实现令人难以置信的性能表现。此外，PowerScale也是首个获得英伟达SuperPod认证的以太网存储方案。”

在硬件方面，戴尔还推出了PowerScale F910，这是一套面向非结构化数据的高密度、高性能文件解决方案。它在2U机架平台中引入了重大硬件升级，包括搭载DDR5、PCIe Gen 5以及24块NVMe SSD。

Lewis在戴尔科技世界大会上宣布，更强大的存储理念也即将与全世界见面，这就是计划于明年推出的Lightning项目。

“Lightning项目是一套将要改变游戏规则的并行文件系统，专为AI的非结构化存储而构建。所谓改变游戏规则，是指与跟我们最接近的闪存横向扩展竞争对手相比，其性能可提高20倍、吞吐量提高18.5倍，这是全新数量级下的颠覆性成果。”

随着技术的进步以及AI模型在组织机构中的实践应用，这些模型所需要的参数规模以及运行算力需求也将逐渐下降。但在Lewis看来，模型快速引用数据所带来的附加存储需求则会保持增长。

“如果大家相信算法创新能够催生出更多体量较小的领域特定模型，那么AI的工作方式就将转化为在本地GPU上直接运行模型，意味着查询操作将入驻GPU并接入模型。如果模型能够响应则做出响应，如果不能则需要从附加存储中提取数据。随着模型变得越来越小，需要从附加存储中获取的信息规模也将急剧增长。”

对于希望在较小模型上训练自有数据的客户来说，附加存储的质量将决定整个系统的性能。

Lewis解释称，“在拥有4000亿参数的模型当中，附加存储性能意义不大。但随着我们开始深入研究80亿、40亿乃至20亿参数模型，附加存储的重要性也将同步提升。”

Howdyshell认为，在本届戴尔科技世界大会上展出的各类产品中，最令他眼前一亮的就是拥有5：1压缩率的全新PowerScale。

他总结道，“这是一项非常重要的技术。结合我们以往的交易以及察觉到的未来机遇，客户往往首先希望能够加快计算速度，其实就是提升存储性能。这代表着巨大的机遇，因为数据、处理数据的算力以及承载数据的存储是一条完整的业务链条。到了这一步，存储的重要性必将得到凸显，并成为支撑性能的关键一环。”

查看原图 262K