火山引擎升级云服务,要做AI大模型“发动机”

4月18日,字节跳动旗下火山引擎在其举办的“原动力大会”上发布自研DPU等系列云产品,并推出新版机器学习平台:支持万卡级大模型训练、微秒级延迟网络,弹性计算可节省70%算力成本。基于自研DPU的GPU实例,相比上一代集群性能最高提升三倍以上。
会上,火山引擎宣布与字节跳动国内业务并池。基于内外统一的云原生基础架构,抖音等业务的空闲计算资源可极速调度给火山引擎客户使用。简单来说就是,让用户在更小的资源池内调度资源,提高整体资源利用率的效果,从而达到降本增效。
字节跳动副总裁杨震原认为,业务创新需要试错,试错要大胆、敏捷,但试错也一定要控制成本。通过潮汐、混部等方式,火山引擎实现资源的高利用率和极低成本。以抖音推荐系统为例,工程师用15个月的样本训练某个模型,5小时就能完成训练,成本只有5000元。火爆全网的抖音“AI绘画”特效,从启动到上线只用一周多时间,模型由一名算法工程师完成训练。
据MiniMax联合创始人杨斌介绍,MiniMax与火山引擎合作建立了超大规模实验平台,实现千卡级常态化训练;超大规模推理平台有万卡级算力池,支撑单日过亿次调用。在火山引擎的云上,MiniMax大模型业务实现快速突破。
火山引擎总裁谭待透露,“国内大模型领域的数十家企业,超过七成已经在火山引擎云上”。
除了像MiniMax这类AI技术公司,火山引擎也在寻求与传统企业合作的机会。谭待对《凤凰周刊》记者表示,这是一个很有挑战性的事,不仅要有技术的升级,也要考虑到组织、机制等方面。目前火山引擎的做法是,找到行业内的标杆客户,加强彼此的了解,推出落地方案。比如和吉利在营销、座舱、自动驾驶等方面都在努力做深度共创。
图片
图:火山引擎总裁谭待
同时,谭待也表示,火山引擎作为ToB服务和ToC服务很不一样,它需要一个漫长的积累过程,但在积累过后会有很强的连续性。所以短期内,火山引擎的目标是怎么面向客户创造更多价值,长期目标最终会回归商业本质,成为一个盈利的业务。而以目前全球领先的云计算公司盈利性作为参考,他认为这是一个很好的赛道。