火山引擎升级云服务，要做AI大模型“发动机”

凤凰WEEKLY

2023-04-19 14:19发布于北京凤凰WEEKLY官方账号

4月18日，字节跳动旗下火山引擎在其举办的“原动力大会”上发布自研DPU等系列云产品，并推出新版机器学习平台：支持万卡级大模型训练、微秒级延迟网络，弹性计算可节省70%算力成本。基于自研DPU的GPU实例，相比上一代集群性能最高提升三倍以上。

会上，火山引擎宣布与字节跳动国内业务并池。基于内外统一的云原生基础架构，抖音等业务的空闲计算资源可极速调度给火山引擎客户使用。简单来说就是，让用户在更小的资源池内调度资源，提高整体资源利用率的效果，从而达到降本增效。

字节跳动副总裁杨震原认为，业务创新需要试错，试错要大胆、敏捷，但试错也一定要控制成本。通过潮汐、混部等方式，火山引擎实现资源的高利用率和极低成本。以抖音推荐系统为例，工程师用15个月的样本训练某个模型，5小时就能完成训练，成本只有5000元。火爆全网的抖音“AI绘画”特效，从启动到上线只用一周多时间，模型由一名算法工程师完成训练。

据MiniMax联合创始人杨斌介绍，MiniMax与火山引擎合作建立了超大规模实验平台，实现千卡级常态化训练；超大规模推理平台有万卡级算力池，支撑单日过亿次调用。在火山引擎的云上，MiniMax大模型业务实现快速突破。

火山引擎总裁谭待透露，“国内大模型领域的数十家企业，超过七成已经在火山引擎云上”。

除了像MiniMax这类AI技术公司，火山引擎也在寻求与传统企业合作的机会。谭待对《凤凰周刊》记者表示，这是一个很有挑战性的事，不仅要有技术的升级，也要考虑到组织、机制等方面。目前火山引擎的做法是，找到行业内的标杆客户，加强彼此的了解，推出落地方案。比如和吉利在营销、座舱、自动驾驶等方面都在努力做深度共创。

图：火山引擎总裁谭待

同时，谭待也表示，火山引擎作为ToB服务和ToC服务很不一样，它需要一个漫长的积累过程，但在积累过后会有很强的连续性。所以短期内，火山引擎的目标是怎么面向客户创造更多价值，长期目标最终会回归商业本质，成为一个盈利的业务。而以目前全球领先的云计算公司盈利性作为参考，他认为这是一个很好的赛道。

查看原图 32K