特斯拉超算Dojo下月投产,24年末年算力可达100 Exa-Flops

文|韩永昌
编辑|李勤
近日,特斯拉在推特上创建了一个名为 Tesla AI 的帐号,并公布了今年特斯拉在 CVPR 上演讲的部分内容。特斯拉 CEO 埃隆・马斯克也关注了该账户。
Tesla AI 首先公布了一张算力预期图:今年7月特斯拉的 Dojo 就会正式投产,随后,特斯拉的算力将进入快速增长期。2024年2月特斯拉的算力规模将进入全球前五,2024年10月特斯拉的算力总规模将达到 100 Exa-Flops ,相当于30万块英伟达A100显卡的算力总和。A100显卡是英伟达专门针对的是高性能级的AI计算而开发的一款产品,峰值计算力达到19.5TFLOPS。
特斯拉工程总经理Tim Zaman随后在推特上表示,目前我们的计算集群只有0.3%的空闲时间,其中84%的工作都是高优先级的,我们希望可以拥有更多的计算空间。
Dojo 是特斯拉自研的超级计算机。在特斯拉今年的一季度财报电话会上,马斯克称 Dojo 的潜力非常巨大,特斯拉正在为其投入大量精力,并相信它“有可能在训练成本上有一个数量级的提高”。
据特斯拉公开数据显示,每个 Dojo 都集成了120个训练模块,内置3000个D1芯片,拥有超过100万个训练节点,算力达到1.1EFLOP(每秒千万亿次浮点运算)。
Dojo 能够处理海量的视频数据,不仅能够加速特斯拉的 Autopilot 和完全自动驾驶(FSD)系统的迭代,还能为特斯拉的人形机器人 Optimus (擎天柱)提供算力支持。Tesla AI账号也展示了正在构建的机器视觉基础模型,并称这些视觉基础模型将成为汽车和 Optimus 的大脑。
不仅如此,Tesla AI账号还介绍了特斯拉在人工智能领域的最新进展。
特斯拉的多模态神经网络在客户车辆中投入使用,这些网络可以接受任意模式的数据,如摄像头视频、地图、导航、IMU (惯性测量单元) 、GPS等。
特斯拉的计算机已经可以熟练的进行类似于预测障碍物的任务,即可以简单的预测某个3D位置被占据的可能性,这种预测可以让机器人避免碰撞。
当然,这一切都是建立在特斯拉车队的规模自动标注技术上。通过同一地点多次行驶的视频数据,特斯拉可以重建整个场景。基于特斯拉的建模技术,特斯拉能够在多个摄像机数据中进行场景三维重建,预测可能发生的结果。
此外,特斯拉展示了基于车队数据而构建的多个不同场景下的驾驶训练,包括夜间,隧道,小巷,田野,高速以及多种不同障碍物的情况等。
无论是多模态神经网络、自动标注技术、还是基于车队数据的场景三维重建,这些技术都是为了让特斯拉的汽车和人形机器人更好的适应复杂的现实环境。而这一切技术的实现需要庞大的算力支持,也就是特斯拉Dojo的使用。
为了提升智驾功能的表现,除特斯拉以外,不少车企都已投入到算力中心的建设中。
长城旗下毫末智行与火山引擎已合作成立“雪湖·绿洲”智算中心,算力达670PFLOPS(每秒浮点运算达到67亿亿次);吉利牵手阿里云在湖州成立了星睿智算中心,计算能力为81亿亿次/秒;小鹏也与阿里云共同在乌兰察布建成了自动驾驶智算中心“扶摇”,算力达600PFLOPS(每秒浮点运算60亿亿次);理想的超算中心虽在建设当中,但自动驾驶训练里程已经超过了4亿公里。
在智能化的下半场中,自动驾驶是车企们共同的追求,而驶向自动驾驶的道路需要算力来铺就。特斯拉作为全球自动驾驶的领军企业之一,在智算系统Dojo的建设上谋划已久,如今Dojo的投产就在眼前,马斯克也已经率先站上牌桌。接下来,随着各个车企的智算中心逐渐落地,智能化领域的角逐也将全面拉开大幕。