我们正处于对人形机器人兴趣的新一轮热潮中。初创公司已经筹集了数十亿美元,并在创造可以与人类共享环境的通用机器人方面取得了令人瞩目的进展。在技术快速进步和成本下降的推动下,人形机器人即将改变多个行业。Unitree、Figure、特斯拉、波士顿动力、IBM、亚马逊、丰田和本田等领先公司处于这场机器人革命的前沿。这些创新公司正在突破可能的界限,开发出具有前所未有的敏捷性和灵巧性的机器人,适用于各行各业的广泛应用。
在人形机器人热潮兴起之前,有一家公司已经在该领域取得了稳步进展,那就是特斯拉。在最近接受 采访时,特斯拉前人工智能总监 Andrej Karpathy 解释了特斯拉在开发和推出Optimus 人形机器人方面的关键优势。
▍工程化能力带来更大拓展
更优越的工程化能力是国外媒体非常看好特斯拉制造人形机器人的关键原因。特斯拉已经在自动驾驶方面进行了大量研究,拥有最先进的自动驾驶技术之一。Karpathy解释说,制造机器人硬件的难度被低估了,特斯拉将在开发自动驾驶汽车技术时获得的所有知识和创造的成果都转移到了人形机器人上,这种高度的技术和团队复用性,为其创造人形机器人打下了基础。
从机器人公司的角度来看,特斯拉拥有所有合适的人才和工具,可以廉价高效地组装机器人。因为汽车本质上也是机器人,而特斯拉是一家实现“机器人”规模化的公司,具备大规模生产专业知识,有着精密工程生产和研发经验,因此机器人团队轻松地重构了人形机器人的硬件架构,并将优势技术应用于人形机器人。
卡帕西说:“埃隆说我们要这样做的那一刻,人们就带着所有合适的工具出现了……特斯拉拥有制造机器人的卓越专业知识和基础设施。重复使用现有的制造部件将使特斯拉能够以比其他公司更快的速度降低制造 Optimus 机器人的成本。”
从 Optimus 硬件自发布以来,3年时间就取得令人印象深刻的进展,这得益于其长期以来的技术积累。例如特斯拉在电池技术和电源效率方面投入了大量资金,这对于人形机器人等机器人至关重要。由于特斯拉对高密度、轻量级电池的研究,使他们在开发紧凑型能源系统方面具有优势,特斯拉为电动汽车 (EV) 设计长效电池方面的经验,正有助于他们制造出能够长时间高效运行的机器人。
又例如特斯拉的车辆采用一系列摄像头、激光雷达、雷达和超声波传感器进行自动驾驶,特斯拉建立了优化的供应链来采购材料和零部件,管理高质量零件的能力确保特斯拉能够生产可靠且可扩展的机器人。部分硬件技术也可直接应用于人形机器人,用于了解其环境、检测障碍物和与物体交互。同时,特斯拉还拥有先进的电机控制技术,精密的电机控制对于人形机器人的流畅运动和平衡必不可少。当这些基础技术都能够满足,特斯拉切入机器人领域其实就已经是水到渠成。
可以预见,未来特斯拉庞大的制造规模和优化电动汽车生产成本的专业知识,意味着他们能够以比传统机器人公司更低的成本生产人形机器人,从而使消费者更容易获得此类机器人。
▍模型与数据复用性的价值
模型也是特斯拉的核心优势。特斯拉一直在开创自动驾驶系统 (FSD) ,该系统依赖于先进的人工智能 (AI)、计算机视觉和传感器融合。同时,特斯拉开发了强大的人工智能系统,包括用于实时决策和学习的神经网络,这些模型旨在根据传感器输入(例如摄像头和激光雷达)做出端到端的快速决策。
在人形机器人的背景下,这些相同的技术可以适用于人形机器人,类似的神经网络可以应用于基于视觉的任务,例如识别物体、避开障碍物和与人类互动。这对于人形机器人感知和响应周围环境至关重要。正如人们看到的,特斯拉很快自动驾驶模型迁移到机器人身上。或许特斯拉机器人最初或许也认为自己是一辆汽车,正在寻找驾驶空间,只需稍加微调,模型就可以适应人类可导航的空间。这种模型的复用性虽然展现在机器人上带来了更多的难度,但实现路径基本类似。
不仅如此,特斯拉内部非常擅长于控制硬件和软件开发集成、融合,这使他们能够紧密集成系统并制造出高效工作的机器人系统,并快速获取数据。例如特斯拉拥有一个复杂而高效的数据标记管道,特斯拉可以从配备传感器和摄像头的车队中获取大量现实世界的驾驶数据。特斯拉利用其车队的反馈回路,通过实时数据不断改进其人工智能模型。
这种持续学习的方法也可以应用于人形机器人。机器人可以从自己的经验和车队中其他机器人收集的数据中学习,随着时间的推移改进其功能,而无需人工干预。这还意味着从制造自动驾驶汽车和制造汽车的机器人中获得的任何数据化能力都将立即转移到人形机器人项目上,甚至标记数据等流程也将立即转移到 Optimus。
海量数据集有助于改进人工智能模型,使汽车能够在复杂的环境中导航。例如特斯拉的汽车在不同的环境和天气条件下会遇到不同的场景需要处理。同样,人形机器人也需要大量数据来导航和与现实世界互动。特斯拉可以利用这些数据来训练能够像人类一样移动、识别物体和做出决策的人工智能模型。这些动态的真实世界数据可以帮助人形机器人处理家庭、办公室或工业环境中不可预测的环境,使它们能够在复杂环境中导航、找到到达目的地的最佳路径或根据周围环境的变化调整其行为。
在模型算法层,特斯拉已经开发了用于物体检测、车道识别和交通意识的复杂计算机视觉模型。这些模型可以适用于人形机器人,以识别和与环境中的物体交互。例如,人形机器人可以使用这些模型来拾取工具、理解手势或避开家庭或工厂等复杂空间中的障碍物。同时,特斯拉汽车中使用的决策算法可以适用于人形机器人的任务规划。例如,人形机器人可以实时决定如何处理任务,例如拾取物体或在工作空间内高效移动。这些技术都能够复用到人形机器人。
▍持续升级优化的能力
尽管人们早就有在家中使用人形机器人的愿景,但我们距离实现这一目标仍然很遥远。原因有很多,包括安全性以及经济原因,目前的机器人可能会伤害到人,而且你会花数万美元购买一个只能以一般的精度洗碗和洗衣服的机器人吗?
虽然特斯拉的人形机器人价格并不算低,但特斯拉以其汽车中用户友好的软件界面而闻名,这可以转化为人们与人形机器人互动的直观方式,确保硬件和软件系统得到优化,以实现无缝工作。此前,特斯拉的车辆也并不便宜,但其会定期接收无线更新,以提高性能、修复错误或添加新功能,这带来了更大用户价值。人形机器人的类似系统将允许特斯拉推出更新,随着时间的推移增强机器人的能力,而无需物理访问机器人。这也使特斯拉能够快速解决性能问题或让机器人适应新任务。
在这背后,得益于特斯拉使用先进的模拟环境来训练和验证其人工智能模型,然后再将其部署到真实汽车中。这些模拟使特斯拉能够测试现实世界中可能不经常发生的罕见或复杂场景。对于人形机器人,在将机器人部署到现实世界之前,模拟环境可用于训练人工智能模型执行各种任务,例如拾取物体、与人类互动或在不同类型的地形上导航。
可以说底层模拟器技术无疑有助于帮助特斯拉人形机器人通过使用虚拟环境训练人形机器人的人工智能,避免代价高昂或危险的现实世界错误,这使得人工智能模型可以在安全、受控的条件下得到改进和压力测试。
未来,特斯拉继续从其汽车中收集大量数据,并利用这些数据更新其计算机视觉堆栈,使其能够更好地理解不同条件下的环境。由于特斯拉已经能为其汽车提供无线软件更新,因此可以预见,在强大的硬件下,OTA功能可使特斯拉机器人也获得持续改进、修复和功能增强,从而随着时间的推移提高机器人的使用寿命和适应性。
这将再次让特斯拉在人形机器人竞争中占据优势。
▍自身就是试验场
优越的部署设施是人形机器人落地的基础。在特斯拉看来,人形机器人的第一个用例可能是在工业环境中,那里的全球正面临人力资源枯竭、成本高昂且供应不足的问题。在这些环境中,人形机器人将得到磨炼和优化,同时还能完成生产性工作,创造收入或削减成本。同样,这是特斯拉比竞争对手拥有巨大优势的领域。特斯拉拥有多家非常大的工厂,可以在这些工厂部署 Optimus,而无需与外部合作伙伴达成复杂的协议。
“你的第一位客户就是你自己,然后你可以进行 B2B 业务,也可以去拥有大型仓库的公司,”Karpathy 说道。“一旦你在多家公司孵化,你就可以开始研究 B2C 应用了。”Optimus 的推出有可能改变全球劳动力市场。通过执行传统上由人类完成的任务,到 2030 年,该机器人可能会使特斯拉的员工数量减少 60%。虽然这种转变可能会导致工作岗位流失,但它也为制造业和机器人技术开发创造了新的机会。
有人反对通用人形机器人,而赞成只执行单一任务的专用机器人。Karpathy 则认为,从长远来看,一个可以执行多项任务的通用平台必然将击败许多为特定任务而设计的不同平台。因为人们购买人形机器人是想要它是一个可以不断升级新技能和应用程序的平台,最终可以成为解决许多问题的非常经济高效的解决方案,而不是单独某个工具。
在最近的 All-In 峰会的一次采访中,特斯拉首席执行官埃隆·马斯克也分享了他对 Optimus 未来的愿景。 他预计,如果大规模生产,Optimus 的成本将低于一辆小型汽车,约为 20,000 美元。该公司需要两到三次迭代来完善机器人,同时还要在自己的工厂使用它,据马斯克称,这将需要五到六年的时间。然后,他们可以扩大规模,每年生产数百万台机器人。时间表可能会改变,但我认为我们最终将走向一个人形机器人成为常态的新世界。