蓝驰创投合伙人曹巍:人形机器人硬件架构达成共识,还需3-5年时间

全文3861字,阅读约需11分钟,帮我划重点

划重点

01蓝驰创投合伙人曹巍表示,人形机器人硬件架构达成共识还需3-5年时间,需要大模型和具身智能算法的不断普及和迭代。

02他认为,机器人作为智能制造的关键赛道,在未来5-10年甚至15-20年,都将是重要且支柱型的基础创新赛道。

03曹巍指出,在B端场景,机器人从简单任务做起,做到高鲁棒性是切入点的关键;而在C端,大量标准化任务已被成熟的消费电子产品取代,留给机器人创业公司的基本都是复杂任务。

04他期待更多垂直领域的机器人将受益于大模型和具身智能算法的提升,提升在各自应用领域的落地能力。

以上内容由腾讯混元大模型生成,仅供参考

图片
腾讯科技作者 周小燕 杨哲
编辑 郑可君
腾讯科技讯 8月23日,蓝驰创投合伙人曹巍在2024世界机器人大会上,讲述蓝驰投资布局机器人赛道的逻辑。曹巍表示,蓝驰将机器人视为一个超级智能体,它具有感知能力、场景任务理解能力、决策规划、本体控制、人机交互以及各种创新材料,机器人的落地是一个循序渐进的过程。
在 B 端场景,机器人从简单任务做起,做到高鲁棒性是切入点的关键。在 C 端,大量标准化任务已被成熟的消费电子产品取代,留给机器人创业公司的基本都是复杂任务,如非标的房间打理、带孩子、照顾老人、非标的清洁等。这些任务非常复杂,既有空间交互的大量智能体与之博弈,又有复杂长序列任务的串联,还可能涉及机器人与其他智能体的协作,所以 C 端并不容易。
此外,曹巍认为,从人形机器人架构成立到未来硬件架构稳定、行业达成共识,我们认为还需要 3 - 5 年的周期。如果硬件未来能够快速达成共识,对整个产业的发展和人形机器人生态的迭代将非常有帮助。
以下为曹巍演讲内容,由腾讯科技进行整理:
曹巍:蓝驰在中国已逾十年,目前管理资产规模超 150 亿,投资了 200 余家初创企业。蓝驰长期布局 AI 和机器人技术领域,我们不仅投资了机器人项目,还涉足产业链上下游,涵盖底层算力、AI 大模型、中间模型工具层以及顶层上层应用。例如,在底层模型层投资了月之暗面,算力层投资了青云科技。
图片
在机器人领域,蓝驰自 2016 年开始布局。那时,机器人并非热门赛道。经过长时间的行业研究和内部讨论,我们总结出一套方法论,即将技术和项目分为两条线。
一方面,在技术维度关注重要变化;另一方面,筛选业内最优秀的创业团队。
2016、2017 年,自动驾驶技术和 slam 算法在学术界达成高度共识,工业侧迅速落地。同时,大量国内企业开始推进激光雷达国产化,算力也变得更加便宜且易于获取。在此节点,我们投资了新能源汽车公司理想汽车,因为理想汽车也是一种机器人,其执行器为四个轮子。此外,我们还投资了高仙机器人,目前它已成长为国内机器人领域的独角兽之一,覆盖全球超过 50 个国家和地区,在商业清洁领域市占率全球范围内超过 70%。2020 年,随着我们观察到整个机器人与多模态感知的融合、与医疗交叉学科的碰撞,以及端侧神经网络的算力和表现能力越来越强,我们又投资了杭州的外骨骼机器人公司程天科技。
此后,在 2021 - 2022 年,围绕大规模工业集群总控制和大规模 AMR 集群协作,我们投资了蓝星科技、优艾智和以及木蚁机器人。这三家目前已获得多轮融资。在细分垂直领域,如重工领域,我们投资了来自清华的团队帝尔博格;在建筑机器人领域,投资了行业老兵筑领科技。同时,我们也在探索围绕底层新材料以及具身智能的创新,在 2022 年前后投资了来自南科大的万兴科技,他们做出了差异化的柔韧软体机器人。2022 年之后,随着大模型热潮,我们又投资了银河机器人和智源机器人,包括后续围绕物流产业投资了小南科技等一系列项目。
经过近十年的耕耘,蓝驰在机器人领域已投资了超过 10 家早期项目,总投资金额超过 10 亿人民币。很多人问,为何蓝驰从 2016 年开始就对机器人赛道如此有信心?我们进行了深入的行业研究和分析,总结如下供大家分享。
第一,中国市场是巨大的潜在机器人市场,无论是从机器人消费还是出口角度来看,中国在全球都是重要的支柱型市场。
第二,由于各种历史原因,中国面临人口老龄化问题。未来,机器人极有可能成为解决中国人口老龄化和劳动力供给的关键技术。同时,在人才供给和社区生态方面,中国也有着良好的基础。国内有 400 多所大学设有机器人专业。过去五年左右,已有超过 10 万家机器人企业注册,每年约有 1 - 2 万家。过去十年,整个投资界在机器人领域的资金投入总额已过千亿。最近,各地政府和引导基金积极设立与机器人相关的产业大基金,以扶持和推动机器人的发展。从社区层面来看,这也是我们非常关注的。当然,还有产业集群和长期的政策支持。我们认为,机器人作为智能制造的关键赛道,在未来 5 - 10 年,甚至 15 - 20 年,都将是重要且支柱型的基础创新赛道。
那么,蓝驰如何投资机器人呢?我们将其视为一个超级智能体,具有感知能力、场景任务理解能力、决策规划、本体控制、人机交互以及各种创新材料,由多个维度的技术体构成。在每一个技术维度都有创新的技术站和技术点。我们会持续围绕这些创新的技术站和技术点,关注市场上的技术变化,因为只有大的变化才能带来大的投资机会。
过去 2 - 3 年,我们看到的最大变化有哪些呢?
1. 大模型。在大模型的推动下,机器人在复杂任务的串联和执行上有了大幅度的提升。有了大模型的加持,同样的算法结合大模型后,成功率提升了 50%以上,有的甚至提高了 100%,逐渐接近商用水平。可以说,在过去的 2 - 3 年,大模型带来的底层能力推动,让机器人在复杂任务的串联和执行上成功率大幅提高,为未来的商业化落地带来了很大可能。
2. 机器人本体。无论是运动控制还是末端执行的精细化操作,都有了长足的进步。从算法趋势来看,无论是运动控制层面还是精细化操作层面,都从 Model base 的算法逐渐走向 Learning base 的算法。这种趋势让我们看到未来机器人的成长空间可以与数据结合,基于数据进行学习,数据越多表现越好,真正感受到了这种潜力。当然,机器人由上千个零部件构成,本体也很重要。过去 2 - 3 年,机器人人形初步硬件架构已经确立,但关键模块和技术路径仍在不断迭代和探索。比如,现在机器人的感知方案五花八门,上海 WAIC 上展示的十八罗汉,每个机器人的感知方案都不同,目前还没有统一的行业标准。像灵巧手的选型,有众多创业团队在从事这方面的创业,但高自由度与稳定性、鲁棒性之间的矛盾,无论是学术界研究人员还是产业界创业企业家,都还在努力解决。当然,还有很多问题在此不一一列举。从人形机器人架构成立到未来硬件架构稳定、行业达成共识,我们认为还需要 3 - 5 年的周期。如果硬件未来能够快速达成共识,对整个产业的发展和人形机器人生态的迭代将非常有帮助。
我们可以看到,无论机器人多么复杂,或者行业标准和架构体系如何变化,中国的智能制造生态已经具备了非常完整的机器人产业链,包括感知系统、关节驱动系统、整体躯干以及灵巧手的手部关节等,国内都有非常优秀的供应商,既有上市公司也有初创公司。这给投资人带来了很强的信心和良好的生态效应。我们认为,未来的机器人团队不应单兵作战,而要做到生态协同、生态供应。
随着多模态大模型以及具身智能算法的不断普及和顶层能力的不断迭代,具身智能和大模型不仅可以应用于双足诞生的机器人,也可以应用于机械臂或传统工业机器人。我们相信,未来随着机器人成本降低以及算法和模型能力的提升,越来越多垂直领域的机器人也将受益于大模型和具身算法的迭代,这是我们非常欣慰看到的。
记得去年特斯拉刚刚发布人形机器人时,行业内有很多论断,认为人形机器人将替代一切,可能挑战所有传统机器人。但我们觉得,大量经典的工业机器人是人类工程师和产品经理围绕垂直场景的痛点和难点,多年积累的心血和智慧结晶。在一些重要的工业节点和场景,如重载、叉车等,人形机器人并不适合。未来,更多传统垂直领域的机器人也将受益于大模型和具身智能算法的提升,提升在各自应用领域的落地能力。我们也很高兴看到,在人形机器人、半人形机器人领域,国内有很多优秀的创业者,海外也有几家标杆企业,如波士顿动力、国内的银河机器人以及最早发布人形机器人的宇树等,表现都非常好,迭代速度很快,基本半年到一年有一个版本的小幅更新,一年有一个大幅更新。我们看到这些机器人不仅可以在视频上做 Demo,还可以在现场进行接近商用级的落地表现。只有真正将各种算法和具身智能技术与场景侧需求结合,进行产品化和商业化落地,企业才能具备更加持续、稳定的发展动力。
我们总结认为,虽然具身智能和人形机器人备受关注,但机器人的能力边界、场景和任务特点将决定具身智能机器人的落地节奏。场景的特点是什么呢?事物的客观发展规律一定是从易到难。最大的挑战在于如何定义哪些是容易的场景、哪些是简单的场景、哪些是复杂的场景,以及创业者在选择细分切入点时该如何抉择。这里,横轴表示场景的复杂度,纵轴表示任务和操作的复杂度。
什么样的场景是复杂场景或高难度场景呢?
第一,从机器人与物理世界的互动来看,所有有智能体参与博弈的场景都是复杂场景。例如 L4 级自动驾驶,从 2015 年大家充满期待到现在萝卜快跑逐步落地,遇到的挑战就是在路上开放路面运行时,有大量不受控的智能体需要与之博弈,这是决定场景难易度的第一个标准。我们认为,有大量智能体参与博弈的场景是非常复杂和具有挑战性的。
第二,长序列任务的场景。简单的抓放或基础任务难度不高,但当很多简单任务用长序列串联起来,且在执行过程中一旦出现外部干扰还能自纠错、自修复时,任务难度就变得非常高。所以,长序列任务也是一个重要的挑战。
第三,集群协同。机器人不是单独完成任务,而是要和其他智能体一起完成任务,这也是难度的挑战。
我们认为,在机器人落地的过程中,未来的发展趋势一定是循序渐进,从简单到困难逐步展开。在 B 端场景,昨天的一个有趣论坛上,产业侧嘉宾表示,B 端最关注明确的成本要求,即要讲清楚 ROI,明确替代几个人、何时回本,是在场景侧百分百完成简单任务还是 80%完成复杂任务但只是秀一下。他们需要百分百稳定的简单任务。所以,在 B 端场景,能够克服外部干扰,从简单任务做起,做到高鲁棒性,是切入点的关键。在 C 端,我们看到大量标准化任务已被成熟的消费电子产品取代,留给机器人创业公司的基本都是复杂任务,如非标的房间打理、带孩子、照顾老人、非标的清洁等。这些任务非常复杂,既有空间交互的大量智能体与之博弈,又有复杂长序列任务的串联,还可能涉及机器人与其他智能体的协作,所以 C 端并不容易。我们也看到很多优秀的团队已经开始尝试在 C 端努力,期待有团队一起交流和碰撞,找到 C 端的解题路径。
总结来说,机器人的落地不是一蹴而就的,而是一个循序渐进的过程。最后,虽然我们谈到了产业的发展趋势、遇到的问题和挑战,但我们也看到了大家对通用机器人、人形机器人、半人形机器人的巨大期望,这源于它们在场景适应上的包容性,无论是科研、交互服务、搬运巡检、复杂分拣、产业组装柔性任务,还是生活服务场景中的住宿、零售、批发,甚至 C 端的居家、养老、看护、陪伴等,未来都将是一个万亿级的市场,是一个值得大家倾心投入、共同努力的巨大机会。