黄仁勋马斯克看好、李开复泼冷水,人形机器人市场分歧在哪?

全文5057字, 阅读约需15分钟,帮您划重点如下

划重点

01人形机器人市场分歧显现,李开复对短期前景持谨慎态度,而马斯克和黄仁勋看好其发展。

02产业化模式上,业内对B端率先落地人形机器人有初步共识,但具体路线选择各异。

03机器人大模型的训练数据采集方式存在差异,有的厂商完全采用虚拟仿真,有的则结合实物数据。

04尽管人形机器人市场前景存在分歧,但业内普遍认为其具有很大的发展潜力。

由腾讯混元大模型提供技术支持

热潮激涌一周年之际,李开复向人形机器人产业的“星辰大海”泼了盆冷水。
他在近期的北京智源大会上表示,绝大多数应用场景并不需要人形机器人,由他领导的创新工场短期内不看好人形机器人前景,因此从未投资过相关初创公司。
自2023年AI大模型能力爆发后,机器人行业看到了“具身智能”的曙光——机器人身躯和大模型结合,可以听从自然语言指令并输出相应动作,与物理世界交互的智能体呼之欲出。大约从去年下半年开始,人形机器人初创公司从风口鱼贯而入,热钱持续涌向这条未来产业新兴赛道。
业界的分歧也日渐凸显。宏观层面上,对于人形机器人的前景,乐观者与消极观望者态度鲜明。与李开复的谨慎姿态相比,马斯克和黄仁勋成为打头阵的摇旗呐喊者。
中观维度的产业化模式分野同样显现。虽然业内对B端率先落地人形机器人有着初步共识,但到底是走工业制造场景,还是走商用服务业场景,各家公司的选择迥异。即便是商用服务业模式,应凸显机器人的工具性还是与人类情感交流的互动性,亦未有标准步伐。
微观视角则体现为机器人厂商的技术路线差异。人形机器人本体方面,银河通用等厂商注重机器人上肢的泛化操作能力,采用轮式底盘的下肢设计,但优必选、宇树科技等公司则一步到位给机器人配置上肢和双腿,走全人形的路线。机器人大模型的训练数据采集上,靠虚拟仿真还是实物数据,或者将二者结合,方案不一而足。
“0到1”近在咫尺还是长夜漫漫?
随着去年人形机器人再度风靡,广发证券分析师在2023年10月一篇研报中预判:“人形机器人已处于产业化破晓前夕。”
然而,人形机器人何时完成“0到1”的突破,业内人士心中有着不同的时间表,由此衍生出了乐观派和消极观望者。
马斯克自视为一位“病态乐观”者。当地时间6月13日的特斯拉年度股东大会上,马斯克承诺特斯拉将于2025年限量生产旗下人形机器人“擎天柱”,预计生产超过1000台或数千台。他放话称,“擎天柱”有朝一日会助推特斯拉市值抬升至25万亿美元,超过标普500指数目前约45.5万亿美元总市值的一半。
另一位为人形机器人持续鼓与呼的业内大佬是英伟达CEO黄仁勋。近期接受采访时,他预测机器人技术将在未来两到三年内取得重大进展,未来人形机器人将像汽车般普及。马斯克6月18日接过黄仁勋的话术,声称人形机器人普及程度将是汽车的10倍。
乐观情绪背后有积极因素支撑,产业政策、资本扶持、技术迭代等等,共同加速人形机器人“0到1”的催化。
其中技术迭代是基础。人形机器人的身躯由“大脑”“小脑”“肢体”三大模块组成:“大脑”负责感知、决策、交互;“小脑”是软件与物理实体的交汇点,扮演规划与控制角色,负责把“大脑”的感知和决策“翻译”成动作执行;“肢体”则由一系列旋转关节、线性关节、灵巧手等零部件组成。
清华系机器人公司星动纪元联合创始人席悦此前告诉南都记者,大模型的横空出世为机器人智能带来了希望,针对“小脑”的控制与强化学习技术这几年也展现出了强大的能力,另外硬件技术得到提升、零部件成本日渐下降。
尤其是长期困扰人形机器人产业化的高昂成本开始下探。今年1月,高盛的一份报告指出,由于现在可以使用更便宜的零部件,有更多的供应商选择,以及设计和制造技术的优化,一台人形机器人的制造成本从去年的约5万美元到25万美元,降至3万美元到15万美元,降幅达40%。
宇树科技更是在5月打响“价格战”,把新款人形机器人G1基础版的售价砍到9.9万元。据“人形机器人研究院”公众号的价格拆解,G1硬件成本批量化生产不超过8万元,即便算上研发、营销和管理等费用,G1的定价仍有合理的利润空间。宇树科技市场负责人王其鑫此前向南都记者表示,降本的关键依托于全自研路线。
但李开复是少有的公开唱反调的业界大佬。他在智源大会上说,具身智能有很大的想象空间,不过短期要做好,难度很大,要走很漫长的道路。而且,现有的工业机器人和服务机器人已经解决了绝大多数应用场景的需求,并不需要人形机器人。李开复尤其不理解人形机器人的两条腿除了爬楼梯,还有多大程度的必要性。他略带调侃地说,很多科学家和创业者都是从小热爱科技,如果希望能复制一个人形机器人,也无可厚非。
一位头部人形机器人公司研发人员亦向南都记者坦言,人形机器人虽是热点,但离落地和大规模商业化确实还有很长远的过程,目前仍处于造势阶段。
“一些业内人士也是基于目前的现实去做分析,比较理性地去看待人形机器人商业落地及其本身的价值,潜力还是有的,只是说现阶段它的成熟度有一些差距。”李君兰说。
张力解释说,人形机器人的市场需求在于,人口的老龄化和出生率降低,未来工厂可能招不到足够的工人;其次,现实世界的生产工作和生活环境都是为人设计,外形像人的机器人才能无缝衔接应用;并且,通用人形机器人和现有的专用机器人不是零和博弈,而是共存关系,去替代当前专用机器人做不了、仍由人类完成的工作。
制造业“蓝领”还是服务业“白领”?
和人形机器人过去半个世纪的发展历史不同之处在于,本轮热潮真正开始驱动产业化,而不仅仅充当摆设的人形玩具或者科研教具。但各家公司的落地场景选择上存在差异——究竟是让人形机器人去工厂当“蓝领”,还是去商用场景下做“白领”,产业界仍在探索。从目前的整体情况来看,“蓝领”路线相对普遍。
港股上市公司优必选的工业版人形机器人Walker S,今年以来获得多个“实习”机会。2月下旬优必选宣布,Walker S机器人已在蔚来合肥第二先进制造基地总装车间展开实训,负责车门锁质检、安全带检测、车灯盖板质检、贴车标等任务。
随后6月初,优必选又透露已和东风柳汽达成战略合作,共同推动人形机器人在汽车制造场景的应用。有知情人士告诉南都记者,这项战略合作是柳州市当地政府牵头推动的一个重要项目,目前仅仅是双方达成了意向,完成初步启动,但具体如何展开尚未确定。
优必选方面表示:“智能制造尤其是汽车制造领域,或将成为首个大规模应用的领域。”人形机器人的机会点,具体来说是在汽车生产的总装环节。据高工机器人产业研究所所长卢瀚宸介绍,冲压、焊接、涂装这三项流程已有成熟的自动化部署,而总装环节目前的自动化程度相对较低,仍有大量人力参与。
看好汽车制造场景的,还有国内较早入局人形机器人赛道的小米。6月初,小米正式将旗下北京小米机器人技术有限公司迁入北京亦庄的小米汽车工厂,并称正推进人形机器人在自有制造系统的分阶段落地。
国外的不少人形机器人厂商,如特斯拉、Figure AI、Apptronik均已着手汽车制造场景的产业部署。和亚马逊合作的初创公司Agility Robotics,则正在推动旗下人形机器人Digit进入仓库完成物流自动化。Agility Robotics计划采用“机器人即服务”(robots as a service)的商业模式,向下游客户收取使用月费,打消客户对巨额投入成本的担忧。
商用服务业是另一块发挥人形机器人工具性价值的用武之地。美团投资的机器人初创公司银河通用,6月中旬正式发布第一代轮式人形机器人Galbot G1。一位银河通用员工告诉南都记者,机器人今年下半年将投入商超、药店“干活”。由于没有量产,目前售价约30万元一台。
银河通用联合创始人兼CTO王鹤介绍说,G1现阶段将服务于无人值守的商用场景。他以药店场景为例解释了G1的工作原理:机器人进入药店后首先进行场景扫描,完成货架建模,最终建成一幅3D语义地图。当机器人工作时,便能直接走到药盒附近抓取特定药品。
图片
银河通用第一代轮式人形机器人Galbot G1实拍  图:杨柳
王鹤没有回复有关G1落地场景考量因素的询问。但他去年曾告诉南都记者,人形机器人想全面替代汽车装配产线的工人非常困难,车厂总装车间的工人多人并行,熟练、快速地拧上千个位置散布的螺丝,这对机器人灵巧双手配合、肢体灵活及操作节拍的要求,“远超当下具身智能发展的进程”。
与银河通用关注机器人商用服务场景下的工具性相比,部分公司和创业团队着眼于机器人的交流互动价值。
奇瑞汽车于4月底发布一款人形机器人Mornine,计划将其部署在销售、导购等岗位。这款机器人采用仿人硅胶面孔和模拟人类面部肌肉动作能力的设计,可以呈现说话、微笑、张嘴等表情。5月中旬,中国科学技术大学机器人实验室孵化的创业团队,展示了一款名叫“呱呱”的人形机器人,可以根据用户的情感需求提供相应的反馈。该团队负责人曹荣昀在2023年12月底成立无论科技(安徽)有限公司,主打情感交互人形机器人业务。
李君兰认为,商用服务市场的落地会优先于工业制造,引导、讲解等商用场景可以展现其更优的人机交互、情感互动等能力,而进一步应用到单一繁琐的结构化制造业场景则需更精准的运动操控能力。
但高工咨询机器人事业部研究员罗广彦质疑说,情感互动人形机器人的ROI(投入产出比)很难算得过来,落地可能性更低。比如当导购,客户要如何衡量它的效率,以及与人类导购的区别?服务业更需要的是能完成高速配送等通用任务的人形机器人。
双腿一步到位还是渐进式?仿真数据抑或实物数据?
黄仁勋在3月英伟达GTC大会发表演讲时,9款人形机器人一字排开,分列其左右。拥有完全仿人形的双腿,是这些机器人的共同点之一。
图片
英伟达GTC大会,黄仁勋与一众人形机器人  来源:英伟达公司
逐际动力当下也强调双腿能力的研发。今年4月,逐际动力公布的一段研发进展视频显示,旗下首款人形机器人CL-1完成了一步一阶上楼梯和往返跑步的效果。张力表示,没有双腿,机器人只能局限在某些区域进行操作,移动能力受限,影响到全身的运动控制能力,导致机器人不够泛化和通用,“通用性和泛化性才是我们做人形机器人的关键目标”。所以逐际动力的思路是在研发全人形机器人的过程中,把通用性能力迭代出来。
图片
逐际动力人形机器人运动画面截图  来源:公司官方
王鹤认同机器人双腿的价值:实现机器人的环境通用,没有两条腿,很多复杂的地形去不了。另一个作用是辅助上肢工作,如果腿无法弯曲下蹲,会限制双手能操作的技能。
他不否认未来是属于腿式机器人的,但当前腿部技能面临安全性、稳定性和成本上的挑战,无法稳定地弯曲,机器人弯腰捡地上物体时很难不摔倒。因此必须务实地考虑,“人形机器人是一步到位做到跟人一模一样,还是渐进式去发展?”
为了机器人性能稳定和售价便宜,银河通用的思路是先提升上肢的泛化操作能力,把下肢问题留给未来解决。按照这条渐进式的技术路线,王鹤将银河通用首款人形机器人设计成“双臂+单腿+轮式底盘”的躯体结构。他解释说,轮盘没有稳定性问题,能够360度转弯和前后左右移动;单腿可以实现折叠下跪,以跪姿辅助双手抓取地面物体。
上海智元机器人公司联合创始人闫维新亦认同,在通用性要求不那么高、地面平坦的场景下,轮式效果是最好的。
虽然智元对外着重展示的人形机器人为双腿结构,不过去年8月的一则官方宣传视频中也出现了骑平衡车的轮式机器人身影。一位知情人士向南都记者确认,智元在同时研发腿式和轮式两种型号的人形机器人。这一路线与获得OpenAI投资的明星初创公司1X Technologies不谋而合。1X Technologies旗下的EVE机器人为轮式,NEO机器人则是全人形结构。
图片
智元的轮式机器人 来源:官方宣传视频
李君兰分析说,不同厂商的技术路线与所选择的赛道有关,比如许多服务场所、办公楼和一些工厂多为平整环境,轮式人形机器人基本上能够适用。但对于较大坡度、地面坎坷不平的环境,尤其是特种作业场景,双腿更能体现通用性。
不只是本体层的路线有别,机器人大模型的数据采集方式亦存在差异。
具身大模型的数据集短缺已是业内公认的痛点。王鹤说,当前非具身的多模态大模型主要依赖互联网数据,但机器人的大模型数据来源十分受限。为此,上海机器人产业技术研究院今年4月牵头,联合多所高校科研团队,以及傅利叶智能、智元等企业,启动了人形机器人数据集建设项目。
特斯拉训练“擎天柱”、以及谷歌2023年7月推出的视觉-语言-动作(VLA)机器人大模型RT-2,均通过人工遥控机器人操作的方式采集数据。
在王鹤看来,特斯拉的数据采集方式存在路径依赖,将训练FSD(完全自动驾驶系统)的思路挪用到人形机器人产品线。FSD的功能完善,依靠100万辆车主的上亿小时驾驶,这意味着,如果想复制特斯拉汽车的模式,首先得有100万台人形机器人在各种地方、各种场景从事各种各样的任务。“等于说,具身智能的发展阶段现在是0,从0到1的突破,依赖于1,这就死锁了。”
王鹤看好虚拟仿真环境下采集合成数据的训练方案。据介绍,银河通用的机器人Galbot G1完全通过合成数据训练,没有采集任何物理真实数据,但训练出来的效果非常泛化,对任意材质物体能实现成功率达95%的抓取。
不少公司更倾向于采用仿真数据和实物数据相结合的路线。优必选CTO、北京人形机器人创新中心总经理熊友军此前向南都记者表示,优必选的人形机器人数据采集遵循“二八原则”,20%的数据来自物理真实场景,80%从3D虚拟仿真平台收集,这是因为真实场景收集数据很贵、很慢,而虚拟仿真环境下成本更低。
李君兰结合调研案例提到,如果把仿真环境下训练出来的机器人本体放到现实环境,会发现模拟与现实之间的差距,因此结合实物数据的调优是必不可少的。
宇树科技CEO王兴兴在研发工作中发现,如果让全尺寸人形机器人真正去干活,纯仿真数据训练很难应对。在工厂里这种比较复杂、有很多零部件的场景中,采集实物数据训练可能效率更高,“做仿真有点吃力不讨好,比较难适配真实物理环境”。
但问题在于,“如果模型没有足够好,让机器人直接去收集数据,采集不到好的数据;如果没有数据,又没办法做出很好的模型。”王兴兴说,“这是一个先有鸡还是先有蛋的问题。”
采写:南都见习记者 杨柳