一看就会?只需人类“老师傅”带一次,这个机器人就能学会模仿?背后能力是什么

具身智能将众多零散的任务和数据吸纳到一个框架中,从而实现了基础模型的规模化效应,这使得具身智能技术最先落地的载体或许不是人形机器人,在制造产线上,工业机器人能够更快更好应用落地具身智能技术。         

在本届工博会上,具身智能与工业机器人的融合正在成为企业主关注的焦点,在工业机器人的载体上,具身智能等新技术的快速融入已经产生极强的生产力。微亿智造联合捷勃特就在本届工博会上,展示了最新具身智能工业机器人(EIIR, Embodied Intelligent Industrial Robot),提供一个具身智能赋能工业机器人的先行者案例,代表了当前工业机器人正加快进入到具身智能工业机器人的新阶段。

           

图片

         

本次工博会展会现场,EIIR以互动展台的形式出现,能通过观察人类装配积木的动作和流程,进行任务拆解和学习理解并完美复现,同时,通过云端实现实时任务的传送和远程执行,实现人类装配成果的复现。

         

不少专业观众感慨,在人工智能的加持下,该具身智能工业机器人只需看一遍、学一遍,就能批量化复制与执行该动作。这就像是原先老师傅带徒弟,只需师傅教一遍、带一遍,聪明的徒弟通过算法能力学习一遍,就能做到一看就会,而且一次就能上手实操,并且越做越好。这种能力意味着该机器人未来有望真正进入到实际工厂,通过这种学习能力快速理解任务并执行,更快匹配未来工业生产场景需求,帮助智能制造转型升级。

         

微亿智造CTO赵何博士介绍,具身智能工业机器人是将传统机器人控制算法与人工智能算法深度融合,具备复杂环境感知、强任务理解、实时动态规划、高速精准控制等智能特性的下一代工业机器人。在制造业场景下,人形机器人不是最适合的解决方案。而具身智能工业机器人具有通用基础智能,能够通过自然模态进行人机交互,实现生产任务理解,免编程、免示教部署,既能满足制造业的柔性切线要求,又可以实现快速批量生产,是目前最切合制造业场景需求的具身智能解决方案。

                    

▍具身智能带来工业新浪潮

         

成立于2018年的微亿智造是一家专注于工业AI+机器人控制的服务商,从诞生起一直致力于将机器人技术更好地应用于工业制造。得益于长期的制造业深耕和非标自动化经验,微亿智造在解决多个工厂任务的过程中发现,传统工业机器人受限于编程部署方式,大多只能在确认且封闭的空间中重复运动,任务泛化能力弱,而且无法具备柔性切线能力,自动化生产线需要花费大量时间和人力成本来调整各个部件的精准度。 

           

然而,随着中国制造业小批量、多品种,各种各样的新制造形态发展,企业越来越多的产品、越来越频繁需要换线生产,这种长尾的产线特性导致停工停产切线已经成为显著问题。例如微亿智造服务的一家消费电子领域的零部件配套企业,在5年前单一产品大批量生产的时候,该手机零部件产线日检测量达到200万件,微亿智造当时采取传统工业机器人与机器视觉的组合尝试解决该难题,相比人工和模组结构要更加高效,一台设备最多可以代替16名质检人员。但随着其手机厂商更新迭代,该企业面临切线换型难题,一旦更换产品,质检机器人就需要重新编程更新路径点位,传统工业机器人的柔性化就难以满足要求。

         

这是一个非常典型的案例,在原先传统产线乃至部署工业机器人的产线上,换线后一旦工艺流程、来料情况发生变更,由于工件模型复杂,机器人程序就需要重新调整,项目研发部署周期比较长,调整成本高,企业投入也大,这从源头上限制了工业机器人在更多行业的普及和应用。

         

由于自身在AI质检领域非标自动化的经历,在具身智能的浪潮下,微亿智造认识到,大模型行业应用已经掀起机器人的智能化浪潮,机器人产品的灵活性和智能化需求越来越被凸显,以更低的成本满足企业更多的需求,并让ROI在可承受的范围内,那么在传统工业机器人上融入具身智能将是一条可行路径。   

           

图片

     

赵何博士解释道,不同于开放的生活场景,工业场景在宏观上具有明确的边界,是高度可控的场景,这为具身智能技术的落地提供了有利的外部条件。在微观上,工业场景有更高的精度和效率要求,这也是为什么在现有的自动化产线上有很多的工装和夹具对工件进行物理限位。这种方法在满足精度和效率要求的同时也极大提高了自动化产线的切线难度和成本。而具身智能工业机器人通过引入精准高效的感知技术解决微观层面上的定位问题,淘汰产线需要对工件进行物理限位的要求。宏观层面的工业场景边界为具身智能技术的落地提供了更大的可能性;而微观层面的具身智能技术的应用提供了具体技术路径。

         

在近两年的摸索实践中,微亿智造通过客户需求调研确定了研发方向,并尝试将原先的软硬件体系标准化、模块化,整合软硬件底层资源,率先将具身智能理论应用到工业场景,融合感知、驱动、控制、算法、云服务等技术于一体,创新性地逐步将产品形态归纳总结为新一代具身智能工业机器人(EIIR),从而使其能够更好理解和适应复杂的工业环境,帮助制造企业以一种通用的解决方案,轻松解决产线的灵活性和适应性问题,精准且高效地执行各类多元化任务,为工业制造提供一种更专业的新选择。   

         

在微亿智造按照具身智能机器人的定义和规范中,首次将智能化概念引入到精准且高效的工业机械臂中,让机械臂具备足够多的智能和柔性以降低对物理限位的要求,并用大模型梳理重构了机器人感知、规划、控制方面范式,打通底层控制接口,搭建了一整套模型的训练框架以及云边端的运行架构,真正做到了具身智能与机器人的融合。

     

借助这套体系,机器人首先能够通过具身视觉模块,实时捕捉动态环境变化,进行毫秒级的实时地图重建,确保机器人与外部环境交互的实时性,其次,借助认知大模型,机器人再无需传统示教及机器人编程,只需通过对图片、视频、动作等进行精确捕捉,结合工业垂类大模型,即可快速实现任务理解和拆分。最后,通过具身视觉模块结合机械臂实时位姿,能够快速进行来料的三维位姿估计,将识别精度提升至1mm,采用基于优化和采样结合的方案,毫秒级完成点到点路径规划,实时生成距离和速度最优轨迹,让机械臂的任务拆解和执行更加智能化、柔性化。

         

▍核心技术拆解

         

在微亿智造看来,工业场景的任务本质上可以大致分为宏观和微观两个层面,宏观上指的是一致性单任务复现,微观层面则是智能化应对产线多元化的来料问题,任务边界相对明确且清晰。   

         

为此,微亿智造的做法是尝试借助三个基础模型:感知基础模型、决策基础模型和操作基础模型,将任务进行更进一步细化拆解,并分别形成逻辑链和任务链,使其具备更强的具身认知与执行能力反馈回路,并在此基础上延伸出一定的环境、人类交互能力,确保在制造业产线高自由度的情况下,高准确性解决换线、换产、换工艺这类柔性化生产问题。

         

“在原先,机器学习存在一定的语义隔离,但大模型提供了一种全新且直观的可能性,打破了人机交流和交互模块到机器语言的转化瓶颈,这使得机器人的任务理解与自主决策能力已经上了新的台阶。通过完善任务关键步骤以及先后顺序的时间和空间逻辑关系,即可让大模型掌握微观层面不可控变量的任务规律,感知后预测决策,带来更加完美的解决思路。”赵何博士解释道。

           

图片

     

例如在机器人任务理解层面,在原先产线切线后,工程师需要根据最新的产线情况设计编程调整机器人作业轨迹,由人类充当柔性化执行的转化载体。而如今,微亿智造采用多模态大模型,帮助机器人仅需借助语言模型以及视频、图片等多模态大模型,就能对生产任务能有一个正确且直观的理解,机器人无需人类辅助自动生成检测对象轨迹,通过提示或者微调,即可实现执行侧更高效的交付流程。   

         

由于具身智能工业机器人(EIIR)本身具备一定通用的基本智能,能够通过视觉、传感器等多元件的融合,将多模态信息处理、融合与理解形成全新机器语言,配以工艺的SOP,仅需简单的工程师示范或者多模态演示,即可使得机器人对微观任务有所全新理解,并下发自动串联,自动避障执行,自动学习生成全新的任务轨迹,让切线时间缩短至小时级。

         

同时,EIIR的多模态学习包括语义理解、任务拆解等各层级,即使在更换产线后,大模型也无需重新训练,仅需完善训练语料库细节,增强机械臂任务引导,即可重构任务抓取和交互的思维链,实现动态信息印证。随着数据量以及训练时间的提升,该任务理解模型性能、决策执行可靠性会趋于稳定,仅需3个小时以内就能实现对于切线后陌生物料的处理。

         

在这个过程中,虽然传送带上来料的朝向、位置都可能存在偏差等问题,但机器人感知系统和运动系统实现了打通,通过具身视觉模块,且微亿智造自研了基于时间最优的三阶约束轨迹生成技术,让具身智能工业机器人(EIIR)在复杂环境感知基础上,合并成运动控制基础模型,从而更加具备明确的任务导向。

         

可以发现,基于具身认知决策能力,机械臂在任务理解、思考的过程中,能够实现信息的融合和计算,形成感知与执行闭环,更精准地获取工件位姿,并还可以采用基于优化和采样结合的方案,驱动和控制机械臂的运动和轨迹,通过调动机械臂运动系统与视觉系统的位置移动,二次实时捕捉动态来料变化,自主决策与生成任务执行轨迹,保证最终任务执行的高效准确性,极大提升了复杂工况下的识别成功率。   

           

图片

     

▍硬件底层革新

         

除了软件算法层面的巨大革新,微亿智造也发现,想要实现更加即时性的控制以及预测,需要机器人、视觉、传感器等各类硬件的底层接口融合。为此,通过与战略合作伙伴捷勃特的深度合作,目前具身智能工业机器人(EIIR)已经从工业机械臂的底层控制方法到软件设计理念层面完成了一次全新的革新,使其从封闭的控制系统,优化成为能够进行反馈回路计算的开放性智能具身机器人,并提供了更加多元的接口。

         

这种底层架构的革新带来的意义不言而喻,通过开放底层架构,EIIR引入视觉伺服技术,具身视觉模块借助上层决策系统,能结合机械臂六轴实时位姿控制本体姿态。由于视觉相机像素精度达到5像素,机械臂末端能以平均速度达到500毫米/秒,峰值速度达1000多毫米/秒的线速度水平运转,机械臂实时控制频率为1KHZ,具身智能工业机器人(EIIR)能够以更高频更快进行目标物体的三维位姿估计,从而快速响应动态规划的轨迹,进一步提升了感知与执行系统的整体实时性和准确性,而且中间无需停顿,保证了环境感知和任务理解大模型的运行可靠性,也有了我们最终看到所见到的机器人能实现自主工作,并可以实时感知并识别位置,根据任务和姿势调整操作。   

           

图片

     

▍结语与未来

         

具身智能工业机器人(EIIR)的出现,证明了在工业领域,大模型的技术能力特点深度契合新型工业化特征,结合机器人等技术,可基于感知预测和决策规划等能力在设计制造、产能优化、切线管理、生产运营等场景上全面助力工业领域降本增效。

         

具身智能工业机器人(EIIR)也表明,如今的智能制造已经不再是原先简单的端到端或者规划控制等技术,机器人在工业场景的更大范围普及落地,已经执行复杂柔性化任务,必须有复合的智能化技术、底层软件架构颠覆性革新,才能保证功能的有效性和任务的完成度,满足质量管理体系的新要求。

         

可以想象,在未来工厂,将工业机器人控制算法与人工智能算法深度融合的EIIR,已经不再只是扮演编程执行的自动化工具,而是进化为能够实时感知和适应环境,能自动分解任务,并进行自主学习、自主决策及操作的智能体。相比于传统工业机器人,EIIR具备自适应、自学习、免编程示教等优势特征,可承担各类工业现场的复杂工作,并能在多个工业场景间实现柔性切换,极大提升生产效率,实现资源的最优配置,最终带来制造业的全新可能性。