AI训练师:我要让AI更“懂”人类
人工智能是引领未来的战略性通用技术和驱动新一轮产业变革的新引擎,对于抢占未来发展制高点、构建现代化产业体系至关重要。
在人工智能的神奇世界里,有一群特殊的艺术家,他们用数据作为画笔,绘制出AI“理解世界”的蓝图。他们就是AI训练师,通过“投喂”海量数据并不断进行模型的训练迭代,让AI更好地“理解”人类,为发展新质生产力提供强大驱动力。
智能驾驶领域:
数据标注吸引大量年轻人
如祺出行数据标注项目负责人卢健
我是卢健,担任如祺出行数据标注项目的负责人。AI训练师的工作价值特别好理解:想象一下,一位母亲耐心地教导她的婴儿识别周围的世界,告诉她的孩子这是鸡,那是鸭。同样,AI训练师也在不断地向AI模型展示各种图像,帮助它们学会识别和理解这些图像。这个过程,就是AI训练师工作的精髓。
随着智能驾驶技术的蓬勃发展,市场对于AI训练师的需求正迅速上升。数据标注作为AI训练的关键环节,已经成为一个知识密集型的劳动领域,需要大量专业人员的参与。
数据标注是将原始数据转化为机器学习算法可理解的形式的过程。自2023年起,我们公司逐步开展了数据标注业务,同年正式启动了自动驾驶数据标注业务。在智能驾驶领域,数据标注的需求量越来越高。在高峰期,我们有大约三四百名专业人员同时工作,以满足项目需求。这些专业人员不仅需要具备数据标注的基本技能,还要能够根据不同项目的具体要求进行灵活理解并执行数据生产。例如,一些项目可能需要在图像上标注车门、车灯等细节,而另一些则可能涉及3D点云数据的不完整进行脑补标注。项目管理的挑战在于如何根据客户需求,将项目拆分并分配给合适的人员。
在AI数据标注领域,年轻的从业者(20岁~25岁)比较多,他们愿意接触新事物,能够灵活使用电脑。通过实习期的接触和培训,他们有机会发展成为审核员、质检员或组长等更高层次的职位。每个岗位对人员有不同的能力要求,例如观察仔细、带教培训、项目管理等等,具备各种能力的人员都能找到属于自己的发展方向。
案例表明,准确度高的标注工作需要对规则有深入的理解。例如,一个项目可能需要对黄黑相间的防撞杆进行标注,而在不同项目中,这样的杆子可能有不同的定义,例如警示柱。因此,AI训练师需要根据客户规则客观地执行标注任务,仔细了解长达200—300页的规则任务书,以确保更好地保质保量完成需求。
随着自动驾驶车辆在更多城市投入使用,数据量将大幅增加,从而推动对AI标注服务的需求。与此同时,AI人才需求也日益增长,特别是在自动驾驶领域。为了满足这一市场需求,我们公司已经与多所院校建立了校企合作关系,共同培养AI训练师,帮助学生从学术理论过渡到实际工作。
人脸识别研发:
不断优化算法提升模型性能
杰创智能科技股份有限公司AI训练师冼鸿东
我是冼鸿东,作为杰创智能科技股份有限公司的一名AI训练师,我有幸成为这场技术变革的见证者和参与者。AI领域的技术更新迭代非常快,这使得AI训练师需要具备较高的专业门槛,并且需要不断储备跨学科的知识。
自2020年加入公司以来,我参与了多个与人工智能相关的项目和研究课题,主要负责人脸识别产品的研发,见证了人工智能从技术研发走向行业应用的全过程。
在AI训练领域,我们的任务主要分为两大类:基础数据的准备和模型的训练迭代。数据标注是模型训练的基石,而模型的训练迭代则是不断优化算法、提升模型性能的过程,使其变得更“聪明”。
以安全帽正确佩戴智能识别为例,我们团队收集了数万张正负样本图片。这通常是一项庞大的工作。我们不仅要标注出安全帽本身,还要标注出佩戴者的姿势,以确保模型能够准确识别出安全帽是否正确佩戴。标注完成后,我们便着手进行算法的开发和大模型的训练,这是一个不断调试和优化的过程。当然,随着模型的不断迭代,我们也在不断地简化和智能化标注过程。例如,一个初始准确率只有60%~70%的模型,可以通过智能标注的方式,反过来调整标注,从而提高准确率,减轻人工标注的负担。
建立模型并不是最难的部分,真正的挑战在于调试和优化,以找到最优的模型效果。这个过程可能会非常耗时,需要不断地迭代和迸发灵感。我们虽是技术开发者,但要不断学习安全生产的法律法规、安全规范,与央企、监理单位等有着资深实践经验的管理人员探讨,不断锻造大模型的识别能力,提高AI识别的准确性,不断迭代优化安全管控平台的功能模块。
我把自己的工作比喻为升级打怪,不断克服挑战,提升技能。虽然工作过程可能漫长,但当看到我们训练出的模型在实际产品中发挥作用时,我感到非常有成就感。我们通过数据标注和模型训练,让AI越来越智能,越来越接近人类的识别和判断能力。
▌向“新”之路
传统制造“老树发新芽” 未来产业加速开花
低空经济作为新质生产力的典型代表,被国家纳入战略性新兴产业,列入了综合立体交通网规划。(资料图片)
以大模型为基础的新一轮人工智能“风口”正席卷着各行各业。近年来,广州在人工智能、大模型、大数据、算力、算法等先进生产要素的相关产业上抢先布局,加速迭代升级。去年6月发布的佳都知行交通大模型,已通过国家网信办大模型备案,并在轨道交通智能客服、智能运维等场景落地应用。作为人工智能行业龙头企业,佳都科技正通过大模型等新技术赋能,推动轨道交通行业转型升级,让城市交通更“聪明”。
拥有新的数字底座、先进技术做引擎,传统产业改造提升就更“硬气”,并且为新兴产业的发展明确了方向。《2024年广州市政府工作报告》提出,坚持产业第一、制造业立市。厚植经济发展优势,坚持把发展经济的着力点放在实体经济上。统筹推动传统产业改造提升、新兴产业加快发展、未来产业谋篇布局,加快形成新质生产力。
一方面,利用数字化技术改造推进,令传统制造“老树发新芽”,另一方面,加快培育新兴产业,令未来产业加速开花。目前,广州逐步形成新一代信息技术、智能与新能源汽车、生物医药与健康三大新兴支柱产业和智能装备与机器人、轨道交通、新能源与节能环保、新材料与精细化工、数字创意五大新兴优势产业的“3+5”战略性新兴产业集群。
今年7月,广州市社会科学院等联合发布的《广州蓝皮书:广州数字经济发展报告(2024)》(以下简称“蓝皮书”)指出,近年来,广州推动实施以“链长制”培育壮大人工智能产业链的战略举措,推动人工智能与数字经济试验区等重大平台建设,培育出佳都科技智慧交通、金域医学临床检验与病理诊断、广电运通金融智造与服务、科大讯飞机器人智能交互等一批有代表性的新一代人工智能开放创新平台。
蓝皮书预计,2024年广州数字经济核心产业增加值将迈上4200亿元新台阶,同比增长约10%,占地区生产总值比重为13.5%。
《广州日报》2024年9月30日T2版
文/广州日报新花城记者:文静、张露
图/广州日报新花城记者:文静、张露 实习生:朱晓燕(除署名外)
广州日报新花城编辑:苏琬茜