中国信息通信研究院人工智能研究所部门副主任李荪:人工智能研究和应用重点转向以数据为中心

图片
贵阳网•甲秀新闻讯 8月27日,作为2024中国国际大数据产业博览会的活动内容之一,“‘数据要素+人工智能大模型’×千行百业高质量发展”交流活动在贵阳举行。来自各个行业领域的专家和嘉宾齐聚一堂,共同探讨数据要素与人工智能大模型的数字融合之道,赋能千行百业高质量发展。
中国信息通信研究院人工智能研究所部门副主任李荪在会上说,人工智能是新一轮科技革命和产业发展的重要驱动力量,将对全球经济发展和人类文明进步产生深远影响,发展人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇。随着算法的快速提升与基础设施的逐步完善,现象级产品对各行业带来颠覆性影响,人工智能或将开启2.0时代。在人工智能发展过程中,大模型加速人工智能技术范式变迁,迈向“大一统”。与传统AI相比,大模型具备规模可拓展性强、多任务适应性强、能力可塑性强等特征。
他认为,海量原始数据需要经过“炼化”才能构建成数据集,真正有效地提供给大模型用于训练。因此,大模型时代,数据成为新一轮人工智能竞争的壁垒与制高点。人工智能每次阶段性的进步,数据都扮演着重要角色,尤其在大模型时代,海量、高质量、多样化的训练数据,成为拉开能力差距的关键要素。自2022年起,人工智能研究和应用重点逐步从“模型中心”转向以数据为中心,在模型相对固定的前提下,通过提升数据的质量和数量来提升整个模型的训练效果。通过添加数据标记、清洗和转换、优化维护等手段,构建高质量的训练数据,形成完备的人工智能数据开发管理策略,将能更好地服务于模型的开发与应用。
记者 梁婧 李春明