郑晓龙:AI大模型将向轻量化生态演进 国内产业需正视创新差距

本报记者 吴清 北京报道
在AI(人工智能)大模型GPT和Sora的助推下,全球掀起了一股AI浪潮,人工智能已成为新一轮科技革命和产业变革的重要驱动力量。中央经济工作会议明确提出,“发展数字经济”“加快推动人工智能发展”。人工智能已经成为经济社会发展的驱动力量,加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手。
“不是所有企业都能像微软的OpenAI一样,具备投入上百亿美元的能力。当前AI大模型的演进,垂直化和领域化的大模型和小模型或者轻量化混合应用将具有较大的发展空间。”在3月20日的“人工智能涌现 产业生态焕新”专题研讨会上,中国科学院自动化研究所研究员郑晓龙指出,当前AI的竞争还处在比谁能把模型做得更“大”的阶段,但AI在产业侧的发展未来还是会下沉到更“小”的细分行业应用领域。
据不完全统计,截至2023年,我国已推出的通用大模型数量达到130多个,若算上各类行业大模型,数量更达数千之多。用“千模大战”来形容当前的产业态势,并不为过。
对此,郑晓龙认为,进入大模型时代后,AI的发展速度明显加快。“2023年大模型还处在文本交互阶段,目前却已发展到多模态交互时代,后面还会出现更多元更通用的交互模式。”郑晓龙预计,未来软硬结合的人形机器人将是AI的主要趋势之一,而这会重塑很多产业。
AI迈入通用智能时代
从1956年达特茅斯会议上,人工智能这门学科正式诞生,近70年来,AI产业发展的程度超乎人类想象。不过,在1970年到2010年40年的时间里,受限于技术限制,AI发展处于起伏期,甚至一度受到各界质疑。
直到进入2010年后,深度学习技术推动AI取得突破性进展,人工智能行业爆发了新的活力,并在2020年迎来大模型时代,三年多来的发展速度令人目不暇接。“自ChatGPT、Sora为代表的大模型出现后,AI正在展现出更通用、更智能的潜力。”郑晓龙表示。
人工智能发展是一个技术演进的过程,包括原来的专家支持,后面浅层的机器学习,再到深度学习、预训练模型,最后到大家所知的大模型和人工智能相关的技术。这一技术和创新生态的巨大变化,也让AI在形态上更向人脑靠近。在郑晓龙看来,大模型的决策方式也类似于人类大脑,通过不断地喂养数据完成各种智能活动。“它是一个计算机,类似操作系统,是重构的应用服务和数字组织、算力的集群,未来也是一个超级应用,能够面向不同的应用需求,通过裁减形成云、边、端协同的相应技术体系。”他指出。
这一进化形态,也会在未来改变人类的决策方式。“以后可能在复杂的环境下,人做决策,有时候不一定比机器做得更优,很多最优的决策有可能是机器在做。”郑晓龙预计,将来机器能够帮助人做很多事情,但人同时也能帮助机器做很多事情,这意味着,社会将进入人机协同发挥决策优势的阶段。
国内AI创新需要补足差距
郑晓龙表示,我国已形成了新一代人工智能的研究体系,这是有目共睹的科技成就。但同时也应该看到,我国AI产业在原始创新和重大系统性创新等方面仍存在一些挑战,还需要进一步努力。
具体而言,一方面,从0到1的原创性、颠覆性的创新仍然较少。另一方面,“重大系统性集成创新能力还存在进步空间,围绕重大目标持续迭代攻关模式还需进一步完善。”他指出。
在郑晓龙看来,当前火热的文生视频大模型Sora的核心技术有四个特点:第一个是通顺,GPT是通讯文本的生成,Sora则实现了多模态视频连续建模的生成,实现了通顺;第二个是通识,就是全领域知识体系相应的覆盖,它的知识体系比单个的小模型要广,以前我们专业和技术分类总是不停地往下细分,现在则是不停地往外交叉融合,不停地往大的方向去做,这是一种趋势;第三个是通用,即多种自然语言处理和多种视频的通用,还有各种模态间的相互转化,可以从音频到视频、从文本到视频实现通用;第四个就是通常,做大模型前,与机器人进行交互,会明显感觉它是一个机器人,现在大模型出来后,你能感觉到它像个人。
郑晓龙总结了GPT、Sora大火的三个方面的成功因素:“首先是大模型技术的集成,通过诸多的技术集成在一块,这是一个智力密集的工程。其次是人机协同群体的智慧,包括人的标注和计算机的学习方式。最后是大算力和大数据的问题。有了数据基础,再加上算力的一些支撑,美国这方面有相应的一些优势。我们国内在算力这方面现在还需要去提升,就是算力密集的工程。”
为此,郑晓龙认为,加速大模型落地应用是我国当前的重要工作之一。同时,他倡导,应发挥科研人员的热情和多学科交叉的合作,特别是需要将社会科学与人工智能结合,以实现从弱人工智能到强人工智能的发展,并使其造福社会。
“在大模型大到一定程度以后,一定是高度复杂的系统,不是简单凭个人一己之力就能规划出来的。所以,这需要产业中每个具备创新热情的人,有内驱力去从事这份工作,集众人之力协同把产业发展好。”他建议。
在其看来,未来的人工智能产业从业者将是综合型的通识人才,需要具备社会学、经济学、心理学的全学科知识,同时实现交叉融合,从而激活整个产业的创新潜力。