98年“AI天才”、面壁智能CTO曾国洋:我像在创造一个新的智能生命体

【环球时报报道 记者 杨沙沙 胡雨薇 王冬】美国斯坦福大学三名学生组成的一个AI(人工智能)团队,抄袭中国大模型公司“面壁智能”的开源成果“小钢炮”MiniCPM-Llama3-V 2.5的闹剧,引发中美AI技术研发速度的对比。“斯坦福抄袭事件”发生后,《环球时报》记者在第六届北京智源大会见到了面壁团队,无论是创始人刘知远、还是CEO李大海,都尽力淡化此事。而面壁CTO(首席技术官)曾国洋的亮相,引起很多关注。这位被称为“AI天才”的26岁男孩,上台时还被主持人笑问“毕业了么”。被称为“AI界春晚”的北京智源大会是一个纯技术的会场,现场云集众多国内外AI领域人才,让《环球时报》记者十分好奇,中国AI界的生态什么样?“抄袭事件”是否对中国AI界产生震动?中国和美国在AI研发上,处于一种什么状态?《环球时报》记者就此专访了曾国洋。
图片
曾国洋接受《环球时报》专访。 王 冬摄
抄袭事件涟漪
抄袭事件过去三周后,曾国洋从他自己的视角对《环球时报》记者还原此事。“最开始知道此事,还是来自开源网站GitHub的一些用户反馈,我们找到一些相关线索和证据,最终证明(斯坦福大学)确实发生了一个不太好的套壳现象。”曾国洋表示,事件最终以斯坦福本科生团队通过邮件形式道歉、删除相关的代码和产品收尾。
对此,斯坦福AI实验室主任曼宁发文谴责抄袭学生,并称MiniCPM“是很好的开源作品”。曾国洋表示,事件发生后,感受到挺多人的支持,也让更多人了解到,在开源领域很多中国大模型是值得关注的。
面壁智能首席科学家、清华大学长聘副教授刘知远接受《环球时报》记者采访时也表达了同样的感受,他认为,包括面壁在内的中国大模型,并不是因为抄袭事件才受到关注,之前中国在AI领域研发进展已经被关注。
一直被认为在“追赶美国”的国产大模型现在成了被抄袭的对象,是否意味着中国已经领先?曾国洋认为,不能说中美研发水平谁在前谁在后,而是一个“你追我赶”的状态。在开源领域,中国一直是大模型领域非常重要的一个玩家,中美都会不断有前沿的突破性成果出现。尽管很多国家相关研究机构也参与到大模型研发当中,“但在声量上,目前还是以美国和中国比较重要的重量级玩家为主”。
刘知远表示,在学术研究方面,10年前中国已能在国际上发表很多不错的学术论文。但他向记者一针见血地指出,相比国外,目前国内重复开发基础大模型是一种跟风、浪费,国内需把高质量制造大模型的平台系统搭建出来。他称之为建造“大模型光刻机”。
“光刻机的科学原理我们也掌握,但中国高端光刻机被‘卡脖子’,根本原因是我们在系统化、平台化方面做得没那么好。”刘知远以美国人工智能初创企业OpenAI为例说,ChatGPT推出来时,列出的贡献者有数百人,但到今年2月,文生视频大模型Sora问世,核心成员只有13人。这中间发生了什么?刘知远认为,OpenAI将此前大量程序员、科学家等完成的基础工作自动化、平台化,形成了自己的“大模型的光刻机”。Sora在这个基础上研发,自然不需要那么多人参与。
刘知远表示,需要更加清醒地认识到中国和先进技术水平的真实差距,“如果我们只是满足于复现ChatGPT,那就意味着我们以后不可能做出Sora、ChatGPT4o来。我们要把自己的‘大模型光刻机’给造出来,这是我们要努力的方向。”
“《三体》影响了我的职业方向”
曾国洋是刘知远在清华的学生,8岁自学编程、奥赛冠军保送清华。2015年年底,当奥尔特曼、马斯克等人创立OpenAI时,那时17岁的曾国洋,第一次接触AI概念。
曾国洋最早接触大模型,是OpenAI于2020年5月发布的GPT-3,当时他第一时间就去注册账号尝试,他感觉到“人工智能将有重大突破性机会,在未来一定有很大想象空间”,这也促成刘知远、曾国洋等人在2020年年底决定做国内第一个大模型。
“2019年那段时间,我们觉得,在NLP(Natural Language Processing, 自然语言处理,是计算机科学领域与AI领域中的一个重要方向——编者注)领域,我们已和国外基本上没有太大差距。但是GPT-3出现后,对NLP领域带来很大冲击。”他说。
2021年,刘知远牵头成立了面壁智能,清华计算机本科毕业的曾国洋是三个创业核心人物之一。为什么叫面壁?曾国洋回忆,他们先是创立一个人工智能开源社区叫OpenBMB,BMB读起来很像“面壁”,同时团队里有很多人是中国科幻作家刘慈欣科幻小说《三体》的粉丝,“面壁者”又在《三体》中扮演非常重要的角色,最后团队选择用“面壁智能”这个富有科技感的名字。曾国洋说,自己非常喜欢《三体》,“可以说,刘慈欣老师的《三体》影响了包括我在内中国一批人的职业方向”。
从10人到100人
在美国,也有一批年轻人在AI领域创业。Sora的核心团队最小成员出生于2003年。美国AI初创公司Pika labs的创始团队成员仅有4人,其中一个据称是95后的“杭州哈佛女孩”郭文景。曾国洋表示,大模型是一个新的技术变革,给了很多具有挑战精神、愿意尝试新技术的年轻人改变自己的机会。
在中国AI这个新兴领域,既有白发苍苍的学者,也有像曾国洋这样的年轻人。在第六届北京智源大会上,《环球时报》记者看到,一位中年工程师现场提问时,恭恭敬敬喊曾国洋“老师”。曾国洋表示,中国AI圈内并不是论资排辈,大家都互相称呼“老师”,大家都乐于去学习、接受新思想,主动去学习一些自己不懂的技术。
工作之余,曾国洋喜欢看新闻、去开源社区交流,甚至有时候还特别怀念写代码的日子。去年年初,面壁团队只有10个人不到,目前已经扩展到100多人,曾国洋需要整体负责大模型的研发工作。26岁,当很多年轻人大学刚毕业走上工作岗位,曾国洋已经是面壁智能公司的CTO。
对于外界称呼他是“AI天才”“中国版谢尔顿”,曾国洋坦言自己一直以来学习“还行”,也没看过美剧《少年谢尔顿》。“加入到计算机领域,去做人工智能,一直以来都是我的兴趣爱好在驱动着我,AI是一种非常非常有创造力的工作,我的工作就像在创造一个新的智能生命体一样。”曾国洋说,更愿意称呼自己是“AI艺术家”,“我在创造一个艺术性的生物”。
未来,AI能否取代人类?曾国洋认为,AI未来将作为一个助手去提升人类工作效率,并不能完全取代人类。对于AI完全取代了人类工作,这位26岁的年轻人有点向往,“也许人类可能就不需要工作了,会做一些更有创造性的事情,或者做自己特别想要做的事情”。