斯坦福AI项目套壳中国大模型被抓包,抄袭团队致歉并承诺撤下相关模型

近日,斯坦福大学AI团队主导的 Llama3-V 开源模型被证实套壳抄袭国内清华与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5一事,在网络上引发热议。
最初是网友发现吗,一个斯坦福AI团队的Llama3-V模型使用的模型结构和代码与面壁智能不久前发布的MiniCPM-Llama3-V2.5极为相似,仅修改了部分变量名。Llama3-V也具有与MiniCPM-Llama3-V 2.5相同的分词器,包括后者新定义的特殊符号。
随后面壁智能团队确认该模型确实涉嫌抄袭。
目前,斯坦福Llama3-V团队的两位作者Siddharth Sharma(森德哈斯·沙玛)和 Aksh Garg(阿克沙·加格)在社交平台上就这一学术不端行为向面壁MiniCPM团队正式道歉,并表示会将Llama3-V模型悉数撤下。
不过Aksh Garg(阿克沙·加格)称另一名作者已经无法联系到,他还指出自己和Siddharth Sharma主要是负责模型推广,联系不上的那位作者主要编写代码。
他在回应中表示“我们(包括Siddharth Sharma)俩查看了最新的论文,以验证这项工作的新颖性,但并未被告知或意识到OpenBMB(清华团队支持发起的大规模预训练语言模型库与相关工具)之前的任何工作。我们向作者道歉,并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任,并已撤下Llama3-V,再次致歉。”
另外,斯坦福人工智能实验室主任Christopher David Manning也发文谴责这一抄袭行为,并对MiniCPM这一中国开源模型表示赞扬。(第一财经)