斯坦福AI项目套壳中国大模型被抓包，抄袭团队致歉并承诺撤下相关模型

三言科技

2024-06-04 13:18发布于北京三言财经官方账号

近日，斯坦福大学AI团队主导的 Llama3-V 开源模型被证实套壳抄袭国内清华与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5一事，在网络上引发热议。

最初是网友发现吗，一个斯坦福AI团队的Llama3-V模型使用的模型结构和代码与面壁智能不久前发布的MiniCPM-Llama3-V2.5极为相似，仅修改了部分变量名。Llama3-V也具有与MiniCPM-Llama3-V 2.5相同的分词器，包括后者新定义的特殊符号。

随后面壁智能团队确认该模型确实涉嫌抄袭。

目前，斯坦福Llama3-V团队的两位作者Siddharth Sharma（森德哈斯·沙玛）和 Aksh Garg（阿克沙·加格）在社交平台上就这一学术不端行为向面壁MiniCPM团队正式道歉，并表示会将Llama3-V模型悉数撤下。

不过Aksh Garg（阿克沙·加格）称另一名作者已经无法联系到，他还指出自己和Siddharth Sharma主要是负责模型推广，联系不上的那位作者主要编写代码。

他在回应中表示“我们（包括Siddharth Sharma）俩查看了最新的论文，以验证这项工作的新颖性，但并未被告知或意识到OpenBMB（清华团队支持发起的大规模预训练语言模型库与相关工具）之前的任何工作。我们向作者道歉，并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任，并已撤下Llama3-V，再次致歉。”

另外，斯坦福人工智能实验室主任Christopher David Manning也发文谴责这一抄袭行为，并对MiniCPM这一中国开源模型表示赞扬。（第一财经）