斯坦福学生AI团队致歉抄袭中国大模型代码作者曾发声回应质疑：我没有

00:00

07:04

近日，由美国斯坦福大学三名学生组成的一个AI团队发布了开源模型Llama3-V，该模型很快被网友发现与中国大模型公司“面壁智能”的开源成果MiniCPM-Llama3-V 2.5拥有极为相似的模型架构与代码，引发“抄袭”质疑。

当地时间6月3日，Llama3-V团队的其中两名成员森德哈斯·沙玛和阿克沙·加格通过社交平台X发表道歉声明，向“面壁智能”的MiniCPM团队正式道歉，并表示将从网上撤下这一模型。

涉事学生“甩锅”软件工程师？

值得注意的是，前述道歉声明中提到，该模型代码的作者其实是团队的第三名成员——穆斯塔法·阿尔贾德里，该道歉声明还提到穆斯塔法“已经失联”。根据斯坦福大学官网显示，森德哈斯和阿克沙均为斯坦福大学计算机科学系的本科学生。

穆斯塔法在社交平台X的账号已经开启了访客权限。其职业社交平台领英账号资料显示，穆斯塔法本科毕业于美国南加州大学的计算机科学系。值得注意的是，他现在的身份并不是学生。从2023年9月至今，其在一家名为“beehiiv”的公司担任软件工程师。据了解，该公司创立于2021年，专门为创作者和出版商提供软件构建服务。

穆斯塔法的领英资料

穆斯塔法曾为音乐公司设计过网站，也自创过AI博客生成器，还参与撰写了三本有关微积分的教科书。此外，穆斯塔法自学了彭博公司针对在校学生及金融行业新人设计开发的“彭博市场概念”课程并获得了证书。

网友三“锤”揭发“抄袭”过程

红星新闻记者梳理发现，早在6月2日，在开源网站GitHub上，就有一个IP定位在中国厦门、用户名为“PZC163”的网友公开了整个“抄袭”事件的过程，并质疑斯坦福大学AI团队主导的Llama3-V开源模型抄袭“清华系创投”公司“面壁智能”的开源模型MiniCPM-Llama3-V 2.5。

“PZC163”发文称，“MiniCPM-Llama3-V 2.5项目的作者，几天前我发现了一个令人震惊的事实。Llama3-V项目中有大量内容疑似是从MiniCPM-Llama3-V 2.5项目中窃取的，当我提出质疑后，Llama3-V的作者很快删除了我的帖子，并隐藏了Llama3-V项目的相关页面。我强烈质疑他们的所作所为，接下来我将公布所有证据，也敦促你们注意这一事件。”

用户“PZC163”提出了三个证据：首先，其指出MiniCPM-Llama3-V 2.5和Llama3-V项目使用的模型结构和代码几乎是一模一样。其提到，Llama3-V的分词器与MiniCPM-Llama3-V 2.5完全相同。

其次，“PZC163”强调穆斯塔法此前的回应有逻辑漏洞，其可以证明对方在撒谎。据悉，穆斯塔法曾回应称，自己在项目中使用了MiniCPM-Llama3-V 2.5的分词器，还称“我们在MiniCPM-Llama3-V 2.5发布前就已经开始了这项工作”。

“PZC163”称，当自己质疑代码作者“如何在MiniCPM-Llama3-V 2.5发布前就使用MiniCPM-Llama3-V 2.5分词器”时，穆斯塔法辩称其使用的分词器来源于开源大模型网络平台Huggingface上的MinicPM-V-2分词器。“但事实是，MinicPM-V-2的分词器跟MinicPM-Llama3-V 2.5的分词器完全不一样。”

最后，“PZC163”直指Llama3-V代码的作者完全不了解自己的代码，“比如说，感知器重采样器应该是单层交叉注意力，而不是双层交叉注意力”。

从开源网站“复制”算不算“抄袭”？

在面对“PZC163”的质疑时，穆斯塔法一开始予以直接否认，并解释称：“我们在Llama3-V项目的代码版本管理中使用了MiniCPM-Llama3的配置，因为在我测试了很多配置后，发现MiniCPM-Llama3的配置与Llama3-V在Huggingface的Transformer库里进行模型训练时是匹配的。”

穆斯塔法强调称，MiniCPM-Llama3的编程结构来自IDEFICS。自己的Llama3-V项目是在研究了各个开源大模型的基础上，进行了创新。他还表示，如同MiniCPM-Llama3在基于IDEFICS开源模型结构上也有了自己的创新，这不能定性为抄袭。

Llama3-V团队在道歉声明中称，其已要求团队成员穆斯塔法提供训练代码，但目前未收到任何相关回应。

有分析认为，目前来看，对于大模型“套壳”没有明确的界定。开源大模型以及开源社区的构建初衷，是促进技术的共享和交流、加速AI的发展，如果以这种直接“套壳”的形式使用，或许会与这一发展愿景背道而驰。

以上内容来自专辑

主播信息

红星新闻

红星新闻是成都传媒集团致力打造的一款聚焦热点新闻的主流新兴媒体，这里是真相与思想的交汇之地。这里聚集了中国优秀的调查新闻记者，拥有真知灼见的评论员；国内国际有价值的新闻，红星新闻都会冲在第一线。

14.04万

加关注

还没有评论，快来发表第一个评论！

斯坦福学生AI团队致歉抄袭中国大模型代码作者曾发声回应质疑：我没有

红星新闻｜听热点

红星新闻

英语新闻丨错例都一样！斯坦福学生团队致歉抄袭中国大模型

热点解析33 | 斯坦福AI团队抄袭中国大模型，中国AI水平离美国更近一步了吗？

2024年6月6日【面壁智能回应被斯坦福AI团队抄袭：连错的样例都一样】

面壁智能CEO回应斯坦福某AI团队抄袭｜河北省住房公积金变为月取

6月10日实锤了！斯坦福学生抄袭国内大模型！别忽视这个细节

斯坦福学生AI团队致歉抄袭中国大模型 代码作者曾发声回应质疑：我没有

红星新闻｜听热点

红星新闻

英语新闻丨错例都一样！斯坦福学生团队致歉抄袭中国大模型

热点解析33 | 斯坦福AI团队抄袭中国大模型，中国AI水平离美国更近一步了吗？

2024年6月6日【面壁智能回应被斯坦福AI团队抄袭：连错的样例都一样】

面壁智能CEO回应斯坦福某AI团队抄袭｜河北省住房公积金变为月取

6月10日 实锤了！斯坦福学生抄袭国内大模型！别忽视这个细节

斯坦福学生AI团队致歉抄袭中国大模型代码作者曾发声回应质疑：我没有

6月10日实锤了！斯坦福学生抄袭国内大模型！别忽视这个细节