清华与面壁联合开发模型被套壳,两位斯坦福学生作者道歉删除引用

清华与面壁联合开发模型被套壳,两位斯坦福学生作者道歉删除引用

00:00
04:09

6月4日凌晨,斯坦福团队主导的 Llama3-V 开源模型三位发布者中的两位在社交平台X上通过实名认证账号向“小钢炮”团队表示歉意。“团队中另一位名为Mustafa Aljadery的发布者从事了该项目的代码编写工作,我们的角色是在媒体和社交平台上进行推广,此前他并没有告知OpenBMB在这一领域此前已经从事的研究工作。”Aksh Grag和Siddharth Sharma写道。

一位面壁智能的高管对新京报贝壳财经记者表示,“可以简单理解为他们直接拿我们的模型改了个名字,就发布出来变成他们的成果,并且宣传是他们的独立工作。”

此前,不少人工智能专业领域人士在不同平台上表示,上述Llama3-V 开源模型存在抄袭国内清华大学和面壁智能联合开发的开源模型“小钢炮”MiniCPM-Llama3-V 2.5的情况,并且列举了一系列证据,包括模型架构、代码和分词器上的一致。Aksh Grag和Siddharth Sharma正是回应了社交平台X网友的质疑。

Aksh Grag和Siddharth Sharma还写道,他们曾向Mustafa 询问了 Llama3V 的原创性,并要求对方提供训练代码,但到目前为止他们还没有看到任何回复。“由于未能尽全力验证,并且由同行评审这项工作的新颖性,我们向‘小刚炮’的作者们表示歉意。”他们在道歉信中写道。他们还表示将删除所有对Llama3-V 的引用。

6月3日,面壁智能首席科学家、清华大学长聘副教授刘知远在知乎平台回应称:“已经比较确信Llama3-V是对我们MiniCPM-Llama3-V 2.5套壳,比较有意思的证据是MiniCPM-Llama3-V 2.5研发时内置了一个彩蛋,就是对清华简的识别能力。这是我们从清华简逐字扫描并标注的数据集,并未公开,而Llama3-V展现出了一模一样的清华简识别能力,连做错的样例都一样。”

他还表示,“人工智能的飞速发展离不开全球算法、数据与模型的开源共享,我们这次开源的 MiniCPM-Llama3-V 2.5 就用到了最新的Llama3 作为语言模型基座。而开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬。”

6月3日中午,面壁智能 CEO 李大海在其朋友圈发文称:“技术创新不易,每一项工作都是团队夜以继日的奋斗结果,也是以有限算力对全世界技术进步与创新发展作出的真诚奉献。我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”,并且呼吁:“共建开放、合作、有信任的社区环境。加油合作,让世界因 AGI 的到来变得更好!”

此前,海内外开源社区与媒体对这一事件展开热烈讨论。斯坦福人工智能实验室主任Christopher David Manning 发文谴责这一抄袭行为,并且对MiniCPM 这一优异的中国开源模型表示赞扬。谷歌 DeepMind 研究员 Lucas Beyer 表示,中国开源大模型拥有像 MiniCPM 这样好的模型,却没有得到与技术实力相当的国际关注。

以上内容来自专辑
用户评论

    还没有评论,快来发表第一个评论!