前段时间,斯坦福大学人工智能研究院(Stanford HAI)发布了一份报告,表示美国在大模型领域遥遥领先。
报告指出,2023 年 61 个著名的人工智能模型来自美国的机构,远远超过欧盟的 21 个和中国的 15 个。
OpenAI 早期投资人 Vinod Khosla 去年还曾在 X 发文称,美国的开源模型都会被中国抄袭。
然而,一直被认为在「追赶美国」的国产大模型现在却成了被抄袭的对象,而这个抄袭的 AI 团队,正是来自发布上述报告的斯坦福大学。
斯坦福 AI 团队主导的 Llama3-V 开源模型,被揪出涉嫌抄袭国内清华&面壁智能的开源模型「小钢炮」MiniCPM-Llama3-V 2.5,瞬间在 AI 圈里炸开了锅。
在实锤之下,斯坦福团队也不得不紧急道歉。
正如面壁智能 CEO 李大海调侃式的回应,这是一种「受到国际团队认可的方式」。无论我们距离最顶尖的大模型还有多少差距,但国产大模型已经到了不能再被忽视的阶段。
简单梳理一下时间线:
斯坦福 AI 团队发布 Llama3-V,号称 SOTA 多模态大模型
网友质疑该模型抄袭国内面壁智能 MiniCPM-Llama3-V2.5
质疑证据涌现,Llama3-V 作者上演「删库跑路」
面壁智能官方实锤抄袭,深夜给出声明
Llama3-V 作者正式道歉,网友各持己见
抄袭面壁智能「小钢炮」,斯坦福 AI 团队上演「删库跑路」
近日,一个斯坦福 AI 团队宣布,只需 500 美元就可训练出一个超越 GPT-4V 的 SOTA 多模态大模型。
但很快,X 用户 @yangzhizheng1 指出,该项目使用的模型结构和代码与面壁智能不久前发布的 MiniCPM-Llama3-V2.5 惊人地相似。
为此,X 用户 @yangzhizheng1 也放出了相应的质疑证据。
证据一:
Llama3-V 和 MiniCPM-Llama3-V 2.5 的模型结构、代码,简直是复制粘贴级别的相似,区别大概就是换了个马甲——变量名改了改。
就像是同一件衣服,只是换了不同颜色的纽扣,你说巧不巧?
证据二:
Llama3-V 的作者被问到为啥能提前用上还没发布的 MinicPM-Llama3-V2.5 分词器时,他们解释称,用的是面壁智能上一代 MinicPM-V-2 项目。
但有媒体向面壁智能官方求证,在 HuggingFace 中,MiniCPM-V2 与 MiniCPM-Llama3-V 2.5 分词器分别是两个文件,文件大小也完全不同。
更何况,MiniCPM-Llama3-V 2.5 的分词器是用 Llama3 分词器加上 MiniCPM-V 系列模型的特殊 token 组成。
考虑到 MiniCPM-V2 的发布时间早于 Llama3,理论上它不可能包含尚未公开的 Llama3 分词器技术。
证据三:
更离谱的是,llama3-V 项目的作者面对用户的质疑,一看事情不妙,干脆上演了一出「删库跑路」的好戏。
连 GitHub 上的项目页面都撤了,堪称掩耳盗铃 2.0 版本。
Hugging Face 地址如下,目前打开该页面,我们只能看到「404」。
https://huggingface.co/mustafaaljadery/llama3v/commit/3bee89259ecac051d5c3e58ab619e3fafef20ea6
这还没完,更多证据正在不断涌现:
X 用户 @yangzhizheng1 表示如果往 MiniCPM-Llama3-V 2.5 的 checkpoint 添加高斯噪声(由单个标量参数化),出来的模型跟 Llama3-V 就像是一个模子刻出来的。
不仅如此,这模型还能识别「清华简」这种深奥的战国古文字,而且错得都一模一样,用面壁智能官方的话来说:
不仅对得一模一样、连错得都一模一样。
要知道这一古文字数据,是面壁智能和清华大学自然语言处理实验室团队花费数月时间,从清华大学收藏的清华简上逐字扫描并人工标注得来,从未对外公开过。
那斯坦福 AI 团队是如何凭空获得呢?
可以说,面壁智能的连番声明算是彻底实锤了斯坦福 AI 研究团队的抄袭。
直到今天凌晨,斯坦福 Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上就这一学术不端行为向面壁 MiniCPM 团队正式道歉, 表示 Llama3-V 模型将悉数撤下。
名校学霸也抄袭?中国开源大模型正迎头赶上
此事之所以在网络上激起千层浪,一个重要的原因在于抄袭作者的背景实在光鲜。
公开信息显示,Siddharth Sharma 与 Aksh Garg 均是斯坦福大学计算机系的本科生,曾发表过机器学习领域的相关论文。
其中,Siddharth Sharma 曾在亚马逊实习过一段时间,目前主要从事于 AI 和数据相关工作。
而 Aksh Garg 的实习履历,那叫一个丰富,涵盖 SpaceX、斯坦福大学和加州理工学校等知名企业机构。
至于被这上述两位作者称为「代码搬运工」的 Mustafa Aljadery,是南加州大学出身,在舆论发酵之后,目前 X 账号已经被设为隐私状态。
对于斯坦福 Llama3-V 团队的道歉声明,眼尖的网友却不吃这套。
例如,X 用户 @xunie 指出,这哥俩将责任归咎给一个人的甩锅行为,莫不是「有福同享,有难你当」?
斯坦福 AI 实验室主任 Christopher David Manning 也站出来谴责这一抄袭行为,并且对 MiniCPM 这一优异的中国开源模型表示赞扬。
不过,也有网友抱着「得饶人处且饶人」的态度,悠悠然地鼓励道:
开放和诚实是科技界非常重要的价值观,期待你的新作品。
Google DeepMind 研究员 Lucas Beyer 表示,中国开源大模型拥有像 MiniCPM 这样好的模型,但国际上却没给够应有的关注……
面壁智能团队也于昨天对此事进行回应。
面壁智能 CEO 李大海表示:「技术创新不易,每一项工作都是团队夜以继日的奋斗结果,也是以有限算力对全世界技术进步与创新发展作出的真诚奉献。
我们希望团队的好工作被更多人关注与认可,但不是以这种方式。」
面壁智能首席科学家刘知远也在知乎上发文表示,表示这次事件从另一个角度证明了中国创新成果的国际影响力,强调了开源共享的重要性,以及对原创精神的尊重。
不得不说,这出 AI 圈的抄袭大戏,教科书般地诠释了叫「创新不易,且行且珍惜,学术诚信,人人有责」。
要知道,模仿了代码的形,却抄不来那份原创的风姿卓绝。
事实上,自去年以来,中国大模型如同雨后春笋般陆续开源,从以往的受益者转变为贡献者,不吝于向世界提供更多开源的优异成果。
上至阿里巴巴、腾讯等巨头,下至面壁智能,智谱 AI 、昆仑天工等 AI 初创,也都是开源社区的积极分子,为中国大模型的发展添砖加瓦。
我们也盼着,这股子开放共享的春风,能吹得更猛烈些。
正如面壁智能 CEO 李大海所呼吁的那样,大家一起共建开放、合作、有信任的社区环境。加油合作,才能让世界因 AGI 的到来变得更好!
来源:凤凰网科技,APPSO
本文初摘录于:2024-06-05,最后校对或编辑于:2024-06-05
本页面二维码
© 版权声明:
本站资讯仅用作展示网友查阅,旨在传播网络正能量及优秀中华文化,版权归原作者所有。
如有侵权请 联系我们 予以删除处理。
其他事宜可 在线留言 ,无需注册且留言内容不在前台显示。
了解本站及如何分享收藏内容请至 关于我们。谢谢您的支持和分享。
猜您会读:
- 华为创始人兼CEO任正非与ICPC(国际大学生程序设计竞赛)主席、教练及获奖选手座谈会纪要曝光,座谈时间是今年10月14日。在座谈中,针对不同国家选手的提问,任正非谈到了不同国... 2024-10-31
- AI 的疯狂飞跃——你可能不想被甩在后面想象一下,有一天醒来发现人工智能在一夜之间彻底革新了世界。听起来遥不可及?其实比你想象的更近。很多人并没有意识到 AI 发展的... 2024-10-19
- 黄晓明今年46岁了,无论他有多迷恋偶像剧霸总人设,群众也不会再惯着他了。一个网红女朋友,又一次把这位影星送上了舆论高地。人到中年,一次官宣换来终生内向。网友不仅没有... 2024-10-17
- 财联社10月10日讯,据中山大学微信公众号,10月9日,中山大学医学院施莽教授团队与阿里云李兆融团队在《细胞》杂志(Cell)发表论文报告了180个超群、超过16万种全球RNA病毒的... 2024-10-11
- 作者:王选(1937年2月5日-2006年2月13日),计算机专家,1991年当选为中国科学院院士,1994年当选为中国工程院院士,获得2001年度国家最高科学技术奖。本文系王选院士于2002... 2024-10-10
- 兄弟们,终于来了!当被问及月球上能不能上网时,主任霸气回答:“在月球上肯定会有无线网,能源肯定有”。而且主任还顺带说了一句:“能不能种菜,科学家还在研究。”种菜、... 2024-10-06
-
OpenAI机密泄露!前苹果设计总监爆料正合作开发神秘硬件产品
近期,前苹果设计总监Jony Ive终于打破沉默,确认正在与OpenAI合作开发一款神秘的硬件设备。这一爆料迅速引发了科技圈的热议,毕竟,这位曾一手打造iPhone、iPad、MacBook的... 2024-09-26 -
大厂集体沉默,甚至封锁信息,AI背后的肮脏远超想象......
大厂们可能不会告诉你,人工智能技术正在对地球造成巨大的负担,而这背后的真相被紧紧隐藏。想象一下,你走进一家电子产品店,正打算购买一台新笔记本电脑。这款新设备功能强... 2024-09-22 - 众所周知,面对中国电动汽车产业出海这件事,整个欧美可以说是如临深渊,在美国带头搞起关税壁垒以后,西方各国纷纷出台了歧视性的关税政策。但问题在于,在欧美市场,欧美确... 2024-09-09
- 【今天讲一张照片的故事,主要内容据“万维钢精英日课”整理。】奥巴马的这张照片很有名,堪称担任美国总统时他搞笑照片的代表作。2010年8月9日,总统出访行程中,一随行人员... 2024-09-07
- 2022年珠海航展上,一个名为南天门计划的航天舰队项目进入公众视野。它引起了西方国家的广泛关注和担忧,因为它太科幻了。那时候,许多军迷也把这个理解为战忽局的新生意。但2... 2024-09-04
-
山西太原市清徐县政府门前花1305万建仿真椰子树等,中央点名通报后连夜拆除
11月12日,据新华社报道,中央层面整治形式主义为基层减负专项工作机制办公室会同中央纪委办公厅对3起整治形式主义为基层减负典型问题进行通报。其中,山西太原市清徐县违规使... 2024-11-13 - 2024年11月11日19时48分许,珠海发生一起驾车冲撞市民重大恶性案件。12日,珠海市公安局发布警情通报,案件致35人死亡,43人受伤。11月11日傍晚7点50分左右,恰好是很多人吃过... 2024-11-13
- 西方媒体曝光普京与特朗普对话细节11月10日消息,俄罗斯总统弗拉基米尔·普京和赢得美国总统选举成为美国新任总统的唐纳德·特朗普在电话交谈中讨论了停止乌克兰敌对行动的可... 2024-11-11
-
撞上劳斯莱斯的货车司机:有过逃跑的闪念,若没免责,倾家荡产也要赔
撞上劳斯莱斯的货车司机:有过逃跑的闪念,若没免责,倾家荡产也要赔回想起撞上劳斯莱斯时的画面,李先生仍心有余悸。11月4日临近下午5时,货车禁行时间快到了,他有些着急,... 2024-11-09 - 关注国际时事的朋友可能对徐德智这个名字并不陌生,他是央视驻联合国的一位记者,曾是驻叙利亚的战地记者。近日,他在自己个人的社交账号上公布了一张截图,内容是有一个疑似... 2024-11-03
- 新京报记者 吴为 编辑 刘茜贤 校对 刘军据东阿阿胶微信公众号消息,11月2日,东阿阿胶股份有限公司发布《关于积极响应国家医保局有关公告的声明》。全文如下:近期,我公... 2024-11-03
-
特朗普威胁要分裂俄罗斯和中国。他称俄罗斯和中国之间的友谊是拜登的耻辱
11月1日消息,美国共和党总统候选人、美国前总统唐纳德·特朗普威胁称,如果他赢得即将到来的美国总统大选,他将分裂俄罗斯和中国。他是在接受记者塔克·卡尔森采访时做出上述... 2024-11-02 -
河北保定曲阳县4名女高中生称搭讪被拒遭殴打:3名打人者已被抓获
近日,河北保定市曲阳县一餐馆内,4名女高中生称搭讪被拒,遭几名男子殴打,有女生被打得满脸是血。10月31日下午,曲阳县权威部门人士告诉极目新闻记者,目前3名打人者已被抓... 2024-10-31 - 据福建日报,10月29日,福建省贯彻落实《中共中央国务院关于支持福建探索海峡两岸融合发展新路建设两岸融合发展示范区的意见》系列新闻发布会(第四场)在福州举行。会上发布... 2024-10-30
-
中国地质调查局原党组书记、局长钟自然,故意泄露国家秘密,情节严重
高检网10月25日消息,自然资源部原党组成员,中国地质调查局原党组书记、局长钟自然涉嫌受贿、故意泄露国家秘密一案,由国家监察委员会调查终结,经最高人民检察院指定,由浙... 2024-10-26