前段时间,斯坦福大学人工智能研究院(Stanford HAI)发布了一份报告,表示美国在大模型领域遥遥领先。
报告指出,2023 年 61 个著名的人工智能模型来自美国的机构,远远超过欧盟的 21 个和中国的 15 个。
OpenAI 早期投资人 Vinod Khosla 去年还曾在 X 发文称,美国的开源模型都会被中国抄袭。
然而,一直被认为在「追赶美国」的国产大模型现在却成了被抄袭的对象,而这个抄袭的 AI 团队,正是来自发布上述报告的斯坦福大学。
斯坦福 AI 团队主导的 Llama3-V 开源模型,被揪出涉嫌抄袭国内清华&面壁智能的开源模型「小钢炮」MiniCPM-Llama3-V 2.5,瞬间在 AI 圈里炸开了锅。
在实锤之下,斯坦福团队也不得不紧急道歉。
正如面壁智能 CEO 李大海调侃式的回应,这是一种「受到国际团队认可的方式」。无论我们距离最顶尖的大模型还有多少差距,但国产大模型已经到了不能再被忽视的阶段。
简单梳理一下时间线:
斯坦福 AI 团队发布 Llama3-V,号称 SOTA 多模态大模型
网友质疑该模型抄袭国内面壁智能 MiniCPM-Llama3-V2.5
质疑证据涌现,Llama3-V 作者上演「删库跑路」
面壁智能官方实锤抄袭,深夜给出声明
Llama3-V 作者正式道歉,网友各持己见
抄袭面壁智能「小钢炮」,斯坦福 AI 团队上演「删库跑路」
近日,一个斯坦福 AI 团队宣布,只需 500 美元就可训练出一个超越 GPT-4V 的 SOTA 多模态大模型。
但很快,X 用户 @yangzhizheng1 指出,该项目使用的模型结构和代码与面壁智能不久前发布的 MiniCPM-Llama3-V2.5 惊人地相似。
为此,X 用户 @yangzhizheng1 也放出了相应的质疑证据。
证据一:
Llama3-V 和 MiniCPM-Llama3-V 2.5 的模型结构、代码,简直是复制粘贴级别的相似,区别大概就是换了个马甲——变量名改了改。
就像是同一件衣服,只是换了不同颜色的纽扣,你说巧不巧?
证据二:
Llama3-V 的作者被问到为啥能提前用上还没发布的 MinicPM-Llama3-V2.5 分词器时,他们解释称,用的是面壁智能上一代 MinicPM-V-2 项目。
但有媒体向面壁智能官方求证,在 HuggingFace 中,MiniCPM-V2 与 MiniCPM-Llama3-V 2.5 分词器分别是两个文件,文件大小也完全不同。
更何况,MiniCPM-Llama3-V 2.5 的分词器是用 Llama3 分词器加上 MiniCPM-V 系列模型的特殊 token 组成。
考虑到 MiniCPM-V2 的发布时间早于 Llama3,理论上它不可能包含尚未公开的 Llama3 分词器技术。
证据三:
更离谱的是,llama3-V 项目的作者面对用户的质疑,一看事情不妙,干脆上演了一出「删库跑路」的好戏。
连 GitHub 上的项目页面都撤了,堪称掩耳盗铃 2.0 版本。
Hugging Face 地址如下,目前打开该页面,我们只能看到「404」。
https://huggingface.co/mustafaaljadery/llama3v/commit/3bee89259ecac051d5c3e58ab619e3fafef20ea6
这还没完,更多证据正在不断涌现:
X 用户 @yangzhizheng1 表示如果往 MiniCPM-Llama3-V 2.5 的 checkpoint 添加高斯噪声(由单个标量参数化),出来的模型跟 Llama3-V 就像是一个模子刻出来的。
不仅如此,这模型还能识别「清华简」这种深奥的战国古文字,而且错得都一模一样,用面壁智能官方的话来说:
不仅对得一模一样、连错得都一模一样。
要知道这一古文字数据,是面壁智能和清华大学自然语言处理实验室团队花费数月时间,从清华大学收藏的清华简上逐字扫描并人工标注得来,从未对外公开过。
那斯坦福 AI 团队是如何凭空获得呢?
可以说,面壁智能的连番声明算是彻底实锤了斯坦福 AI 研究团队的抄袭。
直到今天凌晨,斯坦福 Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上就这一学术不端行为向面壁 MiniCPM 团队正式道歉, 表示 Llama3-V 模型将悉数撤下。
名校学霸也抄袭?中国开源大模型正迎头赶上
此事之所以在网络上激起千层浪,一个重要的原因在于抄袭作者的背景实在光鲜。
公开信息显示,Siddharth Sharma 与 Aksh Garg 均是斯坦福大学计算机系的本科生,曾发表过机器学习领域的相关论文。
其中,Siddharth Sharma 曾在亚马逊实习过一段时间,目前主要从事于 AI 和数据相关工作。
而 Aksh Garg 的实习履历,那叫一个丰富,涵盖 SpaceX、斯坦福大学和加州理工学校等知名企业机构。
至于被这上述两位作者称为「代码搬运工」的 Mustafa Aljadery,是南加州大学出身,在舆论发酵之后,目前 X 账号已经被设为隐私状态。
对于斯坦福 Llama3-V 团队的道歉声明,眼尖的网友却不吃这套。
例如,X 用户 @xunie 指出,这哥俩将责任归咎给一个人的甩锅行为,莫不是「有福同享,有难你当」?
斯坦福 AI 实验室主任 Christopher David Manning 也站出来谴责这一抄袭行为,并且对 MiniCPM 这一优异的中国开源模型表示赞扬。
不过,也有网友抱着「得饶人处且饶人」的态度,悠悠然地鼓励道:
开放和诚实是科技界非常重要的价值观,期待你的新作品。
Google DeepMind 研究员 Lucas Beyer 表示,中国开源大模型拥有像 MiniCPM 这样好的模型,但国际上却没给够应有的关注……
面壁智能团队也于昨天对此事进行回应。
面壁智能 CEO 李大海表示:「技术创新不易,每一项工作都是团队夜以继日的奋斗结果,也是以有限算力对全世界技术进步与创新发展作出的真诚奉献。
我们希望团队的好工作被更多人关注与认可,但不是以这种方式。」
面壁智能首席科学家刘知远也在知乎上发文表示,表示这次事件从另一个角度证明了中国创新成果的国际影响力,强调了开源共享的重要性,以及对原创精神的尊重。
不得不说,这出 AI 圈的抄袭大戏,教科书般地诠释了叫「创新不易,且行且珍惜,学术诚信,人人有责」。
要知道,模仿了代码的形,却抄不来那份原创的风姿卓绝。
事实上,自去年以来,中国大模型如同雨后春笋般陆续开源,从以往的受益者转变为贡献者,不吝于向世界提供更多开源的优异成果。
上至阿里巴巴、腾讯等巨头,下至面壁智能,智谱 AI 、昆仑天工等 AI 初创,也都是开源社区的积极分子,为中国大模型的发展添砖加瓦。
我们也盼着,这股子开放共享的春风,能吹得更猛烈些。
正如面壁智能 CEO 李大海所呼吁的那样,大家一起共建开放、合作、有信任的社区环境。加油合作,才能让世界因 AGI 的到来变得更好!
来源:凤凰网科技,APPSO
本文初摘录于:2024-06-05,最后校对或编辑于:2024-06-05
本页面二维码
© 版权声明:
本站资讯仅用作展示网友查阅,旨在传播网络正能量及优秀中华文化,版权归原作者所有。
如有侵权请 联系我们 予以删除处理。
其他事宜可 在线留言 ,无需注册且留言内容不在前台显示。
了解本站及如何分享收藏内容请至 关于我们。谢谢您的支持和分享。
猜您会读:
-
《真实的谎言》30周年:90年代烧掉1亿美元,画面吊打当今特效
《真实的谎言》,在全球特效发展史上写下了浓墨重彩的一笔。文 | 臧剑* 特别感谢谢亚伦、王伟男对本文的贡献部分珍贵照片提供 | 约翰·布鲁诺排版编辑 | Joy作为詹姆斯... 2025-04-23 - 第一批受害者已出现撰文/ 黎炫岐编辑/陈邓新排版/Annalee用AI搜集资料、做PPT、改论文……虽然AI暂时还不能“替代”人类,但不可否认的是,AI正以前所未有的速度,渗透进普通... 2025-04-16
- 2016年,马斯克成立了一家脑机接口公司,名叫Neuralink,宣称要打造出一种让人类大脑和外界进行信息交互的设备,如果此举真的能实现,那未来人类就能实现网友口中的赛博飞升。... 2025-04-06
-
“我们跑高速去试驾都在车上睡”,车企销售人员极力宣传智驾系统的强大功能,淡化风险
4月1日,小米汽车智驾系统引发的事故在汽车行业内引发关注。资深汽车研发工程师周强(化名)在接受新黄河记者采访时指出,国内部分车企在智能驾驶系统的用户引导方面存在缺失... 2025-04-02 - 特朗普周五在白宫高调宣布,将第六代战机交由波音公司生产,并命名为F-47,以维持美国“下一代空中优势”(NGAD)。特朗普炫耀说,“这种隐形飞机几乎看不见,而且拥有前所未... 2025-03-23
- 作者 | 姚西西来源 | 华商韬略(ID:hstl8888)33岁的刘靖康,等来了证监会的批复,不出意外,他将是科创板最年轻的董事长之一。他一手创立的影石创新(Insta360),用9年... 2025-03-21
- 2025刚开年,来自杭州的两个年轻人,震撼了全球科技圈,到今天关于他们的讨论热度丝毫未减,成了这个春节当之无愧的“顶流”。他们就是宇树科技的创始人王兴兴与深度求索(Dee... 2025-03-17
- 媒体并没带来更多有价值的思想;技术并没真正促进公平正义,当这两个怪物狼狈为奸时,资本站在旁边猥琐的窃笑,他们要收割百姓。现在的AI最大能耐就是吓唬,不学习就要淘汰,... 2025-03-14
- 据《南华早报》报道,中国科学家已经研发出一款基于激光的全球最强大摄像机,能够从近地轨道识别辨别人脸等微小细节。报道指出,这款摄像机由中国科学院航空航天信息研究所的... 2025-03-13
-
比Deepseek还强的Manus(马牛死)爆火:打工人的天彻底塌了
时代的列车太快,一不小心就闪了我的老腰。前几天我还信誓旦旦地说:AI只是工具,只是我们未来工作的协作者。没想到打脸来得这么快,Manus横空出世,彻底改变了我的想法。如果... 2025-03-12 - 3月10日,人民日报新媒体发布《献给春天的演讲:相信》。讲述人王兴兴是个“90后”,他开创了全球低成本高性能足式机器人的技术先河。他和团队研发的四足机器人已占全球近7成... 2025-03-11
-
众所周知,在这个信息时代,大家已经被铺天盖地的广告覆盖,想要使用浏览器搜索一下问题,前面几页都能是广告推广,极其夸张。但最近某款导航软件,更是将离谱妈妈给小离谱开... 2025-05-10
- 【文/观察者网 阮佳琪】当地时间5月8日,路透社援引两名美国官员的消息报道称,在7日的印巴短暂“空战”中,一架由中国制造的巴基斯坦歼-10战斗机成功击落了至少两架印度军用... 2025-05-10
-
“她的副院长父亲”成怀疑对象!本科生发14篇SCI论文事件细节曝光
5月7日,《重庆这8位同学获国家奖学金》的微信公众号推文提到,来自重庆大学化学化工学院四年级的学生刘某乔已发表十余篇SCI论文,并获得多项国家发明专利授权。有网友质疑:... 2025-05-09 -
印度总理莫迪首次公开发声:在7日与巴基斯坦爆发近20年来最严重的军事冲突后,印度总理莫迪8日召开政府部长会议,称国家处于“敏感时期”,敦促各部门“持续保持警惕”并“保... 2025-05-09
-
2025年4月底,中国政府正式发布了《关于新冠疫情防控与病毒溯源的中方行动和立场》白皮书,开宗明义指出一个被西方反复回避的问题:美国在全球关注的生物安全议题上,至今未向... 2025-05-08
- 极目新闻记者 郭一近日,有网友发视频反映,江西省第三大水库抚州市南城县洪门水库被当地公司承包。该网友质疑称,该公司成立短短数日,是否有参与竞拍的资格。极目新闻记者... 2025-05-07
- 这几天,中日友好医院的事儿连番升级,素材丰富,一波比一波好看。我们办公室一边吃瓜,一边感叹:真好看啊,网友们把祖宗十八代都翻个底儿掉的挖掘能力,从来不会让人失望。... 2025-05-06
- 现代快报讯(记者 宋体佳 张宇) 男性也能患子宫肌瘤、卵巢囊肿?近日,网友“李大海说”向现代快报记者反映,他在知网检索发现,有30余篇医学论文内容荒诞、涉嫌学术造假,... 2025-05-06
-
网红称“胖东来玉石获百倍暴利”,许昌市监部门:平均毛利不超20%
近日,按照五一节期间工作安排,结合网络上关于许昌胖东来销售和田玉有关情况的反映,许昌市市场监督管理局魏都区分局对时代广场销售和田玉的胖东来唯初珠宝有限公司开展了日... 2025-05-06 -
“听泉赏宝”首谈学历风波:我已经到了普通人的极限,不靠直播吃饭
近日,鉴宝博主“听泉赏宝”在直播中谈到了去年的学历风波。“听泉赏宝”表示:“六七月份出那个北大学历的事,我当时最高峰的时候直播间是将近200万人。他们让我赶紧趁这个时... 2025-05-06