前段时间,斯坦福大学人工智能研究院(Stanford HAI)发布了一份报告,表示美国在大模型领域遥遥领先。
报告指出,2023 年 61 个著名的人工智能模型来自美国的机构,远远超过欧盟的 21 个和中国的 15 个。
OpenAI 早期投资人 Vinod Khosla 去年还曾在 X 发文称,美国的开源模型都会被中国抄袭。
然而,一直被认为在「追赶美国」的国产大模型现在却成了被抄袭的对象,而这个抄袭的 AI 团队,正是来自发布上述报告的斯坦福大学。
斯坦福 AI 团队主导的 Llama3-V 开源模型,被揪出涉嫌抄袭国内清华&面壁智能的开源模型「小钢炮」MiniCPM-Llama3-V 2.5,瞬间在 AI 圈里炸开了锅。
在实锤之下,斯坦福团队也不得不紧急道歉。
正如面壁智能 CEO 李大海调侃式的回应,这是一种「受到国际团队认可的方式」。无论我们距离最顶尖的大模型还有多少差距,但国产大模型已经到了不能再被忽视的阶段。
简单梳理一下时间线:
斯坦福 AI 团队发布 Llama3-V,号称 SOTA 多模态大模型
网友质疑该模型抄袭国内面壁智能 MiniCPM-Llama3-V2.5
质疑证据涌现,Llama3-V 作者上演「删库跑路」
面壁智能官方实锤抄袭,深夜给出声明
Llama3-V 作者正式道歉,网友各持己见
抄袭面壁智能「小钢炮」,斯坦福 AI 团队上演「删库跑路」
近日,一个斯坦福 AI 团队宣布,只需 500 美元就可训练出一个超越 GPT-4V 的 SOTA 多模态大模型。
但很快,X 用户 @yangzhizheng1 指出,该项目使用的模型结构和代码与面壁智能不久前发布的 MiniCPM-Llama3-V2.5 惊人地相似。
为此,X 用户 @yangzhizheng1 也放出了相应的质疑证据。
证据一:
Llama3-V 和 MiniCPM-Llama3-V 2.5 的模型结构、代码,简直是复制粘贴级别的相似,区别大概就是换了个马甲——变量名改了改。
就像是同一件衣服,只是换了不同颜色的纽扣,你说巧不巧?
证据二:
Llama3-V 的作者被问到为啥能提前用上还没发布的 MinicPM-Llama3-V2.5 分词器时,他们解释称,用的是面壁智能上一代 MinicPM-V-2 项目。
但有媒体向面壁智能官方求证,在 HuggingFace 中,MiniCPM-V2 与 MiniCPM-Llama3-V 2.5 分词器分别是两个文件,文件大小也完全不同。
更何况,MiniCPM-Llama3-V 2.5 的分词器是用 Llama3 分词器加上 MiniCPM-V 系列模型的特殊 token 组成。
考虑到 MiniCPM-V2 的发布时间早于 Llama3,理论上它不可能包含尚未公开的 Llama3 分词器技术。
证据三:
更离谱的是,llama3-V 项目的作者面对用户的质疑,一看事情不妙,干脆上演了一出「删库跑路」的好戏。
连 GitHub 上的项目页面都撤了,堪称掩耳盗铃 2.0 版本。
Hugging Face 地址如下,目前打开该页面,我们只能看到「404」。
https://huggingface.co/mustafaaljadery/llama3v/commit/3bee89259ecac051d5c3e58ab619e3fafef20ea6
这还没完,更多证据正在不断涌现:
X 用户 @yangzhizheng1 表示如果往 MiniCPM-Llama3-V 2.5 的 checkpoint 添加高斯噪声(由单个标量参数化),出来的模型跟 Llama3-V 就像是一个模子刻出来的。
不仅如此,这模型还能识别「清华简」这种深奥的战国古文字,而且错得都一模一样,用面壁智能官方的话来说:
不仅对得一模一样、连错得都一模一样。
要知道这一古文字数据,是面壁智能和清华大学自然语言处理实验室团队花费数月时间,从清华大学收藏的清华简上逐字扫描并人工标注得来,从未对外公开过。
那斯坦福 AI 团队是如何凭空获得呢?
可以说,面壁智能的连番声明算是彻底实锤了斯坦福 AI 研究团队的抄袭。
直到今天凌晨,斯坦福 Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上就这一学术不端行为向面壁 MiniCPM 团队正式道歉, 表示 Llama3-V 模型将悉数撤下。
名校学霸也抄袭?中国开源大模型正迎头赶上
此事之所以在网络上激起千层浪,一个重要的原因在于抄袭作者的背景实在光鲜。
公开信息显示,Siddharth Sharma 与 Aksh Garg 均是斯坦福大学计算机系的本科生,曾发表过机器学习领域的相关论文。
其中,Siddharth Sharma 曾在亚马逊实习过一段时间,目前主要从事于 AI 和数据相关工作。
而 Aksh Garg 的实习履历,那叫一个丰富,涵盖 SpaceX、斯坦福大学和加州理工学校等知名企业机构。
至于被这上述两位作者称为「代码搬运工」的 Mustafa Aljadery,是南加州大学出身,在舆论发酵之后,目前 X 账号已经被设为隐私状态。
对于斯坦福 Llama3-V 团队的道歉声明,眼尖的网友却不吃这套。
例如,X 用户 @xunie 指出,这哥俩将责任归咎给一个人的甩锅行为,莫不是「有福同享,有难你当」?
斯坦福 AI 实验室主任 Christopher David Manning 也站出来谴责这一抄袭行为,并且对 MiniCPM 这一优异的中国开源模型表示赞扬。
不过,也有网友抱着「得饶人处且饶人」的态度,悠悠然地鼓励道:
开放和诚实是科技界非常重要的价值观,期待你的新作品。
Google DeepMind 研究员 Lucas Beyer 表示,中国开源大模型拥有像 MiniCPM 这样好的模型,但国际上却没给够应有的关注……
面壁智能团队也于昨天对此事进行回应。
面壁智能 CEO 李大海表示:「技术创新不易,每一项工作都是团队夜以继日的奋斗结果,也是以有限算力对全世界技术进步与创新发展作出的真诚奉献。
我们希望团队的好工作被更多人关注与认可,但不是以这种方式。」
面壁智能首席科学家刘知远也在知乎上发文表示,表示这次事件从另一个角度证明了中国创新成果的国际影响力,强调了开源共享的重要性,以及对原创精神的尊重。
不得不说,这出 AI 圈的抄袭大戏,教科书般地诠释了叫「创新不易,且行且珍惜,学术诚信,人人有责」。
要知道,模仿了代码的形,却抄不来那份原创的风姿卓绝。
事实上,自去年以来,中国大模型如同雨后春笋般陆续开源,从以往的受益者转变为贡献者,不吝于向世界提供更多开源的优异成果。
上至阿里巴巴、腾讯等巨头,下至面壁智能,智谱 AI 、昆仑天工等 AI 初创,也都是开源社区的积极分子,为中国大模型的发展添砖加瓦。
我们也盼着,这股子开放共享的春风,能吹得更猛烈些。
正如面壁智能 CEO 李大海所呼吁的那样,大家一起共建开放、合作、有信任的社区环境。加油合作,才能让世界因 AGI 的到来变得更好!
来源:凤凰网科技,APPSO
本文初摘录于:2024-06-05,最后校对或编辑于:2024-06-05
本页面二维码
© 版权声明:
本站资讯仅用作展示网友查阅,旨在传播网络正能量及优秀中华文化,版权归原作者所有。
如有侵权请 联系我们 予以删除处理。
其他事宜可 在线留言 ,无需注册且留言内容不在前台显示。
了解本站及如何分享收藏内容请至 关于我们。谢谢您的支持和分享。
猜您会读:
-
DeepSeek仿照崔颢的《黄鹤楼》写了一首七律,李白读后都会震惊
DeepSeek仿照《黄鹤楼》写了一首七律,是所有AI诗中水平最高的崔颢的《黄鹤楼》闻名遐迩,是流传千古的名篇,在很多诗词排行榜中都位居榜首,至少能进入前十。唐朝崔颢的《黄... 2025-02-21 -
凤凰卫视专访王兴兴:从200块到7万亿美元市场,宇树科技改变世界的逆袭之路
据凤凰卫视报道,从低空经济的新兴崛起,到大型智能制造的精密工艺;从智能机器人的奇妙世界,到无人驾驶的未来出行、新能源材料创新的无限可能,每周二晚7:30,锁定凤凰卫视... 2025-02-21 - 美国造“大家伙”的能力越来越堪忧了,不光有波折不断波音,还有人造工业产品中“最大的大家伙”——船。虽然美国跑遍全球的航母依然威风,但最近的一个新闻,毫无疑问暴露了... 2025-02-21
- 2025刚开年,来自杭州的两个年轻人,震撼了全球科技圈,到今天关于他们的讨论热度丝毫未减,成了这个春节当之无愧的“顶流”。他们就是宇树科技的创始人王兴兴与深度求索(Dee... 2025-02-20
- 壹公元752年,撒马尔罕的造纸坊里,一个杜姓老人,已经习惯了当战俘的日子。只是偶尔在打水浸泡树皮的时候,他才会想到,一年之前的早上,他在怛罗斯河畔清洗盔甲时,水也是一... 2025-02-18
-
《哪吒2》第一版敖光长的不咋地!饺子导演也后怕:幸好听了网友建议
《哪吒2》不负众望,票房过百亿了!每个角色都有自己的弧光,熠熠生辉的群像,让每个观众都找到了共情点。这也是影片大获成功的一个原因吧!其中敖丙亲爹敖光,硬是凭借自己的... 2025-02-17 - 上着上着班,公司没了。春节假期之后,纵目科技的员工回去上班,不仅老板没了,领导们也没了。放假前,老板唐锐跟员工们说,“我是美国国籍,买张机票就能走,但还是要留下来... 2025-02-15
-
七款国产AI大模型:Kimi,智谱清言,通义千问,文心一言,豆包,天工AI,讯飞,各自的优缺点是什么?
随着GPT的问世以来,国内的大大模型也开始呈现喷井式的爆发,而其中最具有代表性的莫过于“Kimi,智谱清言,通义千问,文心一言,豆包,天工AI,讯飞”这几家大模型遥遥领先。... 2025-02-15 -
被流量鸦片摧毁的中国小老板:从年入百万到负债直播,谁在吸食他们的最后一滴血?
2024年初的一天,在杭州四季青服装市场的地下仓库,37岁的服装店主张伟对着手机嘶吼:"家人们三二一上链接!",屏幕显示在线人数7人。这已是他连续第89天熬夜直播,喉咙带着血... 2025-02-11 - 越来越多人关注到,开发DeepSeek的AI公司深度求索、开发现象级国产游戏《黑神话:悟空》的公司游戏科学,都来自浙江杭州。不仅如此,这两家企业,与开发春晚扭秧歌机器人的宇... 2025-02-11
-
2025年1月28日的春节晚会,全国观众见证了一场炫技式的表演:16位机器人演员整齐划一地扭秧歌、转手绢、最后把手绢抛向台下。编排过程中,春晚导演组一度因为时长问题,想要删... 2025-02-09
- 据南方都市报报道,自动驾驶明星企业、去年底刚转型进军游戏产业的图森未来(TuSimple),广州总部现场大门紧锁已无人办公,据悉,高管曾发生激烈内斗,有员工称在2月17日收到... 2025-02-21
- 连续几天发现家里的天然气表一直不停地抖动,他担心发生意外遂致电燃气公司,孰料工作人员怼得他气愤不已。近日,网上一段16秒视频显示,一根竖着的管子上面挂着一个天然气表... 2025-02-21
-
无法兑付,江苏中农集团董事长被曝失联!客服:公司运作都停止了
近日,网上流传公告称,江苏中农集团实控人董事长陈井辉失联,导致公司经营和管理权限出现问题,暂时不能对中农易购的经销商进行兑付和发货。2月19日,江苏中农集团客服回应新... 2025-02-21 - 特朗普刚批评泽连斯基是罪魁祸首,晚上就被乌军炸了宝贝石油管道特朗普批评乌克兰总统泽连斯基“挑起”了血腥冲突,并敦促乌克兰立刻进行总统大选。结果,乌军晚上就把美国有... 2025-02-21
-
你在上面看到的是昨天特朗普在海湖山庄召开的一场新闻发布会的场景。有记者问:美国为何要抛弃乌克兰?特朗普把所有的责任推给了泽连斯基,怒斥是他发动了一场错误的战争,从... 2025-02-20
-
当地时间2月19日,特朗普再次用“喜剧演员”称呼泽连斯基。他表示泽连斯基操控了拜登政府,导致了乌克兰危机的持续,“泽连斯基做得太差了。”泽连斯基:美方要求乌克兰交出50... 2025-02-20
-
“翟欣欣案”择期宣判,苏享茂哥哥再发声:她没有自首情节,没如实供述犯罪事实
翟欣欣涉嫌敲诈勒索一案,1月21日在北京开庭。经过3个多小时的审理,翟欣欣敲诈勒索案在北京市海淀区人民法院山后人民法庭结束一审,该案件将择期宣判。2月17日晚,死者苏享茂... 2025-02-18 -
河北新乐公安机关人员5·25专案组刑讯逼供案开庭:八名被告人认罪认罚
2月13日上午,新乐公安机关人员刑讯逼供案在保定市中级人民法院法警训练基地公开开庭审理,被害人与被告人的家属旁听了此次庭审。2022年7月7日,被害人暴钦瑞等九人因涉嫌寻衅... 2025-02-17 - 这是一起特大医保基金诈骗案,涉事民营医院的多名主要犯罪嫌疑人员已被刑事拘留。撰文 | 燕小六、文慧据国家医保局所属媒体“中国医保”2月13日消息,天津市河东区某眼科医... 2025-02-17
-
泽连斯基:“没有人知道”究竟有多少乌克兰人在战争中死亡,仍有数万士兵失踪或被俘
【环球网报道】综合美国全国广播公司(NBC)、《乌克兰真理报》当地时间2月16日报道,乌克兰总统泽连斯基在慕尼黑安全会议期间接受NBC采访时表示,他恳请特朗普在与普京对话时... 2025-02-17