前段时间,斯坦福大学人工智能研究院(Stanford HAI)发布了一份报告,表示美国在大模型领域遥遥领先。
报告指出,2023 年 61 个著名的人工智能模型来自美国的机构,远远超过欧盟的 21 个和中国的 15 个。
OpenAI 早期投资人 Vinod Khosla 去年还曾在 X 发文称,美国的开源模型都会被中国抄袭。
然而,一直被认为在「追赶美国」的国产大模型现在却成了被抄袭的对象,而这个抄袭的 AI 团队,正是来自发布上述报告的斯坦福大学。
斯坦福 AI 团队主导的 Llama3-V 开源模型,被揪出涉嫌抄袭国内清华&面壁智能的开源模型「小钢炮」MiniCPM-Llama3-V 2.5,瞬间在 AI 圈里炸开了锅。
在实锤之下,斯坦福团队也不得不紧急道歉。
正如面壁智能 CEO 李大海调侃式的回应,这是一种「受到国际团队认可的方式」。无论我们距离最顶尖的大模型还有多少差距,但国产大模型已经到了不能再被忽视的阶段。
简单梳理一下时间线:
斯坦福 AI 团队发布 Llama3-V,号称 SOTA 多模态大模型
网友质疑该模型抄袭国内面壁智能 MiniCPM-Llama3-V2.5
质疑证据涌现,Llama3-V 作者上演「删库跑路」
面壁智能官方实锤抄袭,深夜给出声明
Llama3-V 作者正式道歉,网友各持己见
抄袭面壁智能「小钢炮」,斯坦福 AI 团队上演「删库跑路」
近日,一个斯坦福 AI 团队宣布,只需 500 美元就可训练出一个超越 GPT-4V 的 SOTA 多模态大模型。
但很快,X 用户 @yangzhizheng1 指出,该项目使用的模型结构和代码与面壁智能不久前发布的 MiniCPM-Llama3-V2.5 惊人地相似。
为此,X 用户 @yangzhizheng1 也放出了相应的质疑证据。
证据一:
Llama3-V 和 MiniCPM-Llama3-V 2.5 的模型结构、代码,简直是复制粘贴级别的相似,区别大概就是换了个马甲——变量名改了改。
就像是同一件衣服,只是换了不同颜色的纽扣,你说巧不巧?
证据二:
Llama3-V 的作者被问到为啥能提前用上还没发布的 MinicPM-Llama3-V2.5 分词器时,他们解释称,用的是面壁智能上一代 MinicPM-V-2 项目。
但有媒体向面壁智能官方求证,在 HuggingFace 中,MiniCPM-V2 与 MiniCPM-Llama3-V 2.5 分词器分别是两个文件,文件大小也完全不同。
更何况,MiniCPM-Llama3-V 2.5 的分词器是用 Llama3 分词器加上 MiniCPM-V 系列模型的特殊 token 组成。
考虑到 MiniCPM-V2 的发布时间早于 Llama3,理论上它不可能包含尚未公开的 Llama3 分词器技术。
证据三:
更离谱的是,llama3-V 项目的作者面对用户的质疑,一看事情不妙,干脆上演了一出「删库跑路」的好戏。
连 GitHub 上的项目页面都撤了,堪称掩耳盗铃 2.0 版本。
Hugging Face 地址如下,目前打开该页面,我们只能看到「404」。
https://huggingface.co/mustafaaljadery/llama3v/commit/3bee89259ecac051d5c3e58ab619e3fafef20ea6
这还没完,更多证据正在不断涌现:
X 用户 @yangzhizheng1 表示如果往 MiniCPM-Llama3-V 2.5 的 checkpoint 添加高斯噪声(由单个标量参数化),出来的模型跟 Llama3-V 就像是一个模子刻出来的。
不仅如此,这模型还能识别「清华简」这种深奥的战国古文字,而且错得都一模一样,用面壁智能官方的话来说:
不仅对得一模一样、连错得都一模一样。
要知道这一古文字数据,是面壁智能和清华大学自然语言处理实验室团队花费数月时间,从清华大学收藏的清华简上逐字扫描并人工标注得来,从未对外公开过。
那斯坦福 AI 团队是如何凭空获得呢?
可以说,面壁智能的连番声明算是彻底实锤了斯坦福 AI 研究团队的抄袭。
直到今天凌晨,斯坦福 Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上就这一学术不端行为向面壁 MiniCPM 团队正式道歉, 表示 Llama3-V 模型将悉数撤下。
名校学霸也抄袭?中国开源大模型正迎头赶上
此事之所以在网络上激起千层浪,一个重要的原因在于抄袭作者的背景实在光鲜。
公开信息显示,Siddharth Sharma 与 Aksh Garg 均是斯坦福大学计算机系的本科生,曾发表过机器学习领域的相关论文。
其中,Siddharth Sharma 曾在亚马逊实习过一段时间,目前主要从事于 AI 和数据相关工作。
而 Aksh Garg 的实习履历,那叫一个丰富,涵盖 SpaceX、斯坦福大学和加州理工学校等知名企业机构。
至于被这上述两位作者称为「代码搬运工」的 Mustafa Aljadery,是南加州大学出身,在舆论发酵之后,目前 X 账号已经被设为隐私状态。
对于斯坦福 Llama3-V 团队的道歉声明,眼尖的网友却不吃这套。
例如,X 用户 @xunie 指出,这哥俩将责任归咎给一个人的甩锅行为,莫不是「有福同享,有难你当」?
斯坦福 AI 实验室主任 Christopher David Manning 也站出来谴责这一抄袭行为,并且对 MiniCPM 这一优异的中国开源模型表示赞扬。
不过,也有网友抱着「得饶人处且饶人」的态度,悠悠然地鼓励道:
开放和诚实是科技界非常重要的价值观,期待你的新作品。
Google DeepMind 研究员 Lucas Beyer 表示,中国开源大模型拥有像 MiniCPM 这样好的模型,但国际上却没给够应有的关注……
面壁智能团队也于昨天对此事进行回应。
面壁智能 CEO 李大海表示:「技术创新不易,每一项工作都是团队夜以继日的奋斗结果,也是以有限算力对全世界技术进步与创新发展作出的真诚奉献。
我们希望团队的好工作被更多人关注与认可,但不是以这种方式。」
面壁智能首席科学家刘知远也在知乎上发文表示,表示这次事件从另一个角度证明了中国创新成果的国际影响力,强调了开源共享的重要性,以及对原创精神的尊重。
不得不说,这出 AI 圈的抄袭大戏,教科书般地诠释了叫「创新不易,且行且珍惜,学术诚信,人人有责」。
要知道,模仿了代码的形,却抄不来那份原创的风姿卓绝。
事实上,自去年以来,中国大模型如同雨后春笋般陆续开源,从以往的受益者转变为贡献者,不吝于向世界提供更多开源的优异成果。
上至阿里巴巴、腾讯等巨头,下至面壁智能,智谱 AI 、昆仑天工等 AI 初创,也都是开源社区的积极分子,为中国大模型的发展添砖加瓦。
我们也盼着,这股子开放共享的春风,能吹得更猛烈些。
正如面壁智能 CEO 李大海所呼吁的那样,大家一起共建开放、合作、有信任的社区环境。加油合作,才能让世界因 AGI 的到来变得更好!
来源:凤凰网科技,APPSO
本文初摘录于:2024-06-05,最后校对或编辑于:2024-06-05
本页面二维码
© 版权声明:
本站资讯仅用作展示网友查阅,旨在传播网络正能量及优秀中华文化,版权归原作者所有。
如有侵权请 联系我们 予以删除处理。
其他事宜可 在线留言 ,无需注册且留言内容不在前台显示。
了解本站及如何分享收藏内容请至 关于我们。谢谢您的支持和分享。
猜您会读:
-
美国用这种方式窃取中国企业商业机密!国家互联网应急中心发布调查报告
美网络攻击我国某智慧能源和数字信息大型高科技企业事件调查报告2024年12月18日,国家互联网应急中心CNCERT发布公告(https://www.cert.org.cn/publish/main/8/2024/2024121818... 2025-01-17 - 近期,“天关”卫星首批科学成果正式发布。据《中国科学报》报道,自2024年1月9日发射以来,它探测到多种类型的暂现天体,并捕捉到几例可能的新类型暂现源。其卓越的X射线探测... 2025-01-17
- 据网络安全公司 Lookout 的研究人员称,发现了某国一款曾经未公开的Spy软件,名为 EagleMsgSpy,至少从 2017 年起就被开始使用。研究人员表示,该工具的开发将在 2024 ... 2025-01-14
-
王国辉:只需要一家中国公司成功开发出EUV光刻机 那么“芯片战争就会结束”
曾经芯片是悬挂在中国头顶之上的一把利剑,美利坚挥动着技术霸权的屠刀,肆意地进行收割。华为的悲壮,中兴的屈辱,历历在目。不过风水轮流转,中国芯正在绝地反击!这几天王... 2025-01-12 - 我是万万没想到,就在西方还沉浸在圣诞假期,疯狂 “ 过年 ” 的时候,咱们中国企业给人家放了个新年二踢脚,给人家脑瓜子崩得嗡嗡得。前有宇树科技的机器狗视频让大家惊... 2025-01-04
- 生成式人工智能大模型制作的人形机器人图片。AI制作近年来,随着人工智能技术的快速发展,具身智能逐渐成为备受瞩目的前沿领域。与传统人工智能相比,具身智能更注重通过与环... 2025-01-04
- fdgs 2025-01-01
- 自 TikTok 在美受到挑战以来,多任总统、国会和各地州政府对它掀起了一轮又一轮的攻击,这波攻击随着几天前,美国华盛顿特区巡回上诉法院对 TikTok 案的判决公布,而进入... 2024-12-13
- 百度的核心板块—广告业务,传来隐忧。根据最新财报显示,今年第三季度,百度的在线广告收入同比下滑4%。至此百度广告业务增速已经连续3个季度下滑,且连续2个季度出现负增长... 2024-12-02
- 随着人工智能技术的飞速发展,深度伪造技术逐渐进入我们的生活,在带来惊喜和便利的同时,也暴露出一系列风险隐患,如不注意防范,甚至可能危害国家安全。眼见未必为实,耳听... 2024-11-26
- 有些自媒体说张一鸣退休了,这个喊话对象错了。如果做人作文到这个程度,那起码的廉耻都没有了。我们必须要明确的一点是,无论从任何角度讲,张一鸣都是字节这个庞大机构的创... 2024-11-21
- 1月16日,中央外办主任王毅在北京会见由日本自民党干事长森山裕、公明党干事长西田实仁率领的日本执政党代表团。而就在三天前的1月13日,据国防部的消息,中国人民解放军东部... 2025-01-19
-
直播带货“AB”货套路:“原切肥牛卷”疑似“合成肉”?网红李维刚、呼和浩特市农牧局致歉
近日,有网友称在网红李维刚的直播间买到的“原切肥牛卷”疑似“合成肉”。1月17日,李维刚在抖音上发布视频致歉称,日前,接到部分消费者投诉,称买到的牛肉卷疑似非原切,非... 2025-01-19 - 经济观察网 记者 张铃 张英2025年1月18日,经济观察网从多个信源获悉,国家组织高值医用耗材联合采购办公室主任、天津市政协委员、天津市医保局医药采购中心主任高雪被调查... 2025-01-18
- 作者 | 南风窗记者 宝珠、编辑 | 何子维2025年刚开始,李嘉诚就有了新动作。此次事关中药资产。1月1日,李嘉诚旗下的和黄医药(HK.0013)宣布出售其在上海和黄药业45%的... 2025-01-17
- 1月15日,国乒运动员王楚钦球迷会解散粉丝群。近日来,还有多位国羽运动员相继解散其粉丝群。据统计,1月11日开始,包括中国羽毛球队官博,运动员王昶、梁伟铿、何济霆、任翔... 2025-01-17
- 1月15日,万科企业股份有限公司执行董事、总裁、首席执行官祝九胜被公安机关带走。1月16日,数个消息源告诉了经济观察网记者上述信息。记者多次拨打祝九胜的手机电话,未有人... 2025-01-17
- ► 文 观察者网 齐倩当地时间1月13日,美国钢铁巨头克利夫兰·克利夫斯公司CEO洛伦科·贡萨尔维斯在宾州举行的新闻发布会上对日本进行了猛烈批评,称美国的这个亲密盟友“... 2025-01-15
- 20片羽毛球场地,有54人打球,问单打双打的场地各有多少;《长城谣》歌词中的“四万万同胞心一样”是近似数还是精确数;海底捞针、瓜熟蒂落、旭日东升、水滴穿石等成语所描述... 2025-01-14
- 一场洛杉矶大火,让很多人的美国梦破灭了。有些人做梦也没有料到,这样的事情会落到自己头上,本以为只是个吃瓜看客,没想到被动成了“演员”。洛杉矶的大火让很多人终于意识... 2025-01-14
- 据台媒《台北时报》称,台湾将在该岛北部部署从美国购买的NASAMS防空系统。该报援引台湾防务部门的消息写道:“台湾从美国订购的NASAMS将部署在台北和新北的重要战略位置,以... 2025-01-12