最近,OpenAI发布的视频生成模型Sora爆火,引发了科技界的广泛讨论。OpenAI的白皮书当中,将Sora定义为“世界模拟器”(world simulators),OpenAI称:“ Sora 是能够理解和模拟现实世界模型的基础,我们相信这种能力将成为实现 AGI 的重要里程碑。”
英伟达高级研究科学家 Jim Fan 更是直接断言,“Sora 是一个数据驱动的物理引擎,是一个可学习的模拟器,或世界模型”。
但是,著名人工智能科学家杨立昆(Yann LeCun)对这个说法显然不认同。也许你对杨立昆不熟悉,他是当代最杰出的计算机科学家之一、2018年图灵奖获得者、“卷积神经网络之父”(CNN),是AI领域的泰山北斗。
他也是“世界模型”概念的提出者,杨立昆认为Sora的视频模型与真正的世界模型所提倡的因果预测理念完全不同。杨立昆指出,以Sora代表的大模型技术不仅训练成本高昂,而且对于构建有效的世界模型几乎没有意义。大模型的技术路线不可能通往AGI(通用人工智能),以Sora、ChatGPT为代表的大模型产品注定失败。
一、什么是世界模型?
杨立昆对世界模型的定义,简单来说是一种能够理解并预测环境中发生的事件的模型。这种模型应该能够捕捉到事件之间的因果关系,从而对内容生成未来的状态进行预测。例如,一个有效的世界模型应该能够预测一个苹果从树上掉下来会落到地上,而不是飞向天空。这种预测能力是基于对物理定律和环境规则的理解。
在杨立昆看来,目前的大模型采用的是大数据、大算力、大参数的暴力“美学”,既浪费巨大的资源,也不可能实现真正的AGI,这条路线完全是错误的,它的技术架构存在无法突破的瓶颈,导致了幻觉问题始终无法彻底解决。
二、杨立昆的世界模型,表现如何?
杨立昆基于世界模型的理念,提出了“联合嵌入预测架构(JEPA)”,旨在通过将感知和预测结合起来,构建更有效的世界模型。基于这个理论,Meta发布了I-JEPA和V-JEPA,分别针对图像和视频内容的理解和预测。
这些模型在实际应用中的效果如何呢?确实在有限的场景下,能够更准确地预测事件的发展。但是也有一些业内评论指出,尽管I-JEPA和V-JEPA在某些场景下表现出色,但它们在处理复杂环境和未知情境时仍然存在局限性。也就是说,大部分情况下效果还不如Sora。
三、Sora注定失败?谁更有可能通往AGI
K哥就这个问题,跟几位国内大模型创业大佬进行了探讨。大家的一个共识认为,以OpenAI为代表的自监督语言模型,其实没有本质上的瓶颈,机器幻觉的问题也只是因为token space还不足够大,规模化就可以解决这个问题。可以说,它就是一个世界模型。杨立昆只是放大了当前这个模型的局限性。
从第一性原理的角度看,目前AI唯一可行的路线就是:next token prediction 、scaling law。这也就是以OpenAI为代表的大模型所采取的技术路线,接下来要解决的问题就是token足够完整、算力足够大。这就是为什么OpenAI CEO奥特曼要融资7万亿的原因,Sora以及ChatGPT-5的模型训练所耗费的巨大算力是非常惊人的。
四、大模型,已经深刻改变人类社会
《纽约时报》称ChatGPT为“人工智能的突破”,而《华尔街日报》则认为Sora开启了视频内容生成的新时代。这些评价反映了大模型在提高生产效率、促进创新和改变人类互动方式方面取得的巨大进步。
AI已经迎来了“克林格里奇困境”时刻。所谓的“克林格里奇困境”,是指:一项新技术刚发明出来,容易改变的时候,我们无法预见它对社会可能产生什么影响,也就不知道如何改变;等到不良后果出现时,技术已经成为社会的一部分,很难或无法改变了。
以汽车为例,在汽车发明之初,没有人能够预料到汽车会带来空气污染、资源耗竭、交通拥堵等问题。等到这些问题出现后,汽车早已成为社会结构的重要组成部分。现在再来着手解决汽车带来的问题,已经很难彻底解决了。
AI也是类似的,它可能加剧信息泛滥和虚假信息的传播,对社会造成负面影响,比如AI诈骗、肖像在影视作品中被滥用等等,但无论如何都不能阻挡历史的车轮滚滚向前。
五、结束语
比尔·盖茨说:“我们总是高估技术短期内的影响,而低估长期的影响。”尽管Sora在当前阶段存在局限性,但它代表了视频生成技术的重要一步。大模型也好,世界模型也罢,随着技术的不断进步,我们有理由期待出现更加强大和实用的AI技术,为人类社会带来更深远的变革。
作者|Mr.K 编辑| Emma
来源| 技术领导力(ID:jishulingdaoli)
本文初摘录于:2024-03-06,最后校对或编辑于:2024-03-10
本页面二维码
© 版权声明:
本站资讯仅用作展示网友查阅,旨在传播网络正能量及优秀中华文化,版权归原作者所有。
如有侵权请 联系我们 予以删除处理。
其他事宜可 在线留言 ,无需注册且留言内容不在前台显示。
了解本站及如何分享收藏内容请至 关于我们。谢谢您的支持和分享。
猜您会读:
-
《真实的谎言》30周年:90年代烧掉1亿美元,画面吊打当今特效
《真实的谎言》,在全球特效发展史上写下了浓墨重彩的一笔。文 | 臧剑* 特别感谢谢亚伦、王伟男对本文的贡献部分珍贵照片提供 | 约翰·布鲁诺排版编辑 | Joy作为詹姆斯... 2025-04-23 - 第一批受害者已出现撰文/ 黎炫岐编辑/陈邓新排版/Annalee用AI搜集资料、做PPT、改论文……虽然AI暂时还不能“替代”人类,但不可否认的是,AI正以前所未有的速度,渗透进普通... 2025-04-16
- 2016年,马斯克成立了一家脑机接口公司,名叫Neuralink,宣称要打造出一种让人类大脑和外界进行信息交互的设备,如果此举真的能实现,那未来人类就能实现网友口中的赛博飞升。... 2025-04-06
-
“我们跑高速去试驾都在车上睡”,车企销售人员极力宣传智驾系统的强大功能,淡化风险
4月1日,小米汽车智驾系统引发的事故在汽车行业内引发关注。资深汽车研发工程师周强(化名)在接受新黄河记者采访时指出,国内部分车企在智能驾驶系统的用户引导方面存在缺失... 2025-04-02 - 特朗普周五在白宫高调宣布,将第六代战机交由波音公司生产,并命名为F-47,以维持美国“下一代空中优势”(NGAD)。特朗普炫耀说,“这种隐形飞机几乎看不见,而且拥有前所未... 2025-03-23
- 作者 | 姚西西来源 | 华商韬略(ID:hstl8888)33岁的刘靖康,等来了证监会的批复,不出意外,他将是科创板最年轻的董事长之一。他一手创立的影石创新(Insta360),用9年... 2025-03-21
- 2025刚开年,来自杭州的两个年轻人,震撼了全球科技圈,到今天关于他们的讨论热度丝毫未减,成了这个春节当之无愧的“顶流”。他们就是宇树科技的创始人王兴兴与深度求索(Dee... 2025-03-17
- 媒体并没带来更多有价值的思想;技术并没真正促进公平正义,当这两个怪物狼狈为奸时,资本站在旁边猥琐的窃笑,他们要收割百姓。现在的AI最大能耐就是吓唬,不学习就要淘汰,... 2025-03-14
- 据《南华早报》报道,中国科学家已经研发出一款基于激光的全球最强大摄像机,能够从近地轨道识别辨别人脸等微小细节。报道指出,这款摄像机由中国科学院航空航天信息研究所的... 2025-03-13
-
比Deepseek还强的Manus(马牛死)爆火:打工人的天彻底塌了
时代的列车太快,一不小心就闪了我的老腰。前几天我还信誓旦旦地说:AI只是工具,只是我们未来工作的协作者。没想到打脸来得这么快,Manus横空出世,彻底改变了我的想法。如果... 2025-03-12 - 3月10日,人民日报新媒体发布《献给春天的演讲:相信》。讲述人王兴兴是个“90后”,他开创了全球低成本高性能足式机器人的技术先河。他和团队研发的四足机器人已占全球近7成... 2025-03-11
- 扁鹊见蔡桓公先秦 韩非扁鹊见蔡桓公,立有间,扁鹊曰:“君有疾在腠理,不治将恐深。”桓侯曰:“寡人无疾。”扁鹊出,桓侯曰:“医之好治不病以为功!”居十日,扁鹊复见,... 2024-10-19
- 没有高尚品格和信仰,当了医生就是对这个神圣职业的亵渎。患者把人类最为宝贵的生命都交给了这个“神圣的人”,而这个人却对患者的生命不屑一顾 … 医生对病情的过度渲染实... 2024-09-16
-
清华硕士马翔宇吹响了全民反腐的冲锋号——如同指出皇帝没穿衣服的孩子
在这个信息爆炸的时代,我们每天都被海量的新闻和故事所包围。然而,有些故事,它们的影响力远远超出了文字所能表达的范畴。今天,我们要聊的,就是这样一个故事——一个清华... 2024-08-04 -
布林肯访华期间,有一些奇怪的事一直想谈谈,还是本着沉淀一段时间后再来捋,或许能发现更多的东西。布林肯访华期间发生了什么怪事?当时网络出现顶级流量的骑墙公知抛出的“... 2024-05-13
-
最近在视频号直播,谈到美国像苏联一样解体的外七条和内七条,总结起来就是十四条理由。外七条:1. 美国处于第四次世界大战的战略防御阶段三战是冷战,冷战是混合战争模式。... 2024-01-27
-
全球变局下的中国战略智慧:从印巴冲突到巴拿马运河易主 ——兼论中国领导层的全球视野与战略定力
全球变局下的中国战略智慧:从印巴冲突到巴拿马运河易主——兼论中国领导层的全球视野与战略定力2025年的国际局势风云激荡,印巴军事冲突升级、巴拿马运河控制权更迭、俄乌战... 2025-05-11 - 近年来,在中小学的门口,你很难再听到那句“有什么事您尽管说”的大嗓门;在医院的候诊室,也少了“下一个”的呼号声,取而代之的是低声的“您好,请稍等”。表面上,这一切... 2025-05-11
- 扯淡】——2025年最扯淡的两个现象第一个最扯淡的现象:穷人,富人,最后都是老年人;这家,那家,最后都是老人家。上海某小区门口,修车摊老张和退休干部老王蹲在台阶上啃馒... 2025-05-11
-
人民日报点名,戳穿了胖东来屡犯小人的真相,陶华碧的话有人信了
来源:先锋谷影视娱评胖东来“玉石事件”调查结果出炉,真相大白,不出所料,他又一次被冤枉了!人民日报官网转发调查结果,挑事者“柴怼怼”账号被封禁,大快人心。事实上,... 2025-05-10 - “新词”泛滥何时休?成都市郫都区苟大权工作室 苟大权伴随时代的脚步,新词新语应时而生,既丰富了语言世界,又生动地反映了我们当下的生活面貌,的确是一件令人欣慰的事情... 2025-05-09