Sora,注定失败

繁体

最近,OpenAI发布的视频生成模型Sora爆火,引发了科技界的广泛讨论。OpenAI的白皮书当中,将Sora定义为“世界模拟器”(world simulators),OpenAI称:“ Sora 是能够理解和模拟现实世界模型的基础,我们相信这种能力将成为实现 AGI 的重要里程碑。”

英伟达高级研究科学家 Jim Fan 更是直接断言,“Sora 是一个数据驱动的物理引擎,是一个可学习的模拟器,或世界模型”。

但是,著名人工智能科学家杨立昆(Yann LeCun)对这个说法显然不认同。也许你对杨立昆不熟悉,他是当代最杰出的计算机科学家之一、2018年图灵奖获得者、“卷积神经网络之父”(CNN),是AI领域的泰山北斗。

他也是“世界模型”概念的提出者,杨立昆认为Sora的视频模型与真正的世界模型所提倡的因果预测理念完全不同。杨立昆指出,以Sora代表的大模型技术不仅训练成本高昂,而且对于构建有效的世界模型几乎没有意义。大模型的技术路线不可能通往AGI(通用人工智能),以Sora、ChatGPT为代表的大模型产品注定失败。

一、什么是世界模型?

杨立昆对世界模型的定义,简单来说是一种能够理解并预测环境中发生的事件的模型。这种模型应该能够捕捉到事件之间的因果关系,从而对内容生成未来的状态进行预测。例如,一个有效的世界模型应该能够预测一个苹果从树上掉下来会落到地上,而不是飞向天空。这种预测能力是基于对物理定律和环境规则的理解。

在杨立昆看来,目前的大模型采用的是大数据、大算力、大参数的暴力“美学”,既浪费巨大的资源,也不可能实现真正的AGI,这条路线完全是错误的,它的技术架构存在无法突破的瓶颈,导致了幻觉问题始终无法彻底解决。

二、杨立昆的世界模型,表现如何?

杨立昆基于世界模型的理念,提出了“联合嵌入预测架构(JEPA)”,旨在通过将感知和预测结合起来,构建更有效的世界模型。基于这个理论,Meta发布了I-JEPA和V-JEPA,分别针对图像和视频内容的理解和预测。

这些模型在实际应用中的效果如何呢?确实在有限的场景下,能够更准确地预测事件的发展。但是也有一些业内评论指出,尽管I-JEPA和V-JEPA在某些场景下表现出色,但它们在处理复杂环境和未知情境时仍然存在局限性。也就是说,大部分情况下效果还不如Sora。

三、Sora注定失败?谁更有可能通往AGI

K哥就这个问题,跟几位国内大模型创业大佬进行了探讨。大家的一个共识认为,以OpenAI为代表的自监督语言模型,其实没有本质上的瓶颈,机器幻觉的问题也只是因为token space还不足够大,规模化就可以解决这个问题。可以说,它就是一个世界模型。杨立昆只是放大了当前这个模型的局限性。

从第一性原理的角度看,目前AI唯一可行的路线就是:next token prediction 、scaling law。这也就是以OpenAI为代表的大模型所采取的技术路线,接下来要解决的问题就是token足够完整、算力足够大。这就是为什么OpenAI CEO奥特曼要融资7万亿的原因,Sora以及ChatGPT-5的模型训练所耗费的巨大算力是非常惊人的。

四、大模型,已经深刻改变人类社会

《纽约时报》称ChatGPT为“人工智能的突破”,而《华尔街日报》则认为Sora开启了视频内容生成的新时代。这些评价反映了大模型在提高生产效率、促进创新和改变人类互动方式方面取得的巨大进步。

AI已经迎来了“克林格里奇困境”时刻。所谓的“克林格里奇困境”,是指:一项新技术刚发明出来,容易改变的时候,我们无法预见它对社会可能产生什么影响,也就不知道如何改变;等到不良后果出现时,技术已经成为社会的一部分,很难或无法改变了。

以汽车为例,在汽车发明之初,没有人能够预料到汽车会带来空气污染、资源耗竭、交通拥堵等问题。等到这些问题出现后,汽车早已成为社会结构的重要组成部分。现在再来着手解决汽车带来的问题,已经很难彻底解决了。

AI也是类似的,它可能加剧信息泛滥和虚假信息的传播,对社会造成负面影响,比如AI诈骗、肖像在影视作品中被滥用等等,但无论如何都不能阻挡历史的车轮滚滚向前。

五、结束语

比尔·盖茨说:“我们总是高估技术短期内的影响,而低估长期的影响。”尽管Sora在当前阶段存在局限性,但它代表了视频生成技术的重要一步。大模型也好,世界模型也罢,随着技术的不断进步,我们有理由期待出现更加强大和实用的AI技术,为人类社会带来更深远的变革。

作者|Mr.K 编辑| Emma

来源| 技术领导力(ID:jishulingdaoli)

本文初摘录于:2024-03-06,最后校对或编辑于:2024-03-10

1
0

本页面二维码

© 版权声明:

本站资讯仅用作展示网友查阅,旨在传播网络正能量及优秀中华文化,版权归原作者所有。

如有侵权请 联系我们 予以删除处理。

其他事宜可 在线留言 ,无需注册且留言内容不在前台显示。

了解本站及如何分享收藏内容请至 关于我们。谢谢您的支持和分享。

猜您会读:

  • 张一鸣必须回应钟睒睒

    张一鸣必须回应钟睒睒

    有些自媒体说张一鸣退休了,这个喊话对象错了。如果做人作文到这个程度,那起码的廉耻都没有了。我们必须要明确的一点是,无论从任何角度讲,张一鸣都是字节这个庞大机构的创... 2024-11-21
  • 任正非:世界走向人工智能的潮流不可阻挡

    华为创始人兼CEO任正非与ICPC(国际大学生程序设计竞赛)主席、教练及获奖选手座谈会纪要曝光,座谈时间是今年10月14日。在座谈中,针对不同国家选手的提问,任正非谈到了不同国... 2024-10-31
  • AI:99% 的人尚未为 2027 年的到来做好准备

    AI 的疯狂飞跃——你可能不想被甩在后面想象一下,有一天醒来发现人工智能在一夜之间彻底革新了世界。听起来遥不可及?其实比你想象的更近。很多人并没有意识到 AI 发展的... 2024-10-19
  • 外媒:苹果曾与比亚迪共同秘密研发电池

    黄晓明今年46岁了,无论他有多迷恋偶像剧霸总人设,群众也不会再惯着他了。一个网红女朋友,又一次把这位影星送上了舆论高地。人到中年,一次官宣换来终生内向。网友不仅没有... 2024-10-17
  • 中国科学家团队发现大量全新RNA病毒

    财联社10月10日讯,据中山大学微信公众号,10月9日,中山大学医学院施莽教授团队与阿里云李兆融团队在《细胞》杂志(Cell)发表论文报告了180个超群、超过16万种全球RNA病毒的... 2024-10-11
  • 权威院士王选的自白:当了院士、不再权威

    作者:王选(1937年2月5日-2006年2月13日),计算机专家,1991年当选为中国科学院院士,1994年当选为中国工程院院士,获得2001年度国家最高科学技术奖。本文系王选院士于2002... 2024-10-10
  • 又一个终极阳谋,拖垮美国

    兄弟们,终于来了!当被问及月球上能不能上网时,主任霸气回答:“在月球上肯定会有无线网,能源肯定有”。而且主任还顺带说了一句:“能不能种菜,科学家还在研究。”种菜、... 2024-10-06
  • OpenAI机密泄露!前苹果设计总监爆料正合作开发神秘硬件产品

    OpenAI机密泄露!前苹果设计总监爆料正合作开发神秘硬件产品

    近期,前苹果设计总监Jony Ive终于打破沉默,确认正在与OpenAI合作开发一款神秘的硬件设备。这一爆料迅速引发了科技圈的热议,毕竟,这位曾一手打造iPhone、iPad、MacBook的... 2024-09-26
  • 大厂集体沉默,甚至封锁信息,AI背后的肮脏远超想象......

    大厂集体沉默,甚至封锁信息,AI背后的肮脏远超想象......

    大厂们可能不会告诉你,人工智能技术正在对地球造成巨大的负担,而这背后的真相被紧紧隐藏。想象一下,你走进一家电子产品店,正打算购买一台新笔记本电脑。这款新设备功能强... 2024-09-22
  • 中国“冲击波”抵达,德国大众的狼狈应对,把日本三菱吓坏了

    中国“冲击波”抵达,德国大众的狼狈应对,把日本三菱吓坏了

    众所周知,面对中国电动汽车产业出海这件事,整个欧美可以说是如临深渊,在美国带头搞起关税壁垒以后,西方各国纷纷出台了歧视性的关税政策。但问题在于,在欧美市场,欧美确... 2024-09-09
  • 在AI面前奥巴马的这张照片可以封神

    在AI面前奥巴马的这张照片可以封神

    【今天讲一张照片的故事,主要内容据“万维钢精英日课”整理。】奥巴马的这张照片很有名,堪称担任美国总统时他搞笑照片的代表作。2010年8月9日,总统出访行程中,一随行人员... 2024-09-07

名著精选