生成式人工智能大模型制作的人形机器人图片。AI制作
近年来,随着人工智能技术的快速发展,具身智能逐渐成为备受瞩目的前沿领域。与传统人工智能相比,具身智能更注重通过与环境的实时交互来获取信息,并基于这些信息进行思考、决策和行动。具身智能还可通过经验积累和持续学习,提升行动和操作技能。
2024年,具身智能入选“新一代信息工程科技新质生产力技术备选清单”,具身小脑模型被列入“世界人工智能十大前沿技术趋势”,其重要性不言而喻。
那么,具身智能和我们熟知的传统人工智能、通用人工智能有什么关系?其未来会有怎样的应用前景?请看本期解读。
传统人工智能的进阶
传统人工智能擅长处理结构化的数据、图像、语音等信息,但面对现实世界中的物理互动通常无能为力。
早在1986年,美国著名机器人制造专家布鲁克斯从控制论角度提出,智能是具身化和情境化的,传统以表征为核心的经典人工智能进化路径是错误的,而清除表征的方式就是制造基于行为的机器人。随着人工智能应用逐渐从虚拟环境拓展到物理世界,如工业机器人、自动驾驶、无人机等应用越来越广泛,这一观点得到了验证。
人工智能研究的重心也开始逐步从数字化智能向具身智能进阶。具身智能相比传统人工智能,是从数据到行为的跃迁。传统人工智能的强项在于大规模数据处理和模型训练,它可以通过海量数据生成预测模型或识别模式,但这一过程通常发生在虚拟环境中,缺乏对物理世界的即时反馈。而具身智能不仅依赖数据驱动,还依赖行动与感知的闭环,通过与真实环境的互动,不断修正自身模型和策略。
这意味着,智能系统不再是被动的决策器,而是能够主动干预物理世界并实时适应变化的智能体。
具身智能的发展,标志着人工智能与人类智能的进一步靠近。人类的智慧不仅来自大脑,还来自身体的感知和行动能力。我们学习和认知的过程很大程度上依赖于我们与环境的互动,例如通过行走、抓取物体等方式来理解世界。
正如亚里士多德所说:“我们是通过做事来学习的。”同样,具身智能通过“身体”与环境的交互,在认知、推理、决策和行动之间建立起更自然的联系。它打破了传统人工智能在虚拟环境中的局限,使人工智能具备了与人类类似的感知和应变能力。这为未来通用人工智能的实现提供了更加现实的路径。具身智能的实现不仅是人工智能算法的进化,还涉及多个学科的融合。
从机器人学、控制论到认知科学、神经科学,具身智能的技术体系是跨学科的。感知技术的进步,使得具身智能体可以从视觉、触觉、声音等多个维度实时获取信息。仿生学的发展则使智能体在模仿生物的行为方式后,获得更加自然和灵活的行动能力。例如,人形机器人通过模仿人类的运动系统,实现了类似人类的自主决策和行动能力。
具身智能的核心特征之一在于其动态适应能力。传统人工智能系统通常基于固定的规则或模型,而具身智能具有更强的灵活性和学习能力,能够在不断变化的环境中做出实时反应。它的这种动态适应特性适合军事、无人驾驶等领域。在这些场景中,环境和任务是高度不确定的,智能体必须在毫秒级时间内完成决策并采取行动。因此,具身智能是人工智能从静态、预设逻辑向动态、实时感知行为的重大进化。
通用人工智能的曙光
一座大楼起火,“消防员”攀爬云梯,穿越窗户,用灭火器消火,其中一名“消防员”一边给受困者递矿泉水,一边用温和的语气安抚他们的情绪。镜头一转,“消防员”原来是一个人形机器人。这是一家科技公司畅想的通用人工智能人形机器人用于救灾的场景。
通用人工智能是一种能够像人类一样在多个不同领域中灵活解决问题的智能系统,具备理解、学习、推理、规划和自我适应等能力。通用人工智能的目标在于实现跨领域的广泛应用,这是人类对智能发展的理想化追求。
生成式人工智能大模型曾被认为是实现通用人工智能的一个重要途径,不过,其实际工作原理是基于大量数据训练的模型运算,虽能生成符合逻辑的文本,但并不真正理解其生成内容。而具身智能超越了只处理虚拟信息的传统算法模型,能够与物理世界进行直接交互,专注于解决现实世界中的具体问题,更加符合通用人工智能的定义和需求。
因此,在人工智能的演进中,具身智能被视为通向通用人工智能的一种可行路径。不同于“离身智能”,具身智能通过智能体的身体与环境进行动态交互,主动改造环境,这与通用人工智能的要求一致。通用人工智能需要与多样化的环境互动,从中学习和汲取知识,利用自身行为改造环境。具身智能使得智能体在多变的环境中灵活行动,通过反复尝试、经验积累和多感知融合,持续优化自身行为。通用人工智能要求具备跨领域、多任务的能力。在动态环境中,具身智能体可以灵活应对多种任务,而非局限于单一功能。
例如,一个具备具身智能的机器人不仅能够在工厂中执行运输任务,还能胜任装配和清洁等多重职责,展示出强大的通用性。此外,智能体的身体形态也有助于其适应复杂环境和提升学习能力,复杂环境促使智能体形态和智能的进化,进一步提高其通用性。具身智能体依赖于感知与行动的紧密循环来处理外界信息,这与人类的认知过程高度相似。
通用人工智能需要能够根据变化的信息源做出实时的高阶认知和推理,而这种能力正是具身智能的核心。具身智能通过“感知—行动”循环推动认知发展,为通用人工智能提供实现通用性和灵活性的坚实基础。尽管具身智能为实现通用人工智能提供了基础和可能,但目前实现具身智能也面临着一些难题,比如缺乏一步到位的基础大模型以支持最底层控制、计算能力的局限、多模态感官感知的融合问题、数据收集过程中的安全与隐私挑战等。
未来作战装备的先锋
具身智能强调利用人工智能与物理实体融合,该领域的技术创新将催生武器装备组织形态和作战样式变革,提升武器装备作战能力。具身智能的潜在军事应用包括以下几个方面:人形机器人。具身智能赋予人形机器人与物理世界互动的能力,使其具备感知、决策和行动能力,能够执行危险或高强度军事任务。
德军正在测试的TORO人形机器人,具备高度灵活的运动能力和强大的感知系统,能够在复杂地形中自主行走、避障和执行任务。其强大的传感系统和智能算法可以实时分析环境数据,调整机器人动作,以适应不同的任务需求。有人/无人智能协同空战。
近年来,美军启动了空战演进、空中博格、协同作战航空器系统等项目,希望利用人工智能技术操控战斗机飞行、与有人战机实现空中协同作战。
2024年4月19日,美国国防部高级研究计划局宣布,美国空军进行了首次有人驾驶战斗机与人工智能控制的战斗机之间的近距离空中格斗试验,标志着“人工智能技术在操控战斗机方面实现突破”。
此外,德国、法国和西班牙联合发起“未来空战系统”项目,旨在实现高度自主化的“忠诚僚机”无人机与有人驾驶战机协同作战,从而执行诸多复杂任务,如数据采集、火力支援和敌方防线突破等。具身智能军事训练模拟系统。具身智能通过赋予人工智能与现实环境的物理交互能力,提升军事训练模拟系统的沉浸感与灵活性。在美国陆军提供的综合训练环境中,士兵能够在虚拟与现实结合的空间中进行高度逼真的战斗训练。通过XR设备,士兵可与虚拟敌人和场景互动,模拟战斗操作,获得实时反馈。
同时,具身智能技术让系统能够实时监控士兵的表现,自动调整训练场景的难度,帮助士兵应对各种复杂情境。个性化士兵装备。具身智能通过实时感知和反馈,为定制个性化士兵装备提供智能化的解决方案。美军的增强型夜视镜(ENVG-B)利用热成像传感器和增强现实技术提供战场信息。
通过具身智能技术,ENVG-B可以根据士兵的视线和头部动作调整显示内容,并实现敌我识别、导航和目标瞄准等功能,显著提高战场态势感知和作战效率。智能战斗服与增强外骨骼。具身智能技术还可应用于外骨骼和智能战斗服,通过增强士兵身体能力来提高战斗力和任务完成效率。智能外骨骼使士兵能够承载更重装备并在复杂环境中持久作战;智能战斗服则能感知外部环境并作出相应调整,如调温、降噪或提升防护能力。增强感知认知能力与辅助决策规划。具身智能的引入可以使无人平台在不确定和多变的战场中感知更精准,强大的感知智能赋予无人平台更好的决策与控制能力。
此外,具身智能技术能够迅速处理海量数据,识别复杂模式,为军事指挥控制提供规划决策,以应对不断变化的安全环境。
美国的N3项目旨在推动士兵与人工智能、半自主和自主武器装备的完全交互能力,实现战场士兵的超级认知、快速决策和脑控人机编队等超脑和脑控能力。
具身智能在军事上具有广阔的应用前景,或将成为未来战场上的颠覆性力量。
来源:解放军报