具身智能是什么意思(具身智能发展历程)
*中国人民大学吴玉章讲席教授刘永谋首发于微信公众号,保留一切知识产权,侵犯必究。
20年前具身智能是什么意思,具身智能(EAI)在AI技术专家中有支持者,但反对者不少。比如,克里斯雷认为,具身智能并非新颖的本体,而是概念上的创新,因为有身体的AI早已出现,不过没有被“具身智能”概念提炼出来,于是EAI更重要的是影响人们对身体、智能、计算、思维等概念的理解,由此促进AI的发展。也就是说,EAI概念有益于与实际AI系统的创制。从某种意义上说,“具身性”“具身认知”在AI领域是作为概念启示法来发生作用的。
因此,AI领域工作在继续,并历史地被冠以“具身智能”之名,而不是相反。这正是20年来具身智能发展的实际状况。20年后,当我们说起具身智能,如霍格斯等人综述的,主要是4个领域:
2.1.生物启发与软机器人技术
自然界和生物系统通过富有想象力和智能的方式与环境进行高度复杂和微妙的互动,这得益于它们的物理结构和具身智能。通过分析生物学,我们可以开发出具有类似能力的人工代理,还可以通过“机器人物理学”了解这些生物是如何产生 EI 的。越来越多的人认识到并接受植物提供并展示了许多方面的环境智能,这可以为环境智能提供许多启示。此外,植物的“无脑”结构仍然能够进行计算和智能,这对智能的标准概念和观点提出了挑战。软体机器人技术与生物启发密切相关,许多动物都在利用软体的相互作用。不过,软机器人技术也允许开发并非纯粹受生物启发的技术。在操纵、运动以及以应用为导向的能力(如操纵食品)方面,已经取得了令人兴奋的发展。然而,与生物系统相比,在传感、执行和控制的可扩展性方面仍存在尚未解决的问题。
2.2.人造生命与生物杂交系统
开发人工生命或 “活体生物”,与人类制造的材料、结构和制造工艺相对立,将是设计和创造智能系统的真正具身方法。这将有助于实现“自X”系统,例如具有自我复制、自我修复或自我感应能力的系统。Xenobots等作品的主要发展表明,“机器人”是如何从活细胞中形成的,这些“机器人”还能为创造其他“机器人”做出贡献。与此同时,生物杂交系统的开发也在不断增加,将生物系统和人工系统的主要进展交织在一起。尽管面临着许多技术障碍,但将活肌肉细胞融入机器人系统的工作已于 2021 年初开始。在电子智能方面,这不仅可以探索“大脑”和“身体”的平衡和分布,还可以探索不同类型的“大脑”和“身体”之间的平衡和分布,将模拟计算和数字计算结合起来。
2.3. 神经科学与认知
人类大脑行为和功能的复杂程度令人难以置信,数十亿个神经元和数万亿个突触与人类大脑皮层一起运作,而大脑皮层是大脑的外层,与我们的最高智力能力相关。为了能够设计和开发具有类似能力的人工系统,我们必须更好地了解大脑的行为和功能。对人类发展行为和认知的分析和探索,为我们提供了一种理解具身、出现和持续自主发展的重要性和贡献的方法。通过神经科学的视角探索体现的概念,可以得出一个关键概念,即体现智能为人体提供了一种处理开放式甚至意想不到的互动的手段,因为具身智能不像现代深度学习的核心——监督学习那样依赖于特定的输入/输出。此外,EI 还能“塑造我们的思维方式”,其认知和学习本质上与身体息息相关。这是一个复杂的、多层面的研究领域,但对我们进一步了解环境智能和人类智能至关重要。
2.4.理解智力与哲学
“高层次智能”一词被用来指代纯感官运动的行为,如解决问题和推理,甚至自然语言、情感和意识。然而,物理经验、将其转化为记忆以及这种“更高层次”的智能行为的长期影响之间存在着交叉。通过创建解释这些反应能力的模型,物理交互、感官-运动控制和记忆之间的联系正在不断推进。同样,许多学科都在探索意识的定义或要求,从而产生了不同的观点和方法。
2.5.应用与部署
随着展示或利用电子情报技术的技术越来越普及和容易获得,开发更多面向应用系统的能力也变得越来越可能。其中一个增长领域就是操纵。软机器人技术(Soft Robotics)展示了利用干扰和可变刚度提供通用抓手解决方案的能力,这种解决方案依赖于环境互动。随后,许多软性或顺应性解决方案利用环境相互作用实现了稳健的智能交互。触觉设备的发展为机器与人以及人与人之间的体感交互提供了技术。除了触觉设备的应用外,它们还提供了一个平台,用于了解人类的体感互动、感官-运动协调、学习等。将软机器人技术用作了解智能的工具也是一个不断发展的领域。在磁共振成像(MRI)研究中使用的软可穿戴设备就体现了这一点。因此,开发能够展示和实现具身互动的技术,有可能被用作进一步了解我们对具身互动反应的工具。
有意思的是,“具身智能”最近在AI圈子——注意并非学院、科研院所科技专家,主要是大厂及其科学家以及媒体、资本圈的专家——中大火的根本原因在于:大模型(包括大语言模型、多模态大模型)如何与机器人融合起来,成为AI圈子中人人谈论的话题。ChatGPT火了,很容易想起了把它“安装”到机器人身上,得到的就是当下AI圈子所谓的“具身智能”。如此具身智能,基本上属于AI机器人的范畴。当然,这个问题也是我们此时组织笔谈的出发原因。
比如,一份名为“EAI(具身智能):驱动通用人工智能与机器人产业的关键技术”的最新报告中,列举的具身智能产品包括4种类,即固定式机器人、轮式机器人、四足机器人和人形机器人。而整个具身机器人研究,应该属于上述引文中的2.2之一类。
在进行哲学反思之前,先厘定当下讨论的新科技对象,大家才能指向共同的关注。就大模型与机器人融合以促进“具身智能”发展而言,当先的前提性问题是:大模型与机器人能不能“融合”?这个“融合”是什么意思?
在许多古代造人神话中,神祇用泥土或别的什么世间材料造出人体,接下来必须有个将灵魂结合于人体之上的步骤,比如女娲给泥人吹一口气,泥人就活过来了。这个“融合”意味着什么?它不同于简单的拼凑,不是“两张皮”。给机器装上计算机,然后把训练好大模型存进去,能否等于“融合”呢?也就是说,具身智能不等于“机器人”+“大模型”,而是一个融合后的整体。对于一个正常的人来说,会认为整个身体包括里面的思维都是自己,而不会认为自己是驾驶肉体的灵魂,这是如何可能的?
一个思考问题的方向是:肉体有些预装的东西,你可以称之为“智能”。一部分在哲学上属于先验,另一部分虽然是后天形成的,但由于形成婴幼儿阶段——相当获致于会说话之前,与身体关系紧密,现在流行的“世界模型”的概念便属于这部分内容。如何给机器人“预装”这部分“智能”呢?预装智能究竟是什么呢?
接下来的问题是,大模型能否和机器人融合呢?比如,罗伊等人认为,目前的机器学习方法无法运用于机器人身上:
特别是具身智能是什么意思,具身智能代理(embodied intelligent agents)的范围大大超出了主流机器学习方法的典型考虑范围,这些方法通常(i)不考虑在与训练过程中遇到的条件大不相同的条件下运行;(ii)不考虑在学习和部署过程中的交互通常具有实质性、持久性和潜在的安全关键性;(iii)不要求随时适应新任务,同时(iv)通过有针对性的、深思熟虑的行动有效、高效地策划和扩展其世界模型。
现在机器学习训练的大模型加上机器人,并非具身智能。如果想要在机器人领域运用机器学习方法,必须对机器学习进行根本性地革新。罗伊等人的理由是目前机器学习存在着归纳偏差,“目前依靠最先进的机器学习和人工智能技术的系统已经达到了性能的极限”。
然而,“大模型+机器人”不是具身智能,那是什么呢?比如,我家的扫地机器人,以后不光能扫地,而且能和我说话,它不是具身智能吗?它解决行动靠的是雷达,而不是大模型,它就没有空间智能吗?显然,在当下AI圈子的热炒中,会说话的扫地机器人就是具身智能了。
这些疑问都指向“具身智能”概念本身:它究竟是智能的具身化,还是具身的智能化?“大模型+机器人”似乎两者都是,而是“两张皮”策略。泽依马克认为,从工程学的角度来看,具身人工智能是关于机器人,即物理具身系统的,这一点相当明确;然而,从人工智能是建立自然认知或智能模型的科学角度来看,情况就不那么清楚了。一方面,“具身人工智能”似乎是指物理具身,即机器人认知模型。另一方面,“具身”一词似乎意味着所建模的智能类型和/或建模所依据的(具身)认知概念。因此,他认为,无论哪种情况,目前的具身人工智能似乎都过于狭隘,因为其中的每一种观点都只得到了部分解决。
究竟什么使AI具身化呢?这个理论问题对于推动具身智能研究,在当下同样重要。在这个意义上,我不同意克里斯雷在2004年批评具身智能研究过于重视理论,要想开辟具身智能的新方向,理论思考此时此刻颇有价值。比如,上述预装问题涉及生物进化问题,可以帮助思考具身智能进化问题。在一些人看来,通过学习进化是具身智能最重要的特征。
文章评论(0)