AI 的终极形态可能是人形机器人。以下是一些原因:
此外,鉴于人工智能的神经网络基础,专家 AI 可能通过元学习更快获得知识并促进人类进步。AI 行业的终极目标是实现 AGI,期望仅靠简单指令就能以媲美或超越人类的智力执行任何任务,但当前大模型处理多步骤复杂任务存在局限,如在“数据分析图表、剧情游戏”等任务中,即便先进的模型仅靠单一 Prompt 指令也难以稳定执行,现阶段的 AI Agent 更像缺乏独立解决问题能力的职场新人。
具身智能的本体不只是机器人,还可以是汽车、无人机、玩具等具有传感器并可自主运动的硬件。应用的领域包括工业生产、安防巡检、医疗护理、家庭陪护、应急救援等。具身智能的载体会因不同的应用场景而产生不同的形态。这是因为在目前的具身智能体仍处于ANI(人工狭窄智能)阶段,它们只能执行单一的任务。[heading4]人形的优点[content]随着AI的发展逐渐步入AGI(人工通用智能)阶段,人形机器人将成为具身智能体的最终形态。这是因为大模型为“智能”提供了通用性,而类人体的构造为“具身”提供了通用性。具体原因如下:1.遵循自然的高效设计:人类本身拥有高效的身体结构和功能。例如,直立行走解放了双手,使我们能够使用多种工具。机器人甚至可以弥补人类身体的缺憾,例如,机器人的可见光相机不会近视,还可以使用红外相机、深度相机等多种光学传感器。2.适应人类环境:人类物理世界的环境和工具都是为人类使用而设计的。人形机器人通过类似人体的构造可以自然地适配这些环境和工具。例如,ANI阶段的扫地机器人只能执行扫地任务,而AGI阶段的人形机器人不仅可以使用吸尘器扫地,还可以使用抹布擦桌子。3.人机交互的自然性:与非人形机器人相比,人形机器人具有与人类相似的外观和行为模式,更容易被用户接受,减少了用户对未知技术的恐惧感。用户更容易与人形机器人建立积极的心理联系,产生亲近感和信任感,这极大地降低了用户习惯培养的成本。拟人化的机器人更容易被视为有道德责任的主体,用户在与机器人互动时会更加注意自己的言行举止,从而减少对机器人硬件的损坏。4.数据的可获得性:具身智能训练模型时面临训练数据匮乏的问题,这是因为训练数据需要人类对机器的动作进行规划。而由于人形机器人的身体结构与人类相似,大量的人类运动视频可以通过标注成为训练数据,从而解决了数据匮乏的问题。
鉴于人工智能依赖的神经网络基础,这些专家AI可能通过元学习(或学会学习)比我们预期的更快地获得知识,并带着我们人类一同进步。AI的性质让我们可以做一些我们无法对人做的事情;即将他们一部分一部分地拆解,并研究每一个小部分。通过构建系统以深入探索专家AI的内部工作机制,我们将创造一个学习的飞轮。最终,专家AI可能超越领域专家的角色,成为下一代专家——无论是人类还是AI——的教师。
AI行业的终极目标是实现AGI(通用人工智能),期望仅凭简单指令就能用媲美或超越人类的智力执行任何任务。然而,当前的大模型在处理多步骤复杂任务时仍存在明显局限。以“数据分析图表、剧情游戏”或“本文结构化外文精读”等需要多个子步骤协调完成的任务为例,即便是最先进的ChatGPT-4o和Claude 3.5 sonnet,仅依靠单一Prompt指令也难以实现稳定执行。现阶段的AI Agent更像缺乏独立解决问题能力的职场新人,需要遵循mentor的指引,按照给定的SOP流程才能完成特定任务。本文将帮助你了解如何将一个复杂任务从需求雏形逐步落地,构筑为一个AI Agent,为你后续手捏Agent提供思路指引。