当前在 AI 智能体领域,以下类型表现较好:
此外,AGI 分为五个等级:
生成式AI应用当前有三个核心用例与强大的产品市场契合度:搜索、合成和生成。Menlo Ventures投资组合公司如[Sana](https://menlovc.com/portfolio/sana-labs/)*(企业搜索)、[Eve](https://menlovc.com/portfolio/eve/)*(法律研究副驾驶)和[Typeface](https://menlovc.com/portfolio/typeface/)*(内容生成AI)在这些类别中都是早期突破性的代表,其中心是LLMs的少样本推理能力。但是生成式人工智能的承诺远远超越了这第一波核心使用案例。能为您阅读和写作的人工智能很棒,但更令人兴奋的是能够代表您思考和行动的人工智能。为此,我们已经看到领先的应用程序构建商如[Anterior](https://www.anterior.com/)、[Sema4](https://sema4.ai/)和[Cognition](https://www.cognition.ai/)正在建立解决方案,来处理之前只能由大量人力来解决的工作流程。借助多步逻辑、外部内存以及访问第三方工具和API等新型构建块,下一波智能体正在拓展AI能力的边界,实现端到端流程自动化。在我们深入探讨人工智能体领域的过程中,我们将概述Menlo对新兴市场的论点——首先定义什么是智能体以及什么使它们成为可能。我们将追溯[现代人工智能技术栈](https://menlovc.com/perspective/the-modern-ai-stack-design-principles-for-the-future-of-enterprise-ai-architectures/)从少量样本指令到检索增强型生成(RAG)再到完备的智能体系统的架构演化过程,然后探讨这一范式转变对应用和基础设施层面的影响。
很明确,未来的完全自主智能体可能会拥有所有四个构建块,但今天的LLM应用程序和智能体还没有达到这个水平。例如,流行的RAG架构不是智能体式的,而是以推理和外部记忆作为其基础。一些设计,如[OpenAI的结构化输出](https://openai.com/index/introducing-structured-outputs-in-the-api/)甚至支持工具使用。但重要的区别在于,这些应用程序将LLM作为语义搜索、综合或生成的"工具",但它们采取的步骤(即逻辑流)仍由代码预先确定。对比来说,当您将LLM置于应用程序的控制流中并让它动态决定要采取的行动、要使用的工具以及如何解释和响应输入时,智能体就会出现。只要这是真的,有些智能体甚至不需要与外部工具交互或采取行动。在Menlo,我们确定了三种不同主要用例和应用程序进程控制自由度的智能体类型。受到最严格限制的是"决策智能体"设计,它们使用语言模型来遍历预定义的决策树。"轨道智能体"则提供了更大的自由度,为智能体配备了更高层次的目标,但同时限制了解决空间,要求遵循标准作业程序并使用预先设定的"工具"库。最后,在光谱的另一端是"通用人工智能体"——本质上是没有任何数据支架的for循环,完全依赖于语言模型的推理能力来进行所有的计划、反思和纠正。以下,我们将探讨五种参考架构和每种智能体类型的人工智能体示例。
OpenAI在其内部会议上分享了关于通用人工智能(AGI)的五个发展等级。OpenAI自2015年成立以来,一直将AGI作为其战略目标之一,随着ChatGPT、多模态大模型和AI Agent等技术的发展,我们似乎越来越接近实现这一目标。AGI的五个等级分别为:1.聊天机器人(Chatbots):具备基本对话能力的AI,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。2.推理者(Reasoners):具备人类推理水平的AI,能够解决复杂问题,如ChatGPT,能够根据上下文和文件提供详细分析和意见。3.智能体(Agents):不仅具备推理能力,还能执行全自动化业务的AI。目前许多AI Agent产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。4.创新者(Innovators):能够协助人类完成新发明的AI,如谷歌DeepMind的AlphaFold模型,可以预测蛋白质结构,加速科学研究和新药发现。5.组织(Organizations):最高级别的AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。