Chat with Wiki - AI agent和智能体有什么区别

Answer

AI agent 和智能体在以下方面存在区别：

概念侧重点：AI agent 更强调作为数字人的大脑，拥有记忆模块等，以实现更真实的交互；智能体则被视为智能的最小单元，是可以设定目标后主动完成任务的。
能力构成：AI agent 主要通过接入大语言模型，并结合工具、记忆、行动、规划等能力来发挥作用；智能体不仅具备推理能力，还能执行全自动化业务，但目前许多相关产品仍需人类参与。
实现方式：AI agent 目前行业里主要通过如 langchain 框架，在 prompt 层和工具层完成设计，将大模型与工具进行串接；智能体在实现上可能涉及更多复杂的技术和逻辑。

Content generated by AI large model, please carefully verify (powered by aily)

References

这类数字人强调自驱动，人为干预更少，技术实现上更加复杂，一个最简单的算法驱动的数字人大致流程如下：其中三个核心算法分别是：1.ASR(Automatic Speech Recognition，语音识别)：我们希望和数字人的交互跟人一样以对话为主，所以算法驱动的第一步就是语音识别，它能将用户的音频数据转化为文字，便于数字人理解和生成回应。2.AI Agent（人工智能体）：充当数字人的大脑，可以直接接入大语言模型，强调Agent的概念是为了让数字人拥有记忆模块等更加真实。3.TTS(Text to Speech，文字转语音）：数字人依靠LLM生成的输出是文字，为了保持语音交互一致性，需要将文字转换为语音，由数字人。

Ranger：【AI 大模型】非技术背景，一文读懂大模型（长文）

agent算是从年前到现在，比较火的一个概念了，也被很多人认为是大模型的未来的一个主要发展方向。首先我们看这个很经典的一张图看起来还是蛮复杂的，然后市面上的很多描述agent的文章写的也比较复杂，说智能体是啥智能的最小单元，相较于copilot，是可以给他设定一个目标后主动完成任务的等等。当然这些说法都没错，但是我觉得还是有些不好理解的。所以我们依然先从原理着手去理解下，agent是个什么东西。首先这张图里，中间的“智能体”，其实就是llm，或者说大模型。四个箭头，分别是我们为llm增加的四个能力。工具、记忆、行动、规划。那么这个是怎么新增的呢？目前行业里主要用到的是一个叫langchain的框架，这个框架可以简单理解为，他把llm和llm之间，以及llm和工具之间，通过代码或prompt的形式，进行了串接。这个其实也像是在rag的基础上再进了一步。因为我们知道rag其实是给了大模型一个浏览器工具来使用嘛，那agent，其实就是给了大模型更多的工具。比如像是长期记忆，其实就是给了大模型一个数据库工具让其往里记录重要信息。规划和行动，其实就是在大模型的prompt层做的些逻辑，比如让其将目标进行每一步的拆解，拆解完成后，每一步去输出不同的固定格式action指令，给到工具作为输入。当然langchain或者说agent还不止这些，也会有很多其他的代码逻辑体现在其中，不过其主要的主干逻辑，其实还是在prompt层和工具层，完成的设计。

问：AGI 的 5 个等级是什么？

OpenAI在其内部会议上分享了关于通用人工智能（AGI）的五个发展等级。OpenAI自2015年成立以来，一直将AGI作为其战略目标之一，随着ChatGPT、多模态大模型和AI Agent等技术的发展，我们似乎越来越接近实现这一目标。AGI的五个等级分别为：1.聊天机器人（Chatbots）：具备基本对话能力的AI，主要依赖预设脚本和关键词匹配，用于客户服务和简单查询响应。2.推理者（Reasoners）：具备人类推理水平的AI，能够解决复杂问题，如ChatGPT，能够根据上下文和文件提供详细分析和意见。3.智能体（Agents）：不仅具备推理能力，还能执行全自动化业务的AI。目前许多AI Agent产品在执行任务后仍需人类参与，尚未达到完全智能体的水平。4.创新者（Innovators）：能够协助人类完成新发明的AI，如谷歌DeepMind的AlphaFold模型，可以预测蛋白质结构，加速科学研究和新药发现。5.组织（Organizations）：最高级别的AI，能够自动执行组织的全部业务流程，如规划、执行、反馈、迭代、资源分配和管理等。