Chat with Wiki - 一句话阐述ai agent的原理。

Answer

AI Agent 的原理主要包括以下几个方面：

其核心通常是大型语言模型（LLM）或大模型。
为 LLM 增加了工具、记忆、行动、规划这四个能力。
- 工具：如长期记忆，相当于给大模型一个数据库工具来记录重要信息。
- 记忆：提供长期记忆能力。
- 行动：将目标进行每一步的拆解，并输出不同的固定格式 action 指令给工具。
- 规划：在大模型的 prompt 层做逻辑处理，如目标拆解。
目前行业里主要用到的是 langchain 框架，它通过代码或 prompt 的形式将 LLM 与 LLM 之间以及 LLM 与工具之间进行串接。
心灵社会理论认为，智能是由许多简单的 Agent（分等级、分功能的计算单元）共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能，通过协作实现复杂的智能行为。
- 多重层次：从低层次的感知和反应到高层次的规划和决策，每个层次由多个 Agent 负责。
- 功能模块：每个 Agent 类似于功能模块，专门处理特定类型的信息或执行特定任务。
- 分布式智能：智能通过多个相互关联的 Agent 共同实现，提高系统的灵活性和鲁棒性。
AI Agent 包括 Chain（步骤，可接受输入变量并产生输出变量）、Router（通过判定让 Agent 走向不同的 Chain）、Tool（工具调用）等概念。同时，还需要 Responser Agent（主 agent，用于回复用户）、Background Agent（背景 agent，用于推进角色当前状态）、Daily Agent（每日 agent，用于生成剧本等）等不同类型的 Agent 协同工作。

Content generated by AI large model, please carefully verify (powered by aily)

References

agent算是从年前到现在，比较火的一个概念了，也被很多人认为是大模型的未来的一个主要发展方向。首先我们看这个很经典的一张图看起来还是蛮复杂的，然后市面上的很多描述agent的文章写的也比较复杂，说智能体是啥智能的最小单元，相较于copilot，是可以给他设定一个目标后主动完成任务的等等。当然这些说法都没错，但是我觉得还是有些不好理解的。所以我们依然先从原理着手去理解下，agent是个什么东西。首先这张图里，中间的“智能体”，其实就是llm，或者说大模型。四个箭头，分别是我们为llm增加的四个能力。工具、记忆、行动、规划。那么这个是怎么新增的呢？目前行业里主要用到的是一个叫langchain的框架，这个框架可以简单理解为，他把llm和llm之间，以及llm和工具之间，通过代码或prompt的形式，进行了串接。这个其实也像是在rag的基础上再进了一步。因为我们知道rag其实是给了大模型一个浏览器工具来使用嘛，那agent，其实就是给了大模型更多的工具。比如像是长期记忆，其实就是给了大模型一个数据库工具让其往里记录重要信息。规划和行动，其实就是在大模型的prompt层做的些逻辑，比如让其将目标进行每一步的拆解，拆解完成后，每一步去输出不同的固定格式action指令，给到工具作为输入。当然langchain或者说agent还不止这些，也会有很多其他的代码逻辑体现在其中，不过其主要的主干逻辑，其实还是在prompt层和工具层，完成的设计。

AI-Agent系列(一)：智能体起源探究

核心思想：心灵社会理论认为，智能是由许多简单的Agent（分等级、分功能的计算单元）共同工作和相互作用的结果。这些Agent在不同层次上执行不同的功能，通过协作实现复杂的智能行为。多重层次：心灵社会将智能划分为多个层次，从低层次的感知和反应到高层次的规划和决策，每个层次由多个Agent负责。功能模块：每个Agent类似于功能模块，专门处理特定类型的信息或执行特定任务，如视觉处理、语言理解、运动控制等。分布式智能：智能不是集中在单一的核心处理单元，而是通过多个相互关联的Agent共同实现。这种分布式智能能够提高系统的灵活性和鲁棒性，应对复杂和多变的环境。同时，在《心灵社会》中，明斯基还详细描述了不同类型的Agent及其功能：专家Agent：拥有特定领域知识和技能的Agent，负责处理复杂的任务和解决特定问题。管理Agent：协调和控制其他Agent的活动，确保整体系统协调一致地运行。学习Agent：通过经验和交互，不断调整和优化自身行为，提高系统在不断变化环境中的适应能力。从达特茅斯会议开始讨论人工智能（Artificial Intelligence），到马文·明斯基引入“Agent”概念，到这里，“AI”和“Agent”就彻底聚齐了。往后，我们都将其称之为AI Agent。

皮皮：你的微信虚拟女友 - 李洛云

AI Agent：基于大型语言模型（LLM）和其他技术实现的智能实体，其核心功能在于自主理解、规划决策、执行复杂任务。AI Agent包括下面几个概念：Chain：通常一个AI Agent可能由多个Chain组成。一个Chain视作是一个步骤，可以接受一些输入变量，产生一些输出变量。大部分的Chain是大语言模型完成的LLM Chain。Router：我们可以使用一些判定（甚至可以用LLM来判定），然后让Agent走向不同的Chain。例如：如果这是一个图片，则a；否则b。Tool：Agent上可以进行的一次工具调用。例如，对互联网的一次搜索，对数据库的一次检索。总结下来我们需要三个Agent：Responser Agent：主agent，用于回复用户（伪多模态）Background Agent：背景agent，用于推进角色当前状态（例如进入下一个剧本，抽检生成增长的记忆体）Daily Agent：每日agent，用于生成剧本，配套的图片，以及每日朋友圈Responser AgentDaily AgentBackground Agent每隔一段时间运行一次（默认3分钟）分析期间的历史对话变更人物关系（亲密度，了解度等）变更反感度，如果超标则拉黑用户抽简对话内容，提取人物和用户的信息成为“增长的记忆体”按照时间推进人物剧本有概率主动聊天（与亲密度正相关，跳过夜间时间）[heading1]复杂的东西：中期记忆中的增长记忆体