Chat with Wiki - 如何使用AI agent

Answer

使用 AI Agent 主要包括以下几个方面：

理解工具：AI Agent 有效使用工具的前提是全面了解其应用场景和调用方法。利用 LLM 的 zero-shot learning 和 few-shot learning 能力，可通过描述工具功能和参数的 zero-shot demonstration 或特定工具使用场景和相应方法演示的少量提示来获取工具知识。面对复杂任务，AI Agent 应先将其分解为子任务，再组织和协调，这依赖于 LLM 的推理和规划能力及对工具的理解。
使用工具：AI Agent 学习使用工具的方法主要包括从 demonstration 中学习和从 reward 中学习（清华有相关从训练数据中学习的文章）。这包括模仿人类专家行为，了解行为后果，并根据环境和人类反馈（包括行动结果反馈、环境状态变化的中间反馈、显性评价和隐性行为如点击链接）做出调整。
具身智能：在追求 AGI 的过程中，具身 Agent 成为核心研究范式，强调智能系统与物理世界紧密结合。与传统深度学习模型不同，LLM-based Agent 能主动感知和理解物理环境并互动，利用内部知识库决策并产生行动改变环境，此系列行为称为“具身行动”。

此外，AI Agent 还包括以下概念：

Chain：通常一个 AI Agent 可能由多个 Chain 组成，一个 Chain 视作一个步骤，可接受输入变量并产生输出变量，大部分 Chain 是大语言模型完成的 LLM Chain。
Router：可使用判定（甚至用 LLM 判定）让 Agent 走向不同的 Chain，如根据输入是图片还是其他进行不同处理。
Tool：Agent 上的一次工具调用，如互联网搜索、数据库检索。

同时，还需要三个 Agent：

Responser Agent：主 agent，用于回复用户（伪多模态）。
Background Agent：背景 agent，用于推进角色当前状态，如进入下一个剧本，抽检生成增长的记忆体等。
Daily Agent：每日 agent，用于生成剧本、配套图片及每日朋友圈。Background Agent 每隔一段时间运行一次（默认 3 分钟），分析期间的历史对话，变更人物关系、反感度，抽简对话内容提取信息成为“增长的记忆体”，按照时间推进人物剧本，有概率主动聊天（与亲密度正相关，跳过夜间时间）。

Content generated by AI large model, please carefully verify (powered by aily)

References

AI-Agent系列(一)：智能体起源探究

理解工具：AI Agent有效使用工具的前提是全面了解工具的应用场景和调用方法。没有这种理解，Agent使用工具的过程将变得不可信，也无法真正提高AI Agent的能力。利用LLM强大的zero-shot learning和few-shot learning能力，AI Agent可以通过描述工具功能和参数的zero-shot demonstartion或提供特定工具使用场景和相应方法演示的少量提示来获取工具知识。这些学习方法与人类通过查阅工具手册或观察他人使用工具进行学习的方法类似。在面对复杂任务时，单一工具往往是不够的。因此，AI Agent应首先以适当的方式将复杂任务分解为子任务，然后有效地组织和协调这些子任务，这有赖于LLM的推理和规划能力，当然也包括对工具的理解。使用工具：AI Agent学习使用工具的方法主要包括从demonstartion中学习和从reward中学习（清华有一篇从训练数据中学习的文章）。这包括模仿人类专家的行为，以及了解其行为的后果，并根据从环境和人类获得的反馈做出调整。环境反馈包括行动是否成功完成任务的结果反馈和捕捉行动引起的环境状态变化的中间反馈；人类反馈包括显性评价和隐性行为，如点击链接。具身智能在追求人工通用智能（AGI）的征途中，具身Agent（Embodied Agent）正成为核心的研究范式，它强调将智能系统与物理世界的紧密结合。具身Agent的设计灵感源自人类智能的发展，认为智能不仅仅是对预设数据的处理，更多地来自于与周遭环境的持续互动和反馈。与传统的深度学习模型相比，LLM-based Agent不再局限于处理纯文本信息或调用特定工具执行任务，而是能够主动地感知和理解其所在的物理环境，进而与其互动。这些Agent利用其内部丰富的知识库，进行决策并产生具体行动，以此改变环境，这一系列的行为被称为“具身行动”。

AI-Agent系列(一)：智能体起源探究

皮皮：你的微信虚拟女友 - 李洛云

AI Agent：基于大型语言模型（LLM）和其他技术实现的智能实体，其核心功能在于自主理解、规划决策、执行复杂任务。AI Agent包括下面几个概念：Chain：通常一个AI Agent可能由多个Chain组成。一个Chain视作是一个步骤，可以接受一些输入变量，产生一些输出变量。大部分的Chain是大语言模型完成的LLM Chain。Router：我们可以使用一些判定（甚至可以用LLM来判定），然后让Agent走向不同的Chain。例如：如果这是一个图片，则a；否则b。Tool：Agent上可以进行的一次工具调用。例如，对互联网的一次搜索，对数据库的一次检索。总结下来我们需要三个Agent：Responser Agent：主agent，用于回复用户（伪多模态）Background Agent：背景agent，用于推进角色当前状态（例如进入下一个剧本，抽检生成增长的记忆体）Daily Agent：每日agent，用于生成剧本，配套的图片，以及每日朋友圈Responser AgentDaily AgentBackground Agent每隔一段时间运行一次（默认3分钟）分析期间的历史对话变更人物关系（亲密度，了解度等）变更反感度，如果超标则拉黑用户抽简对话内容，提取人物和用户的信息成为“增长的记忆体”按照时间推进人物剧本有概率主动聊天（与亲密度正相关，跳过夜间时间）[heading1]复杂的东西：中期记忆中的增长记忆体