Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

agent

Answer

智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,既可以是软件程序,也可以是硬件设备。

在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并具有以下关键组成部分:

  1. 规划:包括子目标和分解,将大型任务分解为更小、可管理的子目标,以有效处理复杂任务。
  2. 反思和完善:能够对过去的行为进行自我批评和反思,从错误中吸取教训,完善未来步骤,提高最终结果质量。
  3. 记忆:包含短期记忆,用于所有的上下文学习;长期记忆,通过利用外部向量存储和快速检索,为 Agents 提供长时间保留和回忆(无限)信息的能力。
  4. 工具使用:Agents 学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。

以下是一些关于智能体 Agent 的相关目录:

  1. 大圣-技术开发/Agent
  2. 安仔-技术开发/Agent
  3. 一泽 Eze-Agent/Prompt
  4. 景淮-GPTs/Agents
  5. 刘宇龙 Rryu-GPTs
  6. 艾木-技术开发/Agent

从产品角度思考 Agent 设计:

  1. Agent 可以是一个历史新闻探索向导。
    • 身份:历史新闻探索向导
    • 性格:知识渊博、温暖亲切、富有同情心
    • 角色:主导新闻解析和历史背景分析
    • 为使角色更生动,可为其设计简短背景故事,如曾是一位历史学家,对重大历史事件了如指掌,充满热情,愿意分享知识。
  2. 写好角色个性的方法:
    • 角色背景和身份:编写背景故事,明确起源、经历和动机。
    • 性格和语气:定义性格特点,如友好、幽默、严肃或神秘;确定说话方式和风格。
    • 角色互动方式:设计对话风格,从基本问答到深入讨论。
    • 角色技能:明确核心功能,如提供新闻解析、历史背景分析或心理分析;增加附加功能以提高吸引力和实用性。

正如《Character.ai:每个人都可定制自己的个性化 AI》所写:个性化定制的“虚拟伴侣”能得到用户认可,是因为精准击中许多年轻人无处可藏的孤独和焦虑,背后是年轻人渴望被理解、沟通和交流。美国心理学家 Robert Jeffrey Sternberg 提出了“爱情三角理论”,认为爱情包含“激情”“亲密”“承诺”三个要素。激情是生理上或情绪上的唤醒,例如对某人有强烈的性或浪漫的感觉;亲密是一种相互依恋的感觉,通过相互联结带来的喜爱和相互沟通分享自己的所见所闻、喜怒哀乐来体现;承诺是决定建立长期稳定关系,融入对方生活,形成互助互惠的关系,代表着一种长相厮守的责任。

Content generated by AI large model, please carefully verify (powered by aily)

References

问:什么是智能体 Agent

"智能体"(Agent)在人工智能和计算机科学领域是一个非常重要的概念。它指的是一种能够感知环境并采取行动以实现特定目标的实体。智能体可以是软件程序,也可以是硬件设备。以下是对智能体的详细介绍:[heading3]智能体的定义[content]智能体是一种自主系统,它可以通过感知环境(通常通过传感器)并采取行动(通常通过执行器)来达到某种目标。在LLM支持的自主Agent系统中,LLM充当Agents的大脑,并辅以几个关键组成部分:规划子目标和分解:Agents将大型任务分解为更小的、可管理的子目标,从而能够有效处理复杂的任务。反思和完善:Agents可以对过去的行为进行自我批评和自我反思,从错误中吸取教训,并针对未来的步骤进行完善,从而提高最终结果的质量。记忆短期记忆:所有的上下文学习都是利用模型的短期记忆来学习。长期记忆:这为Agents提供了长时间保留和回忆(无限)信息的能力,通常是通过利用外部向量存储和快速检索来实现。工具使用Agents学习调用外部API来获取模型权重中缺失的额外信息(通常在预训练后很难更改),包括当前信息、代码执行能力、对专有信息源的访问等。

智能体 Agent 目录

[大圣-技术开发/Agent](https://waytoagi.feishu.cn/wiki/AaswweY9iiEqFZkgrrNcBAAsnNg)[安仔-技术开发/Agent](https://waytoagi.feishu.cn/wiki/LT6GwjPggigfsDk6hMscoiU5nvx)[一泽Eze-Agent/Prompt](https://waytoagi.feishu.cn/wiki/RL5AwtPrcieK1ZkcIKUcCkjFnNe)[景淮-GPTs/Agents](https://waytoagi.feishu.cn/wiki/JvHXwrsAIiwxFLk9ivzcbZTrnaf)[刘宇龙Rryu-GPTs](https://waytoagi.feishu.cn/wiki/V5YCw8u2AiiCSfk068tcsjO0nwd)[艾木-技术开发/Agent](https://waytoagi.feishu.cn/wiki/OGUTwWmpji5ifLkuJsYczdHMnRh)

Roger:从产品角度思考 Agent 设计

我们的Agent是一个历史新闻探索向导。身份:历史新闻探索向导性格:知识渊博、温暖亲切、富有同情心角色:主导新闻解析和历史背景分析为了使角色更加生动,我为Agent设计了一个简短的背景故事。比如,这个Agent曾是一位历史学家,对世界上的重大历史事件了如指掌,充满热情,愿意分享知识。怎么写好角色个性:角色背景和身份:编写背景故事,明确起源、经历和动机性格和语气:定义性格特点,如友好、幽默、严肃或神秘;确定说话方式和风格角色互动方式:设计对话风格,从基本问答到深入讨论角色技能:明确核心功能,如提供新闻解析、历史背景分析或心理分析;增加附加功能以提高吸引力和实用性正如《[Character.ai:每个人都可定制自己的个性化AI](https://waytoagi.feishu.cn/wiki/EoBkwirgjiqscKkAO6Wchyf1nPe)》所写:个性化定制的“虚拟伴侣”能得到用户的认可,这是因为精准地击中了许多年轻人无处可藏的孤独和焦虑,背后是年轻人渴望被理解、沟通和交流。美国心理学家Robert Jeffrey Sternberg提出了“爱情三角理论”,认为爱情包含“激情”、“亲密”和“承诺”三个要素。激情是生理上或情绪上的唤醒,例如对某人有强烈的性或浪漫的感觉;亲密是一种相互依恋的感觉,通过相互联结带来的喜爱和相互沟通分享自己的所见所闻、喜怒哀乐来体现;承诺是决定建立长期稳定关系,融入对方生活,形成互助互惠的关系,代表着一种长相厮守的责任。

Others are asking
agent 打通应用之间的协议?
在 AI 领域中,Agent 是连接模型与应用的关键。端侧 Agents 是在终端设备上自主运行的智能代理程序,具备感知、决策、执行的闭环能力。 Agent 之所以重要,原因包括:端侧资源约束要求最优化使用,任务具有复杂性,生态存在多样性,双系统路线更适合端侧。 Agent 创造价值的方式体现在双重价值实现:一是资源优化,包括任务分解、按需调用;二是生态连接,比如跨应用协作、UI 理解。 其发展趋势包括:技术上从单一模型到多智能体协作;生态上从封闭应用到开放服务;交互上从指令执行到场景理解。 在技术层面,AI Agent 的发展出现了两条技术路线:一是以自主决策为核心的 LLM 控制流,二是以工作流(Workflow)编排为重点的工具集成系统。 特别值得关注的是 Anthropic 提出的 MCP(Model Context Protocol),它的本质是一个通用接口协议,试图解决让 AI 模型能够以标准化、可扩展的方式与外部世界交互的问题。 此外,还有 Agent Protocol 这种用于与 AI 代理进行通信的统一接口,它提供了一种 API 规范,任何代理开发者都可以实现该协议,设计简单且不依赖特定技术栈,有助于生态系统发展和简化集成,并提供了不同语言的 SDK 供开发者使用。
2025-03-09
做一个每日收集兴趣信息的工具,如收集agent,从微信公众号上收集,应该怎么做
以下是一种通过文章链接订阅公众号,定时推送情报消息,并实现情报 CoT 问答的方式来做每日收集兴趣信息的工具: 1. 安装 Docker(假设已经装上) 浏览器打开:http://127.0.0.1:4000 或 http://wewerss 服务的 IP:端口(为上面设置的外部端口) 点开后,输入 Dash 管理页面密码 先点帐号管理,然后点“添加读书帐号”(即使用微信读书来实现公众号订阅),扫码添加帐号 然后在公众号源上,点添加 将您想订阅的公众号的一篇文章链接粘贴并点确定即可订阅公众号文章。但建议不要短时间订阅太多公众号(最好不超 40 个),然后在本地 data/目录会生成一个 SQLite 数据库文件 wewerss.db 2. 关于 Coze 工作流和 Bot 因为前面需要对多维表格操作,所以要先在 http://open.feishu.cn 上建一个飞书机器人,并添加知识库或多维表格编辑权限,具体可参考飞书文档。得到机器人的 app_id 和 app_secret 即可获得租用 token:tenant_access_token 来获取多维表格数据和编辑能力。 工作流一:通过微信文章链接进行文章解读成摘要报告。通过 LLM 能力,开源提示词如下。由于 Coze 使用 LLM 和批量执行任务延时的约束,建议不要同时处理太多文章(如 6 篇左右)。这样执行后,将多维表格的文章状态转换成“已通知”并生成简报。 消息情报官 Bot:最后可以通过 Coze,建定时任务,执行工作流二,并添加其他如分析文章和搜索文章的能力,即可变成一个消息情报官的 Agent,我们即可以获得想要的领域或行业情报,也可以深入挖掘相关情报的信息。然后发布到想要的平台,如:Coze 商店、豆包、飞书、微信、微信公众号、微信小程序等,即可使用。可以构建多个分身,就能收集整理不同领域和行业的情报信息。 如感兴趣欢迎联系交流合作。
2025-03-08
AI Agent MANUS个人助手是否可以本地私有化部署
目前没有明确的信息表明 AI Agent MANUS 个人助手可以本地私有化部署。 Manus 是一款由中国团队研发的全球首款通用型 AI 代理工具,于 2025 年 3 月 5 日正式发布。它区别于传统聊天机器人,具备自主规划、执行复杂任务并直接交付完整成果的能力。其技术架构主要基于多智能体架构,运行在独立的虚拟机中,核心功能由多个独立模型共同完成,包括规划、执行和验证三个子模块,还包括虚拟机、计算资源、生成物、内置多个 agents 等关键组件,并采用了“少结构,多智能体”的设计哲学。 但对于其是否能本地私有化部署,现有资料未给出确切说明。在构建高质量的 AI 数字人方面,由于整个数字人的算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,算法一般会部署到额外的集群或者调用提供出来的 API。而在本地部署资讯问答机器人方面,有相关案例,但未提及与 AI Agent MANUS 个人助手的直接关联。
2025-03-07
AI Agent MANUS个人助手
AI Agent MANUS 个人助手是一种真正自主的 AI 代理。它区别于传统的 AI 助手,能够自主完成复杂任务,不仅生成想法,还能直接执行并交付结果。其核心亮点包括: 1. 自主执行:可直接执行任务,而非仅提供建议。 2. 类人工作模式:能解压文件、浏览网页、阅读文档、提取关键信息等。 3. 云端异步运行:在后台执行任务,完成后自动通知用户。 4. 持续学习和记忆:从用户反馈中学习,提高未来任务的准确性。 5. “心智与手”理念:象征着实际执行能力。 在构建高质量的 AI 数字人时,涉及到为数字人构建灵魂,使其具备各种智能,充当个人助手等。其中在构建数字人灵魂方面,有以下几个工程关键点: 1. AI Agent:要让数字人像人一样思考,需要编写一个像人一样的 Agent,工程实现所需的记忆模块、工作流模块、各种工具调用模块的构建存在挑战。 2. 驱动躯壳的实现:灵魂部分通过定义接口由躯壳部分通过 API 调用,调用方式视躯壳部分的实现而定。但包含情绪的语音表达以及保证躯壳的口型、表情、动作和语音的同步及匹配存在困难,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对成熟但闭源。 3. 实时性:由于数字人的算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,算法一般会部署到额外的集群或者调用提供出来的 API,会涉及到网络耗时和模型推理耗时,低延时是亟需解决的问题。 4. 多元跨模态:仅仅语音交互的数字人远远不够,可根据实际需求添加其他感官,如通过添加摄像头数据获取视觉信息,再通过系列 CV 算法做图像解析等。 5. 拟人化场景:正常与人交流时并非线性对话,会有插话、转移话题等情况,这些情景的工程处理需要优化。 在人工智能的发展历程中,Agent(智能代理)一直是令人着迷的概念之一。2024 年,Agent 技术实现了从概念到实践的关键突破。例如,当对手机下达指令“帮我给同事的朋友圈点赞”,AI 就能识别屏幕并完成操作。这种进化展示了 AI 不仅能“听懂”,还能“思考”和“行动”,会分析任务、规划步骤、选择工具,甚至在遇到问题时及时调整策略。2024 年,Anthropic 的 Computer Use、智谱 AI 的 AutoGLM 以及 Google 的 Gemini 2.0 等都展示了 AI Agent 的突破性进展。这种接近成型的工程化的 Agent 核心在于四个关键能力的进展,但在过往,类似的 Agent 能力存在成功率不高、泛化能力不够强等问题,训练模型识别所有 App 的 UI 很难,模型进行自主操作也是难点。
2025-03-07
如何使用AI agent
使用 AI Agent 主要包括以下几个方面: 1. 理解工具:AI Agent 有效使用工具的前提是全面了解其应用场景和调用方法。利用 LLM 的 zeroshot learning 和 fewshot learning 能力,可通过描述工具功能和参数的 zeroshot demonstration 或特定工具使用场景和相应方法演示的少量提示来获取工具知识。面对复杂任务,AI Agent 应先将其分解为子任务,再组织和协调,这依赖于 LLM 的推理和规划能力及对工具的理解。 2. 使用工具:AI Agent 学习使用工具的方法主要包括从 demonstration 中学习和从 reward 中学习(清华有相关从训练数据中学习的文章)。这包括模仿人类专家行为,了解行为后果,并根据环境和人类反馈(包括行动结果反馈、环境状态变化的中间反馈、显性评价和隐性行为如点击链接)做出调整。 3. 具身智能:在追求 AGI 的过程中,具身 Agent 成为核心研究范式,强调智能系统与物理世界紧密结合。与传统深度学习模型不同,LLMbased Agent 能主动感知和理解物理环境并互动,利用内部知识库决策并产生行动改变环境,此系列行为称为“具身行动”。 此外,AI Agent 还包括以下概念: 1. Chain:通常一个 AI Agent 可能由多个 Chain 组成,一个 Chain 视作一个步骤,可接受输入变量并产生输出变量,大部分 Chain 是大语言模型完成的 LLM Chain。 2. Router:可使用判定(甚至用 LLM 判定)让 Agent 走向不同的 Chain,如根据输入是图片还是其他进行不同处理。 3. Tool:Agent 上的一次工具调用,如互联网搜索、数据库检索。 同时,还需要三个 Agent: 1. Responser Agent:主 agent,用于回复用户(伪多模态)。 2. Background Agent:背景 agent,用于推进角色当前状态,如进入下一个剧本,抽检生成增长的记忆体等。 3. Daily Agent:每日 agent,用于生成剧本、配套图片及每日朋友圈。Background Agent 每隔一段时间运行一次(默认 3 分钟),分析期间的历史对话,变更人物关系、反感度,抽简对话内容提取信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。
2025-03-07
agent有哪些文章推荐?
以下是为您推荐的关于 agent 的文章: 从下往上看,一个一个点进去,都有视频。共学都有视频,都是手把手从注册开始的教学,不会就多看几遍,基本保障一个工具能调通、一个 Agent 能搭好。 注意事项:确实内容有点多,点进去看看哪个工具您听过就从哪个工具开始吧,不然太累啦。 看了一些视频之后,您就知道您要看理论还是应用了,找到导航,想看哪里点哪里。 备注:智能千帆、阿里云百炼都是有视频的,其余没有视频。 注意事项:确实内容有点多,您如果都看到这里了,就要考虑聚焦了,先挑一个,开始手把手一起做起来,看看能不能持续用起来,只要您开始用起来,这事儿就成啦! 增加了 AI Agent 图谱,由共建者缱绻怡然制作。 》,作者孔某人,主要讨论基于 LLM 的复杂 Agent 的实现。 《》,来自有新 Newin,Essential AI 由两位谷歌重要研究论文的作者 Ashish Vaswani 和 Niki Parmar 创立,2017 年在谷歌工作时与他人一起共同撰写了具有重要影响力的论文《Attention Is All You Need》。Essential AI 正在开发全栈 AI 产品,这些产品具备快速学习能力,能够通过自动化繁琐且耗时的工作流程来提高生产力。 Tesla 发布 Optimus Gen2 机器人,现在拥有更加精致的外观,并且比 5 月份特斯拉展示 Optimus Gen1 时的速度快了 30%,。 《》是微软亚洲研究院、华为天才少年李博杰的一篇文章,虽然目前的大模型技术已经非常强大,应付日常的 chat 并不难,但做一个有多模态能力、有记忆、能解决复杂任务、会利用工具、有性格、有情感、有自主性、低成本、高可靠的 AI Agent 并不容易。如果说 Chat 是大模型的第一个应用场景,也许 Agent 才是大模型真正的 killer app。 《》的 GitHub 地址,收集了多模态大型语言模型的最新论文和数据集及其评估。 《》是知识库的好友「INDIGO 的数字镜像」万字长文,本探讨在新一轮的 AI 变革之下,如何用新工具来帮助扩展大脑思维与记忆的边界,以及知识工作流的新方法,激发潜能,构建外脑!强烈推荐阅读。 《》是波士顿咨询的一篇新文章,讲述 CEO 抓住机遇和应对挑战,他们必须在三个关键支柱上做出选择:潜力、人员和政策。 收集群友的每日创作。
2025-03-07