Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

多智能体

Answer

多智能体(Multi-Agent)是由多个自主、独立的智能体(Agent)组成的系统。每个智能体都能感知环境、决策并执行任务,且它们之间能信息共享、任务协调与协同行动以实现整体目标。

随着大型语言模型(LLM)出现,以 LLM 为核心构建的 Agent 系统受广泛关注。单 Agent 核心在于 LLM 与工具协同配合,可能需与用户多轮交互;多 Agent 为不同 Agent 指定角色,通过协作完成复杂任务,与用户交互可能减少。

构建多 Agent 框架,需考虑增加的组件,包括:

  1. 环境(environment):所有 Agent 处于同一环境,环境含全局状态信息,Agent 与环境有信息交互与更新。
  2. 阶段(stage):现有多 Agent 框架常采用 SOP 思想,将复杂任务分解为多个子任务。
  3. 控制器(controller):可以是 LLM 或预先定义好的规则,负责环境在不同 Agent 和阶段间切换。
  4. 记忆:多 Agent 框架中因 Agent 数量增多,消息数量及每条消息需记录的字段也增多。

此外,新兴的依靠协同的多智能体系统是复杂智能行为可来自大量简单智能系统相互作用的一种实现智能的方法。Manus 作为一款通用型 AI 代理工具,其技术架构主要基于多智能体(Multiple Agent)架构,运行在独立虚拟机中,通过规划、执行和验证三个子模块分工协作处理复杂任务,核心功能由多个独立模型完成,还包括虚拟机、计算资源、生成物、内置多个 agents 等关键组件,采用“少结构,多智能体”设计哲学,实现高效处理复杂任务和高质量输出。

Content generated by AI large model, please carefully verify (powered by aily)

References

问:Multi-Agent是什么

多智能体(Multi-Agent)是由多个自主、独立的智能体(Agent)组成的系统。在这个系统中,每个智能体都能够感知环境、进行决策并执行任务,同时它们之间可以进行信息共享、任务协调以及协同行动,以实现整体的目标。[heading2]关于Multi-Agent[content]随着大型语言模型(LLM)的出现,以LLM为核心构建的Agent系统近期受到了广泛关注。Agent系统旨在利用LLM的归纳推理能力,为不同的Agent分配角色和任务信息,并配备相应的工具插件,以完成复杂的任务。目前,更常见的框架主要集中在单Agent场景下。单Agent的核心在于LLM与工具的协同配合。LLM根据用户任务的理解,推理出需要调用的工具,并根据调用结果向用户提供反馈。在任务完成过程中,Agent可能需要与用户进行多轮交互。与此同时,越来越多的Agent框架开始关注多Agent场景。为了完成任务,多Agent会为不同的Agent指定不同的角色,并通过Agent之间的协作来完成复杂的任务。与单Agent相比,在任务完成过程中,与用户的交互可能会减少一些。[heading2]主要组成部分[content]为构建一个多Agent框架,我们需要思考相对于单Agent,框架中增加了哪些组件。环境(environment):所有Agent应该处于同一个环境中。环境中包含全局状态信息,Agent与环境之间存在信息的交互与更新。阶段(stage):为了完成复杂任务,现有多Agent框架通常采用SOP思想,将复杂任务分解为多个子任务。控制器(controller):控制器可以是LLM,也可以是预先定义好的规则。它主要负责环境在不同Agent和阶段之间的切换。记忆:在单Agent中,记忆只包括用户、LLM回应和工具调用结果等部分。而在多Agent框架中,由于Agent数量增多,导致消息数量增多。同时,每条消息可能需要记录发送方、接收方等字段。

人工智能简介和历史

如果我们希望让一台计算机表现得像人类一样,需要在计算机内模拟人类的思维方式。因此,我们需要理解是什么造就了人类的“智能”。我们必须理解自己的决策过程是如何进行的,才能够为机器编写智能程序。如果你稍微做一下自我觉察,就会发现有些过程是下意识发生的,例如我们可以不假思索地区分出猫和狗,而有些过程则需要推理。解决这个问题有两种可能的方法:|自上而下的方法(符号推理)|自下而上的方法(神经网络)||-|-||自上而下的方法模拟人类通过推理来解决问题的方式。它包括对人类知识的提炼,并用计算机可读的形式来表示,此外还需要开发一种在计算机内部模拟推理的方法。|自下而上的方法模拟人脑的结构,由大量称为神经元的简单单元组成。每个神经元的行为取决于输入数据的加权平均值,我们可以提供训练数据来训练神经元网络,从而解决有用的问题。|还有一些其他可能实现智能的方法:新兴的、依靠协同的多智能体系统(multi-agent),它基于这样一个事实,即复杂的智能行为可以来自大量简单智能系统的相互作用。根据进化控制论,在元系统跃迁的过程中,智能可以从更简单的反应行为中产生。进化方法或遗传算法(genetic algorithm),是一种基于进化原理的优化过程。[1]译者注:元系统跃迁,[Metasystem Transition](https://en.wikipedia.org/wiki/Metasystem_transition),是指通过演化涌现出更高层次的组织或者控制。我们将在课程的后续部分考虑这些方法,但现在我们将重点关注自上而下、自下而上两个主要方向。

详解:Manus

Manus是一款由中国团队研发的全球首款通用型AI代理工具,于2025年3月5正式发布。它区别于传统聊天机器人(如ChatGPT),具备自主规划、执行复杂任务并直接交付完整成果的能力,被称为“首个真干活的AI”。[heading1]Manus AI代理工具的具体技术架构是什么?[content]Manus AI代理工具的具体技术架构主要基于多智能体(Multiple Agent)架构,运行在独立的虚拟机中。这种架构通过规划、执行和验证三个子模块的分工协作,实现了对复杂任务的高效处理。具体来说,Manus AI的核心功能由多个独立模型共同完成,这些模型分别专注于不同的任务或领域,如自然语言处理、数据分析、推理等。这种多模型驱动的设计不仅提高了系统的鲁棒性和准确性,还增强了其处理复杂任务的能力。[heading2]Manus AI的技术架构还包括以下几个关键组件:[content]1.虚拟机:Manus AI运行在云端虚拟机中,用户可以随时查看任务进度,适合处理耗时任务。2.计算资源:Manus AI利用计算资源生成算法,用于筛选简历等具体任务。3.生成物:Manus AI能够生成各种类型的输出,如文本、表格、报告等。4.内置多个agents:Manus AI通过内置多个智能体,实现了任务的分解和协同工作。此外,Manus AI还采用了“少结构,多智能体”的设计哲学,强调在数据质量高、模型强大、架构灵活的情况下,自然涌现AI的能力。这种设计使得Manus AI在处理复杂任务时更加高效和准确。Manus AI的技术架构通过多智能体协同工作、虚拟机运行和生成物输出等机制,实现了对复杂任务的高效处理和高质量输出。

Others are asking
关于人工智能逐渐取代基础劳动力的看法
人工智能逐渐取代基础劳动力是一个复杂且具有多面影响的现象。 一方面,GPT4 等先进的人工智能在各种任务和领域表现出色,其能力涵盖了职业和学术领域,如诊断和治疗疾病、发现和合成新分子、教学和评估学生等。这可能导致一些需要高级培训的工作中,AI 系统取代人类工作者或减少对人类工作者的需求,例如美国医学院学生选择放射学作为职业的决策已受到 AI 在放射学中作用增长的影响。 另一方面,部分科技公司虽利用 AI 提升生产力和降低人力成本,但大多数评论者认为 AI 不会彻底取代程序员,行业会进入“人机协同”阶段,且 AI 取代初级岗位的可能性更高,高级工程师仍不可或缺。 红杉资本的观点指出,AI 正处于重要的发展阶段,其变革性影响巨大。AI 相关行业的 TAM 将扩展到几乎所有人类参与的行业,拥抱 AI 的公司因成本降低和能完成以前人类无法完成的自动化任务,竞争优势将上升。对于专业职业,劳动力虽不易被取代,但更专业的服务将加速出现,熟练 AI 的专业人员能产生高附加值。 总之,人工智能对基础劳动力的影响并非简单的完全取代,而是会带来职业结构的调整和变化,需要人们适应、重新技能或重新调整职业道路。
2025-03-22
关于人工智能有什么推荐的书
以下是为您推荐的关于人工智能的书籍: 1. 《认知神经学科:关于心智的生物学》(作者:Michael S.Gazzaniga;Richard B.Lvry;George R.Mangun):世界权威的认知神经科学教材,系统介绍了认知神经科学的诸多方面。 2. 《神经科学原理》(作者:Eric R.Kandel;James H.Schwartz):让您系统了解神经元的细胞和分子生物学等内容。 3. 《神经生物学:从神经元到脑》(作者:John G.Nicholls 等著):神经生物学领域的世界级名著,涵盖了神经科学的多方面内容。 4. 《深度学习》(作者:Ian Goodfellow、Yoshua Bengio 和 Aaron Courville):深入探讨深度学习背后的深层数学。 5. 《智慧的疆界从图灵机到人工智能》 6. 《白话机器学习的数学(图灵图书)》(作者:立石贤吾) 7. 《人工智能(第 4 版)现代方法》 此外,还有一些相关的学习资源,如微软的 AI 初学者入门课程,包括特定的机器学习云框架课程、对话式人工智能和聊天机器人课程以及深度学习背后的深层数学课程等。同时,李宏毅的机器学习课程也值得关注。
2025-03-21
我想学习智能体提示词如何设计
以下是关于智能体提示词设计的相关内容: 方案扩写助手: 参考 Claude 3.5 的官方提示词写法,用非 markdown 语法输出。 主要能力包括:能够对专业类方案按扩写前的格式和风格输出,保证一致性;能够拆解技术细节,保证技术描述专业;对扩写方法进行提示与教学,保证扩写稳定。 纯 Prompt 类 Agent 的个人感受:提示词不是越多越好,要清晰表达任务让模型理解,不一定是 markdown 语法,参考 Claude 3.5 提示词;提示词需要不断优化,从繁琐逐步简化,在使用过程中根据反馈不断调整,结合实际需求最终简化为 100 个字内。 工作流:智能体采用对话模式的 Prompt 进行设计,提示词为:你是能深入思考文档需求并编写成文字的专家。你通过分析示例文档的内容和结构,判断文章讲述了哪几个方面,并进行扩写。扩写过程中,主要采用的方法为,对里面提到的每个部分,进行进一步描述,比如技术上进一步编写与描述;比如写具体的效果;比如写这样做的原因等,从而让每部分尽可能充实。扩写过程不用采用分段式描写,或者罗列大纲,而是仿照原文的格式,尽可能减少分段。在保证专业准确性的同时,通过自然流畅的语言将各个部分有机串联。请你一步一步思考,不急于输出你的内容,让扩写更加充实,同时保持文章的整体连贯性和可读性。需要扩写的内容为:{{原文}} 拟人化提示词设计: 从使用角度分类,大致分为任务型和拟人化型。任务型提示词专注于完成特定任务或解决特定问题,高度专业化、流程清晰,遵循严格工作逻辑;拟人化提示词模拟人类交互方式,用于陪伴聊天或展现人性化特质,需要更细致全面的设计以呈现丰富个性和背景。 拟人化提示词设计思路:设计过程始于角色的基础信息,包括姓名、性别、年龄和职业等。接着考虑角色的背景和经历,它们与基础信息密切相关,相互影响。角色的背景和经历对爱好、特长、性格和价值观等方面的塑造有深远影响。规划和目标是相对弱关联的元素,可以是短期或长期愿景。
2025-03-21
我想学习扣子智能体提示词
以下是关于扣子智能体提示词的相关信息: 要创建扣子智能体机器人并设置提示词,您可以按照以下步骤进行: 打开扣子官网:https://www.coze.cn/ 。 “画小二智能小助手”Coze商店体验地址:https://www.coze.cn/store/bot/7371793524687241256?panel=1&bid=6cqnnu5qo7g00 。 点击创建 Bot,在对话框中工作空间选择“个人空间”,命名为画小二智能小助手。 进入提示词设置环节,为画小二助手设置提示词。 此外,韦恩作为智能体创业者、WayToAGI 共建者、微软提示词工程师等,在相关课程中提到: 课程计划包括入门和进阶,入门是搭建证件照应用,进阶是邮票收藏馆搭建。 您将收获完整构建一个中等复杂的扣子 AI 应用学习、解决应用构建过程中的卡点以及获得一个价值万元的邮票收藏馆 AI 应用。 在通往 AGI 之路知识库使用指南中,也有关于智能体和提示词的一些介绍。
2025-03-21
我是新手小白,如何用最简单的方式构建多智能体
对于新手小白构建多智能体,以下是一种较为简单的方式: 1. 快速搜索补充参考信息:根据用户的任务调研市场上主流的开源搜索引擎技术架构,使用搜索工具 API WebSearchPro 补充更多信息,具体可参考。 2. 用模型规划和分解子任务:使用大模型如 GLM40520 帮助规划,把用户问题拆分成若干子搜索任务,并转换为 JSON 格式。JSON 格式处理可参考。 3. 用搜索智能体完成子任务:AI 搜索智能体具备联网搜索和自主分析并进行多轮搜索任务的能力。智能体 API 的调用方式可参考。智能体 id 为 659e54b1b8006379b4b2abd6,简介为连接全网内容,精准搜索,快速分析并总结的智能助手。 4. 总结子任务生成思维导图:智能体能调用各种插件,如思维导图、流程图、PPT 工具等,可根据工作需要选择。智能体 API 的调用方式可参考。智能体 id 为 664e0cade018d633146de0d2,简介为告别整理烦恼,任何复杂概念秒变脑图。 另外,OpenAI 官方开源的多智能体框架「Swarm」具有一定优势,其「Handoffs」处理了不同智能体之间交接的逻辑。例如构建客服多智能体,可能只需要准备普通接线客服和宽带客服两个 Agent 。 在实际操作中,如创建 Coze 智能体获取笔记和评论信息,要创建智能体并使用单 Agent 对话流模式,编排对话流,进行测试和发布等步骤。发布时要注意相关配置,如输出类型、输入类型等。
2025-03-20
如何在coze中建智能体
在 Coze 中创建智能体的步骤如下: 1. 打开扣子官网(https://www.coze.cn/)。 “画小二智能小助手”Coze 商店体验地址:https://www.coze.cn/store/bot/7371793524687241256?panel=1&bid=6cqnnu5qo7g00 。 点击创建 Bot,在对话框中工作空间选择“个人空间”,命名为画小二智能小助手。 2. 提示词设置:设置画小二助手的提示词。 3. 进入 coze 官网(www.coze.cn),注册并登录,点击页面左上角的⊕,通过【标准创建】填入 bot 的基本信息。 4. 了解 Bot 开发调试界面: 人设与回复逻辑(左侧区域):设定 Bot 的对话风格、专业领域定位,配置回复的逻辑规则和限制条件,调整回复的语气和专业程度。 功能模块(中间区域): 技能配置:插件(扩展 Bot 的专业能力,如计算器、日历等工具)、工作流(设置固定的处理流程和业务逻辑)、图像流(处理和生成图像的相关功能)、触发器(设置自动化响应条件)。 知识库管理:文本(存储文字类知识材料)、表格(结构化数据的存储和调用)、照片(图像素材库)。 记忆系统:变量(存储对话过程中的临时信息)、数据库(管理持久化的结构化数据)、长期记忆(保存重要的历史对话信息)、文件盒子(管理各类文档资料)。 交互优化(底部区域):开场白(设置初次对话的问候语)、用户问题建议(配置智能推荐的后续问题)、快捷指令(设置常用功能的快速访问)、背景图片(自定义对话界面的视觉效果)。 预览与调试(右侧区域):实时测试 Bot 的各项功能,调试响应效果,优化交互体验。 5. 动手实践: 创建智能体:使用单 Agent 对话流模式。 编排对话流:点击创建一个新的对话流(记得要和智能体关联)。 测试:找到一篇小红书笔记,试运行对话流,直接在对话窗口输入地址,当看到数据即为成功。回到智能体的编排页面,同样方式测试,确保对话流执行成功。 发布:点发布后,只选择多维表格,然后点配置。输出类型选文本,输入类型选字段选择器。完善上架信息,填个表格,选发布范围(可仅自己可用,避免审核时间长)。提交上架信息后,返回配置界面显示已完成,即可完成最终提交。
2025-03-20