以下是为您推荐的一些与 multi agent 相关的项目:
此外,为您补充一些关于 multi agent 的知识: 多智能体(Multi-Agent)是由多个自主、独立的智能体(Agent)组成的系统。每个智能体都能感知环境、决策并执行任务,且它们之间能信息共享、任务协调与协同行动以实现整体目标。
随着大型语言模型(LLM)的出现,以 LLM 为核心构建的 Agent 系统受广泛关注。目前常见框架集中在单 Agent 场景,其核心是 LLM 与工具协同配合,可能需与用户多轮交互。而多 Agent 场景为不同 Agent 指定角色,通过协作完成复杂任务,与用户交互可能减少。
构建多 Agent 框架主要组成部分包括:
《[Multi Agent策略架构基础(1)](https://waytoagi.feishu.cn/record/1sfvunQZGoT5vB2r29i9PWi6W)》是作者对逐渐升温的Multi Agent领域的探索,有代表性的Multi Agent demo项目包括AutoGPT、Smallville小镇和面壁智能ChatDev,Multi Agent有潜力解决复杂问题,但仍需面对挑战和限制;城主发表了一篇《[2023年的大模型:OpenAI科学家最新讲座(完整版)](https://waytoagi.feishu.cn/record/1sfvuPPwj8ZTnMvEQIwaSJRxY)》,Hyung Won Chung从Google跳到OpenAI一年多,他在网络上所做的LLM技术分享中提供了LLM在2023年的最新动向和大量技术细节,颇有价值;《[马丁的](https://waytoagi.feishu.cn/record/1sfvun2KibnFAT2lXmbW1SynB)[Character.AI](https://waytoagi.feishu.cn/record/1sfvun2KibnFAT2lXmbW1SynB)[赛道说明书](https://waytoagi.feishu.cn/record/1sfvun2KibnFAT2lXmbW1SynB)》详细分析了NPC赛道,它通过创造虚拟角色和提供陪伴服务来满足用户的需求,而不是通过认识新的人或建立人际关系。这个赛道的关键在于技术的发展和商业利益的引入,以及创作者生态的建设;
(这一部分介绍的比较少)现在用的比较多的就是使用Copilot进行联网搜索,以及在解决某数理逻辑问题时,调用代码插件来辅助解决。第三个是Planning(规划),非常惊艳的设计,用户输入任务,AI拆解流程、选择工具、调用、执行并输出结果。我在做一些demo时会遇到一些错误,但Agent绕过了我的错误,自主地完成了任务。我在这里举一个例子,改编自HuggingGPT这个论文,我需要生成一个图片,一个女孩在看书,她的姿势要个我给的这个图片中的男孩一样,然后你再用文字描述这篇文章。Agent的做法是,先提取该图片中男孩的姿态(可能是调用的Huggingface上的模型),然后再找到一个模型生成一张同样姿势的图片,最后再描述好生成的这张图片。Agent的效果不一定保证非常好,但大部分情况比较高效,比如我之前谷歌搜索会花费大量时间,现在我会丢一个问题给Agent,然后过一会来看它给的回复。最后一个是Multi-agent,多智能体协作(吴恩达在这里的举例,来自清华面壁智能的开源项目ChatDev)。每个Agent被赋予了不同的身份,比如有的是CEO,有的是产品经理,有的是程序员,他们互相合作互相对话,比如你让他们开发一个简单的小游戏,他们会花几分钟时间来编写代码并测试。尽管有时候不是很有效,但非常有前景和想象力,它模拟了现实生活中的工作场景,Multi-agent不仅仅只能执行单一任务,而是成为了一个复杂系统。最后是结论,我认为未来,得益于Agentic Worklfow,AI能做出来更多牛逼的应用。但现在我们等待Agent的回复需要比较长的时间,所以更快的token生成速度是很重要的(吴恩达在此又扯了个故事,表达的意思是人性就是希望即时满足)。
多智能体(Multi-Agent)是由多个自主、独立的智能体(Agent)组成的系统。在这个系统中,每个智能体都能够感知环境、进行决策并执行任务,同时它们之间可以进行信息共享、任务协调以及协同行动,以实现整体的目标。[heading2]关于Multi-Agent[content]随着大型语言模型(LLM)的出现,以LLM为核心构建的Agent系统近期受到了广泛关注。Agent系统旨在利用LLM的归纳推理能力,为不同的Agent分配角色和任务信息,并配备相应的工具插件,以完成复杂的任务。目前,更常见的框架主要集中在单Agent场景下。单Agent的核心在于LLM与工具的协同配合。LLM根据用户任务的理解,推理出需要调用的工具,并根据调用结果向用户提供反馈。在任务完成过程中,Agent可能需要与用户进行多轮交互。与此同时,越来越多的Agent框架开始关注多Agent场景。为了完成任务,多Agent会为不同的Agent指定不同的角色,并通过Agent之间的协作来完成复杂的任务。与单Agent相比,在任务完成过程中,与用户的交互可能会减少一些。[heading2]主要组成部分[content]为构建一个多Agent框架,我们需要思考相对于单Agent,框架中增加了哪些组件。环境(environment):所有Agent应该处于同一个环境中。环境中包含全局状态信息,Agent与环境之间存在信息的交互与更新。阶段(stage):为了完成复杂任务,现有多Agent框架通常采用SOP思想,将复杂任务分解为多个子任务。控制器(controller):控制器可以是LLM,也可以是预先定义好的规则。它主要负责环境在不同Agent和阶段之间的切换。记忆:在单Agent中,记忆只包括用户、LLM回应和工具调用结果等部分。而在多Agent框架中,由于Agent数量增多,导致消息数量增多。同时,每条消息可能需要记录发送方、接收方等字段。