以下是为您设计企业内销售培训智能体的一些建议:
首先,了解多智能体模式的设置。它包括全局设置和多个代理之间的编排协调两个核心部分。全局设置涵盖角色设定与回复逻辑、记忆管理以及对话体验等,其中人物设定与回复逻辑应侧重于角色塑造。在智能体的交互流程设计上,要形成完整的互动链条,当用户意图未满足跳转条件时,保持与当前智能体的沟通。设计多轮协作的智能体时,应将其交互设计为闭环结构,以确保用户能自由切换。
其次,动手实践制作智能体。对于 Chat GPT 版本,可按以下步骤:点击“浏览 GPTs”按钮,点击“Create”按钮创建,使用自然语言对话或手工设置进行具体配置,然后调试并发布。对于 Chat GLM 版本,点击“创建智能体”按钮,输入智能体描述,可粘贴准备好的提示词模板,其配置可自动生成,可根据需求调整并上传本地文件作为知识库。
然后,考虑多智能体协同的概念。在处理复杂任务时,单智能体可能面临提示词修改和逻辑不清晰的问题。多智能体协作如吴恩达所举例,每个智能体被赋予不同身份,互相合作对话,能模拟现实工作场景,成为复杂系统,但可能存在效率不高的情况。
最后,您可以根据实际情况选择是采用 RAG 还是多智能体协同。如果任务相对简单,RAG 可能足够;若任务复杂,涉及多个环节和角色的协作,多智能体协同可能更合适。您还可以通过具体的例子,如旅游场景中负责景点推荐、路线规划和食宿安排的三个智能体,来更好地理解和设计。
首先,让我们一起深入探索扣子上的多智能体模式设置。这个配置主要包括两个核心部分。第一部分是全局设置,涉及角色设定与回复逻辑、记忆管理以及对话体验等全局性因素。第二部分则关注于多个代理之间的编排和协调。这两大设置共同构成了多智能体模式的详细框架。那么,我们首先需要解决的问题是:在全局设置中,人物设定与回复逻辑应如何填充?简单来说,我们需要在“人物设定与回复逻辑应”中明确整体的人物设定,这更侧重于角色的塑造,而非仅仅是业务流程的描述。(因为这是偏向于全局的设置)接下来,我们来考虑一下智能体的交互流程。我们的设计思路的关键在于,让这些节点形成一个完整的互动链条,而不单单是一次性互动。同时,当用户的意图尚未满足跳转条件时,应保持与当前智能体的沟通和对话。所以,我们的设计思路大概是这样的(见下图)此外,在观察这张图时,大家还可以发现一个关键点:我们在图中实现的是一个循环机制,而不是单向的流程。如果仅仅采用单向流程,那么将像工作流一样,随着对话的进行逐步跳转,直至最后一个智能体。在这种情况下,将无法从最后一个智能体跳转回初始状态。因此,在设计需要多轮协作的智能体时,我们应该在多智能体编排页面中,设计这些智能体的交互为一个闭环结构。这确保了用户在整个对话过程中能够自由地在不同智能体之间切换,克服了单向交互的限制。让我们通过一个具体的例子来更好地理解这一概念。以旅游场景为例,我们将设计三个智能体:分别负责景点推荐、路线规划和食宿安排。让我们先把提示词写出来。同时,我们还应做好全局人物设定:
在介绍了智能体的基本概念之后,我们将继续深入探讨,并动手实践制作智能体。我鼓励大家基于一些公开的大模型应用产品(如Chat GLM、Chat GPT、Kimi等),尝试开发属于自己的智能体。记住,智能体的开发是一个不断学习和进步的过程。不要害怕犯错,每一次尝试都是向成功迈进的一步。通过实践,您将能够更好地理解智能体的潜力,并发掘其在各种应用场景中的可能性。Step.1点击“浏览GPTs”按钮Step.2点击“Create”按钮创建自己的智能体Step.3使用自然语言对话进行具体设置Step.3使用手工设置Step.4开始调试你的智能体并发布[heading1]十五、动手实践——Chat GLM版本[content]Step.1点击“创建智能体”按钮Step.2输入你对于智能体的描述,如果你有准备好的提示词模板,可以直接粘贴上去Step.3 ChatGLM的智能体配置可以自动生成,其默认勾选了增强能力,你可以根据智能体实际需求进行调整,同时你也可以根据实际情况上传你自己本地文件作为知识原料形成属于智能体的知识库[heading1]十六、多智能体协同[content]接下来,我们来探讨多智能体协同的概念。在单智能体或提示词链中,我们通常使用提示词来控制智能体执行特定任务。然而,这种方法可能会遇到一些挑战:如果单一智能体要处理一个非常复杂的任务,我们可能需要不断修改和重写提示词,这不仅会降低工作效率,还会让提示词的逻辑不清晰(即在一个提示词中指派模型干很多类工作,这正好违背了我们在第一部分所讲述的模型特性和原则)。
(这一部分介绍的比较少)现在用的比较多的就是使用Copilot进行联网搜索,以及在解决某数理逻辑问题时,调用代码插件来辅助解决。第三个是Planning(规划),非常惊艳的设计,用户输入任务,AI拆解流程、选择工具、调用、执行并输出结果。我在做一些demo时会遇到一些错误,但Agent绕过了我的错误,自主地完成了任务。我在这里举一个例子,改编自HuggingGPT这个论文,我需要生成一个图片,一个女孩在看书,她的姿势要个我给的这个图片中的男孩一样,然后你再用文字描述这篇文章。Agent的做法是,先提取该图片中男孩的姿态(可能是调用的Huggingface上的模型),然后再找到一个模型生成一张同样姿势的图片,最后再描述好生成的这张图片。Agent的效果不一定保证非常好,但大部分情况比较高效,比如我之前谷歌搜索会花费大量时间,现在我会丢一个问题给Agent,然后过一会来看它给的回复。最后一个是Multi-agent,多智能体协作(吴恩达在这里的举例,来自清华面壁智能的开源项目ChatDev)。每个Agent被赋予了不同的身份,比如有的是CEO,有的是产品经理,有的是程序员,他们互相合作互相对话,比如你让他们开发一个简单的小游戏,他们会花几分钟时间来编写代码并测试。尽管有时候不是很有效,但非常有前景和想象力,它模拟了现实生活中的工作场景,Multi-agent不仅仅只能执行单一任务,而是成为了一个复杂系统。最后是结论,我认为未来,得益于Agentic Worklfow,AI能做出来更多牛逼的应用。但现在我们等待Agent的回复需要比较长的时间,所以更快的token生成速度是很重要的(吴恩达在此又扯了个故事,表达的意思是人性就是希望即时满足)。