Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

Agentic Workflow是什么意思

Answer

Agentic Workflow 指的是一种在生成式 AI 的人机协同中,通过不同模式(如 Embedding、Copilot、Agent)下的角色协作流程来完成任务的方式。

在 Agent 模式中,AI 完成大多数工作。它使用 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作。例如,作为产品经理,可将产品功能设计任务拆解为多个独立任务,遵循不同工作流,生成初步结果后再修改。

Agentic Workflow 还通过学会调用外部不同类型 API 来获取模型缺少的额外信息等。其动作的决策需要根据大模型结合问句、上下文规划、各类工具来确定。

从提升效率、提高质量、节省时间的角度思考,Agentic Workflow 可以将复杂任务分解成较小步骤,融入更多人类参与的规划与定义,减少对 Prompt Engineering 和模型推理能力的依赖,提高 LLM 应用面向复杂任务的性能。

吴恩达通过开源项目 ChatDev 举例,让大语言模型扮演不同角色相互协作开发应用或复杂程序。AI Agent 的基本框架包括“LLM +规划+记忆+工具使用”,其中 LLM 扮演“大脑”,规划包括子目标分解、反思与改进,记忆分为短期和长期,工具用于辅助完成任务。

Content generated by AI large model, please carefully verify (powered by aily)

References

Inhai: Agentic Workflow:AI 重塑了我的工作流

生成式AI的人机协同分为3种产品设计模式:Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理),在这3种模式下,人与AI的协作流程也是有所差异。Embedding模式:人类完成大多数工作。Copilot模式:人类和AI协同工作。Agents模式:AI完成大多数工作。Agentic Workflow驱动角色工作流变革使用Multiagent Collaboration的方法,让不同角色的Agent按照根据任务要求自主规划选择工具、流程进行协作完成一件任务。我作为一个产品经理角色,我的诉求很简单,需要完成某一个产品功能设计,这个时候通过Agents拆解成多个独立的任务,然后遵循不同的工作流,最后给我生成一份在大体上符合我期望的输出结果,我再修修改改就能够达到可用的阶段了。所以,我从原子能力层重新思考,面对这个快速变化的时代,我该如何去重塑我自己的工作流,以不变应万变呢?我抽象化拆解了大模型的一些底层能力,例如:翻译、识别、提取、格式化等等,其实所有的一些都会围绕几个词“输入”、“处理”、“输出”、“反馈”。

Inhai: Agentic Workflow:AI 重塑了我的工作流

通过学会调用外部不同类型API来获取模型(通常在预训练后很难修改)中缺少的额外信息,代码执行能力,访问专有信息源等(例如获取此时此刻的天气、联网网搜索等)Action(动作)根据上述大模型结合问句(Query)、上下文的规划(Context)、各类工具,最终大模型才能决策出最终需要执行的动作是什么。Agentic Workflow解决什么问题?我认为是可以从从提升效率、提高质量、节省时间的角度上进行思考。好比一台“印钞机”,按照指定好的流程重复着机械性的活动,但是它在源源不断的产生价值。Productivity(效率)=产生价值的速率Agentic Workflow通过将一个复杂的任务分解成较小的步骤,在整个过程中中融入了更多人类参与到流程中的规划与定义。它减少了对Prompt Engineering和模型推理能力的依赖,提高了LLM应用面向复杂任务的性能,更丰富、更精确。下面是Coze(扣子)平台上的工作流编排器的示例,这个话其实是一个抽卡游戏的流程,你可以看到在整个工作流中间会有很多节点前后之间有节点以及连线,然后每个节点之间它是通过不同的定义,比如说图片处理工具,或者说是通过多模态模型进行图片理解工具等等其他各种各样的工具组合而成。

Inhai: Agentic Workflow:AI 重塑了我的工作流

吴恩达通过开源项目ChatDev进行举例,你可以让一个大语言模型扮演不同的角色,比如让一个Agent扮演公司CEO、产品经理、设计师、代码工程师或测试人员,这些Agent会相互协作,根据需求共同开发一个应用或者复杂程序。AI Agent基本框架OpenAI的研究主管Lilian Weng曾经写过一篇博客叫做《LLM Powered Autonomous Agents》,其中就很好的介绍了Agent的设计框架,她提出了“Agent = LLM +规划+记忆+工具使用”的基础架构,其中大模型LLM扮演了Agent的“大脑”。Planning(规划)主要包括子目标分解、反思与改进。将大型任务分解为较小可管理的子目标处理复杂的任务。而反思和改进指可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。Memory(记忆)分为短期记忆和长期记忆。其中短期记忆是指的将所有的上下文学习看成是利用模型的短期记忆来学习;而长期记忆是提供了长期存储和召回信息的能力,它们通常通过利用外部的向量存储和快速检索来存储和召回信息。Tools(工具)

Others are asking
How Al Agentic workflows could drive more Al progress than even the next generation of foundation models
以下是关于您提出的“ How Al Agentic workflows could drive more Al progress than even the next generation of foundation models ”问题的相关信息: 吴恩达认为人工智能代理工作流程将在今年推动人工智能的巨大进步,甚至可能超过下一代基础模型。构建代理的设计模式框架包括反思、工具使用、规划和多代理协作。反思是指 LLMs 审视自身工作并提出改进方法;工具使用是指赋予 LLMs 如网络搜索、代码执行等工具以帮助其收集信息、采取行动或处理数据;规划是指 LLMs 制定并执行多步骤计划以实现目标;多代理协作则涉及多个 AI 代理共同工作,通过分工、讨论和辩论来提出比单个代理更好的解决方案。这些设计模式为构建高效的 AI 代理提供了指导,并将在下周进一步详细阐述并提供相关阅读建议。 此外,在医疗保健领域,为了产生真正的改变,AI 需要像我们一样学习。必须让这些专家 AI 接触到顶级从业人员的多样化视角,以避免复制危险的偏见。鉴于人工智能依赖的神经网络基础,这些专家 AI 可能通过元学习(或学会学习)比我们预期的更快地获得知识,并带着我们人类一同进步。 在 AI 进化方面,CNN 的结构基于两类细胞的级联模型,主要用于模式识别任务,在计算上比大多数其他架构更有效、更快速,在许多应用中,包括自然语言处理和图像识别,已经被用来击败大多数其他算法。我们每次对大脑的工作机制的认知多一点,神经网络的算法和模型也会前进一步。
2024-09-02
agentic workflow 是什么?
Agentic Workflow 是指通过学会调用外部不同类型的 API 来获取模型中缺少的额外信息、代码执行能力、访问专有信息源等。它将一个复杂的任务分解成较小的步骤,融入更多人类参与到流程中的规划与定义,减少对 Prompt Engineering 和模型推理能力的依赖,提高 LLM 应用面向复杂任务的性能。 生成式 AI 的人机协同分为 Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理)3 种产品设计模式,在不同模式下,人与 AI 的协作流程有所差异。 Agentic Workflow 可以使用 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。例如,作为产品经理,可通过 Agents 将任务拆解为多个独立任务,遵循不同工作流生成大体符合期望的输出结果,再进行修改。 吴恩达通过开源项目 ChatDev 举例,可让大语言模型扮演不同角色相互协作开发应用或复杂程序。AI Agent 基本框架包括“Agent = LLM + 规划 + 记忆 + 工具使用”,其中 LLM 扮演“大脑”,规划包括子目标分解、反思与改进,记忆分为短期记忆和长期记忆,工具用于处理各种任务。
2024-08-30
Agentic Workflow是什么
Agentic Workflow 是一种基于 AI 的工作流管理方式,它可以帮助人们更高效地完成各种任务。以下是关于 Agentic Workflow 的一些介绍: 1. 专家代理:Agentic Workflow 中的专家代理是指具有特定领域和工具专长的 AI 模型,它们能够以步骤化、理性的方式帮助用户达成目标。 2. 工作流程:Agentic Workflow 的工作流程通常包括收集信息、初始化专家代理、持续支持用户直到目标完成等步骤。 3. Tool Use:Tool Use 是指 Agent 通过自行规划任务执行的工作流路径,面向于简单的或者一些线性流程的运行。 4. Planning:Agent 通过自行规划任务执行的工作流路径,面向于简单的或者一些线性流程的运行。 5. Multiagent Collaboration:通过学会调用外部不同类型 API 来获取模型(通常在预训练后很难修改)中缺少的额外信息,代码执行能力,访问专有信息源等(例如获取此时此刻的天气、联网网搜索等)。 6. Action(动作):根据上述大模型结合问句(Query)、上下文的规划(Context)、各类工具,最终大模型才能决策出最终需要执行的动作是什么。 7. Productivity(效率):Agentic Workflow 通过将一个复杂的任务分解成较小的步骤,在整个过程中中融入了更多人类参与到流程中的规划与定义。它减少了对 Prompt Engineering 和模型推理能力的依赖,提高了 LLM 应用面向复杂任务的性能,更丰富、更精确。 总的来说,Agentic Workflow 是一种将 AI 技术应用于工作流管理的方式,它可以帮助人们更高效地完成各种任务。
2024-05-29
关于workflow有什么著名的论文
以下是一些关于 workflow 的著名论文或相关内容: 1. 5 月 9 日艾木分享的《Workflow》,其中包含关于 workflow 的理论探讨、对 AGI 的正确理解与思考、如何客观看待大语言模型的基础表现、人工智能在编程领域的应用及挑战、从提示词工程到 flow 工程:AI 在代码生成领域的研究与应用、人工智能在开源项目测试集中的表现与工作流的重要性、关于 workflow 的介绍与案例演示等内容。 2. 艾木的《如何用 Coze 制作一个信息检索 Bot(含 Workflow 的基础用法)》,提到 Coze 的 Workflow 为制作 Agents/Bots 提供很大的灵活性和便捷性,对 Workflow 中的函数进行了分类,并提出了超函数(Hyperfuction)的概念。 3. 2024 年 8 月 20 日的更新中,有《[AI Agent 产品经理血泪史(二)欲知方圆,则必规矩【Workflow 篇】》,聚焦于工作流(Workflow)在 AI 智能体中的重要性,回顾了集成平台的演变,探讨了工作流在自动化和手动编排中的应用以及如何提升灵活性以应对不断变化的需求。 4. 还有《[张梦飞:【全网最细】从 LLM 大语言模型、知识库到微信机器人的全本地部署教程》和《[ComfyUI 工作流:黑猴子悟空换脸报错解决大法》等相关内容。
2024-12-18
workflow使用指南
使用工作流的指南如下: 1. 创建工作流。 2. 配置工作流: 通过拖拽的方式将节点添加到画布内,并按照任务执行顺序连接节点。 工作流提供了基础节点供使用,还可以添加插件节点来执行特定任务。具体操作如下: 在左侧面板中选择要使用的节点。 将节点拖拽到画布中,并与其他节点相连接。 配置节点的输入输出参数。 3. 测试并发布工作流。 4. 在 Bot 内使用工作流: 前往当前团队的 Bots 页面,选择进入指定 Bot。 在 Bots 编排页面的工作流区域,单击右侧的加号图标。 在添加工作流对话框,在“我创建的”页面选择自建的工作流。 在 Bot 的人设与回复逻辑区域,引用工作流的名称来调用工作流。
2024-09-23
comfyui的workflow站点推荐
ComfyUI 工作流网站推荐: ComfyWorkflows 网站:https\://comfyworkflows.com/cloud,支持在线运行工作流,从 workflow 的实际下载量和访问量来看,略少于 openart。 Openart.ai:https\://openart.ai/workflows/,“老牌”workflow 网站,流量比较高,支持上传、下载、在线生成,免费账户总共有 50 个积分,加入 Discord 可以再加 100 积分,开通最低的每个月 6 美元的套餐后,每个月会有 5000 积分。 什么是 ComfyUI 的 Workflow?Workflow 是 ComfyUI 的精髓。所谓 Workflow 工作流,在 ComfyUI 这里就是它的节点结构及数据流运转过程。
2024-05-26
多模态大模型是什么意思
多模态大模型(MLLM)是一种在统一框架下,集成多种不同类型数据处理能力的深度学习模型,这些数据包括文本、图像、音频和视频等。通过整合多样化的数据,MLLM 能够更全面地理解和解释现实世界中的复杂信息,在面对复杂任务时表现出更高的准确性和鲁棒性。其架构通常包括一个编码器、一个连接器和一个 LLM,还可选择性地在 LLM 上附加一个生成器以生成除文本之外的更多模态。连接器大致可分为基于投影的、基于查询的和基于融合的三类。 Google 的人工智能多模态大模型叫 Gemini,是 Google DeepMind 团队开发的。Gemini 不仅支持文本、图片等提示,还支持视频、音频和代码提示,能够理解和处理几乎任何输入,结合不同类型的信息,并生成几乎任何输出,被称为 Google 迄今为止最强大、最全面的模型,从设计之初就支持多模态,能够处理语言、视觉、听觉等不同形式的数据。 学习多模态大模型很有必要,因为它可以从图像中提取文本,理解图像或视频中发生的事情,识别物体、场景甚至情绪。例如,有人想为猫买新衣服,可给模型提供猫的图片和文本提示,模型会给出适合猫的衣服建议;在学生解决物理问题的例子中,模型能根据包含问题和答案的图像以及文本提示,进行推理并判断答案是否正确。输入可以是文本、图像、音频的混合,顺序很重要。
2025-01-02
scalinglaw什么意思
Scaling Law(规模定律)指的是在模型预训练中,只要三个关键因素——模型大小、数据量、训练时间(计算量)不断增长,模型性能就能大斜率指数级爆发式提升。足够的规模带来——“涌现”,即自发地产生复杂智能,完成复杂问题的推理、并形成非同分布下的泛化性提升。 2024 年整年,一个争论笼罩着 AI 界——Scaling Law 是正确的,但在现实中,Scaling Law 是不是已经触及天花板。算力需求已达惊人规模,基础设施跟不上发展速度,优质数据接近极限,合成数据训练存在“近亲繁殖”问题可能导致模型能力长期衰退。 在 OpenAI 的相关研究中,“良好且通用的数据表示,良好且通用的数据标注,良好且通用的算法”为检测 Scaling Law 做好了准备。同时,在 Sora 的研究中,也遵循了 Scaling Law,即在足量的数据、优质的标注、灵活的编码下,Scaling Law 在 transformer+diffusion model 的架构上继续成立,其想法很大程度上沿袭了大语言模型的经验。
2024-12-30
绘画提示词中的“P”是什么意思?
在绘画提示词中,“P”通常不是一个具有特定普遍含义的独立符号或缩写。但“POV”是“Point of View”的缩写,意为“视角”。在美术创作中,尤其是绘画和摄影领域,视角指的是观察者或摄像机所在的位置和角度。选择不同的视角可以极大地影响作品的视觉效果和观众对作品的感受。 视角在绘画中的作用包括: 1. 视觉引导:可以用来引导观众的视线,通过选择特定的角度,艺术家可以强调作品中的某些元素,使它们更加突出。 2. 情感表达:不同的视角可以传达不同的情感和氛围。例如,从高处看的视角可能会让物体显得更小、更脆弱,而从低处看的视角可能会让物体显得更强大、更有威严。 3. 空间感:通过精确的透视技巧,视角可以帮助艺术家在二维平面上创造出深度和空间感,使画面更加立体和真实。 4. 故事叙述:视角可以用来讲述故事,通过选择与故事内容相匹配的视角,艺术家可以增强叙事的力度和清晰度。 在创作提示词时,有一些技巧: 1. 透视:了解和运用透视原理是掌握不同视角的关键。透视可以创造出深度感和空间感,使画面更加逼真。 2. 构图:选择合适的视角可以帮助艺术家更好地构图,通过角度和视点的选择来平衡画面,创造出和谐的画面效果。 3. 光影:不同的视角会影响光线的方向和强度,艺术家需要根据所选的视角来调整光影效果,以增强画面的真实感和表现力。 在提示词的语法方面,根据自己想画的内容写出提示词,多个提示词之间使用英文半角符号。一般而言,概念性的、大范围的、风格化的关键词写在前面,叙述画面内容的关键词其次,最后是描述细节的关键词。提示词的顺序很重要,越靠后的权重越低。关键词最好具有特异性,措辞越不抽象越好,尽可能避免留下解释空间的措辞。还可以使用括号人工修改提示词的权重。
2024-12-26
AI提示词的意思是指训练自己的AI智能体吗
AI 提示词并非仅仅指训练自己的 AI 智能体。 智能体大多建立在大模型之上,其发展从基于符号推理的专家系统逐步演进而来。基于大模型的智能体具有强大的学习能力、灵活性和泛化能力。智能体的核心在于有效控制和利用大型模型以达到设定目标,这通常涉及精确的提示词设计,提示词的设计直接影响智能体的表现和输出结果。 设计提示词本质上是对模型进行“编程”,通常通过提供指令或示例完成。与多数其他 NLP 服务不同,补全和聊天补全几乎可用于任何任务,包括内容或代码生成、摘要、扩展、对话、创意写作、风格转换等。 我们的模型通过将文本分解为标记来理解和处理文本,在给定的 API 请求中处理的标记数量取决于输入和输出长度。对于英文文本,1 个标记大约相当于 4 个字符或 0.75 个单词,文本提示词和生成的补全合起来不能超过模型的最大上下文长度。
2024-12-25
生成式人工智能或者专门的书籍教程是什么意思?这种人工智能有什么用?现在市面上有免费的吗?要是没有免费的我去翻外网也可以
生成式人工智能是一种能够创建新内容的人工智能技术。以下是关于生成式人工智能的一些详细信息: 课程方面: 台湾大学李宏毅教授的生成式 AI 课程,主要介绍了其基本概念、发展历程、技术架构和应用场景等内容。课程共 12 讲,每讲约 2 小时。通过学习该课程,可掌握基本概念和常见技术,能使用相关框架搭建简单模型,了解发展现状和未来趋势。学习内容包括: 1. 什么是生成式 AI:定义和分类,与判别式 AI 的区别,应用领域。 2. 生成式模型:基本结构和训练方法,评估指标,常见模型及其优缺点。 3. 生成式对话:基本概念和应用场景,系统架构和关键技术,基于模型的对话生成方法。 4. 预训练语言模型:发展历程和关键技术,优缺点,在生成式 AI 中的应用。 5. 生成式 AI 的挑战与展望:面临的挑战和解决方法,未来发展趋势和研究方向。 改变创意工作方面: 生成式人工智能在创意工作中发挥着重要作用。例如,生成模型经过训练后,可针对特定内容领域进行“微调”,催生了用于生物医学、法律、法语等的专用模型,以及适用于不同目的的 GPT3 等。NVIDIA 的 BioNeMo 是用于在超级计算规模上训练、构建和部署大型语言模型的框架,适用于生成化学、蛋白质组学和 DNA/RNA 等内容。但使用生成式人工智能仍需人工参与,人类要输入提示让其创建内容,创造性的提示会产生创造性的输出,“即时工程师”可能成为新职业。该领域已出现 DALLE 2 图像提示书和提示市场。 学习资源: 1. 教材:《生成式 AI 导论 2024》,李宏毅。 2. 参考书籍:《深度学习》,伊恩·古德费洛等。 3. 在线课程:李宏毅的生成式 AI 课程。 4. 开源项目:OpenAI GPT3、字节跳动的云雀等。 学习方法:根据课程内容和资源,制定适合自己的学习计划,多实践、多思考。 目前市面上有部分免费的生成式人工智能资源,但也有收费的。需要注意的是,未经许可翻外网可能存在法律风险,请您谨慎选择。
2024-12-24
深度学习是什么意思?
深度学习是一种源于新方法和策略的技术,旨在通过克服梯度消失问题来生成深层的非线性特征层次,从而能够训练具有数十层非线性层次特征的体系结构。 深度学习不仅与学习深度非线性层次特征有关,还与学习检测序列数据中非常长的非线性时间依赖性有关。例如,长短时记忆循环神经网络允许网络收集过去几百个时间步的活动,从而做出准确的预测。 深度学习是一种参照人脑神经网络和神经元的方法,由于具有很多层所以称为“深度”。神经网络可以用于监督学习、无监督学习、强化学习等。 自 2010 年早期,结合 GPUs 和激活函数提供更好的梯度流,足以在没有重大困难的情况下训练深层结构,人们对深度学习的兴趣与日俱增。自 2013 年以来,长短时记忆网络的使用量迅速增长,与卷积网络一起构成了深度学习的两大成功案例之一。
2024-12-24