直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

Agentic Workflow是什么意思

回答

Agentic Workflow 指的是一种在生成式 AI 的人机协同中,通过不同模式(如 Embedding、Copilot、Agent)下的角色协作流程来完成任务的方式。

在 Agent 模式中,AI 完成大多数工作。它使用 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作。例如,作为产品经理,可将产品功能设计任务拆解为多个独立任务,遵循不同工作流,生成初步结果后再修改。

Agentic Workflow 还通过学会调用外部不同类型 API 来获取模型缺少的额外信息等。其动作的决策需要根据大模型结合问句、上下文规划、各类工具来确定。

从提升效率、提高质量、节省时间的角度思考,Agentic Workflow 可以将复杂任务分解成较小步骤,融入更多人类参与的规划与定义,减少对 Prompt Engineering 和模型推理能力的依赖,提高 LLM 应用面向复杂任务的性能。

吴恩达通过开源项目 ChatDev 举例,让大语言模型扮演不同角色相互协作开发应用或复杂程序。AI Agent 的基本框架包括“LLM +规划+记忆+工具使用”,其中 LLM 扮演“大脑”,规划包括子目标分解、反思与改进,记忆分为短期和长期,工具用于辅助完成任务。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

Inhai: Agentic Workflow:AI 重塑了我的工作流

生成式AI的人机协同分为3种产品设计模式:Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理),在这3种模式下,人与AI的协作流程也是有所差异。Embedding模式:人类完成大多数工作。Copilot模式:人类和AI协同工作。Agents模式:AI完成大多数工作。Agentic Workflow驱动角色工作流变革使用Multiagent Collaboration的方法,让不同角色的Agent按照根据任务要求自主规划选择工具、流程进行协作完成一件任务。我作为一个产品经理角色,我的诉求很简单,需要完成某一个产品功能设计,这个时候通过Agents拆解成多个独立的任务,然后遵循不同的工作流,最后给我生成一份在大体上符合我期望的输出结果,我再修修改改就能够达到可用的阶段了。所以,我从原子能力层重新思考,面对这个快速变化的时代,我该如何去重塑我自己的工作流,以不变应万变呢?我抽象化拆解了大模型的一些底层能力,例如:翻译、识别、提取、格式化等等,其实所有的一些都会围绕几个词“输入”、“处理”、“输出”、“反馈”。

Inhai: Agentic Workflow:AI 重塑了我的工作流

通过学会调用外部不同类型API来获取模型(通常在预训练后很难修改)中缺少的额外信息,代码执行能力,访问专有信息源等(例如获取此时此刻的天气、联网网搜索等)Action(动作)根据上述大模型结合问句(Query)、上下文的规划(Context)、各类工具,最终大模型才能决策出最终需要执行的动作是什么。Agentic Workflow解决什么问题?我认为是可以从从提升效率、提高质量、节省时间的角度上进行思考。好比一台“印钞机”,按照指定好的流程重复着机械性的活动,但是它在源源不断的产生价值。Productivity(效率)=产生价值的速率Agentic Workflow通过将一个复杂的任务分解成较小的步骤,在整个过程中中融入了更多人类参与到流程中的规划与定义。它减少了对Prompt Engineering和模型推理能力的依赖,提高了LLM应用面向复杂任务的性能,更丰富、更精确。下面是Coze(扣子)平台上的工作流编排器的示例,这个话其实是一个抽卡游戏的流程,你可以看到在整个工作流中间会有很多节点前后之间有节点以及连线,然后每个节点之间它是通过不同的定义,比如说图片处理工具,或者说是通过多模态模型进行图片理解工具等等其他各种各样的工具组合而成。

Inhai: Agentic Workflow:AI 重塑了我的工作流

吴恩达通过开源项目ChatDev进行举例,你可以让一个大语言模型扮演不同的角色,比如让一个Agent扮演公司CEO、产品经理、设计师、代码工程师或测试人员,这些Agent会相互协作,根据需求共同开发一个应用或者复杂程序。AI Agent基本框架OpenAI的研究主管Lilian Weng曾经写过一篇博客叫做《LLM Powered Autonomous Agents》,其中就很好的介绍了Agent的设计框架,她提出了“Agent = LLM +规划+记忆+工具使用”的基础架构,其中大模型LLM扮演了Agent的“大脑”。Planning(规划)主要包括子目标分解、反思与改进。将大型任务分解为较小可管理的子目标处理复杂的任务。而反思和改进指可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。Memory(记忆)分为短期记忆和长期记忆。其中短期记忆是指的将所有的上下文学习看成是利用模型的短期记忆来学习;而长期记忆是提供了长期存储和召回信息的能力,它们通常通过利用外部的向量存储和快速检索来存储和召回信息。Tools(工具)

其他人在问
How Al Agentic workflows could drive more Al progress than even the next generation of foundation models
以下是关于您提出的“ How Al Agentic workflows could drive more Al progress than even the next generation of foundation models ”问题的相关信息: 吴恩达认为人工智能代理工作流程将在今年推动人工智能的巨大进步,甚至可能超过下一代基础模型。构建代理的设计模式框架包括反思、工具使用、规划和多代理协作。反思是指 LLMs 审视自身工作并提出改进方法;工具使用是指赋予 LLMs 如网络搜索、代码执行等工具以帮助其收集信息、采取行动或处理数据;规划是指 LLMs 制定并执行多步骤计划以实现目标;多代理协作则涉及多个 AI 代理共同工作,通过分工、讨论和辩论来提出比单个代理更好的解决方案。这些设计模式为构建高效的 AI 代理提供了指导,并将在下周进一步详细阐述并提供相关阅读建议。 此外,在医疗保健领域,为了产生真正的改变,AI 需要像我们一样学习。必须让这些专家 AI 接触到顶级从业人员的多样化视角,以避免复制危险的偏见。鉴于人工智能依赖的神经网络基础,这些专家 AI 可能通过元学习(或学会学习)比我们预期的更快地获得知识,并带着我们人类一同进步。 在 AI 进化方面,CNN 的结构基于两类细胞的级联模型,主要用于模式识别任务,在计算上比大多数其他架构更有效、更快速,在许多应用中,包括自然语言处理和图像识别,已经被用来击败大多数其他算法。我们每次对大脑的工作机制的认知多一点,神经网络的算法和模型也会前进一步。
2024-09-02
agentic workflow 是什么?
Agentic Workflow 是指通过学会调用外部不同类型的 API 来获取模型中缺少的额外信息、代码执行能力、访问专有信息源等。它将一个复杂的任务分解成较小的步骤,融入更多人类参与到流程中的规划与定义,减少对 Prompt Engineering 和模型推理能力的依赖,提高 LLM 应用面向复杂任务的性能。 生成式 AI 的人机协同分为 Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理)3 种产品设计模式,在不同模式下,人与 AI 的协作流程有所差异。 Agentic Workflow 可以使用 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。例如,作为产品经理,可通过 Agents 将任务拆解为多个独立任务,遵循不同工作流生成大体符合期望的输出结果,再进行修改。 吴恩达通过开源项目 ChatDev 举例,可让大语言模型扮演不同角色相互协作开发应用或复杂程序。AI Agent 基本框架包括“Agent = LLM + 规划 + 记忆 + 工具使用”,其中 LLM 扮演“大脑”,规划包括子目标分解、反思与改进,记忆分为短期记忆和长期记忆,工具用于处理各种任务。
2024-08-30
Agentic Workflow是什么
Agentic Workflow 是一种基于 AI 的工作流管理方式,它可以帮助人们更高效地完成各种任务。以下是关于 Agentic Workflow 的一些介绍: 1. 专家代理:Agentic Workflow 中的专家代理是指具有特定领域和工具专长的 AI 模型,它们能够以步骤化、理性的方式帮助用户达成目标。 2. 工作流程:Agentic Workflow 的工作流程通常包括收集信息、初始化专家代理、持续支持用户直到目标完成等步骤。 3. Tool Use:Tool Use 是指 Agent 通过自行规划任务执行的工作流路径,面向于简单的或者一些线性流程的运行。 4. Planning:Agent 通过自行规划任务执行的工作流路径,面向于简单的或者一些线性流程的运行。 5. Multiagent Collaboration:通过学会调用外部不同类型 API 来获取模型(通常在预训练后很难修改)中缺少的额外信息,代码执行能力,访问专有信息源等(例如获取此时此刻的天气、联网网搜索等)。 6. Action(动作):根据上述大模型结合问句(Query)、上下文的规划(Context)、各类工具,最终大模型才能决策出最终需要执行的动作是什么。 7. Productivity(效率):Agentic Workflow 通过将一个复杂的任务分解成较小的步骤,在整个过程中中融入了更多人类参与到流程中的规划与定义。它减少了对 Prompt Engineering 和模型推理能力的依赖,提高了 LLM 应用面向复杂任务的性能,更丰富、更精确。 总的来说,Agentic Workflow 是一种将 AI 技术应用于工作流管理的方式,它可以帮助人们更高效地完成各种任务。
2024-05-29
workflow使用指南
使用工作流的指南如下: 1. 创建工作流。 2. 配置工作流: 通过拖拽的方式将节点添加到画布内,并按照任务执行顺序连接节点。 工作流提供了基础节点供使用,还可以添加插件节点来执行特定任务。具体操作如下: 在左侧面板中选择要使用的节点。 将节点拖拽到画布中,并与其他节点相连接。 配置节点的输入输出参数。 3. 测试并发布工作流。 4. 在 Bot 内使用工作流: 前往当前团队的 Bots 页面,选择进入指定 Bot。 在 Bots 编排页面的工作流区域,单击右侧的加号图标。 在添加工作流对话框,在“我创建的”页面选择自建的工作流。 在 Bot 的人设与回复逻辑区域,引用工作流的名称来调用工作流。
2024-09-23
comfyui的workflow站点推荐
ComfyUI 工作流网站推荐: ComfyWorkflows 网站:https\://comfyworkflows.com/cloud,支持在线运行工作流,从 workflow 的实际下载量和访问量来看,略少于 openart。 Openart.ai:https\://openart.ai/workflows/,“老牌”workflow 网站,流量比较高,支持上传、下载、在线生成,免费账户总共有 50 个积分,加入 Discord 可以再加 100 积分,开通最低的每个月 6 美元的套餐后,每个月会有 5000 积分。 什么是 ComfyUI 的 Workflow?Workflow 是 ComfyUI 的精髓。所谓 Workflow 工作流,在 ComfyUI 这里就是它的节点结构及数据流运转过程。
2024-05-26
陪练机器人的workflow配置思路
以下是关于陪练 AI 机器人的 workflow 配置思路: 1. 选择合适的预训练大模型作为基础 可以使用基础模型、对话模型等,根据需求选择合适的模型 通过 API 接口调用大模型的能力 2. 设置机器人的人格和背景知识 根据需要为机器人设置不同的人格特点和背景知识 让机器人扮演不同类型的"顾客"角色 3. 开发对话交互流程 设计机器人与用户之间的对话流程和交互逻辑 可以使用工作流引擎等工具来可视化定义和管理对话流程 4. 集成语音交互能力 如果需要语音交互,可以集成语音识别和合成的能力 提升对话的自然性和沉浸感 5. 实时监测和优化 实时监测用户与机器人的对话情况和学习效果 根据反馈数据持续优化对话流程和机器人行为 6. 支持多场景应用 可以将陪练机器人应用于销售培训、客户服务等不同场景 根据场景需求定制不同的机器人角色和对话流程 总的来说,陪练 AI 机器人的 workflow 配置需要充分利用大模型能力,设计贴合实际需求的机器人角色和对话流程,并通过实时监测和优化不断提升应用效果。这需要综合运用 AI、工作流等技术手段。
2024-04-19
sft是什么意思
“SFT”可能有多种含义。在音乐领域,它可能指某种特定的音乐风格,如“Swift”指快速和敏捷的音乐风格,常用于表现快速和敏捷的情感,如 Taylor Swift 的《Shake It Off》;“Swirling”指旋转和流动的音乐风格;“Swooning”指陶醉和倾倒的音乐风格;“Syllabic”指音节和节奏的音乐风格;“Symbiotic”指共生和互助的音乐风格。 在语音处理方面,“SFT”可能指短时傅里叶变换(Shorttime Fourier Transform,STFT)。语音通常是短时平稳信号,在进行傅里叶变换前一般要进行分帧,取音频的小片段进行短时傅里叶变换。其结果是一个复数,包括幅度和相位信息。能量频谱是振幅频谱的平方,通过对频域信号进行逆傅里叶变换可恢复时域信号。离散傅里叶变换计算复杂度高,可采用快速傅里叶变换简化。在实际应用中,对语音信号分帧加窗处理,视为短时傅里叶变换。
2024-11-17
WAY TO AGI中AGI是什么意思?
AGI 指通用人工智能,也叫强人工智能。通常在其出现时会是奇点科技大爆炸的时刻,科技将推动文明呈指数级增长。虽然通往通用人工智能的道路可能还漫长,但它已如海风般逐渐临近。例如科幻作家刘慈欣所说“未来已来,像盛夏的大雨,在我们还不及撑开伞时就扑面而来”(很多人早就失业了)。
2024-11-15
AGI是什么意思?
AGI 即通用人工智能(Artificial General Intelligence),指能够像人类一样思考、学习和执行多种任务的人工智能系统。它可以做任何人类可以做的事。 Deepmind 的研究团队在去年十一月发表的论文《Levels of AGI》中,给 AGI 的定义提出了六个原则,其中最重要的一点是“关注能力,而非过程”,即应关注 AGI 能完成什么,而非它如何完成任务。AGI 的定义应包括多个级别,每个级别都有明确的度量标准和基准。 还有一个常见且较合理和可验证的定义:AGI 是一种自主系统,在大多数具有经济价值的工作中超越了人类的能力。例如 Sam Altman 常说的,用自动化来贡献 GDP。Andrej Karpathy 今年初在其博客上发表的《Selfdriving as a case study for AGI》(虽很快删除),全文用自动化的交通服务来类比 AGI 和它的经济价值。
2024-11-13
sd中的采样是什么意思
在 Stable Diffusion 中,采样(Sampling)指的是去噪过程。稳定扩散从随机高斯噪声起步,通过一步步降噪逐渐接近符合提示的图像。每一步都会产生一个新的样本图像,这种方法被称为采样器(Sampler)或采样(Sampling)。 不同的采样器具有不同的特点和效果,例如: Euler a 可以以较少的步数产生很大的多样性,不同的步数可能有不同的结果。 Euler 是最简单、最快的。 DDIM 收敛快,但效率相对较低,需要很多 step 才能获得好的结果,适合在重绘时候使用。 LMS 是 Euler 的衍生,使用一种相关但稍有不同的方法,大概 30 step 可以得到稳定结果。 PLMS 是 Euler 的衍生,可以更好地处理神经网络结构中的奇异性。 DPM2 旨在改进 DDIM,减少步骤以获得良好的结果,但速度较慢。 UniPC 效果较好且速度非常快,对平面、卡通的表现较好,推荐使用。 采样步数(Sampling Steps)也很重要,随着步数增多,可以得到对目标更小、更精确的图像,但增加步数会增加生成图像所需的时间,且增加步数的边际收益递减,一般开到 20 30 步。在实际应用中,如何选择采样器和设置采样步数可以按照模型作者的推荐进行。
2024-11-09
AGI是什么意思
AGI 指的是通用人工智能(Artificial General Intelligence),它是一种能够像人类一样思考、学习和执行多种任务的人工智能系统。做任何人类可以做的事,涵盖了广泛的认知技能和能力,包括推理、规划、解决问题、抽象思维、理解复杂思想、快速学习和从经验中学习等。在 2000 年代初,“通用人工智能”这一名词开始流行,以强调从“狭义 AI”到更广泛的智能概念的追求。但目前 AGI 还未取得巨大进展。
2024-11-02
boosting 模型是什么意思
Boosting 模型是一种集成学习方法,主要包括以下两种常见类型: 1. Bagging(Bootstrap Aggregating):通过多次有放回抽样生成多个数据集,训练多个相同类型的模型(如决策树、多项式等),对于回归任务将多个模型的预测结果取平均,对于分类任务通过多数投票来决定最终的分类结果,以减少机器学习模型的方差,提高泛化能力。其核心步骤包括从原始数据集中有放回地抽取多个子集,每个子集用于训练一个独立的模型,最后集成这些模型的结果。 2. AdaBoost(Adaptive Boosting):主要用于分类问题,也可用于回归问题。它通过组合多个弱学习器(通常是决策树桩)来构建一个强学习器,以提高模型的预测性能。弱学习器的准确率仅略高于随机猜测,例如在二分类问题中可能略高于 50%。在 AdaBoost 中,强学习器通常是具有高准确率、能很好泛化到新数据的复杂模型,如深度神经网络或支持向量机,能够捕捉数据中的复杂模式。 此外,在 Coze 上,GLM 模型和 MoonShot 模型因对结构化提示词的良好理解适合处理精确输入和输出任务,豆包系列模型在角色扮演和工具调用方面表现出色,将这三种模型结合在工作流或多 Agent 中可实现优势互补。
2024-10-21