与知识库对话 - ai agent和workfolw的差异

回答

AI Agent 和 Workflow 的主要差异如下：

任务编排方式：AutoGPT 的任务由大模型自动编排，而 Workflow 中的子任务是人为编排的。
带来的优化：
- 流程中可加入人类 Knowhow，弥补模型知识的不足。
- 专家测试试跑，减少生产环境中的无效反思，提升 Agent 的表现。
- 引入图的概念，灵活组织节点，连接各类工具，包括套工具、套其他 Agent、写代码用硬逻辑处理、接大模型进行判断等，极大地提高了灵活性和可控性，提升了 Agent 能力的上限。
解决的问题：Agentic Workflow 可以从提升效率、提高质量、节省时间的角度思考，通过将复杂任务分解为小步骤，融入更多人类参与的规划与定义，减少对 Prompt Engineering 和模型推理能力的依赖，提高 LLM 应用面向复杂任务的性能。
涉及的概念：
- 记忆：分为短期记忆和长期记忆，短期记忆将上下文学习视为利用模型的短期记忆学习，长期记忆提供长期存储和召回信息的能力。
- 工具：学会调用外部不同类型 API 获取模型缺少的额外信息、代码执行能力、访问专有信息源等。
- 动作：大模型根据问句、上下文规划、各类工具决策出最终执行的动作。
人机协同关系：生成式 AI 的人机协同分为 Embedding（嵌入式）、Copilot（副驾驶）、Agent（智能代理）3 种模式，不同模式下人与 AI 的协作流程有所差异。
- Embedding 模式：人类完成大多数工作。
- Copilot 模式：人类和 AI 协同工作。
- Agents 模式：AI 完成大多数工作。
工作流变革：使用 Multiagent Collaboration 的方法，让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。
信息处理逻辑：抽象化拆解大模型的底层能力，如翻译、识别、提取、格式化等，围绕“输入”“处理”“输出”“反馈”构建最底层的信息处理逻辑。
对获取信息方式的重塑：搜索引擎和基于大模型的聊天机器人在解决问题方面目标一致，ChatGPT 的发布被认为将对传统搜索引擎带来颠覆。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

AI Agent 产品经理血泪史（二）-欲知方圆，则必规矩【Workflow篇】

上图分别是Coze和Dify的workflow可视化编排页面（框架：React Flow），不得不说Coze的确不是最早做编排的，但是集各家之所长，在用户体验上做的的确得人心。再回过头对比一下上节中AutoGPT的实现，我们可能就发现了这个差异：AutoGPT的任务是大模型编排出来的，我们可以理解为自动编排；而Workflow里面的子任务，是我们人为编排的，我们就称为手动编排吧。由此带来的优化也非常明显：1.在流程中加入人类Knowhow，补足模型知识的不足；2.专家测试试跑，减少生产环境中的反复无效反思，至少不会让用户觉得你的Agent真蠢；3.引入图的概念，灵活组织节点，连接各类工具（让你的Agent看起来很牛逼）其实加入了图的概念之后，workflow的天花板也就变得非常高了。因为你可以在这个流程中去任意增加节点，增加各种类型的节点，不仅能套工具，还能套其它agent，你也可以写代码用硬逻辑去处理，你也可以接大模型，让它代替人类进进行判断。能力的上限，很大概率就是你想象力的上限。灵活和可控，把Agent能力的天花板往上顶了一大截。这就是workflow的功劳。我之前评价一个Agent平台好不好用：1看基座模型的function calling能力，2看workflow的灵活性，3看平台创作者的workflow写的牛逼不牛逼哈哈1、2看的是技术能力，其实也没啥门槛

Inhai: Agentic Workflow：AI 重塑了我的工作流

分为短期记忆和长期记忆。其中短期记忆是指的将所有的上下文学习看成是利用模型的短期记忆来学习；而长期记忆是提供了长期存储和召回信息的能力，它们通常通过利用外部的向量存储和快速检索来存储和召回信息。Tools（工具）通过学会调用外部不同类型API来获取模型（通常在预训练后很难修改）中缺少的额外信息，代码执行能力，访问专有信息源等（例如获取此时此刻的天气、联网网搜索等）Action（动作）根据上述大模型结合问句（Query）、上下文的规划（Context）、各类工具，最终大模型才能决策出最终需要执行的动作是什么。Agentic Workflow解决什么问题？我认为是可以从从提升效率、提高质量、节省时间的角度上进行思考。好比一台“印钞机”，按照指定好的流程重复着机械性的活动，但是它在源源不断的产生价值。Productivity（效率）=产生价值的速率Agentic Workflow通过将一个复杂的任务分解成较小的步骤，在整个过程中中融入了更多人类参与到流程中的规划与定义。它减少了对Prompt Engineering和模型推理能力的依赖，提高了LLM应用面向复杂任务的性能，更丰富、更精确。下面是Coze（扣子）平台上的工作流编排器的示例，这个话其实是一个抽卡游戏的流程，你可以看到在整个工作流中间会有很多节点前后之间有节点以及连线，然后每个节点之间它是通过不同的定义，比如说图片处理工具，或者说是通过多模态模型进行图片理解工具等等其他各种各样的工具组合而成。

Inhai: Agentic Workflow：AI 重塑了我的工作流

AI与人的协同关系生成式AI的人机协同分为3种产品设计模式：Embedding（嵌入式）、Copilot（副驾驶）、Agent（智能代理），在这3种模式下，人与AI的协作流程也是有所差异。Embedding模式：人类完成大多数工作。Copilot模式：人类和AI协同工作。Agents模式：AI完成大多数工作。Agentic Workflow驱动角色工作流变革使用Multiagent Collaboration的方法，让不同角色的Agent按照根据任务要求自主规划选择工具、流程进行协作完成一件任务。我作为一个产品经理角色，我的诉求很简单，需要完成某一个产品功能设计，这个时候通过Agents拆解成多个独立的任务，然后遵循不同的工作流，最后给我生成一份在大体上符合我期望的输出结果，我再修修改改就能够达到可用的阶段了。所以，我从原子能力层重新思考，面对这个快速变化的时代，我该如何去重塑我自己的工作流，以不变应万变呢？我抽象化拆解了大模型的一些底层能力，例如：翻译、识别、提取、格式化等等，其实所有的一些都会围绕几个词“输入”、“处理”、“输出”、“反馈”。“输入”、“处理”、“输出”、“反馈”构建了我最底层的信息处理逻辑，我把它比作四个齿轮，齿轮之间通过不同的衔接工具逐步推动运转，从需求作为输入、结果作为输出，围绕着信息加速，不断驱动我向前。重塑获取信息的方式搜索引擎作为互联网基础设施，同时也是互联网的入口，对于用户而言，从解决问题出发，搜索引擎和基于大模型的聊天机器人的目标从根本上是一致的。自2022年底ChatGPT发布，其通过问答形式被认为将对传统搜索引擎带来颠覆。