以下是关于 AI 工作流的相关内容:
目前使用 AI 的一些固定和优化的工作流包括:
生成式 AI 的人机协同分为 3 种产品设计模式:Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理),不同模式下人与 AI 的协作流程有所差异。
Agentic Workflow 驱动角色工作流变革,使用 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。
重塑工作流时,可从原子能力层思考,抽象化拆解大模型的底层能力,如翻译、识别、提取、格式化等,围绕“输入”“处理”“输出”“反馈”构建最底层的信息处理逻辑。
在获取信息方面,搜索引擎和基于大模型的聊天机器人目标一致,如 Kimi Chat 会在互联网上检索相关内容并总结分析给出结论。
Agent 通过自行规划任务执行的工作流路径,面向简单或线性流程运行。
吴恩达通过开源项目 ChatDev 举例,可让大语言模型扮演不同角色相互协作开发应用或复杂程序。
AI Agent 基本框架为“Agent = LLM +规划+记忆+工具使用”,其中大模型 LLM 扮演“大脑”,规划包括子目标分解、反思与改进。
转载自:进击的盖茨比原文地址:https://web.okjike.com/u/bdfcb96a-0a42-4d50-a760-8768221072b4分享下目前使用AI的小小心得,我现在固定+优化的AI工作流:1.起床,让AI“马云”“马化腾”给我排TODO优先级,做一些私董会的脑暴2.工作中,有一个傲娇AI小助理给我加油,给她的Prompt就是:要阳光,会撒娇/卖萌3.重点事项bot,如内容创作,拆成一个bot团队组:工作分成选题,标题、框架、扩写、然后分A/B组两个AI-bot互相改。其中的要点是:提供反常识、梗;需要学习一些我喜欢的UP创作方法论,比如导演小策、影视飓风TIM总结的HKRR(快乐/知识/共鸣/节奏)4.在优化的bot包括:内容选题bot,短视频脚本bot,数据分析bot(GPT4),网页Perplexity的资料库bot5.优化1:Zion、ChatO和自动化AI-Agent分身,基于自身知识库的bot6.优化2:将上述知识库,Prompt资产,全部放入飞书的知识库+多维表单中维护;等待飞书的AI进化7.备选:筛选过的50多个生产力AI,放在工具库里,待命输出8.未来:把整个公司业务,全部搬入飞书中,外接MJ,ChatBot分身,以及咨询日程预约。9.可能:所有流量口bot也介入飞书。给予飞书做数据分析和内容引擎(目前搞不定,得手动)10.告诉自己,马看见什么,是人决定的,关注AI,更关注打交道的人、利益、状态和情绪。
AI与人的协同关系生成式AI的人机协同分为3种产品设计模式:Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理),在这3种模式下,人与AI的协作流程也是有所差异。Embedding模式:人类完成大多数工作。Copilot模式:人类和AI协同工作。Agents模式:AI完成大多数工作。Agentic Workflow驱动角色工作流变革使用Multiagent Collaboration的方法,让不同角色的Agent按照根据任务要求自主规划选择工具、流程进行协作完成一件任务。我作为一个产品经理角色,我的诉求很简单,需要完成某一个产品功能设计,这个时候通过Agents拆解成多个独立的任务,然后遵循不同的工作流,最后给我生成一份在大体上符合我期望的输出结果,我再修修改改就能够达到可用的阶段了。所以,我从原子能力层重新思考,面对这个快速变化的时代,我该如何去重塑我自己的工作流,以不变应万变呢?我抽象化拆解了大模型的一些底层能力,例如:翻译、识别、提取、格式化等等,其实所有的一些都会围绕几个词“输入”、“处理”、“输出”、“反馈”。“输入”、“处理”、“输出”、“反馈”构建了我最底层的信息处理逻辑,我把它比作四个齿轮,齿轮之间通过不同的衔接工具逐步推动运转,从需求作为输入、结果作为输出,围绕着信息加速,不断驱动我向前。重塑获取信息的方式搜索引擎作为互联网基础设施,同时也是互联网的入口,对于用户而言,从解决问题出发,搜索引擎和基于大模型的聊天机器人的目标从根本上是一致的。自2022年底ChatGPT发布,其通过问答形式被认为将对传统搜索引擎带来颠覆。
如果大家使用Kimi Chat来查询某个问题,你会发现它会在互联网上检索相关内容,并基于检索结果进行总结分析,最后给出结论。这其实是大模型利用「网页搜索」工具的一个典型例子,同时你也会看到PPT中介绍了非常多的不同领域类型的工具,它其实是为大模型在获取、处理、呈现信息上做额外的补充。PlanningAgent通过自行规划任务执行的工作流路径,面向于简单的或者一些线性流程的运行。比如下图中:Agent会先识别男孩的姿势,并可能找到一个姿势提取模型来识别姿势,在接下来要找到一个姿势图像模型来合成一个新的女孩图像,然后再使用图像理解文本的模型,并在最后使用语音合成输出,完成这个流程任务。Multiagent Collaboration吴恩达通过开源项目ChatDev进行举例,你可以让一个大语言模型扮演不同的角色,比如让一个Agent扮演公司CEO、产品经理、设计师、代码工程师或测试人员,这些Agent会相互协作,根据需求共同开发一个应用或者复杂程序。AI Agent基本框架OpenAI的研究主管Lilian Weng曾经写过一篇博客叫做《LLM Powered Autonomous Agents》,其中就很好的介绍了Agent的设计框架,她提出了“Agent = LLM +规划+记忆+工具使用”的基础架构,其中大模型LLM扮演了Agent的“大脑”。Planning(规划)主要包括子目标分解、反思与改进。将大型任务分解为较小可管理的子目标处理复杂的任务。而反思和改进指可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。Memory(记忆)