要 100% 调用 Coze 的工作流或插件,您可以参考以下内容:
此外,判断任务/Prompt 是否需要拆解为工作流时,通常先从当前性能最强的 LLM 着手,用单条 Prompt 或 Prompt Chain 测试任务执行质量和稳定性,再根据实际情况逐步拆解子任务。对于场景多样、结构复杂、对输出格式要求严格的内容,基本可预见需要拆解为工作流。鉴于 LLM 只能处理文本输入输出的特性,涉及生成多媒体内容或从网络自主获取额外信息等能力时,必然需要通过工作流来调用相应的插件。
1.上传输入图片2.理解图片信息,提取图片中的文本内容信息3.场景提示词优化/图像风格化处理4.返回文本/图像结果[heading2]2.1零代码版本[content]为了简化流程,我们选择了Coze平台并实现了零代码版本的工作流。搭建流程时,我们主要关注以下几个步骤:上传图片:将本地图片转换为在线OSS存储的URL,以便在平台中进行调用,主要是用图像流过一道。插件封装:将图片理解大模型和图片OCR封装为工作流插件,实现便捷调用,如果市场里面有可以直接使用。
|功能|描述||-|-||插件|Coze提供了丰富的插件选项,允许通过API连接来集成各种平台和服务,从而扩展Bot的功能。无论是利用新闻插件搜索最新资讯,还是使用搜索工具在线查找信息,你都可以轻松调用或创建定制插件来实现。||工作流|工作流是一种强大的工具,用于设计和实施复杂的功能逻辑。通过拖拽不同的任务节点,你可以构建复杂的多步骤任务,有效提高Bot处理任务的效率。||图像流|图像流提供了一个可视化的操作界面,允许你灵活地添加处理节点,设计出符合预期的图像处理流程。||触发器|触发器允许Bot在设定的特定时间或发生特定事件时自动执行任务,是自动化处理的关键组件。||知识库|知识库功能使你能够添加和利用本地或在线的文本内容和数据表,支持Bot提供更准确和实用的回答。||变量|变量功能帮助Bot存储用户的个人信息,如语言偏好,使回复更加个性化和精准。||数据库|数据库功能提供了一个简单而高效的方式来管理和操作结构化数据,支持自然语言的数据插入和查询。该功能还支持多用户模式,提供灵活的读写权限控制。||长期记忆|长期记忆功能使Bot能够形成对用户的个人记忆,基于这些记忆提供个性化的回复,以此来提升用户体验。||卡片|卡片功能允许你自定义Bot生成的内容的格式,以卡片形式展示,增强交互体验。||大模型|通过人设与回复逻辑中的一系列设定,编排Bot的具体执行任务和执行逻辑。|
1.如何判断自己的任务/Prompt是否需要拆解为工作流?构建稳定可用的AI Agent是一个需要不断调试和迭代的过程。Agent工程的终极目标是打造出流程尽量简洁、Prompt尽量精炼、生成结果最稳定的智能体。我们通常从当前性能最强的LLM(如ChatGPT-4和Claude 3.5 sonnet)着手,先用单条Prompt或Prompt Chain(可以简单理解为与LLM连续对话,引导LLM逐步完成复杂的任务)来测试任务的执行质量和稳定性。然后,根据实际执行情况、最终投产使用的LLM,逐步拆解子任务,降低LLM执行单任务的难度,直到达成工程目标。一般而言,对于类似文中这种场景多样、结构复杂、对输出格式要求严格的内容,我们基本可以预见到需要将其拆解为工作流。此外,鉴于LLM只能处理文本输入输出的特性,如果涉及生成多媒体内容或从网络自主获取额外信息等能力,必然需要通过工作流来调用相应的插件。2.只用了一段Prompt的Agent,还算AI Agent吗?算。详见[关于LLM、Prompt、Agent的概念理解](https://zkv549gmz8.feishu.cn/wiki/KhXkwqngAitUufkHNUUcPP57nDb?from=from_copylink)