Chat with Wiki - 扣子工作流上传图片并让AI理解图片内容

Answer

扣子工作流可以实现上传图片并让 AI 理解图片内容。具体步骤如下：

上传输入图片：将本地图片转换为在线 OSS 存储的 URL，以便在平台中进行调用。
理解图片信息，提取图片中的文本内容信息：通过封装的图片理解大模型和图片 OCR 等插件来实现。
场景提示词优化/图像风格化处理。
返回文本/图像结果。

在搭建工作流时，主要关注以下几个步骤：

点击工作流后面的“➕”来添加一个工作流。
点击创建工作流。
给工作流起名字和描述，名字只能用字母、数字和下划线，描述清晰以便区分。
初始化的工作流：左边有各种可用的插件和搭建 Agent 的工具，可通过点击加号或直接拖拽使用。插件一般有对应的参数说明，初始化后会生成开始模块和结束模块，且只能以开始模块启动，结束模块终结工作流。

此外，扣子平台具有以下特点和功能：

集成了丰富的插件工具，包括资讯阅读、旅游出行、效率办公、图片理解等 API 及多模态模型，支持内置插件和自定义插件。
提供简单易用的知识库功能来管理和存储数据，支持多种格式的数据上传，包括文本格式、表格格式，也支持本地文件和在线网页内容及 API JSON 数据的上传。
具有持久化的记忆能力，可记住用户对话的重要参数或内容。
工作流功能灵活，可通过拖拉拽的方式搭建处理逻辑复杂且稳定性要求高的任务流。

Content generated by AI large model, please carefully verify (powered by aily)

References

Coze官方教程

无限拓展的能力集扣子集成了丰富的插件工具，可以极大地拓展Bot的能力边界。内置插件：目前平台已经集成了超过60款各类型的插件，包括资讯阅读、旅游出行、效率办公、图片理解等API及多模态模型。你可以直接将这些插件添加到Bot中，丰富Bot能力。例如使用新闻插件，打造一个可以播报最新时事新闻的AI新闻播音员。自定义插件：扣子平台也支持创建自定义插件。你可以将已有的API能力通过参数配置的方式快速创建一个插件让Bot调用。丰富的数据源扣子提供了简单易用的知识库功能来管理和存储数据，支持Bot与你自己的数据进行交互。无论是内容量巨大的本地文件还是某个网站的实时信息，都可以上传到知识库中。这样，Bot就可以使用知识库中的内容回答问题了。内容格式：知识库支持添加文本格式、表格格式的数据。内容上传：你可以将本地TXT、PDF、DOCX、Excel、CSV格式的文档上传至知识库，也可以基于URL获取在线网页内容和API JSON数据。同时支持直接在知识库内添加自定义数据。持久化的记忆能力扣子提供了方便AI交互的数据库记忆能力，可持久记住用户对话的重要参数或内容。例如，创建一个数据库来记录阅读笔记，包括书名、阅读进度和个人注释。有了数据库，Bot就可以通过查询数据库中的数据来提供更准确的答案。灵活的工作流设计扣子的工作流功能可以用来处理逻辑复杂，且有较高稳定性要求的任务流。扣子提供了大量灵活可组合的节点包括大语言模型LLM、自定义代码、判断逻辑等，无论你是否有编程基础，都可以通过拖拉拽的方式快速搭建一个工作流，例如：创建一个搜集电影评论的工作流，快速查看一部最新电影的评论与评分。创建一个撰写行业研究报告的工作流，让Bot写一份20页的报告。

0基础手搓AI拍立得

1.上传输入图片2.理解图片信息，提取图片中的文本内容信息3.场景提示词优化/图像风格化处理4.返回文本/图像结果[heading2]2.1零代码版本[content]为了简化流程，我们选择了Coze平台并实现了零代码版本的工作流。搭建流程时，我们主要关注以下几个步骤：上传图片：将本地图片转换为在线OSS存储的URL，以便在平台中进行调用，主要是用图像流过一道。插件封装：将图片理解大模型和图片OCR封装为工作流插件，实现便捷调用，如果市场里面有可以直接使用。

利用 AI 批量生成、模仿和复刻《小林漫画》（内含 coze 搭建视频教程）

1、点击工作流后面的➕来添加一个工作流2、点击创建工作流3、给工作流起名字和描述这边注意下，工作流起名字的时候只能用字母、数字和下划线的方式。大家只要符合要求自己看的懂分辨的清楚即可。描述可以写的清晰一些，避免之后自己会误会、混乱。大家按照自己的理解写就好。头像我这边就没改。4、初始化的工作流左边是我们可以使用的各种插件和搭建Agent的一些工具，直接点击加号或者直接拖拽可以直接拉出来。插件的使用，一般都会有个对应的参数说明，这个我们之后只介绍我们需要使用的插件。其他的大家可以自己试试。初始化后，会直接生成开始模块和结束模块。默认生成，且有且只有一个，即只能以开始模块启动，结束模块终结工作流。这个工作流为了让大家更清晰的看到录制了一个视频，大家可以点击观看下。[工作流.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/AFCobLRKbox8ZxxwvkxcJQcWnvd?allow_redirect=1)这边视频中，有个小bug我在使用text2image的时候最后的prompt参数在视频中设置错啦，所以生成图一直是使用的第一个图片的prompt，大家可以把最后一个参数调整一下。图片放在下面。感谢苏的提醒~金句创作提取拆分代码绘画提示词生成