扣子工作流可以实现上传图片并让 AI 理解图片内容。具体步骤如下:
在搭建工作流时,主要关注以下几个步骤:
此外,扣子平台具有以下特点和功能:
无限拓展的能力集扣子集成了丰富的插件工具,可以极大地拓展Bot的能力边界。内置插件:目前平台已经集成了超过60款各类型的插件,包括资讯阅读、旅游出行、效率办公、图片理解等API及多模态模型。你可以直接将这些插件添加到Bot中,丰富Bot能力。例如使用新闻插件,打造一个可以播报最新时事新闻的AI新闻播音员。自定义插件:扣子平台也支持创建自定义插件。你可以将已有的API能力通过参数配置的方式快速创建一个插件让Bot调用。丰富的数据源扣子提供了简单易用的知识库功能来管理和存储数据,支持Bot与你自己的数据进行交互。无论是内容量巨大的本地文件还是某个网站的实时信息,都可以上传到知识库中。这样,Bot就可以使用知识库中的内容回答问题了。内容格式:知识库支持添加文本格式、表格格式的数据。内容上传:你可以将本地TXT、PDF、DOCX、Excel、CSV格式的文档上传至知识库,也可以基于URL获取在线网页内容和API JSON数据。同时支持直接在知识库内添加自定义数据。持久化的记忆能力扣子提供了方便AI交互的数据库记忆能力,可持久记住用户对话的重要参数或内容。例如,创建一个数据库来记录阅读笔记,包括书名、阅读进度和个人注释。有了数据库,Bot就可以通过查询数据库中的数据来提供更准确的答案。灵活的工作流设计扣子的工作流功能可以用来处理逻辑复杂,且有较高稳定性要求的任务流。扣子提供了大量灵活可组合的节点包括大语言模型LLM、自定义代码、判断逻辑等,无论你是否有编程基础,都可以通过拖拉拽的方式快速搭建一个工作流,例如:创建一个搜集电影评论的工作流,快速查看一部最新电影的评论与评分。创建一个撰写行业研究报告的工作流,让Bot写一份20页的报告。
1.上传输入图片2.理解图片信息,提取图片中的文本内容信息3.场景提示词优化/图像风格化处理4.返回文本/图像结果[heading2]2.1零代码版本[content]为了简化流程,我们选择了Coze平台并实现了零代码版本的工作流。搭建流程时,我们主要关注以下几个步骤:上传图片:将本地图片转换为在线OSS存储的URL,以便在平台中进行调用,主要是用图像流过一道。插件封装:将图片理解大模型和图片OCR封装为工作流插件,实现便捷调用,如果市场里面有可以直接使用。
1、点击工作流后面的➕来添加一个工作流2、点击创建工作流3、给工作流起名字和描述这边注意下,工作流起名字的时候只能用字母、数字和下划线的方式。大家只要符合要求自己看的懂分辨的清楚即可。描述可以写的清晰一些,避免之后自己会误会、混乱。大家按照自己的理解写就好。头像我这边就没改。4、初始化的工作流左边是我们可以使用的各种插件和搭建Agent的一些工具,直接点击加号或者直接拖拽可以直接拉出来。插件的使用,一般都会有个对应的参数说明,这个我们之后只介绍我们需要使用的插件。其他的大家可以自己试试。初始化后,会直接生成开始模块和结束模块。默认生成,且有且只有一个,即只能以开始模块启动,结束模块终结工作流。这个工作流为了让大家更清晰的看到录制了一个视频,大家可以点击观看下。[工作流.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/AFCobLRKbox8ZxxwvkxcJQcWnvd?allow_redirect=1)这边视频中,有个小bug我在使用text2image的时候最后的prompt参数在视频中设置错啦,所以生成图一直是使用的第一个图片的prompt,大家可以把最后一个参数调整一下。图片放在下面。感谢苏的提醒~金句创作提取拆分代码绘画提示词生成