Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何在coze创建智能体或工作流

Answer

在 Coze 创建智能体或工作流的步骤如下:

  1. 创建 Bot:
    • 打开 Coze 官网 https://www.coze.cn/home 。
    • 点击页面左上角的⊕,通过【标准创建】填入 bot 的基本信息。
  2. 图像工作流:
    • 创建图像工作流。
    • 图像流分为智能生成、智能编辑、基础编辑三类。
    • 空间风格化插件有参数,如 image_url 是毛坯房的图片地址;Strength 是提示词强度,影响效果图;Style 是生成效果的风格,如新中式、日式、美式、欧式、法式等;user_prompt 是用户输入的 Promot 提示词。
    • 按照构架配置工作流,调试效果。调试工作流毛坯房测试用例:https://tgi1.jia.com/129/589/29589741.jpg 。
    • 开始节点对应配置三项内容,进行提示词优化。
  3. 分步构建和测试 Agent 功能:
    • 首先进入 Coze,点击「个人空间-工作流-创建工作流」,打开创建工作流的弹窗。
    • 根据弹窗要求,自定义工作流信息。点击确认后完成工作流的新建。
    • 左侧「选择节点」模块中,根据子任务需要,实际用上的有插件、大模型、代码。
    • 编辑面板中的开始节点、结束节点,分别对应分解子任务流程图中的原文输入和结果输出环节。
    • 按照流程图,在编辑面板中拖入对应的 LLM 大模型、插件、代码节点,完成工作流框架的搭建。
  4. Bot 开发调试界面:
    • 人设与回复逻辑(左侧区域):设定 Bot 的对话风格、专业领域定位,配置回复的逻辑规则和限制条件,调整回复的语气和专业程度。
    • 功能模块(中间区域):
      • 技能配置:插件可扩展 Bot 的专业能力;工作流可设置固定的处理流程和业务逻辑;图像流处理和生成图像相关功能;触发器设置自动化响应条件。
      • 知识库管理:文本存储文字类知识材料;表格结构化数据的存储和调用;照片是图像素材库。
      • 记忆系统:变量存储对话过程中的临时信息;数据库管理持久化的结构化数据;长期记忆保存重要的历史对话信息;文件盒子管理各类文档资料。
    • 交互优化(底部区域):开场白设置初次对话的问候语;用户问题建议配置智能推荐的后续问题;快捷指令设置常用功能的快速访问;背景图片自定义对话界面的视觉效果。
    • 预览与调试(右侧区域):实时测试 Bot 的各项功能,调试响应效果,优化交互体验。
Content generated by AI large model, please carefully verify (powered by aily)

References

【图像流】用Coze的工作流创建随便虐的室内设计师

打开Coze官网https://www.coze.cn/home[heading2]2、图像工作流[content]创建图像工作流图像流配置界面[heading2]3、图像流分类[content]图像流分为智能生成、智能编辑、基础编辑三类Coze的图像流很像ComfyUI,但是比ComfyUI更普世化,更简单易上手[heading2]4、空间风格化插件[content][heading2]5、空间风格化插件有个参数[content]image_url就是毛坯房的图片地址;Strength提示词强度,就是提示词对效果图的影响度;Style生成效果的风格,比如新中式、日式、美式、欧式、法式等等user_prompt就是用户输入的Promot提示词[heading2]6、工作流流程[content]按照构架配置工作流工作流调试效果调试工作流毛坯房测试用例:https://tgi1.jia.com/129/589/29589741.jpg[heading2]7、开始节点解析[content]开始节点就对应配置三项内容提示词优化[heading2]8、人设和回复逻辑[content]技能1中3项中的编译数字来源然后点击右上角发布,机器人就可以不至疲倦的给你出图了。[出图.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Qxatb9DY0ozrdMxX4YecnJWKnUe?allow_redirect=1)

一泽Eze:万字实践教程,全面入门 Coze 工作流|用 Coze 打造 AI 精读专家智能体,复刻 10 万粉公众号的创作生产力

首先进入Coze,点击「个人空间-工作流-创建工作流」,打开创建工作流的弹窗。根据弹窗要求,自定义工作流信息。点击确认后完成工作流的新建,可以看到整个编辑视图与功能如下:其中,左侧「选择节点」模块中,根据我们的子任务需要,实际用上的有:1.插件:提供一系列能力工具,拓展Agent的能力边界。本案例涉及的思维导图、英文音频,因为无法通过LLM生成,就需要依赖插件来实现。2.大模型:调用LLM,实现各项文本内容的生成。本案例的中文翻译、英文大纲、单词注释等都依赖大模型节点。3.代码:支持编写简单的Python、JS脚本,对数据进行处理。而编辑面板中的开始节点、结束节点,则分别对应1.2分解子任务流程图中的原文输入和结果输出环节。接下来,按照流程图,在编辑面板中拖入对应的LLM大模型、插件、代码节点,即可完成工作流框架的搭建。

Yeadon:写给小小白的-从游戏入手学习搓图像流bot

进入coze官网www.coze.cn,注册并登录点击页面左上角的⊕通过【标准创建】填入bot的基本信息[heading3]步骤二:了解Bot开发调试界面[content]Bot的开发和调试页面功能布局如下:1.人设与回复逻辑(左侧区域)设定Bot的对话风格、专业领域定位配置回复的逻辑规则和限制条件调整回复的语气和专业程度1.功能模块(中间区域)A.技能配置插件:扩展Bot的专业能力,如计算器、日历等工具工作流:设置固定的处理流程和业务逻辑图像流:处理和生成图像的相关功能触发器:设置自动化响应条件B.知识库管理文本:存储文字类知识材料表格:结构化数据的存储和调用照片:图像素材库C.记忆系统变量:存储对话过程中的临时信息数据库:管理持久化的结构化数据长期记忆:保存重要的历史对话信息文件盒子:管理各类文档资料1.交互优化(底部区域)开场白:设置初次对话的问候语用户问题建议:配置智能推荐的后续问题快捷指令:设置常用功能的快速访问背景图片:自定义对话界面的视觉效果1.预览与调试(右侧区域)实时测试Bot的各项功能调试响应效果优化交互体验这些功能模块共同构建了一个完整的Bot开发环境,使开发者能够全方位地设计和优化Bot的性能。

Others are asking
我想要学习关于coze的内容课程
以下是一些关于 Coze 的学习资源和教程: 基础教程: 工作流相关: 大雨:coze 工作流节点大全 引言:介绍 Coze 平台及其在 AI 应用开发中的作用,强调工作流是核心概念,可用于组合各种功能模块实现复杂业务流程编排,适用场景广泛。 Coze 工作流概述:解释工作流是一系列有序任务或操作,适用多步骤任务、插件调用、数据处理等场景。 创建工作流:一般建议直接在 bot 里面新建工作流,若工作流不见,可在首页工作空间资源库工作流中查找。 历史活动教程: 5 月 7 号():大聪明分享|主题:Agent 的前世今生,每个分享人分享最初是怎么接触 Coze 的,以及现在用 Coze 做什么。 5 月 8 号():大圣分享|主题:我眼中的 AI Agent 以及通过搭建知识库实例入门 Coze。 5 月 9 号():艾木分享|主题:Agent 系统的核心构成:Workflow 和 Multiagent Flow(以“Dr.Know”和“卧底”为例,线上答疑。 5 月 10 号():罗文分享|主题:一个方法解锁 COEZ 所有插件的用法+如何自动化解锁每天抓取 X 内容+改写+发布到飞书。 5 月 11 号():Itao 分享|主题:和 AI 成为搭子,线上答疑。
2025-03-17
coze
以下是关于 Coze 的相关信息: 重磅更新:Coze 可以接入抖音评论区,帮您自动回复用户的评论。若想快速上手,可参考视频。若不了解 Coze 是什么,可参考文章。 安装 Coze Scraper: 通过应用商店安装: 1. 打开 Chrome 浏览器。 2. 点击在 Chrome 应用商店中打开 Coze Scrapper 扩展程序。 3. 单击添加至 Chrome。 4. 在弹出的页面,单击添加扩展程序。 本地安装: 1. 单击下载安装包,然后解压下载的文件。 2. 打开 Chrome 浏览器。 3. 在浏览器中输入 chrome://extensions 打开扩展程序页面,确认开发者模式处于打开状态。点击加载已解压的扩展程序,选择已解压的文件夹。 Coze 记账管家——数据库使用教程: COZE 是字节跳动旗下子公司推出的 AI Agent 构建工具,允许用户在无编程知识的基础上,使用自然语言和拖拽等方式构建 Agent,可白嫖海量大模型免费使用,有丰富的插件生态。 记账管家是基于 COZE 平台的能力搭建的一个记账应用,可以直接和 coze 说收入或支出情况,coze 会自动记账并计算账户余额,每一笔记账记录都不会丢失。点击以下卡片体验记账管家。
2025-03-17
上手coze的路径,整理一个教程的列表
以下是上手 Coze 的路径及相关教程列表: 1. 历史活动教程: 5 月 7 号():大聪明分享|主题:Agent 的前世今生,每个分享人分享最初是怎么接触 Coze 的,以及现在用 Coze 做什么。流程安排:20:00@🌈AJ 主持开场,20:00 21:00 大聪明分享,21:00 21:30 关于 Coze 随便聊聊。 5 月 8 号():大圣分享|主题:我眼中的 AI Agent 以及通过搭建知识库实例入门 Coze。流程安排:20:00 21:20 大圣分享。 5 月 9 号():艾木分享|主题:Agent 系统的核心构成:Workflow 和 Multiagent Flow(以“Dr.Know”和“卧底”为例,线上答疑。流程安排:20:00 21:00 艾木分享,21:00 21:30 线上答疑。 5 月 10 号():罗文分享|主题:一个方法解锁 COEZ 所有插件的用法+如何自动化解锁每天抓取 X 内容+改写+发布到飞书。流程安排:20:00 21:00 罗文分享。 5 月 11 号():Itao 分享|主题:和 AI 成为搭子,线上答疑。流程安排:20:00 21:00:itao 分享,21:00 21:30 线上答疑。 2. 基础教程: 3. 大圣的胎教级教程中的 Coze 概述: 字节的官方解释:Coze 是新一代一站式 AI Bot 开发平台。无论是否有编程基础,都可以在 Coze 平台上快速搭建基于 AI 模型的各类问答 Bot,从解决简单的问答到处理复杂逻辑的对话。并且,可以将搭建的 Bot 发布到各类社交平台和通讯软件上,与这些平台/软件上的用户互动。 个人认为:Coze 是字节针对 AI Agent 这一领域的初代产品,在 Coze 中将 AI Agent 称之为 Bot。 字节针对 Coze 这个产品部署了两个站点,分别是国内版和海外版。 国内版: 网址:https://www.coze.cn 官方文档教程:https://www.coze.cn/docs/guides/welcome 大模型:使用的是字节自研的云雀大模型,国内网络即可以正常访问。 海外版: 网址:https://www.coze.com 官方文档教程:https://www.coze.com/docs/guides/welcome 大模型:GPT4、GPT3.5 等大模型(可以在这里白嫖 ChatGPT4,具体参考文档:),访问需要突破网络限制的工具,参考文档:https://www.coze.com/docs/zh_cn/welcome.html AI Agent 的开发流程:Bot 的开发和调试页面布局主要分为提示词和人设的区块、Bot 的技能组件、插件、工作流、Bot 的记忆组件、知识库、变量、数据库、长记忆、文件盒子、一些先进的配置、触发器(例如定时发送早报)、开场白(用户和 Bot 初次对话时,Bot 的招呼话语)、自动建议(每当和 Bot 一轮对话完成后,Bot 给出的问题建议)、声音(和 Bot 对话时,Bot 读对话内容的音色)。
2025-03-16
怎么熟练运用coze
以下是关于熟练运用 Coze 的详细指导: 一、创建 Coze 并添加音乐播放器 1. 创建一个 Coze。 2. 在“用户界面”拖入一个 Markdown 组件。 3. 在 Markdown 中写入 HTML 代码来创建音乐播放器。对于不熟悉前端代码的同学,可以使用智谱清言等 AI 工具生成代码。 4. 调整代码获取在线音乐: 将 Markdown 自带的内容全部删除,将生成的代码写入 Markdown 组件。 找一个在线音乐播放平台,获取歌曲的 URL。 打开浏览器的控制台(按 F12)找到 network(网络),选择播放的请求,将带有.mp3 格式的 URL 复制出来。 找到代码中的<source src=\"song.mp3\" type=\"audio/mpeg\">部分,将 song.mp3 换成复制的音乐地址,刷新开发页面,使播放器可以使用。 二、获取 Coze 的 accessToken 和 botid 1. 获取 accessToken: 在 Coze 界面右侧扣子 API 授权,或者打开链接 https://www.coze.cn/open/oauth/pats 。 添加令牌,设置令牌的名称和过期时间(为了安全起见,最多 1 个月)。 设置权限,如会话管理和对话,拿不准可全部选择,完成后点击“确定”按钮,记得复制下拉令牌,因为该令牌只会出现一次。 2. 获取 botid: 通过工作空间获取,从“工作空间”打开一个 bot,点击商店按钮,地址栏中的数字即为 botid。 注意:如果在前端使用 bot,必须将其发布成为 API,点击发布,选择 API,待审核通过后,按上述方法获取 botid。 三、保姆级教程:Coze 打工你躺平 1. 先跑起来,创建第一个 bot: 目标是创建一个 Coze Bot,帮您查阅 Hacker News 并中文返回。 打开 coze.cn/home,点创建 Bot,信息随便输。 尝试联网询问,若答不出,引入联网插件 WebPilot,重新尝试联网。 2. 用上「回复逻辑」,让它能将链接转换成回答。 3. 发布到飞书,基本成型。 4. 【进阶】使用工作流/workflow&代码/code,更灵活自定义。
2025-03-16
有没有接入微信消息的coze工作流案例
以下是一些接入微信消息的 Coze 工作流案例: 1. 【拔刀刘】自动总结公众号内容,定时推送到微信(附完整实操教程) 搭建工作流: 设置 Bot: 人设和回复逻辑:由于 Bot 主要依托于工作流,设置提示词,直接调用工作流,将 sum_weixin_2_2 替换为工作流的名称。 工作流:添加刚刚创建的工作流。 设置触发器:选择「定时触发」,选择触发的时间,比如每天 18 点,任务执行时输入工作流中开始节点的输入参数,如 key 为 Server 酱的 sendkey,rss_list 可以使用提供的测试数据。触发器在设定时间点根据输入项内容执行工作流,从而在微信收到推送的总结内容。可以同时设置多个触发器,最多 10 个,可推送给不同的人或分不同时间段给自己推送不同内容。 发布到飞书:点击右上角「发布」,注意渠道选择飞书,因为目前 Coze 平台触发器只对飞书渠道生效。 2. AI 实战:搭建信息情报官 Agent 先在 http://open.feishu.cn 上建飞书机器人,并添加知识库或多维表格编辑权限,获得机器人的 app_id 和 app_secret 以获取租用 token:tenant_access_token 来获取多维表格数据和编辑能力。 工作流一:通过微信文章链接进行文章解读成摘要报告,通过 LLM 能力,开源提示词如下。由于 Coze 使用 LLM 和批量执行任务延时的约束,建议不要同时处理太多文章(如 6 篇左右)。执行后将多维表格的文章状态转换成“已通知”并生成简报。 消息情报官 Bot:通过 Coze 建定时任务,执行工作流二,并添加其他如分析文章和搜索文章的能力,变成一个消息情报官的 Agent,发布到 Coze 商店、豆包、飞书、微信、微信公众号、微信小程序等。可以构建多个分身,收集整理不同领域和行业的情报信息。 3. Bot 智能体|用 Coze 实现【多模态资讯的跨平台推送】 技术实现原理: Coze API 接入微信群 Bot:登录宝塔面板,在宝塔面板当中可视化控制云服务器,部署 docker 容器,启动 COW 项目与微信取得关联。chatgptonwechat(简称 CoW)项目是基于大模型的智能对话机器人,可以接入微信公众号、企业微信应用、飞书、钉钉,可选择多种模型,能处理文本、语音和图片,通过插件访问操作系统和互联网等外部资源。点击“Docker”中的“项目模板”中的“添加”按钮,将编译好的内容复制进来,在容器中创建容器,选择容器编排,填入模板和名称,确定。运行成功后点击容器,可看到运行的是两个服务,点击“wcandyaibot”后面的日志按钮,用微信扫码,手动刷新日志,看到 WeChat login success 即成功将 Bot 接入微信。
2025-03-12
coze工作流的相关教程。要求从入门到实操的最新资料
以下是关于 Coze 工作流从入门到实操的相关资料: 一、一泽 Eze 的教程 Step 1:制定任务的关键方法 1. 设计每个子任务的执行方法 阅读理解小作业:基于英文原文,精心策划 3 道符合 CET4 难度的阅读理解题目。每道题均提供 A、B、C、D 四个选项,正确答案所在选项顺序随机,题目和选项均以英文呈现。题目的参考格式如下: 1) A. B. C. D. 参考答案:针对 3 道题目,生成题目答案。预期格式如下: 1) 答案: 2) 答案: 3) 答案: 英文音频:根据原文,利用 TTS 技术朗读全文 全文对照精读:根据原文,按照以下格式,分段完成全文精读结果的输出: 音标: 中文释义: 英文例句: 例句翻译: 二、大圣的教程 二、Coze 使用教程 1. 工作流AI Agent 的内功心法 节点:工作流是由多个节点构成,节点是组成工作流的基本单元。节点的本质就是一个包含输入和输出的函数。 Coze 平台支持的节点类型: LLM(大语言模型):使用输入参数和提示词生成处理结果。 Code(代码):通过 IDE 编写代码处理输入参数,并返回输出值。 Knowledage(知识库):根据输入参数从关联知识库中召回数据,并返回。 Condition(条件判断):ifelse 逻辑节点,用于设计工作流内的分支流程,根据设置条件运行相应的分支。 Variable(获取变量):从 Bot 中获取变量作为参数在工作流中使用。 Database(数据库):在工作流中使用提前配置在 Bot 数据库中的数据。 2. 创建和使用工作流 这一块官方有现成的教程参考: 海外参考文档:https://www.coze.com/docs/zh_cn/use_workflow.html 国内参考文档:https://www.coze.cn/docs/guides/use_workflow 国内版本还提供了一些示例,学习工作流强烈建议大家跟着实操一遍: 搜索新闻:https://www.coze.cn/docs/guides/workflow_search_news 使用 LLM 处理问题:https://www.coze.cn/docs/guides/workflow_use_llm 生成随机数:https://www.coze.cn/docs/guides/workflow_use_code 搜索并获取第一个链接的内容:https://www.coze.cn/docs/guides/workflow_get_content 识别用户意图:https://www.coze.cn/docs/guides/workflow_user_intent 三、蓝衣剑客的教程 三、Coze 简介 1. 工作流 在典型应用场景中,入门级场景可能仅添加一个节点来构建简单工作流。例如,使用获取新闻插件构建一个获取新闻列表的工作流;使用大模型节点接收并处理用户问题等。 更进阶的场景则通过多个节点组合构建逻辑较复杂的工作流。例如,在搜索并获取指定信息详情的场景中,先通过插件能力进行关键词搜索、然后通过代码节点过滤指定信息、最后通过插件能力获取信息详情;或者在通过条件判断识别用户意图的场景中,通过大模型节点处理用户消息,并将消息分类后通过条件节点分别处理不同类型的消息。这些详细配置教程提供了实际操作指南以帮助理解和应用各种功能。
2025-03-12
有什么适合亲子互动用的智能体吗
以下为您推荐两款适合亲子互动的智能体: 1. 名字写对联智能体 作者:韦恩 体验链接:https://tbox.alipay.com/pro/share/202501APggwb00197427?platform=WebService 智能体名称:名字写对联 智能体简介:我是常师傅,别的不懂,春联咱在行,快过年了,用对联送祝福,今年可以不一样 应用场景: 目标人群:想了解对联,想写对联,给朋友送对联祝福的人 解决的问题:想给朋友特殊祝福的人,送春联祝福显得尤为特别,是一份特别的礼物 智能体主要功能: 玩法一:发送朋友名字和祝福,获得一副特殊的对联。 玩法二:发送您的幸运数字,获得您的幸运对联。 玩法三:随便聊聊,对对联,聊聊对联历史。 智能体设计思路: 编排方式:工作流对话模式,可以多轮对话,获得上下文,体验更好。 功能结构:根据用户意图进入不同的流程。 智能体功能实现: 幸运数字模块:发送您的幸运数字,获得您专属幸运对联。 送祝福模块:发送朋友名字祝福,活动给朋友的定制对联。 互动模块:用户可以随意聊,获得您想要的对联相关信息。 2. 旅行青蛙智能体 智能体设计思路: 创意:来源于多年前的火爆 APP——旅行青蛙,采用旅行明信片的方式来与用户互动,一方面让青蛙远游时发回当地景点的明信片,激发用户想去旅游的念头,另一方面通过大模型进行诗歌和文案的创作,可作为自媒体的素材 编排方式:采用单 Agent 的多分支模式,通过意图识别来确定用户的旅行意图,目前运行流畅稳定,有较高的趣味性,效果惊艳。 功能结构:基础功能包括时间季节提取、目的地景点提取、旅行日记文案、景点诗句、文生图提示词编写、风格固定、自定义 FLUX 插件,这些功能相互关联,共同构成一个完整的旅行体验智能体。 智能体功能实现: 随机目的地的旅行模块:青蛙自主选择说走就走的目的地旅行,发回明信片。 指定季节和目的地的旅行模块:青蛙会根据对应的时间和指定的地点,发回来自未来的旅行邮件。 互动模块:用户可以投喂各种食物,与青蛙进行亲密互动。 历史上的今天:当用户选择宅在家里时,青蛙会返回历史上的今天的新闻,并绘制相关的图片 小细节:使用了获取用户 ID,坐标,避免出现推荐与用户同一地区的景点
2025-03-17
电商智能体
电商智能体在品牌卖点提炼和搜索方面有以下应用: 在品牌卖点提炼中: 智能体的构建中,对结构的理解和控制至关重要。品牌卖点提炼助手本质是办公助手,能为有营销思维的团队提供思路,提高团队效率。 实际搭建要根据公司业态调整,如电商产品,线上触点有淘系、京东系电商平台和抖音、小红书等兴趣电商内容平台,线下触点包括产品包装、包裹、卡、说明书等,人员触点有销售人员、主播、售后、客服等。 遵循营销管理流程构建智能体结构,保证输出准确,通过调整提示词提升某部分信息准确度,但注意营销管理的结构化提示词中不要依赖举例,以免限制 AI 创造性思维。 在电商搜索中: 以“什么值得买”智能体为例,用户输入“我想买个笔记本电脑”,智能体会提取关键词,通过 API 检索商品信息,与提示词组装成上下文请求大模型回答,成为电商导购类垂直搜索应用,提升商品推荐效果。 工作流 Workflow 可理解为多智能体协作,通过多个智能体组装解决复杂场景搜索问题,如给新产品取名,涉及多个步骤和智能体,还需要调度中枢协调工作和做决策。 此外,还有“买买买!💥产品买点提炼神器强化版🚀”智能体,专注市场营销,能帮助用户从产品出发挖掘卖点并转化为买点,生成小红书文案和抖音短视频脚本,并保存至飞书文档。
2025-03-17
tob 行业智能体的场景有哪些
TOB 行业智能体的场景包括以下方面: 1. 解决大模型的局限性: 无法回答私有领域问题,如公司制度、人员信息等。 无法及时获取最新信息,如实时天气、比赛结果等。 无法准确回答专业问题,如复杂数学计算、图像生成等。 2. 提升用户体验和增强业务竞争力: 适用于有企业官网、钉钉、微信等渠道,期望为客户提供产品咨询服务的场景。 适用于缺少技术人员开发大模型问答应用的情况。 3. 典型场景: 私有领域知识问答:准备好相关知识库文件,创建私有领域知识问答应用,如公司制度、人员信息等。 个性化聊天机器人:提供长期记忆功能,集成夸克搜索和图像生成等插件,提供个性化聊天体验。 智能助手:引入 RAG 能力、长期记忆和自定义插件等功能,帮助提升工作效率,如处理邮件、撰写周报等。 4. 行业解决方案: 服务和业务助手:行业包括互联网、制造、游戏等,场景包括对客服务、对内助手、产品搜索和推荐,业务关注点包括回答准确率、数据覆盖范围,关键功能需求包括丰富的文档/多媒体/数据库支持、多数据源打通、文档 Meta 信息增强、搜索过滤、大模型召回判定。 个人助理:行业包括互联网、教育、游戏、社交等,场景包括闲聊助手、情感陪伴、学习助手,业务关注点包括回答准确率、业务数据关联性、人设契合度、多模态,关键功能需求包括 Prompt 优化、多模态数据上传、互联网搜索、音频/视频交互。 多模态文件交互和数据处理:行业包括互联网、教育、安防等,场景包括视频理解和信息抽取、作业批改,业务关注点包括成本、延迟、多场景适配度,关键功能需求包括自定义文件解析设置、视觉解析增强、企业级数据管理。 5. 具体案例: 内部业务助手:使用企业内部规章制度、部门结构、产品介绍等文档构建知识库,通过 RAG 智能体进行内部知识问答,数据多源、异构,复杂文档解析视觉增强,提供更好的文档理解。 医疗助手/法律助手/智能导购:构建领域内知识库,为普通用户提供基础的医疗/法律知识,给出准确的就医建议/法律援助建议,在相似度阈值判定的基础上,引入大模型的智能分析能力。 6. 商业化场景: 医疗健康行业:为医疗机构、医生和研究人员提供最新的医学资讯和研究成果,并通过多模态形式推送到他们常用的平台,帮助他们更好地了解行业趋势,提升医疗水平。 教育培训行业:为教育工作者和培训机构提供最新的教育资讯和课程动态,并自动生成教学报告和资料,推送到相关平台,帮助他们更好地规划教学内容和课程设计。 科技创业与孵化器:帮助科技创业公司和孵化器获取最新的科技新闻、创业报告和行业分析,并通过多模态形式推送到他们常用的平台,帮助他们更好地了解市场需求,调整创业方向。
2025-03-17
智能体
智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 智能体的定义: 智能体是自主系统,通过感知环境(通常通过传感器)并采取行动(通常通过执行器)来达到目标。在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并辅以规划、子目标和分解、反思和完善、记忆、工具使用等关键组成部分。 智能体的类型: 1. 简单反应型智能体(Reactive Agents):根据当前感知输入直接采取行动,不维护内部状态,不考虑历史信息。例如温控器。 2. 基于模型的智能体(Modelbased Agents):维护内部状态,对当前和历史感知输入进行建模,能推理未来状态变化并据此行动。例如自动驾驶汽车。 3. 目标导向型智能体(Goalbased Agents):具有明确目标,能根据目标评估不同行动方案并选择最优行动。例如机器人导航系统。 4. 效用型智能体(Utilitybased Agents):不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动优劣并权衡利弊。例如金融交易智能体。 5. 学习型智能体(Learning Agents):能够通过与环境交互不断改进其性能,学习模型、行为策略以及目标函数。例如强化学习智能体。 智能体功能实现: 本智能体主要通过一个工作流实现,采用单 Agent(工作流模式)。工作流全景图按照市场分析报告内容划分,分成 7 个分支处理,每个分支调研并生成报告中的一部分,以发挥并行处理的效率。工作流主要节点包括文本处理节点、必应搜索节点、LinkerReader 节点、代码节点、大模型节点和结束节点。文本处理节点将用户输入与报告主题拼装形成关键词句;必应搜索节点根据关键词句搜索相关网络内容;LinkerReader 节点获取网页详细内容;代码节点对搜索到的网页链接信息进行过滤;大模型节点生成报告内容并添加引用链接;结束节点将 7 部分内容拼接并流式输出。
2025-03-16
作为一个产品经理,我现在要设计一个企业内的销售培训智能体,我手里有产品知识、销售基础知识,我该怎么设计,是只做rag还是做多智能体协同?
以下是为您设计企业内销售培训智能体的一些建议: 首先,了解多智能体模式的设置。它包括全局设置和多个代理之间的编排协调两个核心部分。全局设置涵盖角色设定与回复逻辑、记忆管理以及对话体验等,其中人物设定与回复逻辑应侧重于角色塑造。在智能体的交互流程设计上,要形成完整的互动链条,当用户意图未满足跳转条件时,保持与当前智能体的沟通。设计多轮协作的智能体时,应将其交互设计为闭环结构,以确保用户能自由切换。 其次,动手实践制作智能体。对于 Chat GPT 版本,可按以下步骤:点击“浏览 GPTs”按钮,点击“Create”按钮创建,使用自然语言对话或手工设置进行具体配置,然后调试并发布。对于 Chat GLM 版本,点击“创建智能体”按钮,输入智能体描述,可粘贴准备好的提示词模板,其配置可自动生成,可根据需求调整并上传本地文件作为知识库。 然后,考虑多智能体协同的概念。在处理复杂任务时,单智能体可能面临提示词修改和逻辑不清晰的问题。多智能体协作如吴恩达所举例,每个智能体被赋予不同身份,互相合作对话,能模拟现实工作场景,成为复杂系统,但可能存在效率不高的情况。 最后,您可以根据实际情况选择是采用 RAG 还是多智能体协同。如果任务相对简单,RAG 可能足够;若任务复杂,涉及多个环节和角色的协作,多智能体协同可能更合适。您还可以通过具体的例子,如旅游场景中负责景点推荐、路线规划和食宿安排的三个智能体,来更好地理解和设计。
2025-03-16
我该如何设计智能体
设计智能体可以从以下几个方面考虑: 1. 功能方面: 目标拆解:将用户的目标拆解成具体的小目标和计划大纲。 周任务 LIST:根据计划大纲,为用户提供简单易做的周任务列表,循序渐进地提高难度。 FLAG 社区:允许用户查看别人的 FLAG 目标,并许下自己的 FLAG,形成一个互助的社区。 2. 设计思路: 整体架构:通过意图识别来区分用户的不同需求,并根据需求调用不同的模块,包括模块划分、数据流动和交互逻辑。 功能结构: 目标管理模块:负责帮助用户拆解和规划他们的目标。 任务生成模块:根据用户的目标,生成周任务列表。 内置互动模块:允许用户分享和查看他人的目标,以及提供支持和鼓励。 3. 应用领域: 自动驾驶:自动驾驶汽车中的智能体感知周围环境,做出驾驶决策。 家居自动化:智能家居设备(如智能恒温器、智能照明)根据环境和用户行为自动调节。 游戏 AI:游戏中的对手角色(NPC)和智能行为系统。 金融交易:金融市场中的智能交易算法,根据市场数据做出交易决策。 客服聊天机器人:通过自然语言处理与用户互动,提供自动化的客户支持。 机器人:各类机器人(如工业机器人、服务机器人)中集成的智能控制系统。 4. 设计与实现步骤: 定义目标:明确智能体需要实现的目标或任务。 感知系统:设计传感器系统,采集环境数据。 决策机制:定义智能体的决策算法,根据感知数据和目标做出决策。 行动系统:设计执行器或输出设备,执行智能体的决策。 学习与优化:如果是学习型智能体,设计学习算法,使智能体能够从经验中改进。 5. 多智能体模式: 包括全局设置和多个代理之间的编排和协调。 全局设置中要明确人物设定与回复逻辑、记忆管理以及对话体验等全局性因素。 设计智能体的交互流程时,要让节点形成完整的互动链条,采用闭环结构,确保用户在整个对话过程中能够自由地在不同智能体之间切换。 例如在旅游场景中,设计负责景点推荐、路线规划和食宿安排的智能体。
2025-03-16
怎么创建个人知识库
创建个人知识库可以通过以下几种方式: 1. 使用 GPT 打造个人知识库: 涉及给 GPT 输入(投喂)定制化的知识,但 GPT3.5 一次交互支持的 Token 有限。 OpenAI 提供了 embedding API 解决方案,可将文本转换成向量(embeddings),节省空间,类似索引。 例如,将大文本拆分成小文本块(chunk),通过 embeddings API 转换为向量并保存,用户提问时,将问题也转换为向量,比对后提取关联度高的文本块与问题组合成新的 prompt 发送给 GPT API。 2. 本地部署大模型搭建个人知识库: 利用大模型搭建知识库是 RAG 技术的应用,在实操前需了解 RAG。 RAG 是当需要依靠不在大模型训练集中的数据时,先检索外部数据,然后在生成步骤中将其传递给 LLM。 一个 RAG 的应用包括文档加载、文本分割、存储(包括将文档块嵌入转换成向量形式并存储到向量数据库)、检索、输出(把问题及检索出的嵌入片提交给 LLM 生成答案)。 文本加载器是将用户提供的文本加载到内存中以便后续处理。
2025-03-12
飞书ai助手创建会议纪要
以下是关于飞书创建会议纪要的相关信息: 可以利用飞书的智能伙伴功能来搭建 FAQ 机器人,智能伙伴创建平台(Aily)是飞书团队旗下的企业级 AI 应用开发平台,能提供简单、安全且高效的环境,帮助企业构建和发布 AI 应用。 对于普通人秒变效率王的案例,5 小时的会议可通过以下流程不到 10 分钟搞定纪要:使用飞书妙记将会议对话导出为 txt 文件;启动 Kimichat 输入会议纪要 prompt 提示词并上传 txt 文件;与 Kimichat 对话并补充会议中未记录或需强调的信息;审阅 Kimichat 生成的会议纪要草稿进行必要微调;确认会议纪要内容无误后,输出最终版文档。 通义听悟、飞书妙记、钉钉闪记都可以录音转文字,以钉钉闪记为例,第一步打开钉钉闪记,结束录音后点击“智能识别”,点击智能摘要,就可以获得本次会议的纪要。如果需要更多内容,复制所有文案或下载文本文件到 GPT、GLM、通义千问等大语言模型对话框中,再将会议内容发送。 此外,该场景对应的关键词库有 12 个,包括会议主题、参与人员、讨论议题、关键观点、决策、时间、地点、修改要求、文本格式、语言风格、列表、段落。提问模板有 3 个: 第一步:用飞书会议等软件整理好会议记录,并分段式发给 ChatGPT 生成总结:请根据以下会议资料,整理会议的关键信息,包括:会议主题、参与人员、讨论议题、关键观点和决策。会议资料:1、时间:XXX 年 XXX 月 XXX 日 2、地点:XXXX 3、参与人员:XXX、XXX 4、会议主题:XXXX 5、讨论内容:Speaker1:XXX Speaker2:XXX Speaker3:XXX 第二步:检查生成的总结:请根据我提供的会议补充信息和修改要求,对 XXX 部分进行修改:1、会议补充信息:XXXX 2、修改要求:XXXX 第三步:优化文本格式和风格:1、请将生成的总结,以 XXX 形式呈现(例如:以列表的形式、以段落的形式、使用正式/非正式的语言风格) 2、请给上述会议总结,提供修改意见,并根据这个修改意见做最后的调整
2025-03-09
COZE创建智能体
以下是在 COZE 创建智能体的步骤: 1. 基础智能体创建: 进入 coze 官网(www.coze.cn),注册并登录。 点击页面左上角的⊕。 通过【标准创建】填入 bot 的基本信息。 2. Bot 开发调试界面: 人设与回复逻辑(左侧区域):设定 Bot 的对话风格、专业领域定位,配置回复的逻辑规则和限制条件,调整回复的语气和专业程度。 功能模块(中间区域): 技能配置:插件可扩展 Bot 的专业能力,如计算器、日历等工具;工作流可设置固定的处理流程和业务逻辑;图像流用于处理和生成图像的相关功能;触发器可设置自动化响应条件。 知识库管理:文本可存储文字类知识材料;表格用于结构化数据的存储和调用;照片作为图像素材库。 记忆系统:变量存储对话过程中的临时信息;数据库管理持久化的结构化数据;长期记忆保存重要的历史对话信息;文件盒子管理各类文档资料。 交互优化(底部区域):设置开场白、用户问题建议、快捷指令、背景图片。 预览与调试(右侧区域):实时测试 Bot 的各项功能,调试响应效果,优化交互体验。 3. 具体创建示例: 打开扣子官网(https://www.coze.cn/)。 “画小二智能小助手”Coze 商店体验地址:https://www.coze.cn/store/bot/7371793524687241256?panel=1&bid=6cqnnu5qo7g00 。 点击创建 Bot,在对话框中工作空间选择“个人空间”,命名为画小二智能小助手。 设置画小二助手的提示词。 动手实践: 第一步,创建一个智能体,使用单 Agent 对话流模式。 编排对话流:点击创建一个新的对话流(记得要和智能体关联)。 测试:找到一篇小红书笔记,试运行对话流,直接在对话窗口输入地址,当看到数据即为成功。回到智能体的编排页面,同样方式测试,确保对话流执行成功。 发布:点发布后,只选择多维表格,然后点配置。输出类型选文本,输入类型选字段选择器。完善上架信息,填个表格,选发布范围时,可选仅自己可用以加快审核。提交上架信息后,返回配置界面显示已完成,即可完成最终提交。
2025-03-08
创建自己的智能体
创建自己的智能体可以参考以下步骤: 1. 输入人设等信息,放上创建的工作流。配置完成后进行测试。需要注意的是,工作流中如【所有视频片段拼接】节点使用的插件 api_token 填的是您的 token 时,为避免他人调用消耗您的费用,不能直接发布。您可以将 api_token 作为工作流最开始的输入,让用户购买后自行输入再发布。 2. 第一步创建智能体,使用单 Agent 对话流模式。 编排对话流:点击创建新的对话流(记得要和智能体关联)。 注意事项:两个小红书插件可在插件市场找到,在获取笔记详情节点和笔记评论节点分别配置 cookie,note_link 使用开始节点的 USER_INPUT。之后使用代码节点进行数据处理,注意代码节点输出的配置格式。 测试:找到一篇小红书笔记,试运行对话流,直接在对话窗口输入地址,看到数据即为成功。回到智能体的编排页面同样进行测试,确保对话流执行成功。 发布:点击发布后,只选择多维表格,然后进行配置。输出类型选文本,输入类型选字段选择器。完善上架信息,填写表格,选发布范围时可选仅自己可用以加快审核。提交上架信息后返回配置界面显示已完成,即可完成最终提交。 3. 扣子智能体的创建相对简单,首先想一个智能体的名字,然后写一段详细的介绍,越详细越好,因为它会根据介绍智能生成符合主题的图标,最后点击确认即可。 扣子是字节跳动旗下的 AI 应用开发平台,开发智能体的门槛低,无论有无编程基础都能快速搭建基于 AI 模型的多样化问答 Bot,还提供丰富的插件、工作流、知识库等功能增强 Bot 的能力和交互性。例如菠萝作词家智能体,是专为音乐创作设计的辅助工具,能帮助音乐人等生成高质量歌词。
2025-03-07
如何在Kimi创建我的个人知识库
以下是在 Kimi 创建个人知识库的相关信息: 使用 GPT 打造个人知识库: 由于 GPT3.5 一次交互支持的 Token 有限,OpenAI 提供了 embedding API 解决方案。 将文本拆分成小文本块(chunk),通过 embeddings API 转换成 embeddings 向量并保存。 当用户提问时,将问题也转换成向量,与向量储存库中的向量比对,提取关联度高的文本块与问题组合成新的 prompt 发送给 GPT API。 理解 embeddings: embeddings 是浮点数字的向量,两个向量之间的距离衡量关联性,小距离表示高关联度。 向量是用一串数字表示的量,在计算机科学中常用列表表示。 常见的向量距离计算方式是欧几里得距离。 使用 Coze 创建个人知识库: 来到个人空间,找到知识库导航栏,点击创建知识库。 知识库是共享资源,多个 Bot 可以引用同一个知识库。 选择知识库的格式(目前支持文档、表格、图片)并填写信息。 可选择本地文档或问答对表格,还能进行自定义的文档切割。 数据处理完成后,一个问答对会被切割成一个文档片。 关于使用知识库,可参考教程:
2025-03-07
怎么创建属于自己的数字人
以下是创建属于自己的数字人的方法: 1. 利用剪映生成数字人: 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。 软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,剪映会生成对应音视频并添加到轨道中。 左下角会提示渲染完成时间,可点击预览按钮查看效果。 2. 增加背景图片: 删除先前导入的文本内容。 点击左上角“媒体”菜单,“导入”按钮选择本地图片上传。 点击图片右下角加号将图片添加到视频轨道(会覆盖数字人)。 点击轨道最右侧竖线向右拖拽,直到与视频对齐。 在显示区域拖动背景图的角将图片放大到适合尺寸,并将数字人拖动到合适位置。 3. 增加字幕: 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 4. 数字人“私有化”(换脸): 准备谷歌账号(可在淘宝或“”购买)。 第一步:打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”。 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 第三步:等待专属数字人视频出炉。 有关数字人使用上的问题,欢迎在底部评论区留言交流。同时如果对数字人课程感兴趣,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程: 课程内容: 在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0
2025-03-06
如何实现公众号用智能体+工作流,每天自动发《头条新闻》
要实现公众号用智能体+工作流每天自动发《头条新闻》,可以参考以下步骤: 伊登:最新 Deepseek+coze 实现新闻播报自动化工作流 工作流程详解 第一步:内容获取 1. 只需输入新闻链接,系统就能自动提取核心内容。开始节点,入参包括新闻链接和视频合成插件 api_key。 2. 添加网页图片链接提取插件,承接开始节点的新闻链接。 3. 获取网页里的图片,以 1ai.net 的资讯为例,输入新闻后提取出很多链接,其中第一条链接通常是新闻主图,其他内容多为不重要的 icon。 4. 添加图片链接提取节点,若为节省写代码时间,可直接用大模型节点提取,只拿提取的链接集合的第一条,即可搞定新闻的主要图片。 5. 接着利用调整图片的节点,将 url 属性的图片内容转化为 image 属性的图片(因为 url 节点在画板中是 string 的格式,所以必须转为 img 格式)。 6. 对于文字部分,使用链接读取节点将文字内容提取出来。 7. 在提取链接后面接上一个大模型节点,用来重写新闻成为口播稿子,可使用最强的 DeepseekR1 模型生成有吸引力的口播内容。小 tips,如果想要加上自己的特征,可以在提示词里写:“开头加上‘这里是伊登 AI’之类的个性化台词防伪”。PS:这里的 deepseekR1 基础版本是限额使用,我们可以在专业版手动接入 DeepseekR1 手动接入推理模型。 第二步:画面生成 思路是做成一帧一帧的主图+台词,配合语音合成,保证音屏同步。 1. 用批量化节点,做成一帧一帧的画面,用画板节点完成。批量处理节点输入的是格式变化后的 json 格式的文案。 2. 画面生成的重点是:在批处理中,先把一些固定内容在画板节点安排好,比如背景图片。然后引入变量元素,比如新闻图片(已经提取并转换为 img 属性)、新闻标题(来自链接读取)、口播台词(已经提取并二创)。小 tips:想要找好看的背景图推荐去可画,挑选一个好看的视频模板然后,保存为【图片】格式,然后放在画板节点,当作底图。 第三步:语音合成 使用声音合成的官方插件,引用批处理的一句一句的新闻文案内容,可调节语速和语气,多种播音风格可选。在画板和语音合成的节点后面加入图片音频合成插件。PS:这个插件需要收费,登录 https://ts.fyshark.com//userInfo,【钱包】充值获取 token,【个人中心】获取 token,放入这个节点中,不过充值 10 元可以做好久了,这个插件适合小白同学,也有不收费的插件,但是比较吃操作,如果感兴趣也可以关注后续出相关教程。这个插件的 img_audio_video 的功能是把图片+视频合成,这样就实现了一段一段的口播新闻内容。 【拔刀刘】自动总结公众号内容,定时推送到微信(附完整实操教程) 三、搭建工作流 13、循环将推送内容插入数据库 将本轮推送给用户的内容,写入数据库,下次从 rss 列表中如果再抓取到相同内容,直接跳过,避免重复推送。使用「循环」节点,输入项为第 8 步代码输出的 content_urls,这里有完整的文章内容信息。循环体设置:使用「数据库」节点,输入项为本循环节点 item 中的 url 和 suid,SQL 也是用 AI 生成的。设置循环节点的输出项:output,参数随便选,后边也用不到了。 14、结束节点 选择第 11 步输出的内容,可以在 bot 中也查看到推送的内容。 15、试运行 工作流终于搭建完了,点击右上角的试运行,选择绑定的 bot,输入数据测试。Key:输入你的 server 酱的 sendkey。rss_list:如果你没有现成的数据,可以白嫖我这个,复制下方这两条数据测试使用。试运行结果:如果工作流设置的没有问题,你会在工作流中看到这样的结果。同时,微信上也会收到这条推送,可以查看总结内容,点击链接可以查看公众号原文。点击右上角发布。
2025-03-16
日常工作应用有哪些场景推荐
以下是一些日常工作中的 AI 应用场景推荐: 教师工作: 定制内容场景:可根据学生认知和水平筛选和定制课程材料。 制作课件场景:用 Markdown 语法列出大纲,生成基础课件。 教学执行:协助小组活动、设计分层教学、个性化教学、提供实时反馈、提供策略和知识支持。 学生评估:设计评估,可模仿各类考试题型,生成各种主观反馈和报告,比如写作口语批改反馈、期末学生评价。 深度学习场景:学习学生心理支持,可提供具体场景做案例分析。 专业成长:论文写作辅助、撰写材料,如工作总结、活动简报、领导发言稿、工作邮件,策划活动,如调查问卷、艺术节策划、教师活动策划,行政工作,公众号排版、排校历、排课表。 计划相关: 共学相关。 网页连接制作。 创意构思。 开发网页、小程序、App、桌面应用、浏览器插件等。 本地跑的 PC 应用,如计算器等。 算法学习: 分类问题:例如文本分类、图像识别、手写数字识别、医学诊断等。 回归问题:例如房价预测、股票价格预测等。 异常检测:识别异常值或离群点。 推荐系统:找到与用户兴趣最相似的其他用户或物品,并基于相似性进行推荐。 图像分割:识别图像中的区域,并进行图像分割。 聚类分析:用于聚类任务,尤其是当数据集中的簇不是明显的球形或高斯分布时。
2025-03-16
一个小白,如何通过咱们这个网站来学习和应用AI,赋能工作,请给出详细的方案,
对于一个小白,通过本网站学习和应用 AI 赋能工作,可以参考以下详细方案: 一、了解 AI 基本概念 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 二、开始 AI 学习之旅 在「」中,您将找到一系列为初学者设计的课程。这些课程将引导您了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。通过在线教育平台(如 Coursera、edX、Udacity)上的课程,您可以按照自己的节奏学习,并有机会获得证书。 三、选择感兴趣的模块深入学习 AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。建议您一定要掌握提示词的技巧,它上手容易且很有用。 四、实践和尝试 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 五、体验 AI 产品 与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 六、在网站中引入 AI 助手 1. 创建大模型问答应用:先通过百炼创建一个大模型应用,并获取调用大模型应用 API 的相关凭证。 2. 搭建示例网站:通过函数计算,来快速搭建一个网站,模拟您的企业官网或者其他站点。 3. 引入 AI 助手:接着通过修改几行代码,实现在网站中引入一个 AI 助手。 4. 增加私有知识:最后可以通过准备一些私有知识,让 AI 助手能回答原本无法准确回答的问题,帮助您更好的应对客户咨询。 七、推荐布鲁姆分类法学习路径 应用:深入 分析:大量阅读,理解各知识之间的关系。
2025-03-16
想在comfyui搭建一个音频节奏生成ai抽象粒子视觉效果的工作流,应该使用哪些模型节点?如何搭建?
在 ComfyUI 搭建音频节奏生成 AI 抽象粒子视觉效果的工作流,您可以参考以下内容: 1. 大模型节点: 您可以根据自己的风格选择不同的大模型,推荐使用: AWPainting,链接:https://civitai.com/models/84476/awpainting primemixanything,链接:https://civitai.com/models/75089/primemixanything xxmix9realistic v40,链接:https://civitai.com/models/47274/xxmix9realistic 2. 关键词节点: 可以使用工作流内的关键词,也可以输入自己的正负面关键词。 3. Lora 节点: 可根据自己风格搭配进行选择,如需多个 Lora 可进行串联。 4. ControlNet 节点: 选用 qrcode_monster V2 版本,相比于 V1 版本 V2 版本识别性更强。下载需要魔法,没有魔法的同学文末领取模型。下载链接:https://huggingface.co/monsterlabs/control_v1p_sd15_qrcode_monster/tree/main/v2 5. 采样器节点: 所有生图的老演员了,Step 要选择高步数,35 50 即可。采样器默认的 euler a /dpmpp 2m sde 基础节点介绍: 1. Checkpoint 基础模型(大模型/底模型)节点: 属于预调模型,决定了 AI 图片的主要风格。输出连接:Model 连接 KSampler 采样器的 Model;Clip 连接终止层数的 Clip;Vae 连接 VaeDecode 的 Vae。 2. Clip 终止层数(clip skip)节点: ComfyUI 的是负数的,webUI 的是正数。输出入点:Clip 连接 Checkpoint 基础模型的 Clip。输出节点:Clip 连接 Prompt 节点的 Clip。正向提示词和负面提示词各一个。 3. Prompt 节点: 输出入点:Clip 连接 Clip 终止层数节点的 Clip。输出节点:正向提示词和负面提示词各连接一个。 4. KSampler 采样器: 输出入点:Model 连接 Checkpoint 基础模型;Positive 连接正向提示词;negative 连接负面提示词;latent_imageL 连接 Empty Latent Image 潜空间图像的 Latent。输出节点:Latent 连接一个 VAE 的 Samples。 5. Empty Latent Image 潜空间图像: 设置出图尺寸,例如 10241024。输出入点:Latent 连接 KSampler 采样器的 Latent。 此外,还有一些根据插件整理的工作流,您可以先随便选择一个“文生图”中的“基础+自定 VAE”。选好之后,点击“替换节点树”。界面中就会出现已经连接好的工作流节点(如果没看到,就按一下 home 键),包括大模型、clip、vae、正反提示词、尺寸,采样器等所有在 webUI 中熟悉的参数,而且全都是中文面板。打开模型节点,可以看到 webUI 中的模型全部都在。这次先不更改参数,点击“运行节点树”,直接生成。此时会提醒您是否启用 ComfyUI,点击确定即可。等待一会,就能在最后一个节点预览图中看到生成的图片。点击这里就可以打开后台,看到出图时间。
2025-03-15
comfyui工作流搭建基础
以下是 ComfyUI 工作流搭建的基础步骤: 1. 准备加载大模型的节点(load 节点):在工作区鼠标右键点击,选择“Add Node”,然后依次选择“loaders”和“Load Checkpoint”,接着选择对应的模型,点击“Ckpt_name”下拉选择对应的模型。 2. 加载 Conditioning(条件):在工作区鼠标右键点击,选择“Add Node”,然后选择“Conditioning”,再选择“CLIP TEXT Encode”。这里需要输入正向和反向提示词,相同节点可使用快捷键 Ctrl+C 和 Ctrl+V 复制粘贴。 3. 添加采样器:这部分和 WEB_UI 的设置类似,包括采样器、迭代步数、CFG 等。需要注意的是,seed 值只有固定、随机、每次增加、每次减少这四个选项,采样器和调度器是分开的。 4. 加载 Latent:可以设置图片的宽、高和批次,设置方式与 WEB_UI 相同。 5. 加载 VAE:操作与 WEB_UI 加载 VAE 相同。 6. 加载保存图片的节点。 7. 串联节点:节点分为起始节点、最终输出节点和过程执行节点。首先,checkpoint 加载器中模型选择好可直接使用,CLIP 对应链接需要的两个条件(正向提示词/负向提示词),VAE 直接连接对应的 VAE。然后将正向提示词、负向提示词链接到对应的采样器节点,latent 直接链接空 Latent。串联完毕后即得到最简单的 ComfyUI 工作流。 此外,ComfyUI 共学快闪的飞书学习群中有众多关于 ComfyUI 的学习内容,如王蓉的基础搭建和转绘、唯有葵花向日晴的基础教程、工作流开发和实际应用场景等。
2025-03-15
有没有成熟的ai制作宣传海报的工作流
以下是一些成熟的 AI 制作宣传海报的工作流: 1. 确定需求场景:例如想在社交平台发布内容时,为了获得更多点赞,需要有吸引力的图片;网上图片质量差且易撞图,自己相册中的照片不合适等情况。 2. 大致流程: 主题与文案:确定海报主题,借助 ChatGPT 等文本类 AI 工具完成文案。 风格与布局:选择想要的风格意向,根据文案和风格灵活调整画面布局,背景不一定空白。 生成与筛选:使用无界 AI 输入关键词,生成并挑选满意的海报底图。 配文与排版:将上述素材进行合理排版,得到成品。排版可参考 AIGC 海报成果。 此外,还有一些相关案例: 1. 游戏 PV《追光者》:灵感来源于《艾尔登法环》、《黑神话悟空》等游戏开场片,加入佛教元素。结合 ChatGPT 进行故事框架创作,使用 MJ 绘图、SD 重绘,制作深度图以及视频、AI 抠图,Aive 尝试制作背景音乐,微软 AI 制作旁白。除撰写故事框架外,生图及后期配音约用 7 天完成。 2. Junie 首部 AI 长电影:在传统制作流程中融入 AI 工具,如在 Discord 平台创作,依据 Notion 里的制作安排和细分章节剧本推进。用到多种 AI 工具,包括 AI 图像生成(Stable Diffusion/Midjourney v5.2/DALL·E)、AI 动画(Pika/Runway/Deforum)、口型同步(DID)、AI 旁白(ElevenLabs)、剪辑(Premiere)、文字翻译(ChatGPT)等,也会结合 3D 技术、AE 以及实拍等传统手段。
2025-03-15