Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

你现在是一个工作流方面的专家 我需要你用最简单的方法让我这个小白理解工作流是怎么工作的

Answer

工作流是一种通过可视化方式对插件、大语言模型、代码块等功能进行组合,以实现复杂、稳定业务流程编排的方法。

工作流由多个节点构成,节点是基本单元,包括大语言模型 LLM、自定义代码、判断逻辑等。默认包含 Start 节点(工作起始,可包含用户输入信息)和 End 节点(工作末尾,返回运行结果)。

不同节点可能需要不同输入参数,分为引用前面节点的参数值和自定义的参数值。扣子提供了基础节点,还可添加插件节点或其他工作流。

例如,在角色设计变体生成工作流中,在不改变角色某些特定样式的基础上仅改变设计,能防止提示词外流,还可使用图片引导特定部分的风格和样式。

在智能体“竖起耳朵听”的编排中,插件像工具箱,工作流像可视化拼图游戏,将各种功能组合,满足多步骤、高要求的任务。

Content generated by AI large model, please carefully verify (powered by aily)

References

工作流介绍

工作流支持通过可视化的方式,对插件、大语言模型、代码块等功能进行组合,从而实现复杂、稳定的业务流程编排,例如旅行规划、报告分析等。当目标任务场景包含较多的步骤,且对输出结果的准确性、格式有严格要求时,适合配置工作流来实现。[heading1]功能概述[content]工作流由多个节点构成,节点是组成工作流的基本单元。例如,大语言模型LLM、自定义代码、判断逻辑等节点。工作流默认包含了Start节点和End节点。Start节点是工作流的起始节点,可以包含用户输入信息。End节点是工作流的末尾节点,用于返回工作流的运行结果。不同节点可能需要不同的输入参数,输入参数分为引用和输入两类。引用是指引用前面节点的参数值、输入则是支持设定自定义的参数值。扣子为你提供了以下基础节点,除此之外,你还可以添加插件节点或其他工作流。|节点名称|描述||-|-||LLM|大语言模型节点。使用输入参数和提示词生成处理结果。||Code|代码节点。通过IDE编写代码处理输入参数,并返回输出值。||Knowledge|知识库节点。根据输入参数从关联知识库中召回数据,并返回。||Condition|if-else逻辑节点。用于设计工作流内的分支流程,满足设置条件则运行如果分支,否则运行否则分支。|

CLS- workshop工作流

工作流OpenArt:https://openart.ai/workflows/emperor_rare_28/workflow-for-generating-variant-of-character-design/5jOoeySLayaIevahRZhT工作流简介:1.用于生成角色设计时在不改变角色的剪影、服装和发型样式(如这个角色必须要有特定形状的小臂甲、必须要有大的双马尾发型等)的基础上仅改变设计;2.可防止提示词外流,通过为特定区域绘制蒙版,可以将对于特定区域的描述仅作用于该区域,不影响其他部分(比如说我们可能会遇到这样的情况:写了皮靴,丝质长裙,结果裙子也变成了皮的;只写了需要小臂甲,结果生成了全身的铠甲,此工作流可避免此类情况发生);3.可使用图片引导特定部分的风格和样式(当你不知道如何描述你想添加的元素时,可以通过添加目标效果的图片来引导特定元素的生成)。工作流的具体的使用方法可见工作流中的注释节点中的内容。工作流json:[角色设计变体生成工作流(防提示词外流)-0531.json](https://bytedance.feishu.cn/space/api/box/stream/download/all/GuUsb3d6EooIi5x3vo1c18qPnJb?allow_redirect=1)工作流截图:成品效果:

我用扣子做一个简单的智能体——竖起耳朵听

👉插件插件就像是一个工具箱,里面可以放一个或者好几个工具,我们把这些工具叫做API。目前扣子这个平台上已经有很多不同类型的插件了,比如可以看新闻、规划旅行、提高办公效率、理解图片内容的API,还有一些很厉害的能处理多种任务的模型。用了这些插件,我们创建的智能体就能变得更厉害,比如给它加个新闻搜索的插件,它就能帮你找新闻了。要是扣子上现有的插件没有我们想要的,我们还可以自己动手做一个插件,把我们需要的API加进去。在我的智能体里我加了如下插件:👉工作流工作流就像是一个可视化的拼图游戏,我们可以把插件、大语言模型、代码块这些功能像拼图一样组合在一起,这样就能创造出复杂但又很稳定的业务流程。当我们面对的任务有很多步骤,而且对最后的结果要求很严格,比如结果要准确无误、格式也要对,那这时候用工作流来帮忙就最合适了。😎简单来说,工作流是由很多个小块块(节点)组成的,这些小块块就是工作流的基本单元。比如,大语言模型LLM、你自己写的代码、做判断的逻辑,都可以是小块块。工作流一开始和结束都有特别的小块块。开始的那个小块块就像是工作的起点,它可以包含你输入的信息。结束的那个小块块就像是工作的终点,它会告诉你工作流运行的结果是什么。不同的小块块可能需要不同的信息才能工作,这些信息有两种:一种是引用前面小块块给出的信息,另一种是你可以自己设定的信息。在竖起耳朵听的智能体里,我也用到了5个小块块,可以回答带有图片口语的结果,使回答更好。😎👉知识库

Others are asking
帮我搭建一个工作流编排的智能体
以下是搭建工作流编排智能体的步骤: 1. 逐步搭建 AI 智能体: 创建 Bot。 填写 Bot 介绍。 切换模型为“通义千问”(测试下来,通义对提示词理解、执行效果最好)。 把配置好的工作流添加到 Bot 中。 新增变量{{app_token}}。 添加外层 bot 提示词(可按需求和实际效果优化调整)。完成上述步骤后,在「预览与调试」窗口可与 AI 稍后读智能体对话并使用全部功能。 2. 选择工作流的对话模式: 创建一个工作流对话模式的智能体。 先完成创建,然后切换工作流的模式为对话模式。注意一定要在开始调整工作流节点之前切换模式,因为切换成对话模式会将工作流清空,重置为对话模式默认节点。 3. 确认分支情况: 根据需求分析,确定特定分支(如根据名字和祝福写对联、根据幸运数字写对联)和默认分支,以保证用户其他对话能得到良好回复。 4. 用户意图识别: 通过理解用户意图走不同分支,需将意图介绍写清楚、准确,否则可能导致意图识别不好用。 5. 幸运数字分支: 用代码分支获取用户输入的数字,然后匹配知识库,再对匹配的春联做赏析。代码里有容错机制,返回时加“.0”是为了按指定的幸运数字在知识库里匹配。 6. 名字写祝福: 根据用户输入的名字和祝福信息,通过提示词调试生成对应对联并输出。 7. 通用兜底回复: 在用户不符合前两个意图时进行友好回复。首先匹配知识库,然后让大模型结合匹配结果、历史记录、当前输入,输出符合对话内容的回复。 8. 知识库: 知识库是使用大模型生成的 100 对对联,都比较好看、经典、有意义。
2025-01-18
如何学习使用AI,提高工作效率,以及提高自身全方面能力
以下是关于如何学习使用 AI 来提高工作效率和自身全面能力的建议: 1. 工作方面: 让自己变成“懒人”,能动嘴的不要动手,用嘴说出想做的事。 能动手的尽量用 AI 替代,例如将工作单元切割开,建设属于自己的智能体,并根据结果反馈不断调整。 定期审视工作流程,看哪个部分可以更多地用上 AI,将所学应用于实践,不断优化工作流程。 2. 技术层面: 学习搭建专业的知识库、构建系统的知识体系,不仅用于工作,还可支持个人爱好和创作。 3. 个人素质方面: 提升学习能力,通过持续阅读和实践来吸收、消化和积累知识,培养好奇心和持续学习的习惯,广泛阅读,深入研究新领域,不断探索前沿知识。 提升创造能力,这是在时代保持竞争力的关键。 善用工具,使用 AI 工具自动化重复性任务,适应时代转变,腾出时间进行更高层次思考。 具备抽象与整合能力,在更高层次上学习,为 AI 提供方向并作出合适选择。 4. 编程和研究方面: 参考技术大佬 Nicholas Carlini 的博文「How I Use "AI"」,学习其使用 LLM 进行编程和研究的实例分享。 用 GPT4 构建完整的 Web 应用。 通过与模型的互动式对话学习新技术,如 Docker、Flexbox 和 React 等。 借助 AI 快速获取新项目或新论文所需的样板代码。 用 AI 简化复杂的大型代码库。 将单调且简单的任务交给 AI,如数据格式化等。 在 AI 帮助下提升用户专业度和效率。 通过 AI 获取特定工具或命令的使用信息。 利用 AI 进行搜索,其效果比传统搜索引擎好。 用 AI 解决一次性任务和常见任务,修复常见错误。
2025-01-16
如何利用Ai为我们工作
以下是利用 AI 为我们工作的一些方法: 1. 写作方面: 草拟各种初稿,如博客文章、论文、宣传材料、演讲、讲座、剧本、短篇小说等,只需给出提示。 提升写作质量,将文本粘贴到 AI 中,要求其改进内容、提供针对特定受众的建议、创建不同风格的草稿、使内容更生动或添加例子,以激发自己做得更好。 帮助完成任务,如写邮件、创建销售模板、提供商业计划的下一步等。 从写作困难中解脱,让自己更有动力。 2. 获取信息和学习方面: 利用 AI 辅助教育,包括自学。可以要求 AI 解释概念,能获得较好的结果。但要注意因 AI 可能产生幻觉,对关键数据要根据其他来源仔细检查。
2025-01-15
我想做一篇工作總結,你推薦我用什麼AI?
以下是为您推荐的可用于工作总结的 AI 工具和方法: 1. GPT 系列: 可以总结各种文章(文章不超过 2 万字),您打开后直接全选复制全文,然后粘贴发送给 GPTs 即可。GPT4 能识别出重点内容。 对于有字幕的 B 站视频,可先通过油猴脚本(如)提取字幕,再将字文字内容全选复制发送给 GPTs 进行总结。 2. 会议总结类工具: 3. 简历编写类工具: Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型自动生成简历,为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 Rezi:是一个领先的 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的每个方面,包括写作、编辑、格式化和优化。 Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79 以上工具都可以帮助您快速、高效地完成工作总结,您可以根据自己的需要选择最适合您的工具。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-15
我当前的工作是逐字核对PDF文档和word文档,并按pdf文档将word文档修正,如何借助AI工具实现
以下是一些可以帮助您实现将 PDF 文档与 Word 文档进行核对和修正工作的 AI 工具及方法: 1. DeepL(网站):访问,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件):在安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用):在下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页):使用工具把 PDF 转成 Word,再在点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页):在点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 6. 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(不过有免费次数限制且进阶功能需要付费)。 7. 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-15
扣子工作流教程
以下是一些关于扣子工作流的教程资源: 视频教程: 【Agent 共学第二期】艾木分享|这也许是你一生中第一个 Bot:https://www.bilibili.com/video/BV1XT421i7jH/ 一步一步带你手搓一个 Coze Bot——Dr.Know(极简版 Perplexity):https://www.bilibili.com/video/av1005221752 扣子(coze)系列教程(四):工作流中各节点常用使用方式:https://www.bilibili.com/video/BV1ux4y1J761/ Coze 工作流的手把手教程,让你的 Bot 高质量的处理复杂任务!:https://www.bilibili.com/video/BV1PZ421g7xT/ 微信文章教程: 扣子工作流实战案例教程,手把手教你搭建一个图书管理工作流:https://mp.weixin.qq.com/s/Fh3Vm3EDSzoYVxf91GcMMA 使用扣子 Coze 创建 AI 绘画工作流:https://mp.weixin.qq.com/s/d_6yST8JXKf1Tr6JgBPFg 奶奶也学得会的 AI 工作流,省时省力下班早!:https://mp.weixin.qq.com/s/bXC8DHzs5_OgPh3FtKhJZA 中文 GPTS 使用秘籍,字节扣子 Coze 工作流使用全教程:https://zhuanlan.zhihu.com/p/682108709 Workflow 实践|使用 coze 复现一个 AIGC 信息检索 Bot:https://mp.weixin.qq.com/s/PFgjRq7XcTcqog1gLyFqA AI 自动获取 B 站视频摘要信息:https://mp.weixin.qq.com/s/x8lwvlomhFNLZl__qYuDww 如何用 Coze 制作一个信息检索 Bot(含 Workflow 的基础用法):https://mp.weixin.qq.com/s/Ory8iVXXjjN3zSTcupPm6Q 飞书社区教程: Stuart:教你用 coze 写起点爆款小说《夜无疆》,做到高中生文笔水平:https://waytoagi.feishu.cn/wiki/LRskwrJkli3CgkkY06xcC3HanBh?from=from_copylink Stuart:我把 Coze 比赛第一的 bot 拆了教大家:https://waytoagi.feishu.cn/wiki/Qt8Bwgl3PihQNukO7PjcmeuJnJg?from=from_copylink 画小二:用 Coze 工作流制作行业简报:实战案例画小二日报:https://waytoagi.feishu.cn/wiki/HmIhwt1IkiIAzok73rDcgG7fnQg?from=from_copylink 画小二:Coze 工作流之抖音热门视频转小红书图文详细配置:https://waytoagi.feishu.cn/wiki/MV7gw298TiBajFkSrFeceYRMnXc?from=from_copylink 扣子版虚拟女友李思思的思路:https://waytoagi.feishu.cn/wiki/O9M4w66fxiElylkBkCRcP6jLnsg?from=from_copylink 此外,还有关于白嫖 Groq 平台算力并接入扣子工作流的保姆级教程: 此时我们有了代理服务器和 APIKEY,落地使用方式举例: 1. 通过扣子工作流,用代码模块进行 HTTP 访问,实现 0 token 脱离扣子模型来使用 Groq 作为 LLM,而且可以参考梦飞大佬教程将扣子接入微信机器人(有微信封号风险) 2. 由于 Groq 的 API 与 OpenAI 的 API 几乎兼容,可以适配到任何 APP 产品可以用来填 APIKEY 调用的场景,此处用沉浸式翻译举例(如果还不知道沉浸式翻译这个超级好用的网页翻译工具的,请访问 https://immersivetranslate.com/自行安装) 3. 接入手机类 APP,比如通过快捷方式接入 Siri(此处卖个关子,留着 728 线下切磋赚积分,希望线下小伙伴来找我) 接入扣子工作流: 1. 扣子工作流的搭建细节本篇不详细叙述,请移步 WaytoAGI 自学。 2. 建立工作流,只需要一个代码节点,如下: Copy 以下代码进入代码节点,其中代码节点的输入引用请自行配置为开始节点的用户输入,输出改为“output”,格式为“string” 测试工作流,保证代码块有正常输出(可以看到此处消耗 0 Tokens,白嫖算力成功,在扣子即将收费之际,后续可能可以派上大用处,代替工作流 LLM 节点) 可以建立一个 Bot,来仅仅调用该工作流,建议不要发布,否则你的 Deno 代理流量可能被其他人用。 其他就可以自行发挥了,接入微信等。
2025-01-14
智能体与工作流是同一个概念吗
智能体和工作流不是同一个概念。 智能体是一个能够执行特定任务、具有一定自主性和智能的实体。例如,在扣子平台上,可以通过添加插件和设置工作流等方式让智能体变得更强大,以完成各种复杂的任务。 工作流则像是一个可视化的拼图游戏,由多个小块块(节点)组成,如插件、大语言模型、代码块等,这些小块块可以像拼图一样组合在一起,从而创造出复杂但稳定的业务流程。当面对多步骤、对结果要求严格的任务时,工作流最为适用。工作流有开始和结束的小块块,不同小块块可能需要不同的信息才能工作。 在构建稳定可用的 AI 智能体时,通常会先测试单条 Prompt 或 Prompt Chain 的执行质量和稳定性,然后根据实际情况逐步拆解子任务,对于场景多样、结构复杂、对输出格式要求严格的任务,基本可以预见到需要将其拆解为工作流。此外,如果涉及生成多媒体内容或从网络自主获取额外信息等能力,也必然需要通过工作流来调用相应的插件。
2024-12-26
AI中的工作流是什么?
AI 工作流是在一般工作流的基础上引入了 AI 工具。 一般工作流指的是将一项工作拆分成多个明确步骤,每个步骤都有特定的输入和产出,且步骤之间环环相扣。比如写公众号文章,要经过选题、列大纲写初稿、改稿、写标题、排版、发布等固定步骤。 而 AI 工作流则是将 AI 工具融入到这些工作环节中以提高效率。例如在写作的各个环节使用相应的 AI 工具。搭建 AI 工作流需要具备三层能力: 1. 了解各种 AI 工具的特点和用途。 2. 学会写提示词,以便向 AI 清晰地描述任务。 3. 搭建 AI 智能体,使多个 AI 工具协同工作,自动完成任务。 同时,AI 工作流还在信息获取、处理和表达等方面带来了变革。如重塑了获取信息的方式,颠覆了传统搜索引擎;辅助高效处理信息,如智能摘要能帮助快速筛选;让信息表达更简便。
2024-09-29
我是小白,想要学习AI,从哪开始
对于小白想要学习 AI,您可以从以下几个方面开始: 1. 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅:在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛,比如图像、音乐、视频等,您可以根据自己的兴趣选择特定的模块进行深入学习。同时,掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品:与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,您还可以参考《雪梅 May 的 AI 学习日记》,比如学习模式可以是输入→模仿→自发创造。在学习过程中,您可以去 waytoAGI 社区发现自己感兴趣的 AI 领域,学习最新的内容。而且,学习资源大多是免费开源的。需要注意的是,学习状态很重要,能学多少算多少,不必有心理压力。
2025-01-17
我是一个AI提示词小白,怎样才能提升自己对提示词编写的能力。
以下是提升提示词编写能力的一些方法: 1. 了解提示词的基本概念:提示词用于描绘您想生成的画面,输入语言支持中英文,不同模型可能有不同的输入要求。 2. 预设词组:小白用户可以点击提示词上方的官方预设词组进行生图。 3. 确保提示词内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等要素,例如“一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量”。 4. 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,输入不想生成的内容,如“不好的质量、低像素、模糊、水印”。 5. 利用“加权重”功能:在功能框增加提示词,并进行加权重调节,权重数值越大,越优先。 6. 善用辅助功能:如翻译功能可一键将提示词翻译成英文,还可删除所有提示词或使用会员加速。 7. 优化和润色提示词的方法: 明确具体的描述:使用更具体、细节的词语和短语,避免笼统。 添加视觉参考:插入相关图片参考,提高 AI 理解能力。 注意语气和情感:用合适的形容词、语气词调整整体语气和情感色彩。 优化关键词组合:尝试不同搭配和语序,找到最准确表达需求的方式。 增加约束条件:添加限制性条件,如分辨率、比例等。 分步骤构建提示词:将复杂需求拆解为逐步的子提示词。 参考优秀案例:研究有效的范例,借鉴写作技巧和模式。 反复试验、迭代优化:多次尝试不同写法,根据输出效果反馈持续完善。 8. 提示词探索路径: 遵循 OpenAI 官方的六项最佳实践,包括写清晰具体的指令、给模型时间思考、使用分隔符等。 运用各种提示词框架,如 CRISPE 和 BROKE 等。 明确任务目标,保证描述精确完整。 采用角色扮演方法,让模型更好地理解上下文并生成相关回答。 使用结构化提示词,提高可读性和组织性。 进行提示词测试和迭代,不断优化效果。 将提示词封装为智能体,使复杂任务处理更模块化和可复用。 总之,编写高质量提示词需要不断实践、总结经验,熟悉 AI 模型的能力边界,保持开放思维并尝试创新描述方式。
2025-01-15
新手小白没学过编程,想用AI制作小程序,个人网站和APP
对于新手小白想用 AI 制作小程序、个人网站和 APP,目前有以下相关信息: 「Agent 共学」提供了一系列针对 0 基础小白的课程,包括用 AI 打造个人网站等,具体日程安排为:月日 20:00 开始,由大雨授课。 白九龄在 0 基础的情况下用 cursor 做微信小程序的经历,过程中遇到了诸多问题,如添加背景元素、自适应调整、意图分析页面的信息展示和排版、生成海报时的限制等,还面临大模型理解困难、token 费用和变现等问题。 需要注意的是,虽然有相关的探索和尝试,但使用 AI 制作这些项目仍存在一定的难度和限制。
2025-01-15
小白 如何进入AI行业
对于小白如何进入 AI 行业,以下是一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出自己的作品。 在知识库中有很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 此外,还有一个案例,一位之前只玩过图形化编程的女孩,在暑假超脑 AI 黑客松期间,靠 Claude 和父亲的帮助,用 Unity 开发了一个 RPG 小游戏(C,用到了 coze 的 API)。起初父亲并不相信纯小白能通过 AI 搞定 Unity 程序,但女孩不服气,决定做一个最简单的任务,半小时就完成了这个任务,也明白了 Unity 里的基本概念。后来的开发有顺利也有挫折,这些挫折让父亲意识到小白需要通过 AI 能直接搞定的小项目,来先学明白背后的原理,在此基础上才能开发复杂项目。小小的任务,AI 可以胜任、非常耐心地指导。因此最好是要有人类导师,一开始把任务拆解到足够小,针对性地设计学习路径,并密切关注随时从坑里捞人。 如果您有兴趣,还可以留言互动,有需要可以提供一份 AI 工具逐渐进入状态的 tips 文章。
2025-01-15
我是一个agi的小白我该从哪开始学习AGI
对于 AGI 小白,以下是一些学习建议: 1. 参考《雪梅 May 的 AI 学习日记》:如果您还在观望 AI,不知从何入手,可以先看其目录。作者从一开始的到处看到现在走在学习 AI 的轨道上,学习模式是输入→模仿→自发创造。但日记中的学习内容可能因 AI 节奏快而不适用,您可去 waytoAGI 社区发现自己感兴趣的领域,学习最新内容。学习时间并非每天依次进行,而是有空时学习。 2. 参考完整的学习路径:建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。 3. 借鉴他人经验:YoYo 作为文科生,在学习前不理解 AI 和提示词工程,通过不断尝试走了不少弯路。学习后能搓多 Agent 的智能体,在公司中实践智能客服等。其学习路径的关键词为“少就是多”“先有个初识”“目录索引推荐”“兴趣最重要”“先动手”,强调学以致用,通过学习分享不断填补知识的缝隙来成长。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系。
2025-01-14
小白怎么搭建一个智能体?
对于小白搭建智能体,可参考以下步骤: 1. 智能体创建: 进入 coze 官网(www.coze.cn),注册并登录。 点击页面左上角的⊕,通过【标准创建】填入 bot 的基本信息。 了解 Bot 开发调试界面: 人设与回复逻辑(左侧区域):设定 Bot 的对话风格、专业领域定位,配置回复的逻辑规则和限制条件,调整回复的语气和专业程度。 功能模块(中间区域): 技能配置:插件可扩展 Bot 的专业能力,如计算器、日历等工具;工作流可设置固定的处理流程和业务逻辑;图像流可处理和生成图像;触发器可设置自动化响应条件。 知识库管理:文本可存储文字类知识材料,表格可结构化数据的存储和调用,照片可作为图像素材库。 记忆系统:变量可存储对话过程中的临时信息,数据库可管理持久化的结构化数据,长期记忆可保存重要的历史对话信息,文件盒子可管理各类文档资料。 交互优化(底部区域):开场白可设置初次对话的问候语,用户问题建议可配置智能推荐的后续问题,快捷指令可设置常用功能的快速访问,背景图片可自定义对话界面的视觉效果。 预览与调试(右侧区域):实时测试 Bot 的各项功能,调试响应效果,优化交互体验。 2. 图像流搭建: 创建第一个图像流:由于文本类型大语言模型无法直接生成图片,需要通过【技能】部分的图像流,为文本大模型提供图像生成能力。比如为 marvin 机器人加入图像流,按照步骤创建图像流并设定图像流名称以及描述(注意名称只能是英文)。 了解图像流节点的意义:在图像流编辑界面,左侧的工具栏集合了所有可能用到的功能。智能处理工具包括“智能生成”“智能抠图”和“画质提升”等;基础编辑工具如画板、裁剪、调整、添加文字等可满足日常图片编辑需求;风格处理类工具如风格迁移、背景替换能让图片更有创意。 根据需求进行图像流设计: 生成海报功能在总结故事后,将完整的故事作为输入。 对输入的故事进行一轮提示词优化,从自然语言转变为更符合文生图大模型的提示词。 将优化后的提示词输入生图大模型,调整生图的基础风格和信息,输出最终的配图海报。 测试图像流。
2025-01-13
一句话向完全不了解AI的人介绍什么是AI,并且让他理解什么是AI
AI 是一种模仿人类思维,可以理解自然语言并输出自然语言的存在。对于不具备理工科背景的人来说,可以把它当成一个黑箱。它就像某种可以理解人类文字但不是人的魔法精灵或器灵,其生态位是似人而非人的。 AI 包含多种技术和概念,比如: 1. 生成式 AI 生成的内容称为 AIGC。 2. 机器学习是电脑找规律学习,包括监督学习(有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归)、无监督学习(学习的数据没有标签,算法自主发现规律,如聚类)、强化学习(从反馈里学习,最大化奖励或最小化损失,类似训小狗)。 3. 深度学习是一种参照人脑有神经网络和神经元的方法(因为有很多层所以叫深度),神经网络可用于监督学习、无监督学习、强化学习。 4. 生成式 AI 可以生成文本、图片、音频、视频等内容形式。 5. LLM 是大语言模型,对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解(不擅长文本生成),像上下文理解、情感分析、文本分类。 2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制处理序列数据,比 RNN 更适合处理文本的长距离依赖性。
2025-01-17
如何用一个摄像头记录卷子,通过AI来识别做作业过程中的知识点理解偏差,给出改正措施并记录到错题本
目前暂时没有关于如何用一个摄像头记录卷子,并通过 AI 来识别做作业过程中的知识点理解偏差、给出改正措施并记录到错题本的相关内容。但从理论上讲,要实现这个目标,大致需要以下步骤: 首先,需要通过摄像头获取清晰的卷子图像。这可能需要合适的摄像头位置和光线条件,以确保图像质量。 其次,利用图像识别技术对卷子内容进行识别和分析。这需要训练有素的 AI 模型,能够准确识别题目、答案和书写内容。 然后,通过与预设的知识点和正确答案进行对比,判断知识点的理解偏差。 最后,根据偏差情况,利用相关的教育算法和知识储备,给出改正措施,并将相关内容记录到错题本中。 但要实现这一整套流程,还面临着许多技术挑战和实际操作的困难,例如图像识别的准确性、知识点的精准分析等。
2025-01-16
视觉理解技术最新动态和趋势
以下是视觉理解技术的最新动态和趋势: 一、视觉分析技术 1. Transformer 视觉模型优点 2. Transformer 视觉模型的局限 二、图像语言模型 三、视频语言模型 四、LLM 多模态 Agent 五、应用场景 1. 多模态内容理解与处理 2. 智能交互与自动化 3. 具身智能 4. 未来发展趋势(2024 ?) 5. 视频生成模型 mapping 六、未来发展方向 1. 技术路径而言:利用预训练 LLMs 进行指令调整 最初,多模态融合方法常采用预训练的目标检测器,如 ViLBERT、VisualBERT 和 UnicoderVL,通过提取图像特征和执行交叉模态预训练任务,为后续的图像 文本任务奠定基础。 随着 ViT 的出现和普及,更多方法开始利用 ViT 作为图像编码器,强调大规模预训练,以提高模型的性能和泛化能力,例如 Flamingo。 近期,向多模态 LLMs 发展,从进行预训练到向指令调整(instruction tuning)转变,如 LLaVA 和 MiniGPT4,融合视觉和语言信息,能更有效地完成视觉理解相关任务,提升模型对于指令的理解能力和零样本性能,更好地泛化到未见过的任务和领域。 2. 应用场景而言:赋予机器理解多模态的能力 此外,李飞飞在 2015 年的 TED 演讲《我们怎么教计算机理解图片?》中提到了计算机视觉方面的研究进展,指出虽然在科技上取得了很多进步,但在计算机视觉方面仍存在一些问题,如自动驾驶车辆的视觉敏锐度、向盲人传递画面、无人机的视觉技术等。
2025-01-10
有没有ai制作海报的软件或者网站,最好能理解案例图片的
以下是一些可以用 AI 制作海报的软件和网站,并为您附上相关案例和使用方法: 1. 无界 AI: 网址:https://www.wujieai.cc/ 做图逻辑类似于 SD,优势在于国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。 应用场景示例:朋友圈 po 图,画幅比例选择 1:1。 皮克斯卡通模型位置:二次元模型》模型主题》皮克斯卡通。 关键词类别:场景(如向日葵花田、面包店等)、氛围(如温馨、温暖等)、人物(如父亲和女儿、父亲和儿子)、造型(如发型、发色、服饰、配饰)、情绪(如笑得很开心、大笑、对视等)、道具(如童话书等)、构图(如半身、中景等)、画面(色彩明艳)。 2. Canva(可画): 网址:https://www.canva.cn/ 是一个非常受欢迎的在线设计工具,提供大量模板和设计元素,用户可通过简单拖放操作创建海报,其 AI 功能可帮助选择合适颜色搭配和字体样式。 3. 稿定设计: 网址:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 4. VistaCreate: 网址:https://create.vista.com/ 简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 5. Microsoft Designer: 网址:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子和其他视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,大大简化设计流程。 此外,还有东阿阿胶的海报设计案例分享: 1. 拆解步骤:得到需求 提取元素 绘制线稿 用 controlnet 转绘上色 ps 优化 定稿。 2. 需求元素:风格要潮流插画,还要有唐代元素和国潮(前期基本上是沟通成本,主要定线稿)。 3. 提取元素:获取的信息需要体现产品图,需要体现唐代元素,需要 logo 在中心位置,按照需求开始绘制线稿。 4. 线稿绘制:沟通的元素是牡丹花,驴子(最后换成了琵琶),人参和产品图和 logo,所以进行线稿调整绘制(中间很多细节沟通)最终定下线稿(里面很多元素都是拼接的)。 5. 拆分元素线稿:这一步非常重要,因为会涉及到后续元素替换等问题,比如单个 logo,产品等,提取出单独元素,进行绘制,最后进行替换。 6. 单个元素绘制:这样会让单个元素更加精致,也方便后期替换。 7. 然后利用拼接好的线稿进行大量跑图抽卡,选出一张最合适的进行 ps 优化。 8. 整体拼接上色后的效果(将单独跑的元素在 ps 里替换优化,再过一遍 sd 进行溶图放大)得到以下效果。 9. 最终客户把驴子去掉了,换成了一把琵琶,也是同产品图一样的做法,最后把琵琶替换掉驴子,得到定稿图。 上色运用的大模型:GhostMix 鬼混_V2.0 lora 模型:"盒子系列——平面国潮插画_v1.0:182ba9e2f576 controlnet 模型:"Module:lineart_coarse,Model:contr"
2025-01-07
如何理解AI网站和AI大模型的关系
AI 网站和 AI 大模型之间存在着密切的关系。 首先,AI 大模型是人工智能领域的核心技术之一。它是基于深度学习等方法构建的具有大规模参数和强大能力的模型,例如能够处理自然语言、生成文本、进行语义理解等。 生成式 AI 生成的内容称为 AIGC。相关技术名词包括: 1. AI 即人工智能。 2. 机器学习是电脑找规律学习,涵盖监督学习(有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归)、无监督学习(学习的数据无标签,算法自主发现规律,如聚类)、强化学习(从反馈中学习,最大化奖励或最小化损失,类似训小狗)。 3. 深度学习参照人脑,有神经网络和神经元,因层数多被称为深度,神经网络可用于多种学习方式。 4. LLM 是大语言模型,对于生成式 AI,生成图像的扩散模型不属于大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解(如上下文理解、情感分析、文本分类),但不擅长文本生成。 技术方面,2017 年 6 月谷歌团队发表的《Attention is All You Need》论文首次提出了 Transformer 模型,它基于自注意力机制处理序列数据,比 RNN 更适合处理文本的长距离依赖性。 AI 网站通常是展示和应用 AI 大模型的平台。通过网站,用户可以与 AI 大模型进行交互,获取其提供的服务和功能,例如进行文本生成、问答、翻译等。同时,AI 网站也为 AI 大模型的推广、应用和改进提供了渠道。
2025-01-07
理解LoRA训练以及参数
LoRA 训练的参数主要包括以下方面: 1. 学习步数:指 AI 对每张图片的学习次数。二次元图片的 repeat 一般在 10 15,写实人物图片的 repeat 一般在 30 50,真实世界的景观场景可能要达到 100。repeat 值越高,AI 越能读懂图片,但图片精细度越高,学习步数也要越高。 2. 循环次数:AI 将所有图片按照学习步数学习一轮就是一次循环,循环次数就是将这个过程重复的遍数。一般数值在 10 20 之间,次数并非越多越好,过多会导致过拟合。总的训练步数 = 图片张数×学习步数×循环次数。 3. 效率设置:主要控制电脑的训练速度,可保持默认值,也可根据电脑显存微调,但要避免显存过载。 4. DIM:不同场景有不同的推荐值。如二次元一般为 32,人物常见为 32 128,实物、风景则≥128。DIM 为 64 时,输出文件一般为 70MB +;DIM 为 128 时,输出文件一般为 140MB + 。 5. 样图设置:主要控制训练过程中的样图显示,可实时观测训练效果。“sample every n steps”为 50 代表每 50 步生成一张样图,prompts 提示词可预设效果或自定义。 6. 并行数量:代表 AI 同一时间学习的图片数量。数值越大,训练速度越快,内存占用越大,收敛得慢;数值越小,训练速度越慢,内存占用越小,收敛得快。以 512×512 的图片为例,显存小于等于 6g,batch size 设为 1;显存为 12g 以上,batch size 可设为 4 或 6。增加并行数量时,通常也会增加循环次数。 7. 质量设置: 学习率:指 AI 学习图片的效率,过高会过拟合,过低会不拟合。1e 4 即 1 除以 10 的 4 次方,等于 0.0001;1e 5 即 1 除以 10 的 5 次方,等于 0.00001。一般保持默认,如需调整可点击数值旁的加减号。 网格维度:network dim 决定出图精细度,数值越高有助于 AI 学会更多细节,但数值越大学习越慢,训练时间越长,易过拟合。
2025-01-06