直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

自动工作流

回答

以下是关于自动工作流的相关内容:

ComfyUI 自动生成抠图素材:

  • 学习使用 ComfyUI 的原因:更接近 SD 的底层工作原理,符合 AI 精神,可消灭重复性工作,作为强大的可视化后端工具能实现 SD 之外的功能,还可根据定制需求开发节点或模块。
  • 制作动机:工作室经常需要抠图素材,传统途径存在问题,在 github 上看到相关项目后创建了 ComfyUI 工作流,可自动生成定制需求的抠图素材,速度快。
  • 会分享创建工作流的思路和详细步骤讲解。

Inhai:Agentic Workflow:

  • 完成了自己的工作流重塑,分享了关于个人在使用 AI Agent Workflow 上的思考、AI-Native 应用「Pailido|AI 拍立得」创建的初衷和实现流程,以及在个人工作流重塑上的体悟。
  • 分享大纲围绕 AI Agent 和 Agentic Workflow 从“认识、定义、应用、偏见、实践以及延伸”展开。
  • 介绍了吴恩达老师提出的 4 种主要的 Agentic Workflow 设计模式,包括 Reflection(反思)、Tool Use(工具)、Planning(规划)、Multiagent Collaboration(多智能体协同)。
  • 反思本质上是博弈过程,可让两个 Agent 分别负责 Coding 和 Code Review 以获得更好效果。
  • 提到行业的 Know-how 是短期内个人不可被替代的固有知识资产,AGI 的时代会越来越近。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

ComfyUI自动生成抠图素材

我为什么学习使用ComfyUI:更接近SD的底层工作原理,在更靠近一朵鲜花的地方,才能闻到它的芳香自动化工作流(我也用webui,虽然很好,但我觉得ComfyUI更符合AI的精神,即消灭重复性工作)作为一个强大的可视化后端工具,可以实现SD之外的功能,如调用api及本文所讲的内容等可根据定制需求开发节点或模块Hi,大家好,我是金属文。我制作这个工作流的动机是:我的工作室经常需要一些抠图素材,用做海报、推文、短视频等用途传统的搜集抠图素材途径无非是网站下载、付费购买、自己PS。要么花钱,要么花时间,还不能根据自己的需求定制素材近期在github上看到一个名为[ComfyI2I](https://github.com/ManglerFTW/ComfyI2I)的项目,其中包含了丰富的蒙版处理节点于是我基于[ComfyI2I](https://github.com/ManglerFTW/ComfyI2I)创建了这个ComfyUI工作流,不仅可以用作绿幕素材的抠图,还可以自动生成定制需求的抠图素材,全程只需要几秒,太香了!先来看下效果:下面我将分享创建整个工作流的思路以及详细步骤讲解话不多说,开始干货教程

Inhai: Agentic Workflow:AI 重塑了我的工作流

原创:来自inhai银海公众号“抄就完了”,欢迎关注!从“人工工作流”到“Agentic工作流”"Reshape your workflow with AI."在Agentic Workflow的这件事情上,我先完成了自己的工作流重塑。近期在「特工宇宙」分享了一场关于Agentic Workflow主题的内容,现在同步分享给大家一些关于个人在使用AI Agent Workflow上的思考、AI-Native应用「Pailido|AI拍立得」创建的初衷和实现流程,在个人工作流重塑上分享了一些体悟。本次分享大纲整体围绕着AI Agent和Agentic Workflow从“认识、定义、应用、偏见、实践以及延伸”进行展开,正式拉开「仰望星空,脚踏实地」的序幕。在今年的4月初,吴恩达老师在美国红杉做了一场演讲,介绍了4种主要的Agentic Workflow设计模式。Reflection(反思):让Agent审视和修正自己生成的输出。Tool Use(工具):LLM生成代码、调用API等工具进行操作。Planning(规划):让Agent分解复杂任务并按计划执行。Multiagent Collaboration(多智能体协同):多个Agent扮演不同角色合作完成任务。Reflection反思在根本上其实是一个博弈的过程:如果你让大模型写一段代码,它会立刻给你反馈。这时你可以将它输出的代码片段再输入回去,让大模型仔细检查代码的准确性和结构规范性,并给出评论。然后,你可以将这些反馈结果再次输入给大模型,它可能会输出一个比第一版更好的代码,如果有两个Agent:一个负责Coding,另一个负责Code Review,效果会更佳。Tool Use

Inhai: Agentic Workflow:AI 重塑了我的工作流

我很惊讶的发现:曾经五年前躺在我手机备忘录里的一些在当时不可能实现的想法,在如今时代也逐一被验证。所以,还有什么不能想的呢?脚踏实地,仰望星空。Agent的未来是一个浩渺的宇宙,行业的Know-how是每一个人在短期内不可被替代的固有知识资产,你可能会说我可以通过一系列的方法论去获取到很多行业信息,但是非常多的行业潜规则,就像冰山一样,你可能只看到了表面的一些内容,冰山下的不可被观测的,也是这个时代个人的竞争力。毫无疑问,LLM会有更低的成本、推理处理速度更快、支持多模态全面接入、会有更多AI-Native应用开始诞生...我肯定是,AGI的时代会离我们越来越近了。感谢你看到这儿,如果你觉得不错,欢迎点赞分享关注我哈哈,我们下期再见。完整材料:[Agentic Workflow:AI重塑了我的工作流(1).pdf](https://bytedance.feishu.cn/space/api/box/stream/download/all/JXpXblioaoUPY2x7bU5cpoD0nsc?allow_redirect=1)

其他人在问
我想根据提问的问题关键词设置自动回复
以下是关于根据提问的问题关键词设置自动回复的相关内容: Apple Intelligence 中各种智能应用的提示词已曝光,存在“/System/Library/AssetsV2/com_apple_MobileAsset_UAF_FM_GenerativeModels”目录下。作为邮件助理,可识别邮件中的相关问题并提供简短回复片段,以 JSON 格式呈现输出,包含问题和答案的字典列表。若邮件无提问则返回空列表。 安仔:Coze AI 机器人对接微信群的疑问解答,包括放行端口、Bot ID、微信账号被封、服务器是否需一直开着、不懂编程能否配置好、配置中遇到问题、为何配置多个前缀触发回复等问题及相应答案。 飞书 5000 人大群内置智能机器人“waytoAGI 知识库智能问答”,基于飞书 aily 搭建。使用时在群里发起话题时,它能自动问答、知识搜索、文档引用、互动教学、更新最新动态、促进社区互动、资源共享、支持多语言问答。
2024-11-18
什么软件可以自动给视频翻译并加字幕
以下是一些可以自动给视频翻译并加字幕的软件: 1. Opusclip:利用长视频剪成短视频。网址:https://www.opus.pro/ 2. Raskai:短视频素材直接翻译至多语种。网址:https://zh.rask.ai/ 3. invideoAI:输入想法>自动生成脚本和分镜描述>生成视频>人工二编>合成长视频。网址:https://invideo.io/make/aivideogenerator/ 4. descript:屏幕/播客录制>PPT 方式做视频。 5. veed.io:自动翻译自动字幕。网址:https://www.veed.io/ 6. Reccloud:免费的在线 AI 字幕生成工具,可直接上传视频精准识别,能对识别的字幕进行翻译,自动生成双语字幕。声称已处理 1.2 亿+视频,识别准确率接近 100%。 7. 绘影字幕:一站式专业视频自动字幕编辑器,提供简单、准确、快速的字幕制作和翻译服务。支持 95 种语言,准确率高达 98%,可自定义视频字幕样式。 8. Arctime:对视频语音自动识别并转换为字幕,甚至支持自动打轴。支持 Windows 和 Linux 等主流平台,支持 SRT 和 ASS 等字幕功能。 9. 网易见外:国内知名语音平台,支持视频智能字幕功能,转换正确率较高,支持音频转写功能。 以上工具各有特点,您可以根据自己的需求选择最适合您的视频自动字幕工具。请注意,部分内容由 AI 大模型生成,请仔细甄别。
2024-11-17
有没有自动AI样机的工具 mockup
目前在 AI 领域,暂时没有特别知名的专门用于生成自动 AI 样机的工具 mockup。但随着技术的不断发展,未来可能会出现相关的创新工具。您可以持续关注 AI 技术的最新动态,以获取相关信息。
2024-11-16
汽车自动驾驶处理器
汽车自动驾驶处理器是一种在自动驾驶汽车中发挥关键作用的部件。智能体可以根据其复杂性和功能分为多种类型,其中基于模型的智能体就像自动驾驶汽车,不仅感知当前环境,还维护和更新周围环境的模型,从而做出驾驶决策。 在 AI 领域,有多种与汽车自动驾驶处理器相关的技术和概念。例如,黄仁勋在 AI 界超级碗 GTC2024 的主旨演讲中提到,世界上第一个机器人处理器专为高速传感器处理和人工智能而设计,如用于汽车中运行 Transformer 的处理器。同时,还提到了一些相关的系统和算法,如用于训练 AI 的 DGX、自主处理器 Jetson 等。 智能体在自动驾驶领域有广泛应用,其设计和实现通常涉及定义目标、感知系统、决策机制、行动系统以及学习与优化等步骤。
2024-11-11
自动化工作流
以下是关于自动化工作流的相关内容: ComfyUI 自动生成抠图素材: 学习使用 ComfyUI 的原因:更接近 SD 的底层工作原理,符合 AI 精神,可消灭重复性工作,作为强大的可视化后端工具能实现 SD 之外的功能,还可根据定制需求开发节点或模块。 制作动机:工作室经常需要抠图素材,传统途径存在问题,在 github 上看到相关项目后创建了工作流,可自动生成定制需求的抠图素材,全程只需几秒。 效果展示及分享:将分享创建工作流的思路和详细步骤。 AIGC 落地应用中的自动化工作流: 推荐产品:Auto GPT/Agent/Baby AGI,它们是基于 GPT4 语言模型的开源应用程序。 核心特征:用户输入目标后可自主执行任务、递归开发和调试代码,包括分解任务、选择工具、执行任务和整合结果。 应用场景:自动化任务、创建自主的 AI 代理、完成各种任务、增强 IDE 的补全功能等。 访问地址: 。 【拔刀刘】自动总结公众号内容并定时推送到微信的工作流: 工作流全貌:双击画板查看高清大图,结合具体细节反复查看。 开始节点:用户在开始节点输入 server 酱的 sendkey 和 rss 列表,key 为 server 酱的 sendkey,获取方式参看文档「相关资源」部分;rss_list 为 rss 列表,可先使用提供的测试数据。 分割 RSS 列表:使用「文本处理」节点,将输入的 rss 列表处理为一行一个,输出为数组,方便后续节点批处理。 读取 RSS 内容:在插件中找到链接读取节点,配置批处理,输入参数选择「分割 rss 列表」的 output,下方输入参数中 url 选择当前节点中的 item1。 汇总 RSS 中所有文章内容:承接上一步文章内容并格式化输出,使用「代码」节点,选择 Python 输入相关代码,配置输出项为类型选择「Array<Object>」,分别输出 title、url、author。一个正常公众号每天推送文章数量不超过 3 篇,因此代码只抓取每个公众号最近三篇的内容以提升工作流运行效率。
2024-11-10
通过word自动生成ppt
以下是通过 Word 自动生成 PPT 的几种方法: 1. 方法一(卓 sir): 先让 GPT4 生成 PPT 大纲,然后把大纲导入到 WPS 当中,启用 WPS AI 一键生成 PPT。 为让 PPT 更具灵动性和观感,可让 chatPPT 添加一些动画,最后手动修改细节,如字体、事实性错误等。 制作过程中,最耗时的是让 GPT4 生成符合要求的 PPT 大纲,可能会花费较多时间。 2. 方法二(熊猫 Jay 闪击): 网址:https://ppt.isheji.com/?code=ysslhaqllp&as=invite 选择模板,输入大纲和要点(注意语法偏差,可参考官方使用指南:https://zhuanlan.zhihu.com/p/607583650)。 点击文本转 PPT 并确定,得到转换后的 PPT 后可在线编辑。 导出有一些限制,PPT 需要会员才能导出。 3. 方法三(熊猫 Jay Process ON): 网址:https://www.processon.com/ 输入大纲和要点,有两种方式: 导入大纲和要点: 手动复制,相对较耗时间。 导入方式:复制最终大纲内容到本地 txt 文件,将后缀改为.md(若看不见后缀,可自行搜索开启);打开 Xmind 软件,将 md 文件导入 Xmind 文件中;在 Process ON 导入 Xmind 文件,以导入方式新建思维导图,选择准备好的 Xmind 文件,导入成功。 输入主题自动生成大纲和要求:新增思维导图,输入主题,点击 AI 帮我创作,生成结束。 选择模板并生成 PPT,点击下载,选择导入格式为 PPT 文件,选择模板再点击下载。若喜欢使用 Process ON 且没有会员,可在某宝买个一天会员。
2024-11-10
AI如何为工作提效
以下是关于 AI 如何为工作提效的相关内容: 在工作中使用 AI 能带来显著的效率改善。研究发现,使用 AI 的被测试者比未使用者平均多完成 12.2%的任务,完成速度提高 25.1%,结果质量提高 40%。 同时有以下有趣结论: 1. GPT4 等模型有能力边界,边界内处理良好,边界外则不佳,但具体边界未知。 2. 分三组测试,使用 AI 且接受培训的两组任务完成效率和质量远高于未使用组。 3. AI 对工作能力差的被测试者提升更大,会拉平高级和低级人才的差距。 4. 过于依赖 AI 可能适得其反,降低效率和质量,因无法区分其能力边界。 人类和 AI 协作有两种方式: 1. 半人马模式:人与 AI 紧密结合但各司其职,人类主导流程,根据任务性质调配资源,充分利用人类智慧与判断力及 AI 的计算与生成能力。 2. 机械人模式:人与 AI 高度融合,在细节上循环迭代优化,最终实现人机一体化,充分发挥人类灵活性和 AI 生成能力。 在技术就业市场方面,生成式人工智能带来了变革: 1. 展现出在编程、自动化任务处理和内容创作等方面的惊人能力,提高了工作效率,但威胁到一些技术岗位,如系统管理员、数字营销文案撰写等。 2. 为适应新环境的技术工作者带来新机遇,如云架构师、网络架构师和企业架构师等职位,因其需要人际交往、团队领导和复杂决策能力。 3. 促使企业领导者重新思考角色,利用 AI 提高效率,将更多精力投入创新和战略规划。 在大淘宝设计部,AI 作为工具带来了以下效果: 1. 主要工具为 Midjourney 和 Stabel Diffusion,辅助工具有 RUNWAY 和 PS beta 等。 2. 在营销设计中,整体项目设计时间减少约 18%,创意阶段丰富性提升约 150%,时间节省约 60%。 创意多样:不同创意概念提出数量增加 150%。 执行加速:创意生成阶段时间缩短平均 60%。 整体提效:从创意发散到落地执行品效都有显著提升。 总之,AI 工具不仅是技术进步,更代表了全新工作理念。
2024-11-20
ai的工作原理是什么
AI 的工作原理通常包括以下几个方面: 1. 构建模型:以大型语言模型为例,通过输入大量的数据,如过去菜肴搭配的数据(类比)或文本数据,让计算机学习如何处理这些数据,不依赖于定性细节,形成类似“菜肴空间”(类比)的模型,根据共现频率等对数据进行分类。 2. 发现模式:训练模型依据从数据中学习到的模式,预测哪种元素(如菜肴或单词)最能补充特定的组合。对于文本 AI 工具,基本操作是“下一个单词预测”。 3. 应用于不同领域:如生成式 AI,通过大规模的数据集训练深度神经网络模型,学习各种数据的规律和特征,实现对输入数据的分析、理解和生成,可应用于自动写作、虚拟现实、音乐创作等领域。但在数据处理过程中存在潜在合规风险,如未经授权收集信息、提供虚假信息、侵害个人隐私等。 总之,AI 工作原理涉及简单的数学概念、大量的训练数据,以及找出数据中的模式以模拟机器的“思维”过程。
2024-11-20
如何在企业共创工作坊中,使用AI赋能研讨共创
目前知识库中暂时没有关于如何在企业共创工作坊中使用 AI 赋能研讨共创的相关内容。但一般来说,可以考虑以下几个方面: 1. 利用自然语言处理技术对研讨内容进行实时分析和总结,帮助快速梳理关键观点和共识。 2. 借助 AI 智能助手提供相关的案例、数据和参考资料,丰富研讨的素材和视角。 3. 运用 AI 预测模型,对研讨中提出的方案进行初步的效果预测和风险评估。 4. 利用 AI 驱动的可视化工具,将复杂的研讨内容以更直观清晰的方式呈现。 您可以根据企业共创工作坊的具体需求和场景,有针对性地选择和应用合适的 AI 技术和工具。
2024-11-19
coze工作流中提示词优化节点有吗?
在 Coze 工作流中存在提示词优化节点。这个节点比较容易理解,如果觉得提示词需要优化,可加入该节点进行处理。其参数很简单,只有一个要优化的提示词。例如,用一开始就在用的文生图提示词“1 girl in real world”进行试用。优化后添加了很多具体信息,如在带着好奇心看书,环境中有阳光,色彩搭配的特点等。但修改后的提示词在控制图片生成真实照片的感觉方面,“in real world”控制真实图片生成的效果比“realistic”好。
2024-11-16
ai工作流
以下是关于 AI 工作流的相关内容: 目前使用 AI 的一些固定和优化的工作流包括: 1. 起床时,让 AI 如“马云”“马化腾”为自己排 TODO 优先级,并进行私董会的脑暴。 2. 工作中有傲娇的 AI 小助理加油,其 Prompt 为要阳光、会撒娇/卖萌。 3. 重点事项方面,如内容创作,拆成 bot 团队组,包括选题、标题、框架、扩写等,并分 A/B 组两个 AIbot 互相改,要点是提供反常识、梗,学习喜欢的 UP 创作方法论。 4. 优化的 bot 包括内容选题 bot、短视频脚本 bot、数据分析 bot(GPT4)、网页 Perplexity 的资料库 bot 等。 5. 优化方面,有 Zion、ChatO 和自动化 AIAgent 分身,基于自身知识库的 bot,以及将上述知识库、Prompt 资产放入飞书的知识库和多维表单中维护,等待飞书的 AI 进化。 6. 备选 50 多个生产力 AI 放在工具库待命输出。 7. 未来计划把整个公司业务搬入飞书中,外接 MJ、ChatBot 分身以及咨询日程预约,可能让所有流量口 bot 也介入飞书,给予飞书做数据分析和内容引擎(目前需手动)。 生成式 AI 的人机协同分为 3 种产品设计模式:Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理),不同模式下人与 AI 的协作流程有所差异。 Agentic Workflow 驱动角色工作流变革,使用 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。 重塑工作流时,可从原子能力层思考,抽象化拆解大模型的底层能力,如翻译、识别、提取、格式化等,围绕“输入”“处理”“输出”“反馈”构建最底层的信息处理逻辑。 在获取信息方面,搜索引擎和基于大模型的聊天机器人目标一致,如 Kimi Chat 会在互联网上检索相关内容并总结分析给出结论。 Agent 通过自行规划任务执行的工作流路径,面向简单或线性流程运行。 吴恩达通过开源项目 ChatDev 举例,可让大语言模型扮演不同角色相互协作开发应用或复杂程序。 AI Agent 基本框架为“Agent = LLM +规划+记忆+工具使用”,其中大模型 LLM 扮演“大脑”,规划包括子目标分解、反思与改进。
2024-11-15
AI做工作计划
以下是关于 AI 做工作计划的相关内容: Agentic Workflow: 大模型如 Kimi Chat 会利用「网页搜索」工具,在互联网检索相关内容并总结分析给出结论。 Agent 能自行规划任务执行的工作流路径,适用于简单或线性流程的运行。例如,先识别男孩姿势,再用相关模型合成新的女孩图像,最后语音合成输出。 吴恩达通过开源项目 ChatDev 举例,大语言模型可扮演不同角色相互协作开发应用或复杂程序。 OpenAI 的研究主管 Lilian Weng 提出 Agent 的基础架构为“Agent = LLM + 规划 + 记忆 + 工具使用”,其中大模型 LLM 是 Agent 的“大脑”。 规划包括子目标分解、反思与改进,将大型任务分解为较小可管理的子目标,还能对过去行动进行自我批评和反思以提高结果质量。 OpenAI 通用人工智能(AGI)的计划:暂未获取到关于 OpenAI 通用人工智能(AGI)计划在做工作计划方面的直接相关内容。 AI+工作场景案例: 办公方面,包括编写 Excel 公式、写邮件、会议总结等。 项目管理方面,ChatGPT 可创建和维护跨团队项目协作计划。 销售方面,可总结话术的优缺点,涵盖产品特点、服务优势等多方面。
2024-11-14