Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

夙愿:AI 工作流,赋能我的十倍增长》中的“三、怎么搭建 AI 工作流 3.1 搭建 AI 工作流的三种能力 3.1.3 搭建 AI 智能体

Answer

搭建 AI 工作流包括以下三种能力:

  1. 熟悉各种 AI 工具:这是入门 AI 工作流的第一步。不同环节可能需要不同工具,例如写标题可用 ChatGPT,写文章可用 Claude,检查文本中的错别字和病句可用秘塔写作猫的 AI 纠错功能。需要了解多个不同 AI 工具的特点和用途,根据具体细分任务选择合适的工具。
  2. 编写提示词:这决定能否用好工具。提示词是搭建人和 AI 之间的“沟通桥梁”,要用 AI 能听懂的语言清晰说明需求、任务内容和步骤,让 AI 明白要做什么以及怎么做。
  3. 搭建 AI 智能体:AI 智能体如同员工,能根据设定的工作流自动调用不同 AI 工具完成全流程任务,无需人类时刻干预。例如写一篇文章,可设计“写作助手”的 AI 智能体,输入文章主题、风格和要求,它会自动写大纲、用 Claude 模型写初稿、修改润色并排版,从而提高效率。

您可以对照这三个层级,评估自己的 AI 工作流能力,找出差距和不足,多学习、多实践、多交流。

Content generated by AI large model, please carefully verify (powered by aily)

References

夙愿:AI 工作流,赋能我的十倍增长

第三层呢,是要学会搭建AI智能体。AI智能体它就像是我们的员工,它能根据我们设定的工作流,自动调用不同的AI工具,完成全流程任务,不需要人类每时每刻都盯着它指导它来干活。AI智能体就像是你的智能助手,给它安排好工作步骤,它就能自动选择合适的工具,按顺序完成任务。比如说我们要写一篇文章,就可以设计一个"写作助手"的AI智能体。我们只需要在文本框里输入文章的主题、风格和要求,然后回车发送。它开始自动地写一个文章大纲处理,接着根据大纲使用Claude模型来写一份文章的初稿,接着再进行修改润色,最后排版一下,把一篇完整的文章弄出来给了我们。前面我们还没引入AI智能体这个概念的时候,这原本是需要人类进行干预的,但现在就不需要人类干预了,效率也就大大提高了。以上,我们说了搭建AI工作流所需要的能力,分为三个层级,你也可以思考一下自己现在处于哪个层级呢?现在,你可以对照这三个层级,评估一下自己的AI工作流能力,找出差距和不足,多学习、多实践、多交流。

夙愿:AI 工作流,赋能我的十倍增长

那怎么搭建出这样的一套AI工作流呢?在讨论这个问题之前,得先知道搭建AI工作流,我们需要具备哪些能力呢?我把这个能力分为了三个层级,分别是熟悉各种AI工具、编写提示词、搭建AI智能体。[heading3]3.1.1熟悉各种AI工具[content]首先第一层,就是要熟悉各种各样的AI工具。在AI工作流里,不同的环节可能需要用到不同的工具,还是拿文章举例。写标题,可以用ChatGPT;但是写文章的话,就得用Claude了,因为claude的写作能力比ChatGPT强很多。而检查文本中的错别字和病句呢,可以用秘塔写作猫的AI纠错功能。熟悉各种AI工具,就是入门AI工作流的第一步,我们需要去了解多个不同AI工具的特点和用途,根据具体的某一项细分任务,去选择合适这个任务的AI工具。[heading3]3.1.2编写提示词[content]第二层,是要学会写提示词,因为这决定了你是否能用好这些工具。我们刚刚说了写标题,可以用ChatGPT;写文章,可以用Claude;但具体怎么让AI去写呢,这需要我们有一定的提示词能力,我们才能让AI写出好的内容。因为提示词,就是要搭建起人和AI之间的"沟通桥梁",我们得用AI听得懂的语言,清晰地说明你的需求、任务的内容和步骤,让AI明白你要它做什么,怎么做。

夙愿:AI 工作流,赋能我的十倍增长

感谢你耐心阅读这篇略显冗长的文章。让我们简单回顾一下,首先,我们讨论了什么是AI工作流。简单来说,就是把AI工具融入到工作里的各个环节中,为我们的工作来提效。然后,我们聊到了搭建AI工作流需要的三层能力:第一层,了解各种AI工具,知道每个AI工具的特点和用途。第二层,学会写提示词,这是很关键,决定你能不能把任务给AI说清楚。第三层,搭建AI智能体,让替代人工,使用多个AI工具协同工作,自动完成任务。接下来,我让AI帮我梳理出了这套搭建AI工作流和公众号工作流的SOP:

Others are asking
即梦AI的使用教程
以下是即梦 AI 的使用教程: 1. 生成文案: 工具:DeepSeek 操作: 打开 DeepSeek 网站:https://chat.deepseek.com/ 输入提示词,示例:“让 XX 用现代口语化的表达、生气骂人的口吻吐槽 XXXX(例如:吐槽现代人),XXX 目的(例如:推广 XXX 吸引游客来旅游),输出 3 条 60 字左右的毒舌文案,每条里面都要有‘回答我!Look in my eyes!Tell me!why?baby!why?’” 可根据自己的内容自行调整文案和字数要求。 点击生成,等待 DeepSeek 输出 3 条文案,从中挑选最满意的一条(或多条)保存备用。 2. 准备人物形象图: 工具:即梦 AI 操作: 打开即梦 AI 网站:https://jimeng.jianying.com/aitool/image/generate 输入提示词,即梦已接入 DeepSeek,可直接用其生成绘图提示词。 调整生成参数(如风格、细节等),点击生成。 预览生成的人物图,不满意可调整提示词重新生成,直到满意为止,然后下载最终的人物形象图。 3. 城市艺术字海报设计: 操作: 打开即梦 AI,选择“图片生成”功能:https://jimeng.jianying.com 模型选择图片 2.1,输入提示词(可以直接参考案例提示词)。 点击生成,几秒钟后即可完成专属字体海报。 4. 生成特定图片: 操作: 打开即梦 AI:https://jimeng.jianying.com/aitool/home 点击 AI 作图中的图片生成。 填写绘图提示词,选择生图模型 2.1,点击立刻生成。
2025-04-11
关于deep search和deep research有哪些好的AI应用或工具
以下是关于 deep search 和 deep research 的一些 AI 应用或工具: 1. OpenAI Deep Research:提供多语言搜索、精准信息提炼和专业写作,适用于学术研究、SEO 和产品策划,但存在信息滞后与混乱的问题,无法完全取代人类的深度思考。详细体验链接:https://mp.weixin.qq.com/s/_4UZrJuI42PuyTD5s5mVZg?token=1639803888&lang=zh_CN 详情:https://x.com/dotey/status/1886671986559967734 2. Google Gemini 的 Deep Research:是一款智能信息检索与分析工具,可以基于主题快速检索全网资源并生成综合报告,并支持导出为 Google Docs 文档格式。特别适合学术研究、内容创作、行业分析等需求场景。工具核心亮点是充分整合了 Google 核心数据源(Google Search、Google Scholar、Google Books、YouTube 等),再结合 Gemini 1.5 模型的多模态处理能力,可处理高达 100 万 tokens 的上下文信息,实现深度信息挖掘与分析。测评长文:https://mp.weixin.qq.com/s/Xn8ZwF40dDUDJv_6RU4JQA 产品入口:Deep Search 已经上线 Gemini Advanced(Gemini 付费版 https://gemini.google.com) 3. 第四范式发布的桌面端 AI 搜索工具:这是一款基于人工智能技术的全能搜索助手,能够提升用户在本地文件、即时通信、网盘等各类在线应用中的搜索体验。用户可通过简单描述查询意图进行模糊搜索,无需精确关键字,工具支持实时预览搜索结果。官方演示:https://mp.weixin.qq.com/s/01vVRWyoXlSvI7McaY_g 工具处于 Beta 版测试阶段,使用方式和具体定价尚未公布。 4. Deep Research 还可利用 DeepSeekR1 大模型对复杂问题进行多角度分析,以豆包 1.5 模型辅助总结互联网资料,可快速生成最合适用户的解决方案,无论在学术研究、企业决策还是产品调研上,都能够有效地协助用户深入挖掘,提出切实可行的解决策略。
2025-04-11
请给我提供一个 AI辅助我进行知识管理的方案
以下是一个 AI 辅助知识管理的方案: 1. 利用提示词规划 PARA 分类模式:PARA 代表项目(Projects)、领域(Areas)、资源(Resources)和档案(Archives)。AI 可分析您的工作模式和内容类型,自动生成提示词,助您将信息和知识分类到相应部分,简化分类过程,加快组织和检索信息。核心是理解以行动为驱动的笔记逻辑。 2. 借助提示词设计笔记标签系统:有效的标签系统对知识管理很关键,AI 能分析笔记内容和使用习惯,推荐合适的标签和结构,提高检索效率。 3. 让知识助手 Bot 渐进式积累领域知识:随着在特定领域的深入,需要系统积累和更新知识。知识助手 Bot 可根据学习进度和兴趣点,定期推送相关文章、论文和资源,实现渐进式学习,扩展知识边界并确保知识更新。例如基于 dify.ai 将数百个思维模型整合成知识库,根据不同对话和条件判断为用户选择适用的思维模型分析工具,封装成智能分析的 Bot。 4. 基于已积累知识的 RAG 方法进行深度研究:RAG 是结合检索和生成的 AI 模型,应用于知识管理,能在深度研究时自动检索相关知识点和资料,辅助构建更全面深入的分析。 5. 打造个人知识导师,随时对话辅助梳理线索:创建个人知识管理员机器人,随时与之对话,询问特定知识点或寻求解决问题思路。它能基于知识库自学习,了解您的知识结构和需求,成为不可或缺的知识伙伴。 6. 构建最了解您的智能体作为 AI 写作助手:涵盖构思、草稿生成、内容迭代、润色与优化等全流程。构思阶段利用智能体生成创意点、主题或大纲;草稿生成基于构思让智能体生成文本草稿;内容迭代通过 promptchain 工具设计迭代提示修改完善草稿;润色与优化对最终文本进行语言风格和语调调整。通过实践和反馈优化 prompt 设计,使写作助手贴合个人风格和需求。 此外,生成式人工智能在知识管理应用程序方面也有新兴应用,例如用作管理组织内基于文本(或可能基于图像或视频)知识的手段。一些研究表明,针对组织内特定知识体系微调模型培训,可有效管理组织知识。一些公司正与领先的商业提供商合作探索基于生成式人工智能的知识管理理念,但用户可能需要培训或帮助来创建有效提示,且知识输出应用前可能仍需编辑或审查。
2025-04-11
ai在教学中的最新应用
以下是 AI 在教学中的一些最新应用: 1. MIT 为孩子开设免费的 AI 课程,涵盖了 AI 在跨学科领域的应用,如 AI 与气候、AI 与大学录取、AI 对美国大选的影响等。孩子们需要思考如何用气候数据写好故事、预测气候变换走向,从数据分析角度了解大学录取中的相关问题,以及识别 AI 深度伪造的新媒体材料等。 2. 张翼然提出用 AI 为教师减负,为有初步 AI 使用经验、渴望了解最新技术进展并交流的老师提供了相关技巧和分享。例如,在智慧技术助理加持下探索教学新样态,分享全球 AI 技术在教育界的新发展和应用案例。 3. 从 AI 助教到智慧学伴的应用探索中,提出调整教学理念,将 AI 作为教学辅助工具和合作伙伴。学习利用 AI 工具的优势应用于教学,如自动生成练习、个性化反馈等,同时确认输出质量。根据 AI 能力设计开放性作业,调整考核方式,继续发挥教师在提供情感支持、培养团队合作等方面的优势。
2025-04-11
ai用于教学现在到什么层次了
目前 AI 用于教学大致处于以下几个层次: 1. 生成教学资源:包括智能素材处理与创作等。 2. 解决教学场景问题:例如辅助教师设计提示词等。 3. 师生机共学:AI 作为“副驾”,与师生共同参与学习过程。 4. 促进学生正确使用:帮助学生更好地利用 AI 进行学习。 5. 提升学生人机共创力:培养学生与 AI 协同创新的能力。 然而,现阶段 AI 能力大多只能达到 Level 2,在教学中主要起辅助作用。AI 在教学中的应用仍处于不断发展和探索的阶段,还需要解决一些局限性,如伦理和价值观把控等问题,以保障教学的安全和有效性。同时,AI 在教学中的应用也存在职业渗透而非颠覆的情况,例如在编程和写作方面应用较多,但对体力劳动和部分专业职业影响较小。未来,AI 在教学中的应用模式可能会从“人机共创”向“任务外包”演进。
2025-04-11
有没有很对汽车三维建模方面的AI应用 介绍介绍
以下是一些与汽车三维建模相关的 AI 应用: Vibe Draw:可以根据草图进行 3D 建模。 PhysTwin:能够通过视频创建交互式物理数字孪生。 GroomLight:用于重打光的人体头发外观建模的混合逆向渲染。
2025-04-11
怎么搭建微信机器人?
以下是搭建微信机器人的步骤: 1. 登录成功后,找另一个人私聊或者在群中@您,就可以看到机器人的正常回复,此时表示已通。 2. 如果想为这个 AI 赋予提示词,可以返回相应步骤进行更改。例如在“目录 4 里的第 17 步”或“第三章,第 7 步”,其中双引号内的 value 部分,便是设置 AI 提示词的地方。 3. 此后,进行任何更改,都需要重新打印登陆二维码。并且一个月内,不要上来就加好友、最好不要私聊聊天。 4. 报错"wxsid"是因为微信未实名,实名即可解决。 5. 如果没有手机登录,可以使用夜神模拟器模拟手机登录。 6. 重新在“文件”的【终端】里,直接输入 nohup python3 app.py&tail f nohup.out 重新扫码登录。 7. 多次重新登录后,就在宝塔“首页右上角点击重启,重启一下服务器”,清理进程。 8. 熟悉 linux 操作的话,也可以通过重启进程的方式来重启服务。 9. 如果想退出机器人,在手机微信上找到桌面版已登录的信息,点击退出桌面版即可。 此外: 1. Link AI 提供的 100 个,合计 3500 万 GPT3.5 Token 的礼品码。可以用来实现画图、搜索、识图等功能,COW 插件里几乎都支持使用 LinkAI 平台。完成机器人搭建,机器人拉群里,领兑换码。 2. 添加微信,拉您进机器人群,先行体验。 如果您仍旧遇到问题,可以先查询社区知识库,或者加“通往 AGI 之路”群,社区小伙伴们会尽力帮助。也可以加 Stuart 个人微信询问。
2025-04-11
如何搭建本地数字人
搭建本地数字人主要有以下两种方法: 开源方案: 1. 先剪出音频,使用 https://elevenlabs.io/speechsynthesis 或使用 GPTsovits克隆声音,做出文案的音频。 2. 使用 wav2lip 整合包,导入视频和音频,对口型得到视频。基础 wav2lip+高清修复整合包下载地址:https://github.com/Rudrabha/Wav2Lip 产品:https://synclabs.so/ 剪映方案: 1. 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉青春”。当选择一个数字人形象时,软件会播放出该数字人的声音。判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。剪映 App 会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示渲染完成时间,然后可点击预览按钮查看生成的数字人效果。 2. 增加背景图片:删除先前导入的文本内容,为视频增加背景图片。点击左上角的“媒体”菜单,并点击“导入”按钮,选择本地的一张图片上传。将图片添加到视频的轨道上(会覆盖数字人),点击轨道最右侧的竖线,向右拖拽,直到视频的最后,使其在整个视频播放时都显示。
2025-04-10
如何搭建数字人
以下是搭建数字人的一般步骤: 1. 生成数字人: 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择后软件会播放其声音,确认需要后点击右下角“添加数字人”,剪映会生成对应音视频并添加到当前视频文件轨道中,左下角会提示渲染完成时间,可点击预览查看效果。 2. 增加背景图片: 删除先前导入的文本内容,为视频增加美观的背景图片。点击左上角“媒体”菜单并“导入”,选择本地图片上传,点击图片右下角加号添加到视频轨道(会覆盖数字人)。将图片轨道最右侧竖线向右拖拽,使其与视频对齐。 3. 增加字幕: 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 4. 构建数字人灵魂: 借助开源社区的力量,如使用像 dify、fastgpt 等成熟的高质量 AI 编排框架。在开源项目中,可使用 dify 的框架,利用其编排和可视化交互任意修改流程,构造不同的 AI Agent,赋予数字人灵魂。具体部署过程参考 B 站视频:https://www.bilibili.com/video/BV1kZWvesE25 。如有更加高度定制的模型,也可在 Dify 中接入 XInference 等模型管理平台,然后部署自己的模型。此外,数字人 GUI 工程中保留了 LLM、ASR、TTS、Agent 等多个模块,能保持更好的扩展。 至此,数字人视频就完成了。点击右上角的“导出”按钮,导出视频以作备用。如果希望数字人换成自己希望的面孔,需要用另一个工具来进行换脸。
2025-04-10
搭建链接转文字的智能体
搭建链接转文字的智能体可以参考以下步骤: 1. 创建一个智能体,输入人设等信息,并放上相关工作流。 2. 配置完成后进行测试。但注意工作流中【所有视频片段拼接】节点使用的插件 api_token 填的是您的 token,为避免他人调用消耗您的费用,您可以将 api_token 作为工作流最开始的输入,让用户购买后输入使用,然后再发布。 3. 在阿里云百炼平台中,Deepseek R1 模型无需部署可直接使用。使用该模型需要解锁和授权,若没有授权按钮需对阿里云进行实名认证,可通过支付宝扫码或在右上角头像处进行,共学群里有相关指引。 4. 新建智能体应用时,可选择模型并调整参数,如回复字数限制和携带上下文轮数等。 5. 对于模型的连接,可通过模型广场的 API 调用示例获取链接,截断后粘贴到 Chat Box 的设置中,添加自定义提供方,设置模型名称为 Deepseek R1,并获取 API key。还可重置 API key 以方便本地软件连接。
2025-04-10
我是一个新手,我擅长的是短视频和直播,我想做一个智能体+短视频/直播的一个培训,但是我不懂怎么搭建智能体,我应该从哪里开始学
如果您作为新手,想做智能体+短视频/直播的培训但不懂搭建智能体,可以从以下几个方面开始学习: 1. 按照“五津:DeepSeek+扣子:1分钟生成小红书爆款单词视频”中的指导,创建智能体,输入人设等信息,并放上相关工作流。配置完成后进行测试,但千万不要直接发布。工作流中如【所有视频片段拼接】节点使用的插件 api_token 填的是您的 token,为避免他人调用消耗您的费用,您可以将 api_token 作为工作流最开始的输入,让用户购买后自行输入使用,然后再发布。 2. 参考“元子:WayToAGI 知识库究竟咋用?”中的内容,对于完全没有编程基础但对 AI 有一定概念的小白,可以从工具入门篇(AI Agent)中的“Agent 工具小白的 Coze 之旅”开始,了解相关搭建平台。 3. 学习“智谱 BigModel 共学营第二期:把你的微信变成超级 AI 助理”中的教程,包括注册智谱 Tokens 智谱 AI 开放平台(https://bigmodel.cn/),获取资源包(新注册用户注册即送 2000 万 Tokens,或通过充值/购买多种模型的低价福利资源包,如语言资源包、多模态资源包等,所有资源包购买地址:https://bigmodel.cn/finance/resourcepack ),然后进入【财务台】左侧的【资源包管理】查看自己的资源包,再进入智能体中心我的智能体开始创建智能体。
2025-04-10
适合搭建应用的AI
以下是一些适合搭建应用的 AI 相关信息: Menlo Ventures 指出生成式 AI 应用当前有三个核心用例与强大的产品市场契合度:搜索、合成和生成。其投资组合公司在这些类别中有早期突破性的代表,中心是 LLMs 的少样本推理能力。但生成式人工智能的承诺不止于此,领先的应用程序构建商正在建立解决方案处理大量人力工作流程。借助多步逻辑等新型构建块,下一波智能体正在拓展 AI 能力边界,实现端到端流程自动化。在深入探讨人工智能体领域时,将概述 Menlo 对新兴市场的论点,包括定义智能体及使其成为可能的因素,追溯现代人工智能技术栈的架构演化过程,探讨范式转变对应用和基础设施层面的影响。 第一期「AI 实训营」手把手学 AI,在阿里云百炼从零搭应用。阿里云百炼是基于通义系列大模型和开源大模型打造的一站式大模型服务平台,提供生成式大模型的应用编排搭建能力和企业大模型的全链路训练部署能力。其核心能力和优势包括大模型 API 服务、AI 应用搭建、模型在线训练部署等。目标客户群体包括有开发经验的企业或独立开发者,期望通过“企业知识+大模型”降本增效的企业,以及有算法和技术人力、有丰富企业数据、期望拥有专属大模型的企业。 目前企业正在自行构建而非购买应用程序,重点主要放在自主构建应用程序上,基础模型的出现使企业更易通过 API 构建自己的 AI 应用程序。企业正在构建常见应用,也在尝试更新颖的应用。关于“GPT wrappers(GPT 套壳)”的局限性已有诸多讨论,目前尚不清楚当更多面向企业的 AI 应用上市时情况是否会变化。那些能在“LLM+UI”公式之外创新,并显著重新思考企业基本工作流程或帮助企业更好利用专有数据的应用,将在市场上表现出色。
2025-04-10
如何制作一个只要输入主题内容,就可以制作文案和视频的工作流
以下是制作一个只要输入主题内容,就可以制作文案和视频的工作流的方法: 概述: 基于其他博主开源的视频生成工作流进行功能优化,实现视频全自动创建,并写了教程供大家参考。 先看效果: 可查看 功能: 通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。 涉及工具: 1. Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成) 2. 飞书(消息) 3. 飞书多维表格(字段捷径、自动化流程) 大体路径: 1. 通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频。 2. 发布 coze 智能体到飞书多维表格。 3. 在多维表格中使用字段捷径,引用该智能体。 4. 在多维表格中创建自动化流程,推送消息给指定飞书用户。 Coze 智能体创建: 1. “开始”节点: 共有 4 个输入变量,分别为:idea_txt(主题观点)、left_to_txt(画面左上角的文字)、right_to_txt(画面右上角的文字)、img_prmpot(画面中间图片生成提示词)。注意这 4 个变量名称要和智能体中提示词的变量对应一致,方便接收用户传入的参数。 2. “大模型”节点: 使用 DeepSeek R1 模型,提示词要求不复杂,说出需求即可,格式可用大白话说出来。 3. “文本”节点: 为将文案分句,每一句要生图、配音。选择按“句号”分句,具体可根据文案格式选择不同方式。 4. “图像生成”节点: 使用官方插件,模型选“LOGO 设计”。若要生成全景图,此插件效果欠佳,建议选其它插件。 5. “抠图节点”: 将上个节点生成的图片进行抠图。
2025-04-09
企业场景下最常用的工作流
在企业场景下,工作流是一种灵活的智能体编排方式,将业务过程中的任务按规则和顺序组织执行,降低任务复杂度和不确定性,减少对提示词工程和模型推理能力的依赖,提高大语言模型应用面向复杂任务的性能、稳定性和可解释性。工作流是智能体平台最核心强大的部分,衡量一个 AI 智能体的含金量,除大模型能力外,大部分业务价值体现在工作流设计里。 工作流的典型场景包括: 入门场景: 仅添加一个节点构建简单工作流,如通过插件节点内的插件能力自定义工作流,使用获取新闻插件构建获取新闻列表的工作流,详细配置教程可参见。 使用大语言模型(LLM)节点接收并处理用户问题,详细配置教程可参见。 使用 Code 节点生成随机数,详细配置教程可参见。 进阶场景: 通过多节点组合构建逻辑较复杂的工作流,如先通过插件能力进行关键词搜索、然后通过 Code 节点过滤指定信息、最后通过插件能力获取信息详情,详细配置教程可参见。 通过条件判断识别用户意图,例如通过 LLM 节点处理用户消息,将消息分为不同类型,然后通过 Condition 节点分别处理不同类型的用户消息,详细配置教程可参见。 常见的 AI Workflow 开发平台有: Coze:新一代 AI Bot 开发平台,集成了丰富的插件工具,国际版和国内版均有。 Dify:开源平台,支持自定义和插件。 腾讯元器。 FastGPT:国内知名,支持自定义流程。 影刀&zapier。 Leap。 Betteryeah:立足 RPA 场景,用 AI 将用户需求生成工作流,并通过 RPA 自动化,产品形态与 Coze 相似,是企业级的 AI 应用开发平台,无论团队编程技能如何,都能快速创建由 AI 驱动的 Agents、知识库、工作流和任务。 Flowise:快速实现智能体搭建。 BISHENG:主攻 tob 场景的开源 LLM 搭建平台,与 fastgpt 功能类似,但面向的客户不同,整体功能和部署成本更重。 Agent 构建平台有豆包、文心一言、星火助手、kimi.ai 等。由于 Coze 具有拓展强、好上手、不用出国等优点,本教程的工作流以 Coze 为主。
2025-04-09
从事AI工作,需要什么样的能力
从事 AI 工作需要具备以下能力: 1. 熟悉各种 AI 工具:了解不同 AI 工具的特点和用途,根据具体任务选择合适的工具。例如,写标题可用 ChatGPT,写文章可用 Claude,检查文本错别字和病句可用秘塔写作猫的 AI 纠错功能。 2. 编写提示词:这是用好 AI 工具的关键。要用 AI 能理解的语言,清晰说明需求、任务内容和步骤,搭建起人与 AI 之间的“沟通桥梁”,让 AI 明白要做什么和怎么做。 3. 搭建 AI 智能体:让其替代人工,使用多个 AI 工具协同工作,自动完成任务。 此外,从“AI 摊主速成脑暴会”的相关内容来看,具备以下方面的能力和背景也有助于从事 AI 工作: 1. 技术背景:包括编程、算法工程、AI 应用开发、后端开发等,是 AI 行业内的技术专家或初学者。 2. 产品开发与管理经验:有产品经理的经验,尤其在互联网和 AI 产品开发方面,具备项目管理与执行能力。 3. 多元化应用场景经验:广泛涉足 AIGC 内容创作、自动驾驶、金融数据分析、教育、医疗健康、影视创作、营销等 AI 应用场景。 4. AI 学习与技能提升:处于 AI 技术的初学阶段,渴望通过学习提升技能,并将 AI 技术应用到实际工作和生活中。 5. 内容创作与营销能力:包括自媒体运营、视频博主、内容创作者所具有的文案策划、视频剪辑、图文制作等创意能力,以及营销和品牌运营人士所掌握的商业化路径和解决方案提供能力。 6. 活动策划与执行能力:有丰富的活动策划和运营经验,涉及线下工作坊、社群活动、比赛等,具备资源整合和组织协调能力。
2025-04-09
常见的工作流与 Agent 开发平台
常见的工作流与 Agent 开发平台如下: AI Workflow 开发平台: Coze:新一代 AI Bot 开发平台,集成了丰富的插件工具,有国际版和国内版。 Dify:开源平台,支持自定义和插件。 腾讯元器。 FastGPT:国内知名,支持自定义流程。 影刀&zapier。 Leap。 Betteryeah:立足 RPA 场景,用 AI 将用户需求生成工作流,并通过 RPA 自动化,产品形态与 Coze 相似,是企业级的 AI 应用开发平台。 Flowise:快速实现智能体搭建。 BISHENG:主攻 tob 场景的开源 LLM 搭建平台,与 fastgpt 功能类似,但面向的客户不同,整体功能和部署成本更重。 Agent 构建平台: Coze:具有拓展强、好上手、不用出国等优点。 Mircosoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行设计良好的工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景。 钉钉 AI 超级助理:依托于钉钉强大的场景和数据优势,提供更深入的环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 此外,Inhai 的 Agentic Workflow 将一整套工作流组合起来,每个工具在每一个节点执行一个任务。LangGPT 提示词框架应用了 CoT 完成从输入到思维链再到输出的映射。
2025-04-09
转型AI工作需要什么能力
转型 AI 工作通常需要以下能力: 1. 技术方面: 具备 AI 技术的专业知识,例如了解 AI 如何用于提供产品和服务,以及技术标准的开发、使用和适用性。 熟悉不同 AI 工具的特点和用途。 掌握如何写提示词,以便清晰地向 AI 传达任务。 能够搭建 AI 智能体,实现多个 AI 工具协同工作。 2. 监管方面: 政府需要持续评估监管领域的不同能力需求,并密切关注和审查。 监管机构需要获取新的技能和专业知识,部分监管机构存在潜在的能力差距,特别是在 AI 技术的专业知识、AI 应用案例在多个监管制度中的交互以及市场情报等方面。 监管机构要具备有效适应 AI 应用案例和应用的出现,并在组织内吸收和分享这些知识的能力。 能够与提供保证技术的组织(如保证服务提供商)和制定技术标准的组织(即标准开发组织)合作,将相关工具嵌入监管框架和最佳实践。 跨监管机构合作,分享知识并协同监管跨多个监管制度的 AI 应用案例。 3. 组织方面: 有效适应 AI 应用案例和应用的出现,并在组织内吸收和分享这些知识。 与相关组织合作,开发技术标准,并将其嵌入监管框架和最佳实践。 跨部门合作,共享知识并协同工作。
2025-04-09
工作流 和 智能体的区别?
工作流和智能体的区别主要体现在以下几个方面: 定义: 工作流是通过预定义代码路径来编排 LLM 和工具的系统。 智能体则是由 LLM 动态指导自身流程和工具使用的系统,能够自主控制任务完成方式。 功能: 智能体是一个自动化的“助手”,用来执行特定任务,擅长做一些具体的、重复性的任务,比如客服聊天、推荐商品、处理订单等,但只能按照预先设定的规则和任务来做事,如果遇到超出范围的情况,就不知道怎么办了。 工作流是一系列任务的流程,决定了每个步骤应该做什么,可以处理一个完整的过程,比如从客户下单、付款到发货和售后服务,涵盖了所有步骤和环节,更灵活,能够适应变化,可以调整步骤和规则来应对不同的情况,不需要一开始就固定下来。 范围: 智能体是特定任务的“助手”,用于局部执行任务。 工作流是一个“计划”或“路线图”,指导整个任务的流程。简单说,工作流是全局的,智能体是局部的。 在业务中,通常需要的是工作流而非单个智能体,因为整个业务流程设计至关重要。例如,在烹饪中,关键不在于使用多贵的锅,而是按步骤完成每道工序。因此,工作流才是解决问题的关键,它帮助优化思路、提升效率。设计好工作流才能大幅提升整体业务效率。
2025-04-08
2025.3.18 新的大模型新闻
以下是 2025 年 3 月 18 日的一些新的大模型新闻: DeepSeek 深夜发布大一统模型 JanusPro,将图像理解和生成统一在一个模型中。其官网发声渠道包括微信公众号:DeepSeek;小红书:@DeepSeek(deepseek_ai);X:DeepSeek(@deepseek_ai);知乎账号(2025 年 3 月 1 日注册)。模型(7B)和(1B)的相关信息可参考特定链接。 2025 年 3 月 10 日的新闻:《大模型的未来,是 Agent 还是 App?》中提到 OpenAI 的 Deep Research 被视为一种新型的研究语言模型,具备自主执行搜索任务的能力。 2025 年 3 月 3 日的新闻:2025 年将是智谱的开源年,即将发布全新大模型并开源。2024 年 12 月,智谱已完成 D+轮 30 亿元人民币融资。
2025-03-18
3.18日AI科技新闻
以下是 3 月 18 日的 AI 科技新闻: 《Google 首席科学家 Jeff Dean 对话 Transformer 发明者:基于自回归的下一词预测方式并非人类学习的最佳模拟》:在与 Google 首席科学家 Jeff Dean 和 Transformer 发明者 Noam Shazeer 的对话中,他们强调 AI 发展需更主动引导,不能完全依赖自然演进。Jeff Dean 指出,每次模型改进不仅依赖硬件,更源于算法和架构的创新。两人还讨论了量化和低精度技术的未来,认为它们将显著提升 AI 性能。 《Linkloud 2 月 23 日线下分享活动回顾:增长与商业化(二十七期)》:本次 Linkloud 活动中,嘉宾围绕 AI 出海与增长实践进行了深入分享,结合近一年服务超 40 家 AI/SaaS 公司的经验,系统剖析了技术护城河逐渐消失、商业化路径尚不清晰背景下,增长在产品发展中的核心地位。内容涵盖如何精准定位产品、衡量关键增长指标、制定可持续的 SEO 策略,以及多渠道冷启动的实战经验,为 AI 应用在出海与增长阶段提供了极具参考价值的路径与思考。 《4 段超神提示词解锁 Claude 3.7 能力上限》:Claude 3.7 大幅提升了 AI 生成网页的能力,通过明确的设计提示词,能够创建美观、现代且易读的单页 HTML。这种创新方法不仅限于网站开发,还扩展至 3D 动画展示,使复杂信息变得引人胜。利用现代组件库如 TailwindCSS 和 Three.js,AI 展现了强大的视觉设计和交互能力。 《争先恐后接入 DeepSeek 的企业们,你们考虑过后果吗?》:DeepSeek 推出以来,企业纷纷追逐接入,但大多数未充分准备,盲目跟风可能是个严重错误。成功应用 AI 需基础数据、整体战略和人才支持,而不仅仅是接入大模型。真正的创新在于将 AI 与其他技术融合,企业应鼓励一线员工探索,而非制定复杂的 AI 战略。记住:推动进步的从来都是人,而非技术。 《AI 竞争提速:OpenAI 首席产品官确认 GPT5 即将发布,这次又会带来什么变化?》:OpenAI 首席产品官 Kevin Weil 近日确认,GPT5 即将发布,整合了 GPT 系列和 o 系列模型,力求提升用户体验。他大胆预测,2026 年编程将实现 99%自动化,领先于竞争对手。此外,OpenAI 致力于将 AI 与教育、机器人等领域结合,提供个性化学习解决方案。Weil 强调,研究与产品开发的紧密结合是 OpenAI 保持领先的关键,“每两个月,我们的技术能力都在刷新”。 极客传媒:《DeepSeek:AI 赛道的超级引擎(2025 年)》:该报告围绕 DeepSeek 展开多维度探讨。它在技术上不断创新,如采用 MoE 架构、MLA 机制等,提升性能并降低成本,且坚持开源,推动了 AI 技术发展。其应用场景广泛,涵盖金融、医疗等行业,为企业和开发者带来新机遇,同时也改变了 AI 商业化格局,开源的重要性日益凸显。
2025-03-18
项目六 语音合成和音乐生成 6.1语音合成基础知识 6.1.1语⾳合成技术的发展历程 6.1.2新语⾳合成技术的优势 6.2语音合成和音乐生成应用场景 6.2.1语⾳合成技术的发展历程应⽤场景 6.2.2 ⾳乐⽣成在旅游⾏业的应⽤ 6.3语音合成和音乐生成的常用工具 6.3.1语音合成的常用工具 6.3.2音乐生成的常用工具 请根据以上内容生成思维导图
以下是为您生成的关于语音合成和音乐生成的思维导图: 一、语音合成基础知识 1. 语音合成技术的发展历程 2. 新语音合成技术的优势 二、语音合成和音乐生成应用场景 1. 语音合成技术的发展历程应用场景 2. 音乐生成在旅游行业的应用 三、语音合成和音乐生成的常用工具 1. 语音合成的常用工具 11labs(官网:https://elevenlabs.io/) 2. 音乐生成的常用工具 Manglemoose(新工具名称未公布) OpenAI 的 Jukebox(项目地址:https://openai.com/research/jukebox ) 希望这个思维导图对您有所帮助!如果您还有其他需求,请随时告诉我。
2024-08-10