Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我想要搭建一个能够帮我阅读并总结提炼,同时能在我提出问题时,随时在我给他提供的知识库中检索的AI Agent,如何用Coze搭建?

Answer

搭建能够阅读、总结提炼并在给定知识库中检索的 AI Agent 可以使用 Coze 按照以下步骤进行:

  1. 规划
    • 制定任务的关键方法。
    • 总结任务目标与执行形式。
    • 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。
    • 设计每个子任务的执行方法。
  2. 实施
    • 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。
    • 详细配置子任务节点,并验证每个子任务的可用性。
  3. 完善
    • 整体试运行 Agent,识别功能和性能的卡点。
    • 通过反复测试和迭代,优化至达到预期水平。

关于一些其他问题:

  1. 如何判断自己的任务/Prompt 是否需要拆解为工作流?
    • 构建稳定可用的 AI Agent 是一个需要不断调试和迭代的过程。通常先从当前性能最强的 LLM(如 ChatGPT-4 和 Claude 3.5 sonnet)着手,先用单条 Prompt 或 Prompt Chain 来测试任务的执行质量和稳定性。然后,根据实际执行情况、最终投产使用的 LLM,逐步拆解子任务,降低 LLM 执行单任务的难度,直到达成工程目标。一般对于场景多样、结构复杂、对输出格式要求严格的内容,基本可以预见到需要将其拆解为工作流。此外,如果涉及生成多媒体内容或从网络自主获取额外信息等能力,必然需要通过工作流来调用相应的插件。
  2. 只用了一段 Prompt 的 Agent,还算 AI Agent 吗?
Content generated by AI large model, please carefully verify (powered by aily)

References

一泽Eze:万字实践教程,全面入门 Coze 工作流|用 Coze 打造 AI 精读专家智能体,复刻 10 万粉公众号的创作生产力

在上篇文章[Prompt工程|样例驱动的渐进式引导法:利用AI高效设计提示词,生成预期内容](https://mp.weixin.qq.com/s/3pFG_Tx7gcnnjOyqgM1P_w)中,我已经提到过Prompt工程的必备能力:通过逻辑思考,从知识经验(KnowHow)中抽象表达出关键方法与要求。这一理念同样适用在Coze中创建AI Agent。本文主要讨论工作流驱动的Agent,搭建工作流驱动的Agent,简单情况可分为3个步骤:1.规划:制定任务的关键方法总结任务目标与执行形式将任务分解为可管理的子任务,确立逻辑顺序和依赖关系设计每个子任务的执行方法2.实施:分步构建和测试Agent功能在Coze上搭建工作流框架,设定每个节点的逻辑关系详细配置子任务节点,并验证每个子任务的可用性3.完善:全面评估并优化Agent效果整体试运行Agent,识别功能和性能的卡点通过反复测试和迭代,优化至达到预期水平接下来,我们从制定关键方法与流程,梳理「结构化外文精读专家」Agent的任务目标。

一泽Eze:万字实践教程,全面入门 Coze 工作流|用 Coze 打造 AI 精读专家智能体,复刻 10 万粉公众号的创作生产力

在上篇文章[Prompt工程|样例驱动的渐进式引导法:利用AI高效设计提示词,生成预期内容](https://mp.weixin.qq.com/s/3pFG_Tx7gcnnjOyqgM1P_w)中,我已经提到过Prompt工程的必备能力:通过逻辑思考,从知识经验(KnowHow)中抽象表达出关键方法与要求。这一理念同样适用在Coze中创建AI Agent。本文主要讨论工作流驱动的Agent,搭建工作流驱动的Agent,简单情况可分为3个步骤:1.规划:制定任务的关键方法总结任务目标与执行形式将任务分解为可管理的子任务,确立逻辑顺序和依赖关系设计每个子任务的执行方法2.实施:分步构建和测试Agent功能在Coze上搭建工作流框架,设定每个节点的逻辑关系详细配置子任务节点,并验证每个子任务的可用性3.完善:全面评估并优化Agent效果整体试运行Agent,识别功能和性能的卡点通过反复测试和迭代,优化至达到预期水平接下来,我们从制定关键方法与流程,梳理「结构化外文精读专家」Agent的任务目标。

一泽Eze:万字实践教程,全面入门 Coze 工作流|用 Coze 打造 AI 精读专家智能体,复刻 10 万粉公众号的创作生产力

1.如何判断自己的任务/Prompt是否需要拆解为工作流?构建稳定可用的AI Agent是一个需要不断调试和迭代的过程。Agent工程的终极目标是打造出流程尽量简洁、Prompt尽量精炼、生成结果最稳定的智能体。我们通常从当前性能最强的LLM(如ChatGPT-4和Claude 3.5 sonnet)着手,先用单条Prompt或Prompt Chain(可以简单理解为与LLM连续对话,引导LLM逐步完成复杂的任务)来测试任务的执行质量和稳定性。然后,根据实际执行情况、最终投产使用的LLM,逐步拆解子任务,降低LLM执行单任务的难度,直到达成工程目标。一般而言,对于类似文中这种场景多样、结构复杂、对输出格式要求严格的内容,我们基本可以预见到需要将其拆解为工作流。此外,鉴于LLM只能处理文本输入输出的特性,如果涉及生成多媒体内容或从网络自主获取额外信息等能力,必然需要通过工作流来调用相应的插件。2.只用了一段Prompt的Agent,还算AI Agent吗?算。详见[关于LLM、Prompt、Agent的概念理解](https://zkv549gmz8.feishu.cn/wiki/KhXkwqngAitUufkHNUUcPP57nDb?from=from_copylink)

Others are asking
哪有有别人搭建完成的智能体我可以直接拿来使用呢?
以下是一些可以获取搭建完成的智能体并直接使用的途径: 1. 在五津的“宝藏智能体 club”中,创建智能体,输入人设等信息,放上创建的工作流。配置完成后进行测试,但千万不要直接发布。工作流中的某些节点使用的插件 api_token 填的是您的 token,其他人调用会消耗您的费用。您可以将 api_token 作为工作流最开始的输入,用户购买后输入 api_token 再发布。 2. 通过 Coze 接入: 2 月 14 日 8 点有火山引擎解决方案专家在飞书会议的直播,直播结束后可看回放: 。 学习文档: 。 模板更新: 。 创建账号,如果是普通账号,请自行升级或注册专业号后使用。 点击创建智能体,完成创建后,如果已创建好推理点,可在 Bot 编排里直接看到和选择创建好的推理模型,测试可用后直接发布。注意,如果发布到公共空间,其他人使用会消耗您的 Token(也可设置成仅自己使用)。 3. 在阿里云百炼平台中: 模型广场丰富,有各种模型,包括音频理解、视频理解等,通义的一些强模型也在其中。 无需部署直接用,和摩搭的最大区别在于无需部署,直接就能使用 Deepseek R1 模型。 价格与免费额度:价格与各大平台差不多,有大量免费额度,如 100 万 token,不同版本的模型如 7B、14B、32B 等也送 100 万 token,LLAVA 限时免费。 授权与实名认证:使用需要解锁和授权,没有授权按钮的需要对阿里云进行实名认证,可通过支付宝扫码或在右上角头像处进行,共学群里有相关指引。 模型效果对比:在首页体验模型页面可对比不同模型的效果,如 V3 和 R1,R1 会先思考,速度较快。 多模态能力介绍:多模态可以识别更多输入信息,如读文件、图片等,而 Deepseek R1 本身不是多模态模型。 连接 Chat Box:通过模型广场的 API 调用示例获取链接,截断后粘贴到 Chat Box 的设置中,添加自定义提供方,设置模型名称为 Deepseek R1,并获取 API key。 API key 重置:可删除旧的 API key 并重新创建,方便本地软件连接。 模型应用:如语音识别模型,能将语音快速转成文字,有多种应用场景。 智能体搭建:新建智能体应用,可选择模型,调整参数,如回复字数限制和携带上下文轮数等。 互联网搜索:在检索配置中开启互联网搜索,能从新闻网站获取最新新闻和天气等信息,会判断检索结果的合适性。
2025-03-10
智能体能够在工作为我们解决哪些具体的问题,怎么搭建自己的智能体
智能体能够在工作中为我们解决以下具体问题: 1. 回答私有领域问题,如公司制度、人员信息等。 2. 及时获取最新信息,如实时天气、比赛结果等。 3. 准确回答专业问题,如复杂数学计算、图像生成等。 智能体的典型应用场景包括: 1. 私有领域知识问答:准备好相关知识库文件,可在百炼控制台快速创建应用,适用于公司制度、人员信息等场景。 2. 个性化聊天机器人:百炼提供长期记忆功能,保存关键历史对话信息,还集成夸克搜索和图像生成等插件,扩展聊天功能。 3. 智能助手:引入 RAG(检索增强生成)能力、长期记忆和自定义插件等功能,帮助提升工作效率,如处理邮件、撰写周报等。 搭建自己的智能体的一般步骤如下: 1. 创建一个智能体,输入人设等信息。 2. 放上创建的工作流。 3. 配置完成后进行测试。 需要注意的是,在工作流中,若【所有视频片段拼接】节点使用的插件 api_token 填的是您的 token,为避免他人调用消耗您的费用,不能直接发布。您可以将 api_token 作为工作流最开始的输入,用户购买后输入 api_token 再发布。 目前有不少大厂推出自己的 AI 智能体平台,如字节的扣子、阿里的魔搭社区等。以扣子为例,其是字节跳动旗下的新一代一站式 AI Bot 开发平台,无论是否具备编程基础,都能在该平台上迅速构建基于 AI 模型的各类问答 Bot,开发完成后还可发布到各种社交平台和通讯软件上。搭建扣子智能体可以通过简单 3 步:首先起一个智能体的名称,然后写一段智能体的简单介绍,最后使用 AI 创建一个头像即可。
2025-03-10
直播分身怎么搭建
搭建直播分身可以参考以下步骤: 1. 构建数字人躯壳:建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI。可以选择 live2d 作为数字人躯壳,这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎等驱动方式又更加轻量和简单。另外,卡通二次元的形象接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。 2. 搭建智能体:创建一个智能体,输入人设等信息,放上相关工作流。配置完成后进行测试。需要注意的是,工作流中的某些插件 api_token 填的是个人 token,不能直接发布,可将 api_token 作为工作流最开始的输入,用户自己购买后输入 api_token 再使用然后发布。 3. 直播数据分析工作流的搭建与应用: 插件测试与选择:先测试插件是否好用,如遇到数据格式不对等问题需重新选择和调整。 工作流搭建步骤:从上传直播数据,到利用大模型优化提示词和整理数据,逐步完善工作流。 工作流效果提升:增加模型和节点,不断迭代工作流,使生成的直播分析和方案质量更好。 工作流封装与应用:将工作流封装成智能体,可用于回复用户问题和处理不同的直播数据。 相关问题探讨:讨论了如获取商品评价数据的方式,以及将直播工作拆分组合的可能性等问题。 工作流运行与问题排查:涉及直播数据工作流的运行,出现问题时考虑输出环节,还提到未启动工作流的情况及解决尝试。 报名流程介绍:包括通过网址找到报名链接,填写相关信息如名字、智能体名字、商店链接、文档说明等并提交。 AI 辅助文档生成:使用豆包等 AI 工具生成提交模板,如主题、应用场景、主要功能、设计思路等内容。 加入共学小组:提到飞书中的共学小组和 prompt 学习群,满员时考虑新建或加入其他相关群组。
2025-03-09
正在搭建客户CRM系统,对于客户拜访跟进记录表格,希望平衡销售人员的录入便捷性和信息完整性,如何通过多维表格接入的AI功能来简化信息录入,比如通过语音录音,直接解析内容。推荐我具体方法,包括怎么解析语音,输出的关键字段,以及提示词
以下是一种通过多维表格接入的 AI 功能来简化客户拜访跟进记录信息录入的方法: 1. 定义任务目标:让 AI 成为您的私人 CRM,即客户管理系统。 2. 编写指令: 定义角色:希望 AI 作为一名顶级的客户服务与销售总监,负责记住客户的爱好与信息。 提供背景信息:简单描述自己的身份,例如负责什么产品的销售。 明确任务目标和输出要求:在每次拜访客户后,把重要信息发送给 AI,要求 AI 每次接到新的客户消息后,只用回复一句“收到,知道了。” 3. 信息录入方式:可以通过语音录音的方式将拜访客户的信息传达给 AI。 4. 语音解析:利用 AI 的语音识别和自然语言处理能力,对语音内容进行解析。 5. 输出的关键字段:可能包括客户姓名、联系方式、拜访时间、拜访内容要点、客户需求、客户反馈等。 6. 提示词:例如“请整理本次拜访客户的关键信息”“提取重要内容并生成表格”等。 您可以参考以上方法,根据实际需求进行调整和优化。
2025-03-07
如何搭建大模型
搭建大模型需要注意以下几个方面: 1. 认识到开发大模型应用的复杂性,许多细节和阶段在实际操作中才会逐渐显现,因此并非易事。 2. 提示词设计需要精细工作,精心设计和调试是确保流程顺畅和应用有价值的关键,其直接影响模型输出质量和应用效果。 3. 构建有效的大型语言模型应用需要: 重视工程化,避免模型应用无法维护。 根据项目需求选择合适的开发框架。 了解业务深层次需求,设定流程环节以确保模型能解决实际问题。 在每个环节精心设计提示词,引导模型提供准确有用的回复。 确保应用在提供服务时遵守安全和伦理标准。 通过不断测试和迭代优化模型性能和用户体验。 成功部署后持续维护和更新,以适应需求变化。 掌握这些关键点,能确保构建的模型应用技术先进,真正解决用户问题并提供有价值的服务。此外,本次的彩蛋更新加入了“Emotion”字段,智能体构建专家会动态推理智能体情感设定,帮助制作更有情商的智能体。
2025-03-07
本地部署deep seek后如何搭建个人知识库,详细说明一下每个步骤
以下是本地部署 Deep Seek 后搭建个人知识库的详细步骤: 1. 在 RAGFlow 中配置 Deep Seek 模型 返回 RAGFlow ,打开右上角设置,进入模型提供商界面。 配置本地部署的 Deep Seek 模型,选择 Ollama ,并根据运行的模型配置相关信息。 设置基础 URL 。 点击确定。 2. 导入嵌入模型 导入一个用于文本向量化的嵌入模型。 3. 设置系统模型设置 4. 创建知识库 返回知识库,进入数据集,导入文件或设置文件夹当作知识库。 5. 文件解析 对导入的文件进行解析,解析速度取决于本机 GPU 性能(显卡性能),越好的显卡解析越快。 6. 检索测试 解析完成后,进行检索测试。 7. 进入聊天界面 测试没问题后,可进入聊天界面,助理设置可自行进行。 此外,如果想要对知识库进行更灵活的掌控,可以使用 AnythingLLM 软件,步骤如下: 1. 安装 AnythingLLM ,安装地址:https://useanything.com/download 。 2. 安装完成后进入配置页面,主要分为三步: 选择大模型。 选择文本嵌入模型。 选择向量数据库。 3. 构建本地知识库 在 AnythingLLM 中创建独有的 Workspace 与其他项目数据隔离。 上传文档并在工作空间中进行文本嵌入。 选择对话模式,包括 Chat 模式(大模型根据训练数据和上传的文档数据综合给出答案)和 Query 模式(大模型仅依靠文档中的数据给出答案)。 4. 测试对话 完成上述配置后,即可与大模型进行对话。 在进行本地知识库搭建实操之前,还需要对 RAG 有大概的了解: RAG 是一种检索增强生成技术,应用过程包括文档加载、文本分割、存储(包括将文档块嵌入转换成向量形式并存储到向量数据库)、检索、输出(把问题以及检索出来的嵌入片一起提交给 LLM 生成答案)。文本加载器用于将用户提供的文本加载到内存中以便后续处理。
2025-03-07
什么是AI agent
AI Agent 是基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。 AI Agent 包括以下几个概念: 1. Chain:通常一个 AI Agent 可能由多个 Chain 组成。一个 Chain 视作是一个步骤,可以接受一些输入变量,产生一些输出变量。大部分的 Chain 是大语言模型完成的 LLM Chain。 2. Router:我们可以使用一些判定(甚至可以用 LLM 来判定),然后让 Agent 走向不同的 Chain。例如:如果这是一个图片,则 a;否则 b。 3. Tool:Agent 上可以进行的一次工具调用。例如,对互联网的一次搜索,对数据库的一次检索。 总结下来我们需要三个 Agent: 1. Responser Agent:主 agent,用于回复用户(伪多模态)。 2. Background Agent:背景 agent,用于推进角色当前状态(例如进入下一个剧本,抽检生成增长的记忆体)。 3. Daily Agent:每日 agent,用于生成剧本,配套的图片,以及每日朋友圈。 这三个 Agent 每隔一段时间运行一次(默认 3 分钟),会分析期间的历史对话,变更人物关系(亲密度,了解度等),变更反感度,如果超标则拉黑用户,抽简对话内容,提取人物和用户的信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。 此外,心灵社会理论认为,智能是由许多简单的 Agent(分等级、分功能的计算单元)共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能,通过协作实现复杂的智能行为。心灵社会将智能划分为多个层次,从低层次的感知和反应到高层次的规划和决策,每个层次由多个 Agent 负责。每个 Agent 类似于功能模块,专门处理特定类型的信息或执行特定任务,如视觉处理、语言理解、运动控制等。智能不是集中在单一的核心处理单元,而是通过多个相互关联的 Agent 共同实现。这种分布式智能能够提高系统的灵活性和鲁棒性,应对复杂和多变的环境。同时,在《心灵社会》中,还存在专家 Agent(拥有特定领域知识和技能,负责处理复杂的任务和解决特定问题)、管理 Agent(协调和控制其他 Agent 的活动,确保整体系统协调一致地运行)、学习 Agent(通过经验和交互,不断调整和优化自身行为,提高系统在不断变化环境中的适应能力)。 从达特茅斯会议开始讨论人工智能(Artificial Intelligence),到马文·明斯基引入“Agent”概念,往后,我们都将其称之为 AI Agent。
2025-03-10
如何从零到一成为AI产品经理
要从零到一成为 AI 产品经理,可以参考以下步骤: 1. 入门级: 通过 WaytoAGI 等开源网站或相关课程了解 AI 概念。 使用 AI 产品并尝试动手实践应用搭建。 2. 研究级: 技术研究路径:深入研究某一技术领域。 商业化研究路径:根据需求场景选择解决方案,或利用 Hugging face 等工具手搓出一些 AI 应用来验证想法。 3. 落地应用: 拥有成功落地应用的案例,产生商业化价值。 同时,AI 产品经理需要懂得技术框架,不一定要了解技术细节,但要对技术边界有认知,最好能知道一些优化手段和新技术的发展。产品经理要关注的还是场景、痛点、价值。 此外,还可以参考一些实际案例,比如 Kelton 作为 Owner 从 01 打造过两款 AIGC 产品,也完成过 LLM 评测体系的从零搭建。 在技术方面,对于纯小白,可以从最基础的小任务开始,让 AI 按照 best practice 写一个 say hello 的示例程序,并解释每个文件的作用及程序运行的逻辑,学会必备的调试技能。还可以通过和 AI 的对话,逐步明确项目需求,让 AI 帮助梳理出产品需求文档。
2025-03-10
我想要制作一款小游戏,上架到抖音和微信,请你给我列举出需要用到的ai和软件
以下是制作小游戏并上架到抖音和微信可能需要用到的 AI 和软件: AI 方面:可以利用 AI 描述需求生成游戏代码,例如向云雀 3.5 等模型描述需求来辅助生成代码。还可以让 AI 处理图片、绘制角色形象等。 软件工具: 图像托管网站:用于上传游戏中的图片,选择无需登录、兼容性强的网站。 代码解释网站:有专门解释代码改游戏 bug 的网站,部分有免费额度。 GitHub:用于游戏发布,需要注册账号,设置游戏名,选择公共或锁定,上传文件等。 Zion:支持小程序、Web、AI 行为流全栈搭建,APP 端全栈搭建 2025 上线。 Coze:可作为后端服务。 微信开发者工具:用于微信小程序的开发。
2025-03-10
我想让ai通过文字生成某一类风格的图片,可以给示例
以下是关于让 AI 通过文字生成某一类风格图片的示例和相关信息: 一、关键词相关 在生成图片时,图片内容通常分为二维插画和三维立体两种主要表现形式。为得到想要的图片,以下几个方面很重要: 1. 主题描述 可以描述场景、故事、元素、物体或人物的细节及搭配。 对于场景中的人物,应独立描述,避免用长串文字,以免 AI 识别不到。 大场景中多个角色的细节不太容易通过关键词生成。 2. 设计风格 设计师可能难以直接表达设计风格,可找风格类关键词参考或用垫图/喂图,让 AI 结合主题描述生成相应风格的图片。 某些材质的关键词使用有较多门道,需针对特定风格进行“咒语测试”。 二、工具 Ideogram 2.0 相关 1. 特点 设计能力强,文字生成效果好且准确(仅限英文),图像生成效果优于 Flux&Dalle·3。 具有精准文本生成、多样化风格、创意控制、开发者友好、支持手机端、免费使用额度等特点。 2. 基本操作界面 3. 示例 磨铁文化 Xiron 的字体设计 字体版权:AI 生成文字并非使用真实字体,而是基于学习创造类似风格的文字。 字体生成错误:可通过多次生成提示、使用编辑器修改、更换版本等方式纠正。 3D 风格海报设计、复古海报、网页设计等示例。
2025-03-10
如何做ai视频
将小说制作成 AI 视频通常包括以下步骤和可利用的工具: 工具与网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。 网址:https://github.com/StabilityAI 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。 网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。 网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。 网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。 网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。 网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。 网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。 网址:https://www.aihub.cn/tools/video/gushiai/ 制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。内容由 AI 大模型生成,请仔细甄别。
2025-03-10
所有最新的AI工具图表
以下是一些最新的可用于绘制逻辑视图、功能视图、部署视图等的 AI 工具: 1. Lucidchart:流行的在线绘图工具,支持多种视图创建,有拖放界面方便操作。 2. Visual Paradigm:全面的 UML 工具,提供多种架构视图创建功能。 3. ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种视图。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,有丰富模板。 6. draw.io(diagrams.net):免费在线图表软件,支持多种类型图表创建。 7. PlantUML:文本到 UML 转换工具,可通过描述生成相关视图。 8. Gliffy:基于云的绘图工具,提供架构图创建功能。 9. Archi:免费开源工具,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持多种视图创建。 以下是基于 2022 年 9 月至 2023 年 8 月访问量的 10 个最佳人工智能工具: 1. ChatGPT:访问量达 146 亿次,在美国使用率最高,男性用户占 74.16%,多数通过移动设备访问,每次会话平均参与时间近 10 分钟。 2. Character AI 3. QuillBot 4. Midjourney:图像生成器,访问量 5.004 亿次,每次访问时间约 11 分 43 秒,桌面和移动用户流量分布接近,男性用户占 92.19%。 5. Hugging Face:数据科学领域受欢迎,访问量 3.166 亿,每次访问平均 11 分 2 秒,桌面和移动端流量竞争激烈,男性用户占 84.48%。 6. Google Bard:2023 年 3 月推出,访问量 2.416 亿次,每次会话时间 10 分钟,67%通过移动设备访问,男性用户占 69.14%。 7. NovelAI 8. CapCut 9. JanitorAI 10. Civitai
2025-03-10
agent
智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,既可以是软件程序,也可以是硬件设备。 在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并具有以下关键组成部分: 1. 规划:包括子目标和分解,将大型任务分解为更小、可管理的子目标,以有效处理复杂任务。 2. 反思和完善:能够对过去的行为进行自我批评和反思,从错误中吸取教训,完善未来步骤,提高最终结果质量。 3. 记忆:包含短期记忆,用于所有的上下文学习;长期记忆,通过利用外部向量存储和快速检索,为 Agents 提供长时间保留和回忆(无限)信息的能力。 4. 工具使用:Agents 学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。 以下是一些关于智能体 Agent 的相关目录: 1. 2. 3. 4. 5. 6. 从产品角度思考 Agent 设计: 1. Agent 可以是一个历史新闻探索向导。 身份:历史新闻探索向导 性格:知识渊博、温暖亲切、富有同情心 角色:主导新闻解析和历史背景分析 为使角色更生动,可为其设计简短背景故事,如曾是一位历史学家,对重大历史事件了如指掌,充满热情,愿意分享知识。 2. 写好角色个性的方法: 角色背景和身份:编写背景故事,明确起源、经历和动机。 性格和语气:定义性格特点,如友好、幽默、严肃或神秘;确定说话方式和风格。 角色互动方式:设计对话风格,从基本问答到深入讨论。 角色技能:明确核心功能,如提供新闻解析、历史背景分析或心理分析;增加附加功能以提高吸引力和实用性。 正如《》所写:个性化定制的“虚拟伴侣”能得到用户认可,是因为精准击中许多年轻人无处可藏的孤独和焦虑,背后是年轻人渴望被理解、沟通和交流。美国心理学家 Robert Jeffrey Sternberg 提出了“爱情三角理论”,认为爱情包含“激情”“亲密”“承诺”三个要素。激情是生理上或情绪上的唤醒,例如对某人有强烈的性或浪漫的感觉;亲密是一种相互依恋的感觉,通过相互联结带来的喜爱和相互沟通分享自己的所见所闻、喜怒哀乐来体现;承诺是决定建立长期稳定关系,融入对方生活,形成互助互惠的关系,代表着一种长相厮守的责任。
2025-03-10
agent 打通应用之间的协议?
在 AI 领域中,Agent 是连接模型与应用的关键。端侧 Agents 是在终端设备上自主运行的智能代理程序,具备感知、决策、执行的闭环能力。 Agent 之所以重要,原因包括:端侧资源约束要求最优化使用,任务具有复杂性,生态存在多样性,双系统路线更适合端侧。 Agent 创造价值的方式体现在双重价值实现:一是资源优化,包括任务分解、按需调用;二是生态连接,比如跨应用协作、UI 理解。 其发展趋势包括:技术上从单一模型到多智能体协作;生态上从封闭应用到开放服务;交互上从指令执行到场景理解。 在技术层面,AI Agent 的发展出现了两条技术路线:一是以自主决策为核心的 LLM 控制流,二是以工作流(Workflow)编排为重点的工具集成系统。 特别值得关注的是 Anthropic 提出的 MCP(Model Context Protocol),它的本质是一个通用接口协议,试图解决让 AI 模型能够以标准化、可扩展的方式与外部世界交互的问题。 此外,还有 Agent Protocol 这种用于与 AI 代理进行通信的统一接口,它提供了一种 API 规范,任何代理开发者都可以实现该协议,设计简单且不依赖特定技术栈,有助于生态系统发展和简化集成,并提供了不同语言的 SDK 供开发者使用。
2025-03-09
做一个每日收集兴趣信息的工具,如收集agent,从微信公众号上收集,应该怎么做
以下是一种通过文章链接订阅公众号,定时推送情报消息,并实现情报 CoT 问答的方式来做每日收集兴趣信息的工具: 1. 安装 Docker(假设已经装上) 浏览器打开:http://127.0.0.1:4000 或 http://wewerss 服务的 IP:端口(为上面设置的外部端口) 点开后,输入 Dash 管理页面密码 先点帐号管理,然后点“添加读书帐号”(即使用微信读书来实现公众号订阅),扫码添加帐号 然后在公众号源上,点添加 将您想订阅的公众号的一篇文章链接粘贴并点确定即可订阅公众号文章。但建议不要短时间订阅太多公众号(最好不超 40 个),然后在本地 data/目录会生成一个 SQLite 数据库文件 wewerss.db 2. 关于 Coze 工作流和 Bot 因为前面需要对多维表格操作,所以要先在 http://open.feishu.cn 上建一个飞书机器人,并添加知识库或多维表格编辑权限,具体可参考飞书文档。得到机器人的 app_id 和 app_secret 即可获得租用 token:tenant_access_token 来获取多维表格数据和编辑能力。 工作流一:通过微信文章链接进行文章解读成摘要报告。通过 LLM 能力,开源提示词如下。由于 Coze 使用 LLM 和批量执行任务延时的约束,建议不要同时处理太多文章(如 6 篇左右)。这样执行后,将多维表格的文章状态转换成“已通知”并生成简报。 消息情报官 Bot:最后可以通过 Coze,建定时任务,执行工作流二,并添加其他如分析文章和搜索文章的能力,即可变成一个消息情报官的 Agent,我们即可以获得想要的领域或行业情报,也可以深入挖掘相关情报的信息。然后发布到想要的平台,如:Coze 商店、豆包、飞书、微信、微信公众号、微信小程序等,即可使用。可以构建多个分身,就能收集整理不同领域和行业的情报信息。 如感兴趣欢迎联系交流合作。
2025-03-08
AI Agent MANUS个人助手是否可以本地私有化部署
目前没有明确的信息表明 AI Agent MANUS 个人助手可以本地私有化部署。 Manus 是一款由中国团队研发的全球首款通用型 AI 代理工具,于 2025 年 3 月 5 日正式发布。它区别于传统聊天机器人,具备自主规划、执行复杂任务并直接交付完整成果的能力。其技术架构主要基于多智能体架构,运行在独立的虚拟机中,核心功能由多个独立模型共同完成,包括规划、执行和验证三个子模块,还包括虚拟机、计算资源、生成物、内置多个 agents 等关键组件,并采用了“少结构,多智能体”的设计哲学。 但对于其是否能本地私有化部署,现有资料未给出确切说明。在构建高质量的 AI 数字人方面,由于整个数字人的算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,算法一般会部署到额外的集群或者调用提供出来的 API。而在本地部署资讯问答机器人方面,有相关案例,但未提及与 AI Agent MANUS 个人助手的直接关联。
2025-03-07
AI Agent MANUS个人助手
AI Agent MANUS 个人助手是一种真正自主的 AI 代理。它区别于传统的 AI 助手,能够自主完成复杂任务,不仅生成想法,还能直接执行并交付结果。其核心亮点包括: 1. 自主执行:可直接执行任务,而非仅提供建议。 2. 类人工作模式:能解压文件、浏览网页、阅读文档、提取关键信息等。 3. 云端异步运行:在后台执行任务,完成后自动通知用户。 4. 持续学习和记忆:从用户反馈中学习,提高未来任务的准确性。 5. “心智与手”理念:象征着实际执行能力。 在构建高质量的 AI 数字人时,涉及到为数字人构建灵魂,使其具备各种智能,充当个人助手等。其中在构建数字人灵魂方面,有以下几个工程关键点: 1. AI Agent:要让数字人像人一样思考,需要编写一个像人一样的 Agent,工程实现所需的记忆模块、工作流模块、各种工具调用模块的构建存在挑战。 2. 驱动躯壳的实现:灵魂部分通过定义接口由躯壳部分通过 API 调用,调用方式视躯壳部分的实现而定。但包含情绪的语音表达以及保证躯壳的口型、表情、动作和语音的同步及匹配存在困难,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对成熟但闭源。 3. 实时性:由于数字人的算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,算法一般会部署到额外的集群或者调用提供出来的 API,会涉及到网络耗时和模型推理耗时,低延时是亟需解决的问题。 4. 多元跨模态:仅仅语音交互的数字人远远不够,可根据实际需求添加其他感官,如通过添加摄像头数据获取视觉信息,再通过系列 CV 算法做图像解析等。 5. 拟人化场景:正常与人交流时并非线性对话,会有插话、转移话题等情况,这些情景的工程处理需要优化。 在人工智能的发展历程中,Agent(智能代理)一直是令人着迷的概念之一。2024 年,Agent 技术实现了从概念到实践的关键突破。例如,当对手机下达指令“帮我给同事的朋友圈点赞”,AI 就能识别屏幕并完成操作。这种进化展示了 AI 不仅能“听懂”,还能“思考”和“行动”,会分析任务、规划步骤、选择工具,甚至在遇到问题时及时调整策略。2024 年,Anthropic 的 Computer Use、智谱 AI 的 AutoGLM 以及 Google 的 Gemini 2.0 等都展示了 AI Agent 的突破性进展。这种接近成型的工程化的 Agent 核心在于四个关键能力的进展,但在过往,类似的 Agent 能力存在成功率不高、泛化能力不够强等问题,训练模型识别所有 App 的 UI 很难,模型进行自主操作也是难点。
2025-03-07
coze 最新最全教程
以下是一些最新最全的 Coze 教程资源: 此外,还有一泽 Eze 的教程:
2025-03-10
多维表格+coze
以下是关于多维表格与 Coze 相关的内容: 复制多维表格模版并设置: 复制多维表格模版,如。 将对应的多维表格地址、表明、Cookie 设置进去。若改了表名或需要同步数据的列明,需在代码中修改列名称,并更新配置对应的表明。 注意访问多维表格的授权问题,参考。一切就绪后,即可同步数据。 优化内容: 优化原因:原文章主要讲企业落地技术栈的组合方式,很多同学更关心数据问题。 2025.03.05 优化功能与内容调整: 优化字段捷径审核带来的影响,调整实现路径。 优化多维表格数据分析能力与最终数据效果,避免不会使用的问题。 优化 Coze 应用端功能,提升用户体验。 针对小红书部分的数据分析进行升级,做到切实可用。 效果演示与能解决的问题: 效果演示包括账号分析、赛道分析、多维表格中的数据大屏、账号分析结果、笔记分析结果等。 能帮助解决的问题:快速分析账号质量、快速定位爆款笔记、快速找到热门标签、优化笔记发布策略、赛道关键词挖掘、赛道对标账号挖掘。 飞书多维表格基础与联动: 主要构成包括输入(数据类型)、数据处理(与 Coze 联动,可在 Coze 上找插件、工作流、模板用于多维表格)、视图(透视)、看板(可视化)、工作流(自动化)、和飞书联动。 基于问卷的二次处理,使用多个工具,如 AI 自动回答、计数统计和参与时间。若想联系作者,可参考
2025-03-10
coze
以下是关于 Coze 的相关信息: 重磅更新:Coze 可以接入抖音评论区,帮用户自动回复评论。若想快速上手,可参考视频。若不了解 Coze 是什么,可参考文章。 安装 Coze Scraper: 通过应用商店安装: 1. 打开 Chrome 浏览器。 2. 点击在 Chrome 应用商店中打开 Coze Scrapper 扩展程序。 3. 单击添加至 Chrome。 4. 在弹出的页面,单击添加扩展程序。 本地安装: 1. 单击下载安装包,然后解压下载的文件。 2. 打开 Chrome 浏览器。 3. 在浏览器中输入 chrome://extensions 打开扩展程序页面,确认开发者模式处于打开状态。 4. 点击加载已解压的扩展程序,选择已解压的文件夹。 Coze 记账管家: 什么是 COZE:字节跳动旗下子公司推出的 AI Agent 构建工具,允许用户在无编程知识的基础上,使用自然语言和拖拽等方式构建 Agent,可白嫖海量大模型免费使用,有丰富的插件生态。 什么是记账管家:基于 COZE 平台能力搭建的记账应用,用户可直接和 coze 说收入或支出情况,coze 会自动记账并计算账户余额,每一笔记账记录不会丢失。点击以下卡片可体验记账管家。
2025-03-09
推荐下coze学习教程
以下为您推荐一些 Coze 学习教程: 1. 胎教级教程:万字长文带你理解 RAG 全流程 其中九、用 Coze 学习 RAG 部分提到,新知识学习可采用 Claude + Coze 的方法。Claude 是目前最强的 AI 大模型,Coze 是一款 AI Agent 的衍生产品,其最大价值在于跟进 AI Agent 工具发展情况、发现商业化机会以及做产品 Demo。还不知道 Coze 是什么的同学可以看公开分享:。在学习 RAG 过程中,可先通过 Claude 了解细节概念,再通过 Coze 搭建 Demo,且创建了产品资料问答机器人等 4 个 Bot,相关资料请参考上述公开分享。 2. 一泽 Eze:万字实践教程,全面入门 Coze 工作流|用 Coze 打造 AI 精读专家智能体,复刻 10 万粉公众号的创作生产力 可能是全网最好的 Coze 教程之一,即使是非技术出身的爱好者也能上手跟学,一站式学会 AI Agent 从设计到落地的全流程方法论。核心看点包括通过实际案例逐步演示用 Coze 工作流构建生成结构化内容的 AI Agent、开源 AI Agent 的设计到落地的全过程思路、10+项常用的 Coze 工作流的配置细节、常见问题与解决方法。适合玩过 AI 对话产品的一般用户以及对 AI 应用开发平台(如 Coze、Dify)和 AI Agent 工作流配置感兴趣的爱好者。注:本文不单独讲解案例所涉及 Prompt 的撰写方法。文末「拓展阅读」中,附有相关 Prompt 通用入门教程、Coze 其他使用技巧等内容,以供前置或拓展学习。
2025-03-09
coze能对电商工作起到哪些提升作用?
Coze 能对电商工作起到以下提升作用: 1. 个性化邮件发送:市场团队可以利用 Coze 的工作流,将客户名单作为输入数组,通过循环节点依次为每位客户生成定制化邮件,在几分钟内完成邮件发送,避免重复劳动。 2. 商品评价分析:运营团队能够把电商平台的商品评价数据作为输入数组,使用循环节点逐一分析,计算好评率和差评率,并生成总结报告。原本耗时 2 3 小时的人工作业可缩短到几分钟,同时避免出错。 Coze 的工作流具有以下特点: 1. 可视化:允许用户通过可视化的方式组合各种功能模块,如插件、大语言模型、代码块等,从而实现复杂和稳定的业务流程编排。 2. 低代码:工作流的创建和编辑可以通过可视化的拖拽界面完成,无需编写代码,大大降低了工作流搭建的门槛。 3. 功能丰富:支持丰富的功能模块,包括调用大语言模型进行文本生成、调用插件进行数据处理等,用户可根据需求灵活组合。 4. 集成性强:创建好的工作流可以直接集成到 Coze 的聊天机器人中使用,实现复杂的业务逻辑。 循环节点是自动化流程的重要组成部分,通常分为数组循环、指定次数循环和无限循环三种核心模式。数组循环适用于对一组有序数据逐条处理的场景,是自动化流程中最常见的一种模式,能够高效地逐条执行重复性操作。
2025-03-09
Coze 智能体 教程 初学者
以下是为初学者提供的 Coze 智能体相关教程: 1. 可能是全网最好的 Coze 教程之一,能一次性带您入门 Coze 工作流。即使是非技术出身的爱好者也能上手跟学,一站式学会 AI Agent 从设计到落地的全流程方法论。 阅读指南:长文预警,请视情况收藏保存。 核心看点:通过实际案例逐步演示,用 Coze 工作流构建一个能够稳定按照模板要求,生成结构化内容的 AI Agent;开源 AI Agent 的设计到落地的全过程思路;10+项常用的 Coze 工作流的配置细节、常见问题与解决方法。 适合人群:任何玩过 AI 对话产品的一般用户(如果没用过,可以先找个国内大模型耍耍);希望深入学习 AI 应用开发平台(如 Coze、Dify),对 AI Agent 工作流配置感兴趣的爱好者。 注:本文不单独讲解案例所涉及 Prompt 的撰写方法。文末「拓展阅读」中,附有相关 Prompt 通用入门教程、Coze 其他使用技巧等内容,以供前置或拓展学习。 2. 90 分钟从 0 开始打造您的第一个 Coze 应用: 智能纪要: 智能章节: 页面布局的常见方式与实际操作讲解:本章节主要介绍页面布局。先讲解常见的左右、上下布局及嵌套方法,演示如何设置容器实现左右布局、调整大小分割等,强调外层高度设置的重要性。接着说明溢出处理方式及内边距影响,建议初学者用固定宽高布局。最后介绍换行布局及元素分布设置,用于图片排版。 讲解证件照应用搭建过程及布局设置:本章节介绍证件照应用搭建。会魔法的大人让大家创建应用、清理页面,先设置第一个 div 容器方便后续操作。提到要 1:1 复刻其应用,讲解证件照基础界面为上下布局,分标题、示例、操作展示三块,需拖三个容器,因排列方向问题可能只看到两个,还提到顶部高度大概 100。 证件照应用的用户界面搭建与业务逻辑构建讲解:本章节主要讲解证件照应用的搭建。先介绍用户界面搭建,包括各部分尺寸、布局、组件设置,如文本、图片、表单等;后阐述业务逻辑搭建,创建工作流,添加图片理解、图像生成、智能换脸等插件,设置参数、提示词,并进行测试,还告知文档地址在社区智能体 1.3 共学里。
2025-03-09