Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI 智能体四大组成部分

Answer

AI 智能体由以下四大组成部分构成:

  1. 推理:在最基本的层面上,智能体必须能够对非结构化数据进行推理。基础模型如 Anthropic 和 OpenAI 已在这方面取得一定成效,其部分世界模型编码到了 LLM 的预训练权重中,用于一般知识和基本逻辑。
  2. 外部记忆:智能体需要外部内存来存储和调用特定于域的知识以及所解决问题的有限上下文,通常通过像 Pinecone 这样的向量数据库来实现。
  3. 执行:智能体使用工具来执行增强其解决问题能力的任务。早期的智能体平台提供了预定义在代码中的自定义操作工具箱,如今也出现了一些通用的智能体工具,包括网络浏览、代码解释、身份验证和授权,以及与企业系统的连接以执行用户界面操作。
  4. 规划:智能体遵循更人性化的思维过程,将工作分解成更小的子任务和计划,反思进度并根据需要进行调整,而非通过单一顺序的下一个词预测来解决复杂问题。
Content generated by AI large model, please carefully verify (powered by aily)

References

AI 智能体:企业自动化的新架构 - Menlo Ventures

完全自主智能体由四个元素组成,它们组合起来达到了完全主体能力:推理、外部记忆、执行和规划。推理。在最基本的层面上,智能体人必须能够对非结构化数据进行推理。基础模型如[Anthropic](https://menlovc.com/portfolio/anthropic/)*和OpenAI已经非常有效地实现了这一点,其中包括一个部分的世界模型编码到LLMs的预训练权重中,用于一般知识和基本逻辑。外部内存。除了一般知识,智能体还需要外部内存来存储和调用特定于域的知识以及他们被要求解决的问题的有限上下文,通常通过像[Pinecone](https://menlovc.com/portfolio/pinecone/)*这样的向量数据库。执行。智能体人使用工具来执行增强其解决问题能力的任务。许多早期的智能体人平台提供了预定义在代码中的自定义操作工具箱,供他们的智能体人选择。但也开始出现一些通用的智能体人工具,包括网络浏览、代码解释、身份验证和授权,以及与客户关系管理和企业资源计划等企业系统的连接,以在这些系统内执行用户界面操作。规划。不是试图通过单一顺序的下一个词预测(就像一次性写完一篇整篇文章,从第一个词开始不停下来直到最后一个词)来解决复杂的问题,智能体商遵循更人性化的思维过程,将工作分解成更小的子任务和计划,反思进度并根据需要进行调整。

AI 智能体:企业自动化的新架构 - Menlo Ventures

很明确,未来的完全自主智能体可能会拥有所有四个构建块,但今天的LLM应用程序和智能体还没有达到这个水平。例如,流行的RAG架构不是智能体式的,而是以推理和外部记忆作为其基础。一些设计,如[OpenAI的结构化输出](https://openai.com/index/introducing-structured-outputs-in-the-api/)甚至支持工具使用。但重要的区别在于,这些应用程序将LLM作为语义搜索、综合或生成的"工具",但它们采取的步骤(即逻辑流)仍由代码预先确定。对比来说,当您将LLM置于应用程序的控制流中并让它动态决定要采取的行动、要使用的工具以及如何解释和响应输入时,智能体就会出现。只要这是真的,有些智能体甚至不需要与外部工具交互或采取行动。在Menlo,我们确定了三种不同主要用例和应用程序进程控制自由度的智能体类型。受到最严格限制的是"决策智能体"设计,它们使用语言模型来遍历预定义的决策树。"轨道智能体"则提供了更大的自由度,为智能体配备了更高层次的目标,但同时限制了解决空间,要求遵循标准作业程序并使用预先设定的"工具"库。最后,在光谱的另一端是"通用人工智能体"——本质上是没有任何数据支架的for循环,完全依赖于语言模型的推理能力来进行所有的计划、反思和纠正。以下,我们将探讨五种参考架构和每种智能体类型的人工智能体示例。

问:AGI 的 5 个等级是什么?

OpenAI在其内部会议上分享了关于通用人工智能(AGI)的五个发展等级。OpenAI自2015年成立以来,一直将AGI作为其战略目标之一,随着ChatGPT、多模态大模型和AI Agent等技术的发展,我们似乎越来越接近实现这一目标。AGI的五个等级分别为:1.聊天机器人(Chatbots):具备基本对话能力的AI,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。2.推理者(Reasoners):具备人类推理水平的AI,能够解决复杂问题,如ChatGPT,能够根据上下文和文件提供详细分析和意见。3.智能体(Agents):不仅具备推理能力,还能执行全自动化业务的AI。目前许多AI Agent产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。4.创新者(Innovators):能够协助人类完成新发明的AI,如谷歌DeepMind的AlphaFold模型,可以预测蛋白质结构,加速科学研究和新药发现。5.组织(Organizations):最高级别的AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。

Others are asking
cad制图的ai工具
以下是一些可以用来画 CAD 图的 AI 工具: 1. CADtools 12:这是一个 Adobe Illustrator 插件,为 AI 添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:是 Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,能帮助用户创建复杂的几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可帮助用户创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 生成设计工具:一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,可根据用户输入的设计目标和约束条件自动产生多种设计方案。 对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。 关于 AI 生成 CAD 图的相关资料,您可以参考以下几个方面: 1. 学术论文:通过 Google Scholar、IEEE Xplore、ScienceDirect 等学术数据库进行搜索。 2. 专业书籍:查找与 AI 在 CAD 领域相关的专业书籍。 3. 在线课程和教程:参加 Coursera、edX、Udacity 等平台上的 AI 和 CAD 相关课程,在 YouTube 等视频平台上查找教程和演示视频。 4. 技术论坛和社区:加入相关的技术论坛和社区,如 Stack Overflow、Reddit 的 r/AI 和 r/CAD 等,与其他专业人士交流和学习。 5. 开源项目和代码库:探索 GitHub 等开源平台上的 AI 和 CAD 相关项目,例如 OpenAI 的 GPT3、AutoGPT 等 AI 模型在 CAD 设计中的应用。 6. 企业案例研究:研究 Autodesk、Siemens 等公司在 AI 在 CAD 设计中的应用案例。 此外,1 月 25 日的 Xiaohu.AI 日报中提到: 1. AdamCAD:通过简单的语言描述生成复杂的 CAD 图纸,支持直接 3D 打印。适用于工业零部件设计、产品外壳设计以及快速制作 3D 打印原型。 链接: 2. Llasa3B:语音克隆的黑科技
2025-04-10
AI对练
以下是关于 AI 对练的相关信息: AI 健身方面: AI 健身是利用人工智能技术辅助或改善健身训练和健康管理,通过算法和数据分析为用户提供个性化指导。相关产品有: 1. Keep:中国最大的健身平台,提供全面健身解决方案。https://keep.com/ 2. Fiture:集硬件、课程、教练和社区于一体。https://www.fiture.com/ 3. Fitness AI:利用人工智能进行锻炼,增强力量和速度。https://www.fitnessai.com/ 4. Planfit:提供健身房家庭训练与 AI 健身计划,AI 教练使用大量文本数据和 ChatGPT 实时指导。https://planfit.ai/ AI 市集方面: 11 月 9 日至 10 日在文三路数字生活街区举办了“AI 切磋大会”,这是“通往 AGI 之路”每月举办的交流分享会,首次面向大众举行线下摆摊活动。现场有 106 个摊位,带来了非遗 AI 刮刮乐、AI 3D 打印、AI 视频转绘、AI 量化交易、AI 产品设计等贴近日常的“AI+”产品。例如,高一的“小朱婷”开发了“航天小飞侠”AI 助理模型,还有 AI 玩聚摊位根据 MBTI 和星座生成专属鸡尾酒配方并现场调制。 汽车领域的 AI 对练方面: 在“AI+汽车”的应用落地中,AI 可在营销赛道发挥作用,如辅助市场营销和新媒体运营、提升销售体验引导留资或下单、提升销售能力(专业知识/销售话术)。例如通过互动游戏智能导购了解客户需求推荐车型,还可通过 AI 扮演客户进行销售对练。
2025-04-10
ai生成文献综述引言的指令
以下是关于利用 AI 生成文献综述引言的一些指导: 1. 确定课题主题:明确您的研究兴趣和目标,选择一个具有研究价值和创新性的主题。 2. 收集背景资料:使用 AI 工具如学术搜索引擎和文献管理软件来搜集相关的研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成课题的大纲,包括引言、文献综述、方法论、结果和讨论等部分。 5. 撰写文献综述引言:利用 AI 工具来帮助撰写引言部分,确保内容的准确性和完整性。但需注意,AI 工具只是辅助,不能完全替代研究者的专业判断和创造性思维。在使用 AI 进行写作时,应保持批判性思维,并确保研究的质量和学术诚信。 例如,像“根据以下关于我的信息,写一篇四段的大学申请论文:我来自西班牙巴塞罗那。尽管我的童年经历了一些创伤性事件,比如我 6 岁时父亲去世,但我仍然认为我有一个相当快乐的童年。在我的童年时期,我经常换学校,从公立学校到非常宗教的私立学校。我做过的最‘异国情调’的事情之一是在爱达荷州的双子瀑布与我的大家庭一起度过六年级。我很早就开始工作了。我的第一份工作是 13 岁时的英语老师。在那之后,以及在我的学习过程中,我做过老师、服务员,甚至建筑工人。”这样的需求,可让 AI 辅助生成。 每次生成后,您还可以通过向提示栏添加更多说明,然后按 Enter 键,以便 AI 根据您的后续说明重新生成,从而进一步优化提示。默认情况下,除了您包含的手动之外,Cursor 还将尝试查找不同类型的有用信息来改进代码生成。其他上下文可能包括相关文件、最近查看的文件等。收集后,Cursor 按与编辑/生成的相关性对上下文项进行排名,并将排名靠前的项目保留在大型语言模型的上下文中。
2025-04-10
交互式 AI 应用
以下是关于交互式 AI 应用的相关信息: 3 月 25 日 AI 资讯汇总中的用例: 制作交互式地球仪,可呈现地球自转、调整光照。 制作雅思单词交互式练习,能生成 4 选 1 英语单词填空题,并以可点选交互的 HTML 格式呈现,同时提供答案和中文解析,还有“分值显示”。 制作“日程备忘”交互式应用,可完成事务添加、定时提醒、完成设置及任务倒数,并有 emoji 表情作为图标装饰。 美国 AI 投融资事件中的 Sizzle AI:是一家位于纽约的公司,致力于开发直接面向学习者的人工智能产品,这是一款免费的交互式应用程序,使用人工智能帮助学习者逐步解决问题,引导学生完成解决问题的每一步,适合初中和高中学生,目前提供英语版本,并计划扩展功能。 90 分钟从 0 开始打造你的第一个 Coze 应用中提到:智能体开发从最初的 chatbot 只有对话框,到有了更多交互方式,因用户需求推出了 AI 应用,以证件照为例说明了以前实现成本高,现在有客户端需求并做了相关智能体和交互。在创建 AI 应用时,要学习操作界面、业务逻辑和用户界面等。
2025-04-10
我应该如何开始0-1学习AI绘画?当前最好用的工具是什么?
以下是一些关于 0 1 学习 AI 绘画的建议和当前好用的工具: 您可以通过观看相关视频教程来入门,比如: “10 分钟教会你如何手把手撰写提示语,全网最细 ChatGPT 对话指南,保姆级教程!” ,视频使用到的 AI 工具包括 AI 提示语,平台链接: 。 “零基础 AI 绘画入门,Midjourney、Stable Diffusion,小白速成,一站式使用和最强入门教程” ,视频使用到的 AI 工具包括 AI 提示语,一个无需魔法上网的 AI 绘画工具,平台链接: 。 目前,Midjourney 和 Stable Diffusion 是比较受欢迎的 AI 绘画工具。
2025-04-10
入门:Ai绘画
以下是为您提供的 AI 绘画入门相关的资源和教程: 在“通往 AGI 之路介绍.pdf”中,有关于 AI 绘画入门的部分,包括产品工具与案例实战,开箱即用。 以下是一些 B 站的视频教程链接: 「AI 绘画」软件比较与 stable diffusion 的优势: 「AI 绘画」零基础学会 Stable Diffusion: 「AI 绘画」革命性技术突破: 「AI 绘画」从零开始的 AI 绘画入门教程——魔法导论: 「入门 1」5 分钟搞定 Stable Diffusion 环境配置,消灭奇怪的报错: 「入门 2」stable diffusion 安装教程,有手就会不折腾: 「入门 3」你的电脑是否跑得动 stable diffusion?: 「入门 4」stable diffusion 插件如何下载和安装?: 还有 SD 新手从 0 入门的 AI 绘画教程,包括以下章节: 第一节课:AI 绘画原理与基础界面 第二节课:20 分钟搞懂 Prompt 与参数设置,你的 AI 绘画“咒语”学明白了吗? 第三节课:打破次元壁!用 AI“重绘”照片和 CG 第四节课:AI 绘画模型,“画风”自由切换 第五节课:提高 AI 绘画分辨率的方式 第六节课:LoRa|Hypernetwork 概念简析 第七节课:定向修手修脸,手把手教你玩转局部重绘! 第八节课:提示词补全翻译反推,“终极”放大脚本与细节优化插件 第九节课:LoRA 从原理到实践 第十节课:零基础掌握 ControlNet! 您可以通过以上资源进行学习,祝您在 AI 绘画领域学有所成!
2025-04-10
智能微信客服
以下是零成本、零代码搭建一个智能微信客服的保姆级教程: 1. 起个好名字和给它头像 进入 Bot 主页并开始创建 Bot,网址:https://www.coze.cn/home 。 名字(Bot 名称):善良有爱专业的幼师。 头像(图标):AI 生成后,不喜欢可以重新生成,选择其中一个。 补充:创建 Bot 的方式有两种,点击创建 Bot 和 Coze Assistant。主页上包含这两种方式,示例通过创建 Bot 创建。侧边导航栏一直有创建 Bot 方式,仅主页有 Coze Assistant。两者区别为: 创建 Bot 适合使用过 Bot 且想好名称和描述的人。 Coze Assistant 适合第一次创建 Bot 的人,从说“我想创建 bot”开始,Coze 助理会引导创建,自动生成名称、头像、人设与回复逻辑、开场白文案、开场白预设问题等。 2. 教她技能 如果通过 Coze Assistant 方式创建 Bot,Coze 助理已帮教技能,可按需修改完善。 起好名字和头像后进入教技能环节,先看整理布局,找到编排、预览与调试,在编排的人设与回复逻辑教她技能: 教她技能 1:认识自己。 教她技能 2:掌握专业技能。 教她技能 3:不能做什么。 3. 让她教别人 她学会技能后,使命及目标是通过互动方式教会请教的人。 找到高级下开场白,点击展开,填写开场白文案、开场白预置问题,设置 3 个问题。 勾选用户问题建议:在 Bot 回复后,根据 Prompt 提供最多 3 条用户提问建议。 添加语音选择:让她不仅会写,还会通过语音交流。 点击“发布”,选择发布平台:Bot Store、豆包、飞书、微信客服、微信公众号(服务号)、微信公众号(订阅号)、掘金。 Bot Store:Bot 会出现在 Coze Bot 商店中,获取更多曝光和流量。 豆包:一键发布到豆包 App,随时随地对话。 飞书:在飞书中直接@Bot 对话,提高工作生产力。 微信客服:微信沟通更高效,是本次分享重点,发布较复杂,下面是重新注册和解绑后重新配置微信客服的流程。 微信公众号(服务号):针对企业,不支持个人注册,订阅号运营主体可为企业或个人。 微信公众号(订阅号):托管公众号消息,助力微信运营无间断。 掘金:在掘金社区 AI 聊天室圈子与 Bot 互动。
2025-04-10
搭建链接转文字的智能体
搭建链接转文字的智能体可以参考以下步骤: 1. 创建一个智能体,输入人设等信息,并放上相关工作流。 2. 配置完成后进行测试。但注意工作流中【所有视频片段拼接】节点使用的插件 api_token 填的是您的 token,为避免他人调用消耗您的费用,您可以将 api_token 作为工作流最开始的输入,让用户购买后输入使用,然后再发布。 3. 在阿里云百炼平台中,Deepseek R1 模型无需部署可直接使用。使用该模型需要解锁和授权,若没有授权按钮需对阿里云进行实名认证,可通过支付宝扫码或在右上角头像处进行,共学群里有相关指引。 4. 新建智能体应用时,可选择模型并调整参数,如回复字数限制和携带上下文轮数等。 5. 对于模型的连接,可通过模型广场的 API 调用示例获取链接,截断后粘贴到 Chat Box 的设置中,添加自定义提供方,设置模型名称为 Deepseek R1,并获取 API key。还可重置 API key 以方便本地软件连接。
2025-04-10
多智能体
多智能体(MultiAgent)是由多个自主、独立的智能体(Agent)组成的系统。在这个系统中,每个智能体都能感知环境、决策并执行任务,且它们之间能信息共享、任务协调与协同行动以实现整体目标。 随着大型语言模型(LLM)出现,以 LLM 为核心构建的 Agent 系统受广泛关注。单 Agent 核心在于 LLM 与工具协同配合,可能需与用户多轮交互。而多 Agent 为不同 Agent 指定角色,通过协作完成复杂任务,与用户交互可能减少。 构建多 Agent 框架,需考虑新增组件,包括: 1. 环境:所有 Agent 处于同一环境,包含全局状态信息,有信息交互与更新。 2. 阶段:通常采用 SOP 思想,将复杂任务分解为多个子任务。 3. 控制器:可以是 LLM 或预先定义好的规则,负责环境在不同 Agent 和阶段间切换。 4. 记忆:因 Agent 数量增多,消息数量及相关字段记录增加。 此外,多智能体系统是实现智能的一种新兴方法,复杂智能行为可来自大量简单智能系统相互作用。Manus 作为全球首款通用型 AI 代理工具,于 2025 年 3 月 5 日发布,其技术架构主要基于多智能体架构,运行在独立虚拟机中,通过规划、执行和验证子模块分工协作处理复杂任务,核心功能由多个独立模型完成,还包括虚拟机、计算资源、生成物、内置多个 agents 等关键组件,采用“少结构,多智能体”设计哲学,实现高效处理和高质量输出。
2025-04-10
人工智能简史
人工智能作为一个领域始于二十世纪中叶。最初,符号推理流行,带来了如专家系统等重要进展,但因方法无法大规模拓展应用场景,且从专家提取知识并以计算机可读形式表现及保持知识库准确的任务复杂、成本高,导致 20 世纪 70 年代出现“人工智能寒冬”。 随着时间推移,计算资源变便宜,数据增多,神经网络方法在计算机视觉、语音理解等领域展现出卓越性能。过去十年中,“人工智能”常被视为“神经网络”的同义词,因多数成功案例基于神经网络方法。 以下是人工智能发展历程中的一些重要节点: 1969 年:经历低潮。Marvin Minsky 和 Seymour Papert 阐述因硬件限制,几层的神经网络仅能执行基本计算,AI 领域迎来第一次泡沫破灭。 1960 1970 年代:早期专家系统。此时期 AI 研究集中在符号主义,以逻辑推理为中心,主要是基于规则的系统,如早期专家系统。 1980 年代:神经网络。基于规则的系统弊端显现,人工智能研究关注机器学习,神经网络根据人脑结构和操作创建和建模。 1997 年:深蓝赢得国际象棋比赛。IBM 深蓝战胜国际象棋冠军卡斯帕罗夫,新的基于概率推论思路广泛应用于 AI 领域。 1990 2000 年代:机器学习。AI 研究在机器人技术、计算机视觉和自然语言处理等领域取得显著进展,21 世纪初深度学习出现使语音识别、图像识别和自然语言处理进步成为可能。 2012 年:深度学习兴起。Geoffrey Hinton 开创相关领域,发表开创性论文引入反向传播概念,突破感知器局限。 2012 年:AlexNet 赢得 ImageNet 挑战赛。引发深度学习热潮。 2016 年:AlphaGo 战胜围棋世界冠军。DeepMind 的 AlphaGo 战胜李世石,标志着人工智能在围棋领域超越人类,对人类理解产生深远影响。
2025-04-10
智能客服有什么特别好的产品形态?
智能客服的产品形态具有多样性,以下为您介绍: 1. 传统智能客服:但在 LLM 时代发展不佳,部分企业如 xxx 欠薪、解散团队或转向出海客服方向。这与智能客服行业的属性有关,其分为智能部分和客服部分,智能部分基于 NLP 技术进行 AI 对话管理,客服部分包括传统客服坐席、内部数据查询台、AI 与 IM 对接等。然而,企业对客服效果极为看重,且智能客服企业难以获取关键数据,导致很多采取本地部署,吃力不讨好且难有积累。 2. 基于 LLM 的智能客服:如 GPT 智能客服,通过将 FAQ 上传到知识库,让其具有客服应答能力。GPTs 作为 GPT 的一种 ID 账号形态,开放门槛低,基本是 0 代码,开发方式包括自然语言(prompt)、知识库(knowledge)、第三方 API 对接(Action),具有对话流畅、多观点融合、答案准确等特点,但不太擅长推理计算。 3. 特定功能的智能客服:例如帮助企业快速建立产品智能客服体系的方案,通过用户意图识别、知识库检索答案、AI 大模型总结输出答案等方式,提供全面的 AI 客服解决方案,提高回答准确率,降低企业商用 AI 客服门槛。还有如自动化处理和分析商品负面评论、为中小型消费品企业提供销售订单管理等特定功能的智能客服。
2025-04-10
我是一个新手,我擅长的是短视频和直播,我想做一个智能体+短视频/直播的一个培训,但是我不懂怎么搭建智能体,我应该从哪里开始学
如果您作为新手,想做智能体+短视频/直播的培训但不懂搭建智能体,可以从以下几个方面开始学习: 1. 按照“五津:DeepSeek+扣子:1分钟生成小红书爆款单词视频”中的指导,创建智能体,输入人设等信息,并放上相关工作流。配置完成后进行测试,但千万不要直接发布。工作流中如【所有视频片段拼接】节点使用的插件 api_token 填的是您的 token,为避免他人调用消耗您的费用,您可以将 api_token 作为工作流最开始的输入,让用户购买后自行输入使用,然后再发布。 2. 参考“元子:WayToAGI 知识库究竟咋用?”中的内容,对于完全没有编程基础但对 AI 有一定概念的小白,可以从工具入门篇(AI Agent)中的“Agent 工具小白的 Coze 之旅”开始,了解相关搭建平台。 3. 学习“智谱 BigModel 共学营第二期:把你的微信变成超级 AI 助理”中的教程,包括注册智谱 Tokens 智谱 AI 开放平台(https://bigmodel.cn/),获取资源包(新注册用户注册即送 2000 万 Tokens,或通过充值/购买多种模型的低价福利资源包,如语言资源包、多模态资源包等,所有资源包购买地址:https://bigmodel.cn/finance/resourcepack ),然后进入【财务台】左侧的【资源包管理】查看自己的资源包,再进入智能体中心我的智能体开始创建智能体。
2025-04-10