Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

能否整理AI AGENT的架构图

Answer

AI Agent 的架构主要包括以下部分:

  1. 中间的“智能体”通常是 LLM(大语言模型)。
  2. 为 LLM 增加的四个能力分别是工具、记忆、行动和规划。
    • 工具:通过如 Langchain 框架将 LLM 与工具进行串接,例如给大模型提供数据库工具用于长期记忆。
    • 记忆:让大模型能够记录重要信息。
    • 规划:在大模型的 prompt 层进行目标拆解。
    • 行动:每一步拆解后输出不同的固定格式 action 指令给工具作为输入。

AI Agent 是一个融合了语言学、心理学、神经学、逻辑学、社会科学、计算机科学等多个学科精髓的综合实体,不仅有实体形态,还有丰富的概念形态,具备许多人类特有的属性。这些学科大多以人为研究对象,探索人类内在本质。但网络上对其的介绍往往晦涩难懂,其自主性、学习能力、推理能力等核心概念,以及如何规划和执行任务、理解和处理信息等内容常笼罩在神秘面纱之下。

Content generated by AI large model, please carefully verify (powered by aily)

References

Ranger:【AI 大模型】非技术背景,一文读懂大模型(长文)

agent算是从年前到现在,比较火的一个概念了,也被很多人认为是大模型的未来的一个主要发展方向。首先我们看这个很经典的一张图看起来还是蛮复杂的,然后市面上的很多描述agent的文章写的也比较复杂,说智能体是啥智能的最小单元,相较于copilot,是可以给他设定一个目标后主动完成任务的等等。当然这些说法都没错,但是我觉得还是有些不好理解的。所以我们依然先从原理着手去理解下,agent是个什么东西。首先这张图里,中间的“智能体”,其实就是llm,或者说大模型。四个箭头,分别是我们为llm增加的四个能力。工具、记忆、行动、规划。那么这个是怎么新增的呢?目前行业里主要用到的是一个叫langchain的框架,这个框架可以简单理解为,他把llm和llm之间,以及llm和工具之间,通过代码或prompt的形式,进行了串接。这个其实也像是在rag的基础上再进了一步。因为我们知道rag其实是给了大模型一个浏览器工具来使用嘛,那agent,其实就是给了大模型更多的工具。比如像是长期记忆,其实就是给了大模型一个数据库工具让其往里记录重要信息。规划和行动,其实就是在大模型的prompt层做的些逻辑,比如让其将目标进行每一步的拆解,拆解完成后,每一步去输出不同的固定格式action指令,给到工具作为输入。当然langchain或者说agent还不止这些,也会有很多其他的代码逻辑体现在其中,不过其主要的主干逻辑,其实还是在prompt层和工具层,完成的设计。

AI-Agent系列(一):智能体起源探究

更系列文章合集请访问:[蓝衣剑客-AIGC思维火花](https://waytoagi.feishu.cn/wiki/IYtowrzONiysdTkeA5QcEraxntc)[heading2]一、前言[content]本文主要向大家讲述智能体的概念、渊源和发展历史,帮助大家对智能体这一概念奠定一个正确认知。[heading2]二、很多人其实并不知道AI Agent是什么[content]打开浏览器,搜索"什么是AI Agent",我们将会得到如下结果:图2.1.1在Bing上搜索“什么是AI Agent”行吧,我们再来问问Kimi什么是AI Agent:图2.1.2问问Kimi"什么是AI Agent?"我耗费了2分钟,却仿佛在寻找一场空欢喜。这就是所谓的AI Agent吗?......罢了,我还是自己寻找答案吧。通过必应和Kimi的搜索,我们发现网络上对AI Agent的介绍往往显得晦涩难懂,仿佛AI Agent是从石头缝儿里蹦出来的一样,神秘莫测。AI Agent的自主性、学习能力、推理能力等核心概念,以及它们如何规划和执行任务,如何理解并处理信息,这些内容似乎都笼罩在一层神秘的面纱之下。这种神秘感让我们仿佛置身于一个赛博朋克的世界,让我们不禁怀疑,是否我们已经生活在了一个充满未来科技的时代?未来是否真的已经到来?在深入探讨AI agent之前,我们首先需要对其进行定义和总结。AI Agent是一个融合了语言学、心理学、神经学、逻辑学、社会科学、计算机科学等多个学科精髓的综合实体。它不仅拥有实体形态,更蕴含着丰富的概念形态,同时它还具备了许多人类特有的属性。因为这些学科大多以人为研究对象,致力于探索人类内在的本质。

AI-Agent系列(一):智能体起源探究

更系列文章合集请访问:[蓝衣剑客-AIGC思维火花](https://waytoagi.feishu.cn/wiki/IYtowrzONiysdTkeA5QcEraxntc)[heading2]一、前言[content]本文主要向大家讲述智能体的概念、渊源和发展历史,帮助大家对智能体这一概念奠定一个正确认知。[heading2]二、很多人其实并不知道AI Agent是什么[content]打开浏览器,搜索"什么是AI Agent",我们将会得到如下结果:图2.1.1在Bing上搜索“什么是AI Agent”行吧,我们再来问问Kimi什么是AI Agent:图2.1.2问问Kimi"什么是AI Agent?"我耗费了2分钟,却仿佛在寻找一场空欢喜。这就是所谓的AI Agent吗?......罢了,我还是自己寻找答案吧。通过必应和Kimi的搜索,我们发现网络上对AI Agent的介绍往往显得晦涩难懂,仿佛AI Agent是从石头缝儿里蹦出来的一样,神秘莫测。AI Agent的自主性、学习能力、推理能力等核心概念,以及它们如何规划和执行任务,如何理解并处理信息,这些内容似乎都笼罩在一层神秘的面纱之下。这种神秘感让我们仿佛置身于一个赛博朋克的世界,让我们不禁怀疑,是否我们已经生活在了一个充满未来科技的时代?未来是否真的已经到来?在深入探讨AI agent之前,我们首先需要对其进行定义和总结。AI Agent是一个融合了语言学、心理学、神经学、逻辑学、社会科学、计算机科学等多个学科精髓的综合实体。它不仅拥有实体形态,更蕴含着丰富的概念形态,同时它还具备了许多人类特有的属性。因为这些学科大多以人为研究对象,致力于探索人类内在的本质。

Others are asking
有哪些可以生成系统架构图的工具
以下是一些可以生成系统架构图的工具: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,有拖放界面方便操作。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,如逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 3. ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,有丰富模板用于创建逻辑视图、功能视图和部署视图等。 6. draw.io(现称 diagrams.net):免费在线图表软件,支持创建逻辑视图和部署视图等。 7. PlantUML:文本到 UML 转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 9. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建逻辑视图和部署视图。 需要注意的是,虽然这些工具可以辅助创建架构视图,但它们不都是基于 AI 的。AI 在绘图工具中的应用通常涉及到智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,您应该考虑您的具体需求,比如是否需要支持特定的建模语言、是否需要与特定的开发工具集成、是否偏好在线工具或桌面应用程序等。
2025-01-17
是否有工具可以生成系统架构图
以下是一些可以生成系统架构图的工具: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,可通过拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,包括逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 3. ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图的创建,可与 Archi 工具配合使用,该工具提供图形化界面创建模型。 4. Enterprise Architect:强大的建模、设计和生成代码的工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 6. draw.io(现称为 diagrams.net):免费的在线图表软件,允许创建各种类型的图表,包括软件架构图,支持创建逻辑视图和部署视图等。 7. PlantUML:文本到 UML 的转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 9. Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。 需要注意的是,虽然这些工具可以辅助创建架构视图,但它们不都是基于 AI 的。AI 在绘图工具中的应用通常涉及到智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,您应该考虑您的具体需求,比如是否需要支持特定的建模语言、是否需要与特定的开发工具集成、是否偏好在线工具或桌面应用程序等。
2025-01-09
请问有ai生成架构图的工具么
以下是一些可以生成架构图(包括逻辑视图、功能视图、部署视图)的工具: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,用户可通过拖放轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能。 3. ArchiMate:开源建模语言,与 Archi 工具配合使用可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板。 6. draw.io(现称 diagrams.net):免费在线图表软件,支持创建多种类型图表。 7. PlantUML:文本到 UML 转换工具,通过编写描述生成序列图等,辅助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建架构图功能。 9. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图。 请注意,这些工具并非都是基于 AI 的。AI 在绘图工具中的应用通常涉及智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,应考虑具体需求,如是否支持特定建模语言、是否与特定开发工具集成、偏好在线工具或桌面应用程序等。 此外,以下是一些可以辅助或自动生成 CAD 图的 AI 工具: 1. CADtools 12:Adobe Illustrator 插件,为 AI 添加 92 个绘图和编辑工具。 2. Autodesk Fusion 360:集成 AI 功能的云端 3D CAD/CAM 软件。 3. nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据输入自动生成 3D 模型。 5. 主流 CAD 软件(如 Autodesk 系列、SolidWorks 等)的生成设计工具,可根据设计目标和约束条件自动产生多种设计方案。 这些工具通常需要一定的 CAD 知识和技能才能有效使用。对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。 以上内容由 AI 大模型生成,请仔细甄别。
2024-11-09
AI生成系统架构图 用什么
以下是一些可以用于绘制逻辑视图、功能视图和部署视图的工具: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括上述视图,用户可通过拖放轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能。 3. ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,有丰富模板用于创建相关视图。 6. draw.io(现 diagrams.net):免费在线图表软件,支持创建逻辑和部署视图等。 7. PlantUML:文本到 UML 转换工具,可通过描述文本自动生成相关视图。 8. Gliffy:基于云的绘图工具,提供创建架构图功能。 9. Archi:免费开源工具,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建逻辑和部署视图。 请注意,虽然这些工具可以辅助创建架构视图,但它们不都是基于 AI 的。AI 在绘图工具中的应用通常涉及智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,您应该考虑您的具体需求,比如是否需要支持特定的建模语言、是否需要与特定的开发工具集成、是否偏好在线工具或桌面应用程序等。
2024-10-30
输入文字,生成组织架构图
以下是一些可以用于生成组织架构图的工具: 1. PlantUML:这是一个文本到 UML 的转换工具,通过编写描述性文本可自动生成序列图、用例图、类图等,能帮助创建逻辑视图。 2. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 3. Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 4. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包含逻辑视图和部署视图。 需要注意的是,这些工具并非都基于 AI。AI 在绘图工具中的应用通常涉及智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,应考虑具体需求,如是否需要支持特定建模语言、与特定开发工具集成、偏好在线工具或桌面应用程序等。 另外,增强版 Bot 是基于 AI 驱动的智能创作平台,可实现一站式内容生成(包括图片、PPT、PDF)。在图片理解与生成场景中,在对话框输入诉求即可测试效果,比如生成常见的系统架构风格架构设计图,给出一张图片。通过简短的文本就能让 Bot 生成相应的图片,这背后是文本到图片或视频等其他格式内容的映射关系,在日常工作中使用便捷。当然,也可以根据图片提取里面的关键知识内容。
2024-09-03
Agents协作的系统架构图应该怎么画
以下是关于绘制 Agents 协作的系统架构图的一些参考信息: 首先,了解 Agent 的基本框架,即“Agent = LLM + 规划 + 记忆 + 工具使用”。其中大模型 LLM 扮演了 Agent 的“大脑”。 规划方面,主要包括子目标分解、反思与改进。子目标分解能将大型任务分解为较小可管理的子目标来处理复杂任务,反思和改进则可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。 记忆分为短期记忆和长期记忆。短期记忆是将所有的上下文学习看成利用模型的短期记忆来学习;长期记忆提供了长期存储和召回信息的能力,通常通过利用外部的向量存储和快速检索来实现。 工具方面,不同的任务和场景需要选择合适的工具。 在生成式 AI 的人机协同中,分为 Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理)3 种产品设计模式,人与 AI 的协作流程有所差异。在 Agents 模式下,AI 完成大多数工作。 可以通过 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。例如,作为产品经理角色,可将产品功能设计需求通过 Agents 拆解成多个独立的任务,然后遵循不同的工作流,最后生成一份大致符合期望的输出结果,再进行修改完善。 此外,还可以参考一些实例探究,如提示 LLM 提供 100 个最新观察结果,并根据这些观测/陈述生成 3 个最重要的高层次问题,然后让 LLM 回答这些问题。规划和反应时要考虑主体之间的关系以及一个主体对另一个主体的观察,环境信息以树形结构呈现。
2024-08-18
现在有哪些AI绘画平台
以下是一些常见的 AI 绘画平台: 1. MewXAI:这是一款强大且新手友好、操作简单的 AI 绘画创作平台。其功能包括 MX 绘画、MX Cute、MJ 绘画、边缘检测、室内设计、姿态检测、AI 艺术二维码、AI 艺术字等。访问地址:https://www.mewxai.cn/ 2. StableStudio:Stability AI 开源的 AI 图像生成平台。 3. Roop:一键实现 AI 换脸,仅需一张换脸图像,无需数据集,无需训练,自带敏感图像检测功能。 4. pixian.ai:能够利用 AI 一键移除各种图像背景,并支持在线调整图片分辨率、背景颜色等。 5. Inpaint Anything:一个 AI 图像编辑工具,支持一键擦除、替换图像中的指定物品,通过提示词来自动更换背景图。 6. Segment Anything:一个图像分割模型,可自动分割图片或视频中的所有物品,一键完成自动分割,并支持零样本转移到其他分割任务。 7. Docker:支持一键从图片中解析出 Prompt 描述,并能够基于描述进行扩展,以便二次图片生成。 8. Plask.ai:一个 AI 工具,可以通过 3D 建模,直接生成模特效果图。 9. Recraft AI:是 AI 平面设计工具,用户可以使用其生成和编辑插画,海报,产品周边等,提供多种样式的可选风格,对所有用户每日都有免费的试用点数,并允许对生成的图像进行商业使用。访问地址:https://www.recraft.ai/ 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-03
现在有哪些ai平台?
以下是一些常见的 AI 平台: 图虫网:AI 摄影作品销售平台,利用图像识别、数据分析技术,为摄影爱好者提供作品销售渠道。 网易云音乐音乐人平台:AI 音乐作品发布平台,运用音频处理、数据分析技术,为音乐创作者提供作品发布等服务。 好好住 APP:AI 家居用品推荐平台,通过数据分析、自然语言处理技术,根据用户需求推荐家居用品。 东方财富网投资分析工具:AI 金融投资分析平台,借助数据分析、机器学习技术,分析金融市场并提供投资建议。 此外,在 ProductHunt 2023 年度最佳产品榜单中的 AI 产品有: Dora AI:用一次 prompt 生成网站,支持文字转网站、生成式 3D 互动、高级 AI 动画。 Bard(免费):谷歌推出的官方 ChatGPT 竞争者,由谷歌的对话应用语言模型(LaMDA)提供支持。 Chat.DID(免费):有史以来首个允许人们以人类方式与 AI 进行视频聊天的 APP。 Pika(免费):AI 视频平台,能将创意转化为动态视频。 对于希望自行部署 AIGC 服务的用户,以下云服务平台可供选择: AWS(亚马逊云服务):提供多种 AI 服务,资源丰富、灵活性强,但费用相对较高,适合需求复杂、要求高可用的企业用户。 Google Cloud Platform:推出 Vertex AI 和多款预训练模型供使用,支持多种编程语言和框架,具有领先的计算机视觉和语音识别能力。 Microsoft Azure:Azure 机器学习服务涵盖多种 AI 工作负载,与微软其他产品融合度高,提供硬件加速等优化方案。 Huawei Cloud:提供 ModelArts 等 AI 开发和推理平台,融合 Ascend AI 处理器实现硬件加速,针对本地化部署和行业应用进行了优化。 阿里云:提供 PAI 和机器学习平台等 AI 产品,支持主流深度学习框架部署,与阿里云其他产品生态集成度高。部署 AIGC 服务通常需要大量算力和存储资源,利用云平台是便捷的选择。建议先评估实际业务场景和需求,再对比不同供应商的产品特性和价格,以选择最合适的部署方案。
2025-03-03
用AI生成角色原画的现状
目前,用 AI 生成角色原画既有优势也存在一些问题。 优势方面: Niji·journey 5 作为表现优异的在线二次元角色设计 AI,能在各种类型的二次元设计中发挥重要作用。 对于游戏中的角色设计,AI 设计可以提供参考和辅助。 问题方面: Niji·journey 5 存在对流行二次元风格的偏好、风格相对固定以及版权风险等局限性。 AI 设计生成的角色往往需要进一步修饰和调整以符合游戏整体风格和要求,不能完全掌握角色设计的细节和规律。 AI 绘画生成的设计可能存在版权问题。 未来展望: Niji 有望通过改进算法和扩大数据样本来源,提升角色设计的创新性和独特性,满足不同用户和项目的需求。 随着技术进步,Midjourney 等 AI 不断升级,使用 AI 辅助游戏美术设计师工作将成为趋势。但美术设计师需不断学习新技能和知识,拓展多领域知识,以应对未来变化和挑战。游戏美术中各职业分类的界限可能会越来越模糊。
2025-03-03
我应该如何自学ai
以下是关于自学 AI 的一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。 6. 对于中学生自学 AI 的建议: 从编程语言入手学习,如 Python、JavaScript 等,学习编程语法、数据结构、算法等基础知识。 尝试使用 AI 工具和平台,如 ChatGPT、Midjourney 等,探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 学习 AI 基础知识,包括基本概念、发展历程、主要技术如机器学习、深度学习等,以及在教育、医疗、金融等领域的应用案例。 参与 AI 相关的实践项目,参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题。 关注 AI 发展的前沿动态,关注权威媒体和学者,思考 AI 技术对未来社会的影响。 7. 使用 AI 来做事: 利用人工智能帮助教育和自学学习,可以要求人工智能解释概念并获得结果。但因为人工智能可能会产生幻觉,所以对于关键数据要根据其他来源仔细检查。
2025-03-03
让AI帮我写一篇论文的文献综述,怎么命令
利用 AI 写一篇论文的文献综述可以参考以下步骤: 1. 确定课题主题:明确研究兴趣和目标,选择具有研究价值和创新性的主题。 2. 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具搜集相关研究文献和资料。 3. 分析和总结信息:借助 AI 文本分析工具提取收集资料中的关键信息和主要观点。 4. 生成大纲:利用 AI 写作助手生成包括引言、文献综述、方法论、结果和讨论等部分的大纲。 5. 撰写文献综述:使用 AI 工具辅助撰写,确保内容准确完整。 6. 构建方法论:根据研究需求,参考 AI 建议的方法和技术设计研究方法。 7. 数据分析:若课题涉及数据,使用 AI 数据分析工具处理和解释。 8. 撰写和编辑:依靠 AI 写作工具撰写各部分,并检查语法和风格。 9. 生成参考文献:通过 AI 文献管理工具生成正确格式的参考文献。 10. 审阅和修改:利用 AI 审阅工具检查课题的逻辑性和一致性,根据反馈修改。 11. 提交前的检查:使用 AI 抄袭检测工具确保课题的原创性,并做最后的格式调整。 需要注意的是,AI 工具只是辅助,不能完全替代研究者的专业判断和创造性思维。在使用时应保持批判性思维,确保研究质量和学术诚信。
2025-03-03
用ai帮助聊天
以下是关于用 AI 帮助聊天的相关内容: Cursor 官方: Chat 聊天:允许您与看到您的代码库的 AI 交谈。聊天室始终可以看到您当前的文件和光标,您可以向它询问诸如“这里有 bug 吗”等问题。您可以使用⌘+Shift+L 或“@”将特定代码块添加到上下文中,也可以使用⌘+Enter 与整个代码库聊天。 代码库答案:使用@Codebase 或⌘Enter 询问有关您的代码库的问题,Cursor 会搜索您的代码库以查找与您的查询相关的代码。 引用您的代码:带有@符号的参考代码可用作 AI 的上下文,只需键入@即可查看文件夹中所有文件和代码符号的列表。 使用图像:点击聊天下方的图片按钮,或将图片拖到输入框中,将视觉上下文包含在聊天中。 学习笔记:Generative AI for Everyone 吴恩达: 阅读方面:可以让 LLM 检查文本错误、总结长句。客服人员针对每一位用户传递大量信息时,可内置 LLM 快速总结信息提供给决策管理层,使用 LLM 进行语义分析,将邮箱、客户留言等外部信息传递给相关部门。构建处理信息的 LLM 模型时,要设置好提示词,持续优化。 聊天方面:聊天机器人可用于做旅游计划、职业咨询、做饭建议等,不仅能生成文本,还能产生进一步行动,如处理文本后发送订单信息等。建立聊天机器人的流程为:开始于内部聊天机器人,确保良好表现并避免问题;设置人为参与链路;确保安全后,让机器人对接用户。 大语言模型行与不行:能做类似于应届生能做的事;不可做的包括时间限制(如 GPT3 只有 2022 年 1 月前的数据)、会出现幻觉、接受有限的 prompt、输出有限制、不可以很好处理结构化数据、可能输出有害的信息。 @Chat:此功能目前仅适用于 Cmd K。您可以在 Cmd K 中使用@Chat 将当前聊天消息添加为上下文,当您与希望应用于编辑或生成代码的 AI 进行对话时很有用。
2025-03-03
什么是multi agent
多智能体(MultiAgent)是由多个自主、独立的智能体(Agent)组成的系统。在这个系统中,每个智能体都能够感知环境、进行决策并执行任务,同时它们之间可以进行信息共享、任务协调以及协同行动,以实现整体的目标。 随着大型语言模型(LLM)的出现,以 LLM 为核心构建的 Agent 系统近期受到广泛关注。Agent 系统旨在利用 LLM 的归纳推理能力,为不同的 Agent 分配角色和任务信息,并配备相应的工具插件,以完成复杂的任务。 目前,更常见的框架主要集中在单 Agent 场景下。单 Agent 的核心在于 LLM 与工具的协同配合。LLM 根据用户任务的理解,推理出需要调用的工具,并根据调用结果向用户提供反馈。在任务完成过程中,Agent 可能需要与用户进行多轮交互。 与此同时,越来越多的 Agent 框架开始关注多 Agent 场景。为了完成任务,多 Agent 会为不同的 Agent 指定不同的角色,并通过 Agent 之间的协作来完成复杂的任务。与单 Agent 相比,在任务完成过程中,与用户的交互可能会减少一些。 为构建一个多 Agent 框架,主要组成部分包括: 1. 环境(environment):所有 Agent 应处于同一个环境中。环境中包含全局状态信息,Agent 与环境之间存在信息的交互与更新。 2. 阶段(stage):为完成复杂任务,现有多 Agent 框架通常采用 SOP 思想,将复杂任务分解为多个子任务。 3. 控制器(controller):控制器可以是 LLM,也可以是预先定义好的规则。它主要负责环境在不同 Agent 和阶段之间的切换。 4. 记忆:在单 Agent 中,记忆只包括用户、LLM 回应和工具调用结果等部分。而在多 Agent 框架中,由于 Agent 数量增多,导致消息数量增多。同时,每条消息可能需要记录发送方、接收方等字段。 多智能体的核心交互流程包括: 1. 控制器更新当前环境状态,选择下一时刻行动的 Agent。 2. Agent 与环境交互,更新自身的记忆信息。 3. Agent 调用 LLM,执行动作并获取输出消息。 4. 将输出消息更新到公共环境中。 参考资料: 1. 《》 2. 《》
2025-03-03
实用至上:智能体 / Agent 是什么
智能体(Agent)在人工智能和计算机科学领域是一个非常重要的概念,指的是一种能够感知环境并采取行动以实现特定目标的实体,可以是软件程序,也可以是硬件设备。 智能体可以根据其复杂性和功能分为以下几种类型: 1. 简单反应型智能体(Reactive Agents):根据当前的感知输入直接采取行动,不维护内部状态,也不考虑历史信息。例如温控器,它根据温度传感器的输入直接打开或关闭加热器。 2. 基于模型的智能体(Modelbased Agents):维护内部状态,对当前和历史感知输入进行建模,能够推理未来的状态变化,并根据推理结果采取行动。比如自动驾驶汽车,它不仅感知当前环境,还维护和更新周围环境的模型。 3. 目标导向型智能体(Goalbased Agents):除了感知和行动外,还具有明确的目标,能够根据目标评估不同的行动方案,并选择最优的行动。例如机器人导航系统,它有明确的目的地,并计划路线以避免障碍。 4. 效用型智能体(Utilitybased Agents):不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动的优劣,权衡利弊。比如金融交易智能体,根据不同市场条件选择最优的交易策略。 5. 学习型智能体(Learning Agents):能够通过与环境的交互不断改进其性能,学习模型、行为策略以及目标函数。例如强化学习智能体,通过与环境互动不断学习最优策略。 在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并辅以几个关键组成部分: 1. 规划:包括子目标和分解,将大型任务分解为更小的、可管理的子目标,从而能够有效处理复杂的任务;反思和完善,Agents 可以对过去的行为进行自我批评和自我反思,从错误中吸取教训,并针对未来的步骤进行完善,从而提高最终结果的质量。 2. 记忆:短期记忆,所有的上下文学习都是利用模型的短期记忆来学习;长期记忆,这为 Agents 提供了长时间保留和回忆(无限)信息的能力,通常是通过利用外部向量存储和快速检索来实现。 3. 工具使用:Agents 学习调用外部 API 来获取模型权重中缺失的额外信息(通常在预训练后很难更改),包括当前信息、代码执行能力、对专有信息源的访问等。 随着 LLM 在几个关键能力上的成熟——理解复杂输入、进行推理和规划、可靠使用工具以及从错误中恢复,智能体开始在生产环境中涌现。智能体通过与人类用户的命令或交互式对话开始工作。一旦任务明确,智能体就会独立进行规划和操作,必要时会向人类寻求更多信息或判断。在执行过程中,智能体需要在每个步骤从环境中获取“基准事实”(如工具调用结果或代码执行情况)以评估其进展。智能体可以在检查点或遇到障碍时暂停等待人类反馈。任务通常在完成时终止,但也常常包含停止条件(如最大迭代次数)以保持控制。 智能体适用于难以或无法预测所需步骤数量的开放性问题,且无法硬编码固定路径的场景。LLM 可能需要运行多个回合,您必须对其决策能力有一定信任。智能体的自主性使其非常适合在可信环境中扩展任务,但智能体的自主性也意味着更高的成本和潜在的错误累积。我们建议在沙盒环境中进行广泛测试,并设置适当的防护措施。 以下是一些实用案例: 1. 用于解决 SWEbench 任务的编码智能体,根据任务描述对多个文件进行编辑:https://www.anthropic.com/research/swebenchsonnet 2. 我们的“计算机使用”参考实现,让 Claude 使用计算机完成任务:https://github.com/anthropics/anthropicquickstarts/tree/main/computerusedemo
2025-03-02
有ai产品吗? 咨询一下,能进入面试的自建ai agent项目具体要达到一个什么水准啊?
目前有一些 AI 面试官的相关产品,例如: 1. 用友大易 AI 面试产品:具有强大技术底座、高度场景贴合度、招聘全环节集成的解决方案、先进防作弊技术及严密数据安全保障。能完成面试、初筛并自动发送面试邀约。 2. 海纳 AI 面试:通过在线方式、无需人为干预完成自动面试、自动评估,精准度高达 98%,面试效率比人工方式提升 5 倍以上,候选人到面率提升最高达 30%。 3. InterviewAI:在线平台,提供面试职位相关问题及 AI 生成的推荐答案。候选人用设备麦克风回答,每个问题最多回答三次,并收到评估、建议和得分。 此外,Cognition 发布了首位 AI 软件工程师 Devin,它是一个自主 Agents,能通过使用自己的 shell、代码编辑器和网络浏览器解决工程任务,成功通过知名人工智能公司的实际工程面试,还在 Upwork 上完成了实际工作。在无辅助情况下正确解决了 13.86%的问题,远超之前最先进模型。 在其他领域,也有相关的 AI 项目和产品,如: 1. 软件层具有独特多元化行为动作生成及控制 AI Agent 的产品,能实现人类所有基本行为动作的生成及流程过渡,硬件层具有独特并行通信架构,容错率高,力矩密度前沿,深度耦合软件算法,实现 24 小时全天续航无休。 2. 百奥几何的生成式 AI 大模型赋能蛋白质设计,应用在包括生物医药、化工、医美、食品等整个生物制造领域,其生成式 AI 蛋白质大模型 GeoFlow 已达国际领先水平。 3. 行云致力于打造软件亲和、高显存规格的大模型推理芯片,用异构、白盒的硬件形态重塑大模型计算系统,解决大模型产业的算力成本和供应问题。
2025-03-02
如何做自己的agent
要做自己的 Agent,可以按照以下步骤进行: 1. 从基础案例入门 三分钟捏 Bot Step 1:(10 秒)登录控制台 登录扣子控制台(coze.cn)。 使用手机号或抖音注册/登录。 Step 2:(20 秒)在我的空间创建 Agent 在扣子主页左上角点击“创建 Bot”。 选择空间名称为“个人空间”、Bot 名称为“第一个 Bot”,并点击“确认”完成配置。如需使用其他空间,请先创建后再选择;Bot 名称可以自定义。 Step 3:(30 秒)编写 Prompt 填写 Prompt,即自己想要创建的 Bot 功能说明。第一次可以使用一个简短的词语作为 Prompt 提示词。 Step 4:(30 秒)优化 Prompt 点击“优化”,使用来帮忙优化。 Step 5:(30 秒)设置开场白 Step 6:(30 秒)其他环节 Step 7:(30 秒)发布到多平台&使用 2. 进阶之路 15 分钟做什么 查看下其他 Bot,获取灵感 1 小时做什么 找到和自己兴趣、工作方向等可以结合的 Bot,深入沟通 一周做什么 了解基础组件 寻找不错的扣子,借鉴&复制 加入 Agent 共学小组 尝试在群里问第一个问题 一个月做什么 合理安排时间 参与 WaytoAGI Agent 共学计划 自己创建 Agent,并分享自己捏 Bot 的经历和心得 3. 在 WaytoAGI 有哪些支持 文档资源 交流群 活动 此外,还可以借助开源社区的力量构建高质量的 AI 数字人。推荐使用像 dify、fastgpt 等成熟的高质量 AI 编排框架,它们有大量的开源工作者维护,集成各种主流的模型供应商、工具以及算法实现等。可以通过这些框架快速编排出自己的 AI Agent,赋予数字人灵魂。在开源项目中,使用 dify 的框架,利用其编排和可视化交互任意修改流程,构造不同的 AI Agent,并且实现相对复杂的功能,比如知识库的搭建、工具的使用等都无需任何的编码和重新部署工作。同时 Dify 的 API 暴露了 audiototext 和 texttoaudio 两个接口,基于这两个接口就可以将数字人的语音识别和语音生成都交由 Dify 控制,从而低门槛做出自己高度定制化的数字人。如果有更加高度定制的模型,也可以在 Dify 中接入 XInference 等模型管理平台,然后部署自己的模型。此外,数字人 GUI 工程中仍然保留了 LLM、ASR、TTS、Agent 等多个模块,能够保持更好的扩展。 从产品经理角度思考 Agent 时,比如我们的 Agent 可以是一个历史新闻探索向导,其身份是历史新闻探索向导,性格是知识渊博、温暖亲切、富有同情心,角色是主导新闻解析和历史背景分析。为了使角色更加生动,可以为 Agent 设计一个简短的背景故事。写好角色个性需要注意角色背景和身份、性格和语气、角色互动方式、角色技能等方面。正如《》所写,个性化定制的“虚拟伴侣”能得到用户的认可,这是因为精准地击中了许多年轻人无处可藏的孤独和焦虑。美国心理学家 Robert Jeffrey Sternberg 提出了“爱情三角理论”,认为爱情包含“激情”“亲密”和“承诺”三个要素。激情是生理上或情绪上的唤醒,亲密是一种相互依恋的感觉,承诺是决定建立长期稳定关系。
2025-03-01
agent
智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,既可以是软件程序,也可以是硬件设备。 在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并包含以下关键组成部分: 1. 规划:包括子目标和分解,将大型任务分解为更小、可管理的子目标,以有效处理复杂任务。 2. 反思和完善:能够对过去的行为进行自我批评和反思,从错误中吸取教训,完善未来步骤,提高最终结果质量。 3. 记忆:分为短期记忆,用于所有的上下文学习;长期记忆,通过利用外部向量存储和快速检索实现长时间保留和回忆无限信息的能力。 4. 工具使用:学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。 以下是一些关于智能体 Agent 的相关目录: 1. 2. 3. 4. 5. 6. 从产品角度思考 Agent 设计: 1. Agent 是谁及性格:比如是一个历史新闻探索向导,身份为历史新闻探索向导,性格知识渊博、温暖亲切、富有同情心,角色主导新闻解析和历史背景分析,为使角色更生动可设计简短背景故事,如曾是一位历史学家,对重大历史事件了如指掌且充满热情、愿意分享知识。 2. 写好角色个性:包括编写背景故事明确起源、经历和动机;定义性格特点和说话方式风格;设计对话风格,从基本问答到深入讨论;明确核心功能,如提供新闻解析、历史背景分析或心理分析,增加附加功能提高吸引力和实用性。 正如《》所写:个性化定制的“虚拟伴侣”能得到用户认可,因精准击中年轻人的孤独和焦虑,背后是年轻人渴望被理解、沟通和交流。美国心理学家 Robert Jeffrey Sternberg 提出“爱情三角理论”,认为爱情包含“激情”“亲密”“承诺”三个要素,激情是生理或情绪上的唤醒,亲密是相互依恋的感觉,通过相互联结分享所见所闻、喜怒哀乐体现,承诺是决定建立长期稳定关系,融入对方生活,形成互助互惠的关系,代表着一种长相厮守的责任。
2025-02-27
如何搭建一个自动把录音文件转文字的agent,然后发布到飞书多维表格字段捷径
搭建一个自动把录音文件转文字的 agent 并发布到飞书多维表格字段捷径的步骤如下: 1. 工作流调试完成后,加入到智能体中。可以选择工作流绑定卡片数据,智能体通过卡片回复。绑定卡片数据可自行研究,如有疑问可留言。 2. 发布:选择需要的发布渠道,重点是飞书多维表格。记得智能体提示词的 4 个变量,填写上架信息(为快速审核,选择仅自己可用),确认发布并等待审核。审核通过后即可在多维表格中使用。 3. 创建飞书多维表格,添加相关字段。配置选择“自动更新”,输入 4 个字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 4. 表单分享,实现“填写表单,自动创建文案短视频”的效果。 5. 点击多维表格右上角的“自动化”,创建想要的自动化流程。 此外,关于 Coze 应用与多维表格的结合还有以下相关内容: 1. Coze 智能体(字段捷径)获取笔记+评论信息:创建智能体,使用单 Agent 对话流模式,编排对话流,配置相关节点和插件,进行数据处理和测试,最后发布。 2. Coze 应用:完成后端准备工作后,创建应用,设计界面和工作流,包括读取博主笔记列表的工作流,进行相关配置和参数设置。
2025-02-27
我想通过在sciencedirect上输入关键词后,让AI帮助我整理该词条下文献的内容,输出当今的研究现状、现存问题、解决方法
目前在 ScienceDirect 上,还没有直接通过输入关键词让 AI 为您整理文献内容并输出研究现状、现存问题及解决方法的成熟功能。但您可以利用一些 AI 工具,如文献分析类的软件,先将从 ScienceDirect 下载的文献导入其中,然后让其协助您进行分析和总结。不过,在使用任何工具时,都需要您自己对结果进行评估和筛选,以确保准确性和可靠性。
2025-02-25
有没有什么可以用于会议纪要整理的AI软件
以下是一些可以用于会议纪要整理的 AI 软件: 1. 团队会议总结 Vowel:https://www.vowel.com/ 2. Personalized AI,Everywhere.:https://www.augment.co/?ref=superhuman1_mar23&utm_source=superhuman.beehiiv.com&utm_medium=newsletter&utm_campaign=thisaicanhackinterviews 3. Noty 会议总结为待办事项:https://noty.ai/ 4. The 6 Best AI Tools for Meeting Notes in 2024:https://www.meetjamie.ai/blog/the6bestaimeetingtools 5. The smartest AI team assistant Sembly AI:https://www.sembly.ai/ 6. Briefly: AI meeting summary&email follow up Chrome 应用商店:https://chrome.google.com/webstore/detail/brieflyaimeetingsummar/bjmgcelbpkgmofiogkmleblcmecflldk 7. Welcome fireflies.ai:https://app.fireflies.ai/ 8. Noota Screen Recorder&Meeting Assistant Chrome 应用商店:https://chrome.google.com/webstore/detail/nootascreenrecordermee/eilpgeiadholnidgjpgkijfcpaoncchh 9. Read Meeting Reports:https://app.read.ai/analytics/meetings 10. Read Create Workspace:https://app.read.ai/analytics/settings/workspace/new 11. 10 AI Notes Taking Tool to Summarize Meetings in Seconds Geekflare:https://geekflare.com/ainotestakingtools/ 此外,还有以下免费的会议语音转文字工具,不过大部分有使用的时间限制,超过一定的免费时间后可能需要付费: 1. 飞书妙记:https://www.feishu.cn/product/minutes 2. 通义听悟:https://tingwu.aliyun.com/home 3. 讯飞听见:https://www.iflyrec.com/ 4. Otter AI:https://otter.ai/ 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-24
豆包、DeepSeek、ChatGPT分别有些什么功能用于解决用户整理对话的需求
以下是豆包、DeepSeek、ChatGPT 在解决用户整理对话需求方面的功能: ChatGPT: 1. 内容生成:可以生成文章、故事、诗歌、歌词等内容。 2. 聊天机器人:作为聊天机器人的后端,提供自然的对话体验。 3. 问答系统:为用户提供准确的答案。 4. 文本摘要:生成文本的摘要或概述。 5. 机器翻译:在这方面有不错的表现。 6. 群聊总结:能够对群聊内容进行总结。 7. 代码生成:生成代码片段,帮助开发者解决编程问题。 8. 教育:帮助学生解答问题或提供学习材料。 9. 浏览器插件:如 webpilot 。 10. PDF 对话:通过相关网站实现与 PDF 的对话。 11. PPT 生成:协助高效制作 PPT 。 12. 音视频提取总结:通过特定网站进行总结。 13. 播客总结:通过特定网站完成总结。 14. 生成脑图:通过相关网站生成。 关于豆包和 DeepSeek 在解决用户整理对话需求方面的功能,上述内容中未提及。
2025-02-13
能够模仿产品经理,把我的需求描述整理成格式化的PRD的工具有什么
以下是一些能够模仿产品经理,把您的需求描述整理成格式化 PRD 的工具: 1. 用户研究、反馈分析:Kraftful(kraftful.com) 2. 脑图:Whimsical(whimsical.com/aimindmaps)、Xmind(https://xmind.ai) 3. 画原型:Uizard(https://uizard.io/autodesigner/) 4. 项目管理:Taskade(taskade.com) 5. 写邮件:Hypertype(https://www.hypertype.co/) 6. 会议信息:AskFred(http://fireflies.ai/apps) 7. 团队知识库:Sense(https://www.senseapp.ai/) 8. 需求文档:WriteMyPRD(writemyprd.com) 9. 敏捷开发助理:Standuply(standuply.com) 10. 数据决策:Ellie AI(https://www.ellie.ai/) 11. 企业自动化:Moveworks(moveworks.com)
2025-02-09
给我一个关于ai应用提示词的整理文档
以下是为您整理的关于 AI 应用提示词的相关内容: Apple Intelligence 中的提示词: 在最新开发者测试版中包含生成式 AI 功能,其模型中的指示会在对聊天机器人说话前默认出现。 如“有用的邮件助理”AI 机器人会被告知如何根据邮件内容提问,指示包括“将答案限制在 50 个单词以内,不产生或编造虚假信息”等。 生成 Apple Photos 中“回忆”视频的指示集存在一些限制,如“不要写宗教、政治等负面内容”。 AI 应用于工作场景制作单词卡片的提示词: 核心目的包括生成符合要求的单词卡内容,并填入 Excel 文件中。 生成过程中先给出基本示例,再根据不同生成内容限定规则。 测试结果显示可同时解析多个单词,大体格式符合要求,但存在部分效果偏差和设定改变,可通过复制粘贴等方式处理。 批量产出时需上传压缩文件并完成套版操作。 关于 AI 幻觉的提示词相关思考: 网上找到的总结公众号的提示词存在输出与实际不符的情况。 总结类文章,AI 可能未读完整个文章,大语言模型可能未真去搜索网页,更像是开发商的“狡猾”,而非“AI 幻觉”。
2025-02-07
文本整理
以下是关于文本整理的相关内容: 总结类应用: 大型语言模型在概括文本方面的应用令人兴奋,可在 Chat GPT 网络界面中完成,也可通过代码实现。包括对产品评论的摘要任务,还介绍了文字总结的不同类型,如 4.1 文字总结、4.2 针对某种信息总结、4.3 尝试“提取”而不是“总结”、4.4 针对多项信息总结。 创建并使用知识库: 创建知识库并上传文本内容的上传方式及操作步骤: Notion:在文本格式页签下选择 Notion,依次进行授权、登录选择页面、选择数据、设置内容分段方式(自动分段与清洗或自定义)等操作,最后完成内容上传和分片。 自定义:在文本格式页签下选择自定义,输入单元名称,创建分段并输入内容,设置分段规则,最后保存。 本地文档:在文本格式页签下选择本地文档,拖拽或选择要上传的文档(支持.txt、.pdf、.docx 格式,每个文件不大于 20M,一次最多上传 10 个文件),选择内容分段方式(自动分段与清洗或自定义),完成上传和分片。
2025-02-07