Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI领域,传统机器学习,nlp,深度学习,大语言模型,rag,agent,请生成一张让普通人能看懂的AI领域概念图

Answer

以下是为您生成的 AI 领域概念图的相关解释:

人工智能(AI):一种目标,让机器展现智慧。

生成式人工智能(GenAI):一种目标,让机器产生复杂有结构的内容。

机器学习:一种手段,让机器自动从资料中找到公式,包括监督学习、无监督学习、强化学习。

  • 监督学习:有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归。
  • 无监督学习:学习的数据没有标签,算法自主发现规律,如聚类。
  • 强化学习:从反馈里学习,最大化奖励或最小化损失。

深度学习:一种更厉害的手段,参照人脑有神经网络和神经元(因为有很多层所以叫深度),神经网络可用于多种学习方式。

大语言模型(LLM):是一类具有大量参数的“深度学习”模型。对于生成式 AI,生成图像的扩散模型不是大语言模型;对于大语言模型,生成只是其中一个处理任务,如谷歌的 BERT 模型可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类。

AIGC(Artificial Intelligence Generated Content):利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等内容。

ChatGPT:一个应用实例,通过投喂大量资料预训练后,会通过聊天玩“文字接龙游戏”。它是美国 OpenAI 公司开发的一款基于大型语言模型(LLM)的对话机器人,能够根据用户的输入生成连贯且相关的文本回复。

2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,比 RNN 更适合处理文本的长距离依赖性。

Content generated by AI large model, please carefully verify (powered by aily)

References

快速学习 AIGC,有料通俗易懂版!

人工智能:一种目标,让机器展现智慧,Artificial Intelligence,简称AI生成式人工智能GenAI:一种目标,让机器产生复杂有结构的内容,Generative AI简称GenAI机器学习:一种手段,让机器自动从资料中找到公式深度学习:一种更厉害的手段,类神经网络-非常大量参数的函数大语言模型:是一类具有大量参数的“深度学习”模型,Large Language Models,简称LLMsChatGPT:一个应用实例,形象比喻:通过投喂大量资料预训练后,ChatGPT会通过聊天玩“文字接龙游戏”了。英文解释:Chat聊天,G:Generative生成,P:Pre-trained预训练,T:Transformer类神经网络模型以上概念之间的关系如下图:AIGC(Artificial Intelligence Generated Content,人工智能生成内容)是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等内容。AIGC技术可以用于多种应用,如自动撰写新闻文章、生成艺术画作、创作音乐、制作视频游戏内容等。ChatGPT是AIGC技术的一个应用实例,它代表了AIGC在文本生成领域的进展。ChatGPT是美国OpenAI公司开发的一款基于大型语言模型(Large Language Model,简称LLM)的对话机器人,它能够根据用户的输入生成连贯且相关的文本回复。用户界面如下:AGI、GenAI、AIGC几个概念的区别与理解可参考下图:更多概念可问Kimi、通义千问、文心一言等大模型,也可以继续往下看,会逐步讲解更多概念。国内主要模型公司及地址如下:

快速学习 AIGC,有料通俗易懂版!

人工智能:一种目标,让机器展现智慧,Artificial Intelligence,简称AI生成式人工智能GenAI:一种目标,让机器产生复杂有结构的内容,Generative AI简称GenAI机器学习:一种手段,让机器自动从资料中找到公式深度学习:一种更厉害的手段,类神经网络-非常大量参数的函数大语言模型:是一类具有大量参数的“深度学习”模型,Large Language Models,简称LLMsChatGPT:一个应用实例,形象比喻:通过投喂大量资料预训练后,ChatGPT会通过聊天玩“文字接龙游戏”了。英文解释:Chat聊天,G:Generative生成,P:Pre-trained预训练,T:Transformer类神经网络模型以上概念之间的关系如下图:AIGC(Artificial Intelligence Generated Content,人工智能生成内容)是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等内容。AIGC技术可以用于多种应用,如自动撰写新闻文章、生成艺术画作、创作音乐、制作视频游戏内容等。ChatGPT是AIGC技术的一个应用实例,它代表了AIGC在文本生成领域的进展。ChatGPT是美国OpenAI公司开发的一款基于大型语言模型(Large Language Model,简称LLM)的对话机器人,它能够根据用户的输入生成连贯且相关的文本回复。用户界面如下:AGI、GenAI、AIGC几个概念的区别与理解可参考下图:更多概念可问Kimi、通义千问、文心一言等大模型,也可以继续往下看,会逐步讲解更多概念。国内主要模型公司及地址如下:

【AI学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)

一、视频一主要回答了什么是AI大模型,原理是什么。1、概念:生成式AI生成的内容,叫做AIGC2、概念与关系:相关技术名词1)AI——人工智能2)机器学习——电脑找规律学习,包括监督学习、无监督学习、强化学习。3)监督学习——有标签的训练数据,算法的目标是学习输入和输出之间的映射关系。包括分类和回归。4)无监督学习——学习的数据没有标签,算法自主发现规律。经典任务包括聚类,比如拿一堆新闻文章,让模型根据主题或内容特征分成具有相似特征的组。5)强化学习——从反馈里学习,最大化奖励或最小化损失;类似训小狗。6)深度学习——一种方法,参照人脑有神经网络和神经元(因为有很多层所以叫深度)。神经网络可以用于监督学习、无监督学习、强化学习。7)生成式AI——可以生成文本、图片、音频、视频等内容形式8)LLM——大语言模型。对于生成式AI,其中生成图像的扩散模型就不是大语言模型;对于大语言模型,生成只是其中一个处理任务,比如谷歌的BERT模型,可用于语义理解(不擅长文本生成),如上下文理解、情感分析、文本分类;3、技术里程碑——2017年6月,谷歌团队发表论文《Attention is All You Need》。这篇论文首次提出了Transformer模型,它完全基于自注意力机制(Self-Attention)来处理序列数据,而不需要依赖于循环神经网络(RNN)或卷积神经网络(CNN)。GPT含义:Transformer是关键。Transformer比RNN更适合处理文本的长距离依赖性。

Others are asking
想转型AI产品经理,推荐学习的资料有?
以下是为您推荐的学习资料,有助于您从产品经理转型为 AI 产品经理: 1. 林粒粒呀的相关视频,如“小白如何理解技术原理与建立框架”,其中介绍了思维链、RAG、PAL、ReAct 等概念,并且提到 Transformer 是仿生算法的阶段性实现。 思维链:谷歌在 2022 年一篇论文提到思维链可以显著提升大语言模型在复杂推理的能力,即使不用小样本提示,也可以在问题后面加一句【请你分步骤思考】。 RAG:检索增强生成(RetrievalAugmented Generation),外部知识库切分成段落后转成向量,存在向量数据库。用户提问并查找到向量数据库后,段落信息会和原本的问题一块传给 AI,可搭建企业知识库和个人知识库。 PAL:程序辅助语言模型(ProgramAided Language Model),2022 年一篇论文中提出,对于语言模型的计算问题,核心在于不让 AI 直接生成计算结果,而是借助其他工具比如 Python 解释器作为计算工具。 ReAct:2022 年一篇《React:在语言模型中协同推理与行动》的论文提出了 ReAct 框架,即 reason 与 action 结合,核心在于让模型动态推理并采取行动与外界环境互动。比如用搜索引擎对关键字进行搜索,观察行动得到的结果。可借助 LangChain 等框架简化构建流程。 2. 余一的相关内容,如《AI 时代个人生存/摸鱼探索指南.Beta》《从 2023 年报,看中国上市公司怎么使用生成式 AI》。 3. 相关网页链接: 创新公司观察: 2022 2024 年融资 2000w 美金以上的公司列表和详细公司分析:https://ameliadev.notion.site/202220242000w08f50fafd81b420fa7f26ecd6c0b3243?pvs=4 AI Grant 公司列表和详细公司分析(三期):https://ameliadev.notion.site/AIGranta52f291e81f34b418c9919497961e831?pvs=4 AIGC 行业与商业观察(2024.1):https://gamma.app/docs/AIGCDev9q1bax2pspnlxqu 【AI 产品/功能构建】: 顶级科技公司产品团队正在构建哪些 AI 功能【总览】:https://gamma.app/docs/AIzawqmb2ff3cv958 顶级科技公司产品团队正在构建哪些 AI 功能【产品分析】:https://gamma.app/docs/AItebxqet8ubz3rje 顶级科技公司产品团队正在构建哪些 AI 功能【思考借鉴】
2025-03-18
有什么使用AI驱动的游戏项目吗?其中有哪些比较热门
以下是一些使用 AI 驱动的游戏项目及热门情况: 1. 《Among Us》:由只有 5 名员工的工作室 Innersloth 制作。 2. 《微软模拟飞行》:有新的游戏类型和与新内容实时生成结合的特点。 3. 《AI Dungeon》和《Hidden Door》:基于文本的早期游戏例子。 4. 《Suck Up!》:2023 年 12 月由 Proxima 工作室开发的“喜剧欺骗游戏”,玩家扮演吸血鬼与 LLM 驱动的 NPC 对话,上线仅两周全网播放火速突破千万。 此外,还有以下趋势和特点: 1. 由人工智能辅助的“微型游戏工作室”逐步崛起,小型工作室能创造的游戏规模将增长。 2. 每年发布的游戏数量会增加。 3. 新的游戏类型将会被创造出来,例如以人工智能创造的角色为特色的 Spellbrush 的 RPG 游戏 Arrowmancer。 4. 有的游戏开发商使用人工智能让玩家在游戏中创建自己的头像。 生成式 AI 将使生产高质量游戏变得更加简单、更快和更便宜,同时使玩家能够真正定制他们的游戏体验。我们已经看到像 Scenario、Iliad 这样可以创建游戏资源的 AI 工具,以及像 Promethean 这样可以构建整个虚拟世界的平台。甚至可以用像 Inworld、Charisma 和 Convai 这样的产品生成非玩家角色(NPC)。
2025-03-18
有没有适合记录会议纪要的AI
以下是一些适合记录会议纪要的 AI 工具和方法: 1. 案例一:【普通人秒变效率王】AI 工作流秒记会议纪要 视频讲解:https://m.okjike.com/originalPosts/65fa9d1112ed2fda68e6215e?s=eyJ1IjoiNTlhZDcyZDUwYjAyYTEwMDEyMjc3YmZmIiwiZCI6MX0%3D 工作流概述: 文本导出:使用飞书妙记将会议对话导出为 txt 文件 纪要生成:启动 Kimichat 输入会议纪要 prompt 提示词并上传 txt 文件 内容完善:与 Kimichat 对话并补充会议中未记录或需强调的信息 纪要微调:审阅 Kimichat 生成的会议纪要草稿进行必要微调 成品输出:确认会议纪要内容无误后,输出最终版文档 和 Kimichat 的完整对话(点击可直接复用并接着聊):https://kimi.moonshot.cn/share/cnsk08phmfr6s04umlrg 2. 总结类 AI 工具: 3. 免费的会议语音转文字工具: 飞书妙记:https://www.feishu.cn/product/minutes ,飞书的办公套件之一 通义听悟:https://tingwu.aliyun.com/home ,阿里推出的 AI 会议转录工具 讯飞听见:https://www.iflyrec.com/ ,讯飞旗下智慧办公服务平台 Otter AI:https://otter.ai/ ,转录采访和会议纪要 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-03-18
我自己想做一个英语背单词的游戏,让AI写出Markdown代码运行后,发现问题很大,但是我有不知如何修改这些代码。所以我觉得自己应该懂Markdown 代码语言。但是我不知道Markdown是最适合的编程语言吗?
Markdown 语言不太适合用于编写复杂的英语背单词游戏。虽然 Markdown 简单易用,常用于文档格式化,但在实现游戏逻辑和功能方面存在较大局限性。 如果您想开发英语背单词游戏,更适合使用编程语言,如 Python 等。在处理代码问题时,您可以参考以下方法: 1. 对于编程小白,向 AI 提供代码范例,尤其是新进入代码节点的 IDE 中的范例,减少对 AI 所写代码的改动。 2. 向 AI 说清楚输入变量与输出变量的类型。 3. 说明与工作流中匹配或想要的变量名称,以减少二次修改。 4. 列出输入变量的具体书写形式,对于复杂形式可使用特定方法获取。 5. 说清楚代码要实现的功能,复杂功能尽量将运行逻辑描述清楚,多用变量名称指代涉及的变量。 如果代码运行效果不尽人意,可把当前的代码、输入变量、预期结果提供给 AI,并告知错误的结果或者报错信息,让 AI 帮忙寻找问题并提供修改方案。提问时可参考以下方式: 以上是我目前的 python 代码,我的输入变量。 但是代码运行后的实际结果却是。 另外,在游戏开发与修改过程中,还需注意文件的存放要求、功能优化、平台上传等方面的问题。例如,三个重要文件需在一个文件夹,本地内置图像、音乐等也需在同一文件夹。游戏功能可增加关卡、调整金币获取和技能点花费、解决 Bug 等。研究将游戏发布到 4399 开放平台时,需注册、实名制,审核较严格。获取游戏素材可从官网免费下载或淘宝购买抠好的素材。
2025-03-18
什么ai可以帮我修改简历美化简历
以下是一些可以帮助您修改和美化简历的 AI 工具: 1. 超级简历优化助手:分析简历内容并提供优化建议,帮助用户优化简历提高求职成功率。 2. ResumeMatcher:AI 驱动的开源简历优化工具,提供智能关键词匹配、深入分析见解,提升简历通过 ATS 筛选的几率。 3. KickResume:提供 AI 简历重写服务,使用 OpenAI 的 GPT4 语言模型,能在几秒钟内修复简历错误、使其更专业,并使用行业术语和关键词优化简历,帮助用户通过 ATS 筛选,生成与求职职位匹配的求职信。
2025-03-18
AIGC 检测
以下是一些常见的 AIGC 检测相关的信息: AIGC 论文检测网站和工具: 1. Turnitin:是广泛使用的学术剽窃检测工具,增加了检测 AI 生成内容的功能。使用方法是上传论文,系统自动分析并提供详细报告,标示出可能由 AI 生成的部分。 2. Copyscape:主要用于检测网络上的剽窃行为,虽不是专门的 AIGC 检测工具,但可发现可能被 AI 生成的重复内容。输入文本或上传文档,系统扫描网络查找相似或重复内容。 3. Grammarly:提供语法检查和剽窃检测功能,剽窃检测部分可帮助识别可能由 AI 生成的非原创内容。将文本粘贴到编辑器中,选择剽窃检测功能,系统提供分析报告。 4. Unicheck:基于云的剽窃检测工具,适用于教育机构和学术研究,可检测 AI 生成内容的迹象。上传文档或输入文本,系统分析并生成报告,显示潜在的剽窃和 AI 生成内容。 5. :专门设计用于检测 AI 生成内容的工具,使用先进算法分析文本,识别是否由 GPT3 或其他 AI 模型生成。上传文档或输入文本,系统提供详细报告。 6. :提供免费的 AI 内容检测工具,可识别文本是否由 AI 生成。将文本粘贴到在线工具中,点击检测按钮,系统提供分析结果。 7. GPTZero:专门设计用于检测由 GPT3 生成内容的工具,适用于教育和出版行业。上传文档或输入文本,系统分析并提供报告,显示文本是否由 GPT3 生成。 8. Content at Scale:提供 AI 内容检测功能,帮助用户识别文本是否由 AI 生成。将文本粘贴到在线检测工具中,系统分析并提供结果。 判断一张图片是否 AI 生成: 可以使用一些网站,例如 ILLUMINARTY(https://app.illuminarty.ai/)。但在测试过程中可能存在误判,比如将结构严谨的真实摄影作品识别为 AI 作图,这是因为鉴定 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。
2025-03-18
agent
智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,既可以是软件程序,也可以是硬件设备。 在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并具有以下关键组成部分: 1. 规划:包括子目标和分解,将大型任务分解为更小、可管理的子目标,以有效处理复杂任务。 2. 反思和完善:能够对过去的行为进行自我批评和反思,从错误中吸取教训,完善未来步骤,提高最终结果质量。 3. 记忆:包含短期记忆,用于所有的上下文学习;长期记忆,通过利用外部向量存储和快速检索,为 Agents 提供长时间保留和回忆(无限)信息的能力。 4. 工具使用:Agents 学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。 以下是一些关于智能体 Agent 的相关目录: 1. 2. 3. 4. 5. 6. 从产品角度思考 Agent 设计: 1. Agent 可以是一个历史新闻探索向导。 身份:历史新闻探索向导 性格:知识渊博、温暖亲切、富有同情心 角色:主导新闻解析和历史背景分析 为使角色更生动,可为其设计简短背景故事,如曾是一位历史学家,对重大历史事件了如指掌,充满热情,愿意分享知识。 2. 写好角色个性的方法: 角色背景和身份:编写背景故事,明确起源、经历和动机。 性格和语气:定义性格特点,如友好、幽默、严肃或神秘;确定说话方式和风格。 角色互动方式:设计对话风格,从基本问答到深入讨论。 角色技能:明确核心功能,如提供新闻解析、历史背景分析或心理分析;增加附加功能以提高吸引力和实用性。 正如《》所写:个性化定制的“虚拟伴侣”能得到用户认可,因为精准击中许多年轻人的孤独和焦虑,背后是年轻人渴望被理解、沟通和交流。美国心理学家 Robert Jeffrey Sternberg 提出了“爱情三角理论”,认为爱情包含“激情”“亲密”和“承诺”三个要素。激情是生理上或情绪上的唤醒,例如对某人有强烈的性或浪漫的感觉;亲密是一种相互依恋的感觉,通过相互联结带来的喜爱和相互沟通分享自己的所见所闻、喜怒哀乐来体现;承诺是决定建立长期稳定关系,融入对方生活,形成互助互惠的关系,代表着一种长相厮守的责任。
2025-03-18
AI Agent的具体应用场景,特别是职场办公场景
AI Agent 的具体应用场景如下: 1. 在职场办公场景中,主要应用场景包括研究总结和客户服务。 2. 个性化方面,随着用户的使用越来越了解用户习惯和想法,从而作出喜好预测。例如 Dot App 在对话中了解用户喜好,随后为用户推荐新的咖啡店。 3. 自主完成任务方面,如 Auto GPT,用户输入一个目标后,可自主执行任务、递归地开发和调试代码。 4. 多 Agent 协作方面,如斯坦福大学的 SmallVille(小镇)项目,25 个人工智能体居住在一个沙盒虚拟城镇中通过复杂的社交互动来执行他们的日常生活;Fixie AI 在收到用户请求后启动多个负责不同模块的 Agent 进行数据查询和传递,最终生成邮件内容给客户回复;博主林亦 LYi 的《AI 炒股?我开了一家员工全是 AI 的公司,自动帮我炒股》就在某种程度上实现了多 Agent 协作的能力。 5. 在企业服务方面,Brix 面向北美和欧洲企业,提供全球雇佣的 AI 驱动解决方案。通过 Hiring Agent,Brix 触达全球约 2000 万以上的人才,自动完成候选人筛选、简历分析和面试流程,帮助企业快速组建高效团队。通过 Working Agent 支持远程团队的智能化管理,为企业构建 100 至 500 人规模的全球化组织提供一站式解决方案。 6. 时来智能通过自研的 AI Agent 以及强化学习等技术,为线下餐饮服务门店提供全自动管理私域流量营销运营的解决方案。基于垂直场景数据训练的 AI 营销模型可以针对不同消费者实时生成并推送个性化的营销折扣方案,从而在优化营销成本的同时显著提升营销转化效果。 目前,AI Agent 应用大多集中在 2B 场景,面向个人消费者的产品少之又少。一方面是高度智能化的 Agent 能力需要打磨,概念落地还有较长一段距离;一方面是 AI 和娱乐消费诉求的结合还几乎没有,其主要带来的是生产方式变革和效率变革。个人消费者方向,目前只看到“私人助理”场景。
2025-03-17
agent
智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,既可以是软件程序,也可以是硬件设备。 在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并辅以几个关键组成部分: 1. 规划:包括子目标和分解,将大型任务分解为更小的、可管理的子目标,以有效处理复杂任务。 2. 反思和完善:可以对过去的行为进行自我批评和自我反思,从错误中吸取教训,并针对未来的步骤进行完善,提高最终结果的质量。 3. 记忆:包含短期记忆,所有的上下文学习都是利用模型的短期记忆来学习;长期记忆,为 Agents 提供长时间保留和回忆(无限)信息的能力,通常通过利用外部向量存储和快速检索来实现。 4. 工具使用:Agents 学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。 以下是一些关于智能体 Agent 的相关目录: 1. 2. 3. 4. 5. 6. 从产品角度思考 Agent 设计: 1. Who:Agent 是谁?性格是什么?我们的 Agent 可以是一个历史新闻探索向导,其身份为历史新闻探索向导,性格知识渊博、温暖亲切、富有同情心,角色是主导新闻解析和历史背景分析。为使角色更加生动,可为 Agent 设计简短的背景故事,比如曾是一位历史学家,对世界上的重大历史事件了如指掌,充满热情,愿意分享知识。 2. 怎么写好角色个性: 角色背景和身份:编写背景故事,明确起源、经历和动机。 性格和语气:定义性格特点,如友好、幽默、严肃或神秘;确定说话方式和风格。 角色互动方式:设计对话风格,从基本问答到深入讨论。 角色技能:明确核心功能,如提供新闻解析、历史背景分析或心理分析;增加附加功能以提高吸引力和实用性。 正如《》所写:个性化定制的“虚拟伴侣”能得到用户的认可,这是因为精准地击中了许多年轻人无处可藏的孤独和焦虑,背后是年轻人渴望被理解、沟通和交流。美国心理学家 Robert Jeffrey Sternberg 提出了“爱情三角理论”,认为爱情包含“激情”“亲密”和“承诺”三个要素。激情是生理上或情绪上的唤醒,例如对某人有强烈的性或浪漫的感觉;亲密是一种相互依恋的感觉,通过相互联结带来的喜爱和相互沟通分享自己的所见所闻、喜怒哀乐来体现;承诺是决定建立长期稳定关系,融入对方生活,形成互助互惠的关系,代表着一种长相厮守的责任。
2025-03-17
ToB行业有什么关于AI Agent的应用场景
在 ToB 行业,AI Agent 有以下应用场景: 1. 人力资源领域:如 Brix 面向北美和欧洲企业,提供全球雇佣的 AI 驱动解决方案。通过 Hiring Agent,触达全球约 2000 万以上的人才,自动完成候选人筛选、简历分析和面试流程,帮助企业快速组建高效团队。通过 Working Agent 支持远程团队的智能化管理,为企业构建 100 至 500 人规模的全球化组织提供一站式解决方案。 2. 餐饮营销领域:时来智能通过自研的 AI Agent 以及强化学习等技术,为线下餐饮服务门店提供全自动管理私域流量营销运营的解决方案。基于垂直场景数据训练的 AI 营销模型可以针对不同消费者实时生成并推送个性化的营销折扣方案,从而在优化营销成本的同时显著提升营销转化效果,能帮助门店提升 50%100%的营销转化效果,以及相应提升平均 1520%的营业额。 3. 销售和供应链管理:嵌入企业流程,提升整体运营效率。 此外,AI Agent 具有以下特点: 1. 个性化:随着用户的使用越来越了解用户习惯和想法,从而作出喜好预测。例如 Dot App 在对话中了解用户喜好,随后为用户推荐新的咖啡店。 2. 自主完成任务:如 Auto GPT,用户输入一个目标后,可自主执行任务、递归地开发和调试代码。 3. 多 Agent 协作:例如斯坦福大学的 SmallVille(小镇)项目,25 个人工智能体居住在一个沙盒虚拟城镇中通过复杂的社交互动来执行他们的日常生活;Fixie AI 在收到用户请求后启动多个负责不同模块的 Agent 进行数据查询和传递,最终生成邮件内容给客户回复。 以下是一些 Agent 构建平台: 1. Coze:新一代的一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具拓展 Bot 能力边界。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体(Agent)平台,支持开发者根据自身需求打造大模型时代的产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行设计良好的工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等多种场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托于钉钉强大的场景和数据优势,提供更深入的环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。
2025-03-17
multi agents讲解
多智能体(MultiAgent)是由多个自主、独立的智能体(Agent)组成的系统。每个智能体都能感知环境、决策并执行任务,且它们之间能信息共享、任务协调与协同行动以实现整体目标。 随着大型语言模型(LLM)的出现,以 LLM 为核心构建的 Agent 系统受广泛关注。目前常见框架集中在单 Agent 场景,其核心是 LLM 与工具协同配合,可能需与用户多轮交互。而多 Agent 场景为不同 Agent 分配角色,通过协作完成复杂任务,与用户交互可能减少。 构建多 Agent 框架主要组成部分包括: 1. 环境:所有 Agent 处于同一环境,包含全局状态信息,Agent 与环境有信息交互与更新。 2. 阶段:采用 SOP 思想将复杂任务分解为多个子任务。 3. 控制器:可以是 LLM 或预先定义好的规则,负责环境在不同 Agent 和阶段间切换。 4. 记忆:因 Agent 数量增多,消息数量及每条消息的记录字段增加。 此外,吴恩达最新演讲提到四种 Agent 设计范式,Reflection 和 Tool Use 相对经典且广泛使用,Planning 和 Multiagent 较新颖有前景。Reflection 类似于 AI 自我纠错和迭代,如让 AI 写代码并自我检查修改。Tool Use 指大语言模型调用插件拓展能力。在一些场景中,Reflection 可用两个 Agent,一个写代码,一个 Debug。
2025-03-14
哪个agent可以制作图表?
以下是一些可以制作图表的 agent: Cursor:能够全自动写程序、装依赖、debug 等,为用户生成所需的图表,例如生成谷歌和亚马逊最近五年的股价对比图,以及对图片进行特定形状的处理。 E2b 团队:制作了。 共建者缱绻怡然:制作了中的 AI Agent 图谱。
2025-03-14
RAG
RAG(RetrievalAugmented Generation,检索增强生成)是一种结合检索和生成能力的自然语言处理架构。 通用语言模型通过微调可完成常见任务,而更复杂和知识密集型任务可基于语言模型构建系统,访问外部知识源来实现。Meta AI 研究人员引入 RAG 来完成这类任务,它把信息检索组件和文本生成模型结合,可微调且内部知识修改高效,无需重新训练整个模型。 RAG 接受输入并检索相关支撑文档,给出来源,与原始提示词组合后送给文本生成器得到输出,能适应事实变化,让语言模型获取最新信息并生成可靠输出。 LLM(大语言模型)存在一些缺点,如无法记住所有知识尤其是长尾知识、知识容易过时且不好更新、输出难以解释和验证、容易泄露隐私训练数据、规模大导致训练和运行成本高。而 RAG 具有数据库存储和更新稳定、数据更新敏捷且不影响原有知识、降低大模型输出出错可能、便于管控用户隐私数据、降低大模型训练成本等优点。 在 RAG 系统开发中存在 12 个主要难题及相应的解决方案。
2025-03-17
作为一个产品经理,我现在要设计一个企业内的销售培训智能体,我手里有产品知识、销售基础知识,我该怎么设计,是只做rag还是做多智能体协同?
以下是为您设计企业内销售培训智能体的一些建议: 首先,了解多智能体模式的设置。它包括全局设置和多个代理之间的编排协调两个核心部分。全局设置涵盖角色设定与回复逻辑、记忆管理以及对话体验等,其中人物设定与回复逻辑应侧重于角色塑造。在智能体的交互流程设计上,要形成完整的互动链条,当用户意图未满足跳转条件时,保持与当前智能体的沟通。设计多轮协作的智能体时,应将其交互设计为闭环结构,以确保用户能自由切换。 其次,动手实践制作智能体。对于 Chat GPT 版本,可按以下步骤:点击“浏览 GPTs”按钮,点击“Create”按钮创建,使用自然语言对话或手工设置进行具体配置,然后调试并发布。对于 Chat GLM 版本,点击“创建智能体”按钮,输入智能体描述,可粘贴准备好的提示词模板,其配置可自动生成,可根据需求调整并上传本地文件作为知识库。 然后,考虑多智能体协同的概念。在处理复杂任务时,单智能体可能面临提示词修改和逻辑不清晰的问题。多智能体协作如吴恩达所举例,每个智能体被赋予不同身份,互相合作对话,能模拟现实工作场景,成为复杂系统,但可能存在效率不高的情况。 最后,您可以根据实际情况选择是采用 RAG 还是多智能体协同。如果任务相对简单,RAG 可能足够;若任务复杂,涉及多个环节和角色的协作,多智能体协同可能更合适。您还可以通过具体的例子,如旅游场景中负责景点推荐、路线规划和食宿安排的三个智能体,来更好地理解和设计。
2025-03-16
什么是rag?
RAG(RetrievalAugmented Generation)即检索增强生成,是一种结合检索和生成能力的自然语言处理架构,旨在为大语言模型(LLM)提供额外的、来自外部知识源的信息。 大模型存在一些缺点,如无法记住所有知识(尤其是长尾知识)、知识容易过时且不好更新、输出难以解释和验证、容易泄露隐私训练数据、规模大导致训练和运行成本高。而 RAG 具有诸多优点: 1. 数据库对数据的存储和更新稳定,不存在模型学不会的风险。 2. 数据库的数据更新敏捷,增删改查可解释,且对原有知识无影响。 3. 数据库内容明确、结构化,加上模型的理解能力,能降低大模型输出出错的可能。 4. 知识库存储用户数据,便于管控用户隐私数据,且可控、稳定、准确。 5. 数据库维护可降低大模型的训练成本。 RAG 的核心流程是根据用户提问,从私有知识中检索到“包含答案的内容”,然后把“包含答案的内容”和用户提问一起放到 prompt(提示词)中,提交给大模型,此时大模型的回答就会充分考虑到“包含答案的内容”。其最常见应用场景是知识问答系统。 一个 RAG 的应用可抽象为 5 个过程: 1. 文档加载:从多种不同来源加载文档。 2. 文本分割:把文档切分为指定大小的块。 3. 存储:包括将切分好的文档块进行嵌入转换成向量的形式,以及将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示生成更合理的答案。
2025-03-14
RAG
RAG(RetrievalAugmented Generation,检索增强生成)是一种结合检索和生成能力的自然语言处理架构。 通用语言模型通过微调可完成常见任务,而更复杂和知识密集型任务可基于语言模型构建系统,访问外部知识源来实现。Meta AI 引入 RAG 来完成这类任务,它把信息检索组件和文本生成模型结合,可微调且内部知识修改高效,无需重新训练整个模型。 RAG 接受输入并检索相关支撑文档,给出来源,与原始提示词组合后送给文本生成器得到输出,适应事实随时间变化的情况,让语言模型获取最新信息并生成可靠输出。 LLM 存在无法记住所有知识(尤其是长尾知识)、知识易过时且不好更新、输出难以解释和验证、易泄露隐私训练数据、规模大导致训练和运行成本高等缺点,而 RAG 具有数据库存储和更新稳定、数据更新敏捷且可解释、降低大模型输出出错可能、便于管控用户隐私数据、降低大模型训练成本等优点。 在 RAG 系统开发中存在 12 大痛点及相应的解决方案。
2025-03-14
RAG
RAG(RetrievalAugmented Generation,检索增强生成)是一种结合检索和生成能力的自然语言处理架构。 通用语言模型通过微调可完成常见任务,而更复杂和知识密集型任务可基于语言模型构建系统,访问外部知识源来实现。Meta AI 研究人员引入 RAG 来完成这类任务,它把信息检索组件和文本生成模型结合,可微调且内部知识修改高效,无需重新训练整个模型。 RAG 接受输入后检索相关/支撑文档,并给出来源,这些文档与原始提示词组合后送给文本生成器得到最终输出,能适应事实随时间变化的情况,让语言模型获取最新信息并生成可靠输出。 LLM(大语言模型)存在一些缺点,如无法记住所有知识(尤其是长尾知识)、知识容易过时且不好更新、输出难以解释和验证、容易泄露隐私训练数据、规模大导致训练和运行成本高。而 RAG 具有以下优点:数据库对数据的存储和更新稳定,无学习风险;数据更新敏捷,可解释且不影响原有知识;降低大模型输出出错可能;便于管控用户隐私数据;降低大模型训练成本。 在 RAG 系统开发中存在 12 大痛点及相应的解决方案。
2025-03-13
请帮我推荐优化大模型+知识库的提示词技巧,重点是解决将知识库配置给大模型做RAG后,召回率不高或者不遵循指令。
以下是关于优化大模型+知识库的提示词技巧,以解决将知识库配置给大模型做 RAG 后召回率不高或者不遵循指令的问题: 首先,了解 LLM 应用性能优化的推荐路径: 1. 从 prompt 工程开始把 LLM 应用快速跑起来。 2. 若遇到表现性能不足等问题,如结构化提示词占用上下文过长,可尝试精简提示词长度;若指令遵循度不足,则加强指令约束。 3. 若提示工程无法满足要求,分析问题,若缺失知识,先简单做知识库 RAG。 4. RAG 之后若想让模型表现更收敛更稳定,尝试微调模型。 5. 微调模型后,若模型表现变好,使用更多高级 RAG 技术,构造输入输出样本,进一步用于微调模型,构建正向迭代循环。 需要注意的是,该路径有个隐藏前提:该 LLM 应用依赖外部知识,需要 RAG。若不需要外部知识,则不需要使用 RAG,可以直接进入 prompt 工程与微调的正向迭代循环。 对于 RAG 流程中的检索有用信息部分,有以下改进策略: 1. 优化索引: 按照子部分索引:将文本块再拆分为较小的文本(例如单句),然后对这些小块进行多次索引。适用于有多个主题、有冲突信息的复杂长文本信息,确保与查询相关的上下文。 按照文本框可以回答的问题索引:让 LLM 生成与拆分的文本块相关的假设性问题,并将这些问题用于索引,适用于用户没有提出非常明确的问题,减少模糊性。 按照文本块的摘要进行索引:适用于文本框中有多余信息或者与用户查询无关细节的情况。 2. 重排 rerank:搜到相似信息后,选择策略,大部分场景下选择最相似的即可。 在从知识库中检索出内容后利用大模型进行总结时,有两点需要注意: 1. 优化 Prompt,但此处不展开,可参考相关文章。 2. 选择合适的大模型,考虑上下文长度、聪明度和生成速度。若回答场景是很长的文档,可能更关注上下文长度;大多数情况下,大模型越聪明,生成速度可能越慢。
2025-03-12