直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

构建一个Agent会从计划、记忆、工具、行动,4个方面来描述。那么每个方面具体都包含一些什么内容

回答

构建一个 Agent 通常从计划、记忆、工具、行动这 4 个方面来描述,每个方面具体包含的内容如下:

计划(Planning)

  • 子目标分解:将大型任务分解为较小可管理的子目标,以便有效处理复杂任务。
  • 反思与改进:对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。

记忆(Memory)

  • 短期记忆:将所有的上下文学习视为利用模型的短期记忆来学习。
  • 长期记忆:通过利用外部的向量存储和快速检索来提供长期存储和召回信息的能力。

工具(Tools): Agents 学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。

行动(Action): 当接收到任务时,GPT 会先思考决定如何使用工具,然后可能会出现一个小图示,告知用户它尝试使用工具来完成任务。例如在让它搜索、画图时,它会做出相应的行动。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

像高手一样编写 GPT:从基础到实践,学习使用 GPT 的 Action

“大型语言模型的潜力不仅仅在于创作出流畅的文本、故事、论文和程序;它还可以被视为一个强大的通用问题解决工具。”和开头提到的计算机领域的通用比,Lilian进一步具体化了Agent的能力模型:在Lilian看来,Agent的能力被具象为三大类:1.规划2.记忆3.使用工具(工具+行为Action)你可能有印象——在之前的GPT-4,画图工具Dall-E,Bing搜索,插件,和代码解释器,都需要切换不同的会话/窗口实现的。后来GPT-4成为了GPT:All-Tools,可以在一个会话里根据用户需求和上下文自行选择工具,并且做出行动——这个行动,就是OpenAI定义的“Action”,如下图:当你在让它搜索,画图的时候,GPT会先思考决定怎么使用工具,然后会出现一个小图示,告诉你他尝试使用工具来完成你的任务。现在你应该能够认清AI-Agent、GPT和Action之间的联系了:GPT(All-Tools,也是现在大家正在开发的“GPTs”),是OpenAI之于传统Agent定义交上的一份答卷——具体的描绘了在大语言模型(LLM)驱动下Agent的系统实现方式。即:使用LLM驱动,通过外部API获取信息和执行的行动(Action),也是本文后半部提到的Action的定义,如下:

Inhai: Agentic Workflow:AI 重塑了我的工作流

吴恩达通过开源项目ChatDev进行举例,你可以让一个大语言模型扮演不同的角色,比如让一个Agent扮演公司CEO、产品经理、设计师、代码工程师或测试人员,这些Agent会相互协作,根据需求共同开发一个应用或者复杂程序。AI Agent基本框架OpenAI的研究主管Lilian Weng曾经写过一篇博客叫做《LLM Powered Autonomous Agents》,其中就很好的介绍了Agent的设计框架,她提出了“Agent = LLM +规划+记忆+工具使用”的基础架构,其中大模型LLM扮演了Agent的“大脑”。Planning(规划)主要包括子目标分解、反思与改进。将大型任务分解为较小可管理的子目标处理复杂的任务。而反思和改进指可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。Memory(记忆)分为短期记忆和长期记忆。其中短期记忆是指的将所有的上下文学习看成是利用模型的短期记忆来学习;而长期记忆是提供了长期存储和召回信息的能力,它们通常通过利用外部的向量存储和快速检索来存储和召回信息。Tools(工具)

问:什么是智能体 Agent

智能体是一种自主系统,它可以通过感知环境(通常通过传感器)并采取行动(通常通过执行器)来达到某种目标。在LLM支持的自主Agent系统中,LLM充当Agents的大脑,并辅以几个关键组成部分:规划子目标和分解:Agents将大型任务分解为更小的、可管理的子目标,从而能够有效处理复杂的任务。反思和完善:Agents可以对过去的行为进行自我批评和自我反思,从错误中吸取教训,并针对未来的步骤进行完善,从而提高最终结果的质量。记忆短期记忆:所有的上下文学习都是利用模型的短期记忆来学习。长期记忆:这为Agents提供了长时间保留和回忆(无限)信息的能力,通常是通过利用外部向量存储和快速检索来实现。工具使用Agents学习调用外部API来获取模型权重中缺失的额外信息(通常在预训练后很难更改),包括当前信息、代码执行能力、对专有信息源的访问等。

其他人在问
ai agent 就是 ai 工具吗
AI Agent 是基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。 AI Agent 包括以下几个概念: 1. Chain:通常一个 AI Agent 可能由多个 Chain 组成。一个 Chain 视作一个步骤,可以接受一些输入变量,产生一些输出变量。大部分的 Chain 是大语言模型完成的 LLM Chain。 2. Router:可以使用一些判定(甚至可以用 LLM 来判定),然后让 Agent 走向不同的 Chain。例如:如果这是一个图片,则 a;否则 b。 3. Tool:Agent 上可以进行的一次工具调用。例如,对互联网的一次搜索,对数据库的一次检索。 总结下来需要三个 Agent: 1. Responser Agent:主 agent,用于回复用户(伪多模态)。 2. Background Agent:背景 agent,用于推进角色当前状态(例如进入下一个剧本,抽检生成增长的记忆体)。 3. Daily Agent:每日 agent,用于生成剧本,配套的图片,以及每日朋友圈。 这三个 Agent 每隔一段时间运行一次(默认 3 分钟),运行时会分析期间的历史对话,变更人物关系(亲密度,了解度等),变更反感度,如果超标则拉黑用户,抽简对话内容,提取人物和用户的信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。 此外,AI Agent 也像是在 RAG 的基础上更进一步。RAG 是给大模型一个浏览器工具使用,而 Agent 给了大模型更多工具,比如长期记忆(给大模型一个数据库工具记录重要信息)、规划和行动(在大模型的 prompt 层做逻辑,将目标拆解并输出不同的固定格式 action 指令给工具)。 总的来说,AI Agent 代表了在流程中给大模型使用工具的能力,为大模型的应用提供了更广阔的空间。例如可以让大模型安排差旅,它会判断完成目标所需步骤,搜索近期差旅记录,在相关平台预订酒店和机票,最终完成任务。
2024-09-18
ai agent
AI 智能体(Agent)是随着 ChatGPT 与 AI 概念爆火而出现的新名词,简单理解就是 AI 机器人小助手,参照移动互联网,类似 APP 应用的概念。AI 大模型是技术,面向用户服务的是产品,因此很多公司关注 AI 应用层的产品机会。 在做 Agent 创业的公司有不少,C 端案例中,比如在社交方向,用户注册后先创建自己的 Agent,然后让其与他人的 Agent 聊天,两个 Agent 聊到一起后真人再介入,这是有趣的场景;还有借 Onlyfans 入局打造个性化聊天的创业公司。B 端案例中,如果字节扣子和腾讯元器是面向普通人的低代码平台,类似 APP 时代的个人开发者,那么还有帮助 B 端商家搭建 Agent 的机会,类似 APP 时代专业做 APP 的。 此外,字节于 2 月 1 日正式推出 AI 聊天机器人构建平台 Coze 的国内版“扣子”,主要用于开发下一代 AI 聊天机器人。还有一个情绪主题角色扮演小游戏,本文会按照需求分析、分步实现需求、提示词编写测试、GPTs 使用链接、总结的顺序进行介绍。智能体来源于 Cathy 教练和 Leah 老师的情绪力手册,这是帮助家长和孩子从源头了解、分辨、分析、处理和控制情绪的手册,内涵多个相关的智能体。
2024-09-18
agent 相关的知识
以下是关于 Agent 的相关知识: 在人工智能领域,Agent 通常被定义为一种具有感知能力的实体,它能够通过对其所处环境的观察来做出相应的决策和反应。Agent 既可以是软件形式的程序,例如对话机器人,也可以具备物理形态,比如扫地机器人。 从产品经理角度思考 Agent: Agent 可以是一个历史新闻探索向导。 身份:历史新闻探索向导。 性格:知识渊博、温暖亲切、富有同情心。 角色:主导新闻解析和历史背景分析。 为使角色更生动,可为其设计简短的背景故事,比如曾是一位对世界重大历史事件了如指掌、充满热情且愿意分享知识的历史学家。 写好角色个性的方法: 角色背景和身份:编写背景故事,明确起源、经历和动机。 性格和语气:定义性格特点,如友好、幽默、严肃或神秘;确定说话方式和风格。 角色互动方式:设计对话风格,从基本问答到深入讨论。 角色技能:明确核心功能,如提供新闻解析、历史背景分析或心理分析;增加附加功能以提高吸引力和实用性。 “智能体”(Agent)在人工智能和计算机科学领域是一个非常重要的概念,指的是一种能够感知环境并采取行动以实现特定目标的实体,可以是软件程序,也可以是硬件设备。
2024-09-14
我想设计一款符合企业内部办公的ai agent,有哪些资料可以辅助参考
以下是一些可辅助您设计符合企业内部办公的 AI Agent 的资料和相关信息: Agent 构建平台: 1. Coze:新一代一站式 AI Bot 开发平台,集成丰富插件工具,适用于构建各类问答 Bot,能拓展 Bot 能力边界。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,可将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 AI Agent 的概念和组成: 1. LLM(大模型):提供庞大的信息存储和处理能力,以理解和响应问题。 2. Planning(规划):如同园丁制定种植计划,决定任务执行步骤。 3. Memory(记忆):类似于园丁的笔记本,记录经验和已完成任务。 4. Tools(工具):指可运用的各种软件和程序,帮助执行复杂任务。 AI Agent 的相关概念: 1. Chain:通常一个 AI Agent 可能由多个 Chain 组成,每个 Chain 可视为一个步骤,接受输入变量并产生输出变量,大部分是由大语言模型完成的 LLM Chain。 2. Router:可使用判定(甚至用 LLM 判定)让 Agent 走向不同的 Chain。 3. Tool:Agent 上的一次工具调用,如对互联网的搜索或对数据库的检索。 此外,还包括以下三种 Agent: 1. Responser Agent:主 agent,用于回复用户(伪多模态)。 2. Background Agent:背景 agent,用于推进角色当前状态,如进入下一个剧本,抽检生成增长的记忆体等。 3. Daily Agent:每日 agent,用于生成剧本、配套图片和每日朋友圈。 这三种 Agent 每隔一段时间运行一次(默认 3 分钟),分析期间的历史对话,变更人物关系、反感度等,抽简对话内容提取信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。 以上信息提供了关于 AI Agent 的概述,您可以根据自己的需求选择适合的平台和概念进行进一步探索和应用。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-09-13
AI agent 落地例子
以下是关于 AI agent 的相关信息: AI agent 是在 rag 的基础上更进一步,给大模型提供了更多工具,如长期记忆(相当于给大模型一个数据库工具记录重要信息)、规划和行动(在大模型的 prompt 层做逻辑,将目标拆解并输出固定格式的 action 指令给工具)。例如可以让大模型安排差旅,它会判断完成目标所需步骤,搜索差旅记录,预订酒店和机票等。 一些 Agent 构建平台包括: Coze:新一代一站式 AI Bot 开发平台,集成丰富插件工具拓展 Bot 能力。 Microsoft 的 Copilot Studio:具备外挂数据、定义流程、调用 API 和操作等功能,并能部署到多种渠道。 文心智能体:百度推出的基于文心大模型的智能体平台。 MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识等,并能访问第三方数据和服务或执行工作流。 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于多种场景,提供多种成熟模板。 钉钉 AI 超级助理:依托钉钉优势,在处理高频工作场景表现出色。 大型语言模型置于 Agent 的“大脑”或“控制器”核心位置,赋予强大语言理解和生成能力。通过多模态感知技术和工具利用策略扩展感知和行动范围,采用思维链和问题分解技术展现出推理和规划能力,能从反馈中学习并与环境互动,在软件开发、科学研究等现实世界场景中得到应用,还能与其他 Agent 交流协作。
2024-09-11
什么是agent,技术原理是什么,有哪些应用
智能体(Agent)是指能够自主感知环境、做出决策并执行动作以实现特定目标的实体。 其技术原理包括: AppAgent 可以通过自主学习和模仿人类的点击和滑动手势,能够在手机上执行各种任务。它是一个基于大语言模型的多模态代理,能够处理和理解多种类型的信息(如文本、图像、触控操作等)。 沉浸式单机剧本杀 Bot 由多个 agent 共同协作完成,包括主持人 Agent 通过对话引导玩家,条件判断 Agent 负责解析玩家输入判断触发条件,以及通过对剧本内容进行向量化处理和构建索引来使剧情展开更流畅。 智能体的应用领域广泛,例如: 自动驾驶:自动驾驶汽车中的智能体感知周围环境,做出驾驶决策。 家居自动化:智能家居设备(如智能恒温器、智能照明)根据环境和用户行为自动调节。 游戏 AI:游戏中的对手角色(NPC)和智能行为系统。 金融交易:金融市场中的智能交易算法,根据市场数据做出交易决策。 客服聊天机器人:通过自然语言处理与用户互动,提供自动化的客户支持。 机器人:各类机器人(如工业机器人、服务机器人)中集成的智能控制系统。
2024-09-11
我是一个自媒体创作者,想自学Ai,成为AIGC方面的专家,运用到自媒体创作中,我应该按照怎样的步骤学习,有哪些方式和渠道推荐?
以下是为您整理的自学成为 AIGC 专家并应用于自媒体创作的步骤、方式和渠道: 步骤: 1. 从基础课程入手,通过网上的科普类教程了解 AIGC 的基本概念和知识。 2. 阅读 OpenAI 的官方文档,深入理解每个参数的作用和设计原理。 3. 利用推荐的 Prompt 工具进行实践练习。 学习方式: 1. 观看相关视频,如“用大模型保存你的全部人生,你会接受吗:专访安克创新 CEO 阳萌|大咖谈芯第 11 期”,了解 AI 大模型的原理等内容。 信息获取渠道: 1. 订阅一些 AI 信息源,包括公众号(如“卡尔的 AI 沃茨”)、Telegram 频道(如“黑洞资源笔记”“科技新闻投稿”“AI 探索指南”等)、微博、即刻等平台。 希望以上内容对您有所帮助,祝您在自学 AIGC 的道路上取得成功!
2024-09-16
AI在医疗器械方面有哪些应用?
AI 在医疗器械方面的应用包括以下几个方面: 1. 医疗器械的设计与优化:利用 AI 技术对医疗器械的结构、功能进行模拟和优化,提高器械的性能和安全性。 2. 疾病诊断辅助:通过对医疗数据的分析,帮助医生更准确地诊断疾病。 3. 医疗器械的质量检测:借助机器视觉、图像识别等技术,自动检测器械的外观、包装等是否合格。 4. 医疗设备的维护与预测性维修:分析设备运行数据,提前预测可能出现的故障,安排维护计划。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-09-16
关于ppt方面的ai
以下是一些做 PPT 的 AI 产品: Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。允许用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,适用于多种场合。网址:https://www.xdesign.com/ppt/ Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还包括互动元素和动画效果。网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 目前市面上大多数 AI 生成 PPT 通常按照以下思路来完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 《》 《》 当谈到 PPT 类 AI 产品时,无论国内还是国外,这类产品都非常丰富。市场上的 PPT 类 AI 产品通常是在传统 PPT 设计和生成工具的基础上,融入了生成式 AI 的新功能。但产品种类繁多,可能会让用户在选择时感到困惑。基于个人使用经验,为小白筛选出一些值得推荐的产品。
2024-09-15
chatgpt4.0.1有什么新功能,比chatgpt4先进在哪些方面
ChatGPT 4.0.1 相较于 ChatGPT 4 具有以下新功能和先进之处: 1. 大大减少了幻觉,在内部对抗性设计的事实性评估中得分更高,比最新的 GPT3.5 高 19 个百分点。 2. 在遵循用户意图的能力方面有很大改进,在 70.2%的提示中,产生的响应比 GPT3.5 更受欢迎。 3. 在各种语言中的表现更优,包括低资源语言。 4. 知识更新方面,ChatGPT 4.0.1 知识更新到 2023 年 12 月,而 ChatGPT 4o 的知识更新到 2023 年 10 月。 需要注意的是,尽管 ChatGPT 4.0.1 有这些优势,但它仍存在与早期 GPT 模型类似的局限性,如对事实产生“幻觉”和出现推理错误等,在使用其输出时应谨慎。
2024-09-14
ai在法律方面的应用
AI 在法律方面有以下应用: 1. 协助律师处理复杂案件:律师在面临情绪、精力、时间等压力可能影响专业判断时,可与 AI 协同,借助其优势相互加持。 2. 精准信息检索与整理:律师能指导 AI 精确抓取法律法规、先例判决等关键信息,为案件准备获取素材,也能让其生成和修改标准化合同,减少文档起草和修订的工作量。 3. 辅助整理案件事实和证据:在处理复杂法律关系和前沿性案件时,利用 AI 可减少工作时间。 4. 常用 Prompt 场景: 案例检索:最好使用法律行业垂类的 AI 产品,通用型 AI 可能存在查不出来、数据不全或生成内容不满足需求的情况。 指令词示例: 请搜索近五年内关于商标侵权案件中“混淆可能性”标准的具体判例,并提供相似度最高的三个案例的关键要点摘要。 检索近三年内所有涉及软件算法专利侵权的案例,分析法院判决中关于技术特征对比和侵权判定的标准,为即将面临的专利侵权案件提供参考。 比对不同地区法院在处理劳动争议案件时对加班费计算标准的差异判决,总结对雇主有利的判决趋势,为客户提供合规操作指导。 研究环境法相关案例,特别是涉及工业废弃物处理的法律责任,为客户提供合规处理建议,以降低潜在的法律风险。 5. 提供法律建议的方法: 采用逻辑结构,如 SWOT 分析法或 4P 原则。 从多个角度思考,如在分析商事诉讼时从市场趋势、竞争对手行为等角度思考诉讼策略。 简洁明了总结核心观点和注意事项。 使用引号、分隔符号及连接词组织 Prompt。 赋予 AI 特定角色,如专注于民商事法律领域的律师,以提升工作效率。
2024-09-14
我想转行做AI产品经理我该了解哪些AI方面的知识
如果您想转行做 AI 产品经理,以下是您需要了解的一些 AI 方面的知识: 1. 算法知识: 理解基本的机器学习算法原理,有助于更好地理解 AI 产品的核心技术,从而做出更合理的产品决策。 掌握一定的算法知识,可与开发团队进行更有效的沟通,减少信息不对称带来的误解。 在产品规划阶段,能够评估某些功能的技术可行性。 了解算法前沿,更好地把握产品的未来发展方向。 发现产品的独特优势,提出创新的产品特性,提升产品竞争力。 提升数据分析能力,因为很多 AI 算法都涉及到数据处理和分析。 2. 技术框架:对技术框架有认知,了解技术边界,最好能知道一些优化手段和新技术的发展。 3. 关注重点: 关注场景、痛点和价值。 例如在录播课编程作业的自动批改案例中,要关注班主任批改作业时间长的场景,作业批改无法统一标准的痛点,以及提高教学质量和效率的价值。 总之,AI 产品经理需要具备跨学科的知识背景,能够在技术和业务之间进行有效沟通和决策。
2024-09-14
基于产品知识库构建智能问答助手
以下是基于产品知识库构建智能问答助手的详细步骤: 创建知识库: 1. 以外贸大师产品的帮助文档为例进行演示。 帮助文档地址: 选择其中一个文档,如来创建知识库。 点击创建知识库。 从知识库中添加知识单元。 为了更好的检索效果,使用 Local doucuments 的方式,上传 Markdown 格式文档。首先查看文档数据格式,每个问题使用作为开头(这是 Markdown 的语法)。准备开始上传文件,至此,一个完整的知识库构建完成。 创建数据库存储用户的问答: 1. 2024.06.05 更新,对数据库不太了解的小伙伴,可以阅读。 2. 首先创建一个机器人:外贸大师产品资料问答机器人,进入到 Bot 的开发和预览页面。 3. 由于需求中需要记录下用户的问题和机器人的回答,方便进行统计用户最关心的问题然后进行优化,所以这个需求依赖数据库,将用户的每一次提问都保存到数据库中。 创建数据库。 定义数据库。 场景概述: 现代产品更新换代速度快,用户在使用产品时经常会有疑问,而且新产品的上市会伴随大量的信息和数据。利用 RAG 检索增强生成框架,能够将这些零散的信息整合成一个知识库。通过这个知识库,用户能够快速获得到需要问题的答案,极大地提升了用户体验,让用户不必再翻看厚重的说明书或漫无边际地搜索网络,省时又省力。 特别需要注意的是:文档的分片策略会严重影响查询的结果,这是当前 RAG 自身的方案原理导致的。
2024-09-19
如何构建用于LLM训练的特定领域的数据集,比如林草领域。
构建用于 LLM 训练的林草领域特定数据集可以参考以下方法: 1. 微调现有模型:采用在通用数据集上预训练的模型,以学习到的权重为起点,在新的特定领域数据集上重新训练模型。但 LLM 规模较大,更新每个权重可能需要很长时间的训练工作,且计算成本较高,可能不是最佳选择。 2. 生成 QA 数据集:对于简单需求,以 QA 数据集和 dialogue 数据集为主。先对文件中的文本进行切割,例如将每一大部分放进一个约 200 字的 txt 文件里,然后设定提示词模板。如对于公司产品手册,可设置类似“你是一个聪明的 xxx 公司的 xxx 产品的产品经理。给你一段 xxxxx 有限公司 xx 产品相关的文本,你必须依据文本想出十个不同的问题和这十个问题对应的答案……”的模板。 3. 针对金融服务领域的经验借鉴: 使用特定数据微调模型:新进入者可先使用公开的金融数据优化模型,再用自身收集的数据;现有参与者可利用现有专有数据,但可能过于保守,给新进入者带来竞争优势。 保证模型输出准确性:考虑到金融问题的重要性,新的 AI 模型需要尽可能准确,一开始人类常作为最终验证环节。 总之,构建特定领域数据集需要根据实际情况选择合适的方法,并注重数据的质量和准确性。
2024-09-06
构建新闻收集的 Agent 工具
以下是构建新闻收集的 Agent 工具的相关内容: 1. 可以通过 Coze 建立定时任务,执行工作流二,并添加分析文章和搜索文章等能力,变成一个消息情报官的 Agent,能够获得想要的领域或行业情报,还能深入挖掘相关情报信息。然后发布到 Coze 商店、豆包、飞书、微信、微信公众号、微信小程序等平台即可使用。可以构建多个分身,收集整理不同领域和行业的情报信息。 2. 最近 wiseflow 首席情报官很火,但几乎没有教程和搭建成功案例,其代码存在问题且依赖收费的 OpenAI API。可行的 Free 方案是通过文章链接订阅公众号,定时推送情报消息,并实现情报 CoT 问答。 3. 可以通过读 SQLiteDB 或者获取 RSS XML 页面 http://127.0.0.1:4000/feeds/all.atom 来获取更新的公众号。在公众号订阅不多时,建议使用分析 XML 页面。由于本地部署无法直接将文章同步到 Coze,可以选择使用多维表格及飞书机器人 API 的方式来实现中间数据的传递。在多维表格中设置状态转换,以了解文章是否已被解读和推送。
2024-09-06
我想构建一个基于“AI+易经+禅悟”的智能体,应该如何开展工作?
构建一个基于“AI+易经+禅悟”的智能体可以参考以下步骤: 1. 了解各种 AI 工具:熟悉不同 AI 工具的特点和用途,为后续工作选择合适的工具。 2. 学会写提示词:这是关键环节,决定能否清晰地向 AI 传达任务。 3. 搭建 AI 工作流:按照一定的流程和步骤将 AI 工具融入工作环节,提高效率。 4. 测试 AI 工作流:在使用初期可能会遇到不顺手的情况,需要多尝试并根据体验进行调整和优化。 5. 解决问题:当遇到现有 AI 工具不好用的情况,可能是提示词不够好或工具本身的问题,需要学习写好提示词、寻找更好的工具或寻求帮助。 6. 考虑制作智能体:当工作流效率较低时,可以考虑制作智能体来自动化完成一系列任务,需要学习相关知识或寻求专业人士的帮助。 需要注意的是,将易经和禅悟的元素融入其中需要您根据自身的理解和需求,在上述步骤中进行创新性的结合和应用。
2024-08-27
构建网站和设计网页的免费AI
以下是一些构建网站和设计网页的免费 AI 工具: 1. Bookmark 网址: 特点:AIDA 通过询问用户几个简单的问题,快速生成一个网站。提供直观的拖放编辑器,用户可以轻松自定义网站内容和布局。包括多种行业模板和自动化营销工具。 2. 10Web 网址: 特点:基于 AI 的 WordPress 网站构建工具,可以自动生成网站布局和设计。提供一键迁移功能,将现有网站迁移到 10Web 平台。集成的 AI 驱动 SEO 分析和优化工具。 3. Wix ADI 网址: 特点:基于用户提供的信息,Wix ADI 可以自动生成一个定制化的网站。提供多个设计选项和布局,用户可以进一步调整和自定义。集成了 SEO 工具和分析功能,帮助优化网站表现。
2024-08-22
专业知识库该如何构建
构建专业知识库可以通过以下两种方式: 使用 GPT 构建: 1. 将大文本拆分成若干小文本块(chunk)。 2. 通过 embeddings API 将小文本块转换成 embeddings 向量,这些向量与文本块的语义相关,并在向量储存库中保存这些向量和文本块作为问答的知识库。 3. 当用户提出问题时,将问题通过 embeddings API 转换成问题向量,与向量储存库中的文本块向量比对,查找距离最小的几个向量,把对应的文本块提取出来,与原有问题组合成新的 prompt 发送给 GPT API。 使用 Dify 构建: 1. 准备数据:收集需要纳入知识库的文本数据,包括文档、表格等格式,并对数据进行清洗、分段等预处理,确保数据质量。 2. 创建数据集:在 Dify 中创建新的数据集,上传准备好的文档,并为数据集编写良好的描述。 3. 配置索引方式:Dify 提供了三种索引方式,包括高质量模式、经济模式和 Q&A 分段模式,根据实际需求选择合适的方式。 4. 集成至应用:将创建好的数据集集成到 Dify 的对话型应用中,作为应用的上下文知识库使用,并在应用设置中配置数据集的使用方式。 5. 持续优化:收集用户反馈,对知识库内容和索引方式进行持续优化和迭代,定期更新知识库,增加新内容以保持时效性。 总的来说,Dify 提供了可视化的知识库管理工具,关键步骤包括数据准备、数据集创建、索引配置、集成应用和持续优化。
2024-08-22
AI记忆能力的应用案例
以下是一些 AI 记忆能力的应用案例: 1. 在智能体方面,如果未来能结合持久化 KV Cache、KV Cache 的压缩技术控制成本,就有可能打造出记忆力超越人类的智能体。它能记录所有对话历史、思考过程和情绪状态,在提供服务时展现出更高级别的个性化和情感连贯性。例如 ChatGPT 最新版本引入了记忆功能,可将对话重点记录在“bio”小本子上,用于后续提供更个性化和相关的回答。 2. 文本总结是一种常见应用,能将长篇聊天记录或文档简化为关键描述,提高信息检索效率和易理解性,广泛应用于商业报告、新闻摘要等领域。 3. 外部存储访问方法受到关注,如 UC Berkeley 的 MemGPT 项目,通过特定指令访问外部存储系统保存和回调信息,扩展模型记忆能力和增强上下文理解能力,使 AI 在连续对话中保持信息连贯性并根据历史交互调整响应。 4. 像“AI 女友麦洛薇”,对于不知道的信息会学习并抽取实体和关系存入知识图谱,保证不会因上下文窗口不足溢出,从知识图谱这一永久记忆中提取被丢弃的记忆,实现永久记忆功能。 5. 在学术界,有探索模型层面使用 embedding 进行信息总结的研究方向,虽然目前主要在研究阶段且实用性可能有限,但代表了未来趋势。此外,RAG 架构通过搜索相关信息片段融入大模型上下文帮助回答问题,其存储手段并非仅依赖向量库,传统基于关键词的检索方法在精确匹配具体细节时更适用。
2024-09-10
coze 记忆优化
以下是关于 coze 记忆优化的相关内容: 操作方法: 1. 进入腾讯服务器,进入到目录 chatgptonwechat/bot/bytedance。 2. 双击 bytedance_coze_bot.py。 3. 在第 42 行代码之前添加一行代码:self.sessions.session_reply。 4. 返回到终端,重新启动服务即可。 操作失误后的处理: 1. 若在操作 42 行代码时误操作为替换,并在/root/chatgptonwechat/bot/bytedance 路径下执行重登二维码操作后无反应。 处理结果:机器人复活问题已解决。重新复制课堂下载的 bytedance_coze_bot.py 文件替换后,重登微信机器人,可正常回复。 2. 无法理解图片的问题未解决,期待老师指导。 此外,Coze 复刻是吴恩达开源的 AI 翻译项目,其通过反思优化、使用工具、计划、多 Agent 合作等方式提升 AI 翻译质量。还引入了分块处理等创新点,将长文本拆分成若干小块分别进行翻译和优化,可提高处理效率和翻译质量。有兴趣更深一步了解这个设计模式的小伙伴可以查看:https://waytoagi.feishu.cn/wiki/SPNqwJkmQiyVfGkS8zocMSZcnYd 。最后一步是对初始结果进行优化,调用 AI 模型针对可优化点对初始翻译进行修修补补、润色打磨。
2024-09-02
gpt 长期记忆功能
ChatGPT 的长期记忆功能已上线,能够跨聊天记忆用户信息,从而提供更相关和个性化的回答。用户可以控制记忆内容,同时也考虑到了隐私和安全问题。此外,GPTs 也将拥有记忆功能。 然而,GPT 模型在长期记忆方面仍存在一些局限性: 模型的上下文有限,以“无状态”方式运行,没有明显方法教会模型新事实,甚至不清楚其能否执行需要不断发展记忆和上下文的任务,如阅读一本书并理解对先前章节的引用。 缺乏更新自身或适应变化环境的能力,训练完成后固定,没有机制纳入新信息或用户、世界的反馈。虽可在新数据上微调模型,但可能导致性能下降或过拟合,且由于训练周期的潜在滞后,系统容易过时。 在个性化方面,模型没有有效方法将个性化信息纳入响应,除非使用有限且低效的元提示。 相关链接:
2024-08-20
通过ollama和通义千问大模型,如果要实现一个智能机器人,支持模型微调,扩展知识库,问答记忆功能的实现步骤
要通过 Ollama 和通义千问大模型实现一个支持模型微调、扩展知识库和问答记忆功能的智能机器人,可参考以下步骤: 1. 安装和启动 Ollama 服务: 在 Mac 上启动 Ollama 应用程序,在 Linux 上通过 ollama serve 启动。 通过 ollama list 确认服务是否已启动。 2. 下载模型: 可下载如 Gemma(7B 模型)、Mistral(7B 模型)、Mixtral(87B 的 MoE 模型)、Qwen(通义千问,7B 模型)等。 3. 了解 Ollama 的特点和优势: 支持多种大型语言模型,包括通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 易于在 macOS、Windows 和 Linux 系统使用,支持 CPU 和 GPU。 提供模型库,可通过 https://ollama.com/library 查找和下载不同模型,满足不同需求和硬件条件。 支持自定义模型,如修改温度参数调整创造性和连贯性,或设置特定系统消息。 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 社区贡献丰富,有多种集成插件和界面。 4. 安装相关模型:访问 https://ollama.com/download/ 进行下载安装。 5. 选择文本向量模型:使用文本向量模型 bgem3,可从 https://huggingface.co/BAAI/bgem3 下载。 6. 利用 FAISS 创建向量存储:从 hf 下载好模型放置在指定路径,通过相关函数创建高效的向量存储。 7. 实现 RAG:基于用户问题从向量数据库中检索相关段落,根据设定阈值过滤,让模型参考上下文信息回答问题。 8. 创建网页 UI:通过 gradio 创建网页 UI 并进行评测。获取完整代码可关注公众号发送 fin 获取 github 仓库代码链接。 9. 进行问答测试:对同样的问题和上下文,基于 Qwen7b、Gemma、Mistral、Mixtral 和 GPT4 分别进行多次测试。
2024-08-16
如何利用AI工具帮助单词记忆
利用AI工具来帮助单词记忆可以显著提升学习效率和效果。以下是一些基于AI的工具和方法,可以帮助你更好地记忆单词: 1. Anki 简介:Anki 是一个基于间隔重复(Spaced Repetition)的学习软件,它使用AI算法根据你的记忆情况优化复习间隔。 功能:可以创建或下载词汇卡片,通过定期复习巩固记忆。 网址: 2. Quizlet 简介:Quizlet 提供了丰富的学习卡片和多种学习模式,包括测试、匹配游戏和间隔重复。 功能:AI生成的自定义学习计划,帮助你在最佳时间复习单词。 网址: 3. Memrise 简介:Memrise 使用AI和记忆科学来创建互动的学习体验,帮助记忆单词和短语。 功能:结合视频、图片和语音等多媒体资源,提供沉浸式学习。 网址: 4. Duolingo 简介:Duolingo 是一个广受欢迎的语言学习应用,采用游戏化的方式让学习更有趣。 功能:通过AI调整学习内容的难度,个性化学习路径。 网址: 5. Lingvist 简介:Lingvist 使用AI来个性化学习体验,根据用户的学习进度和记忆情况动态调整内容。 功能:提供实时反馈和个性化的复习建议。 网址: 6. Brainscape 简介:Brainscape 采用基于科学的学习卡片系统,利用AI优化复习间隔。 功能:提供丰富的学习卡片集和自定义学习计划。 网址: 7. ClozeMaster 简介:ClozeMaster 使用填空练习来帮助记忆单词和语法。 功能:AI根据你的学习情况推荐复习内容,提高学习效率。 网址: 8. WordUp 简介:WordUp 使用AI分析你的词汇量,并推荐最适合你的单词进行学习和记忆。 功能:结合例句、视频和图片等多种方式,增强记忆效果。 网址: 使用步骤 1. 选择适合的工具:根据你的学习偏好和目标,选择最适合的AI工具。 2. 创建或选择词汇集:大部分工具允许你创建自己的词汇卡片或选择已有的词汇集。 3. 定期复习:利用工具提供的间隔重复算法,按时进行复习。 4. 多种学习模式:尝试不同的学习模式,如测试、游戏、填空等,增加学习趣味性和多样性。 5. 跟踪进度:使用工具提供的进度跟踪和反馈功能,了解自己的学习进度和薄弱点。 示例工具使用 使用 Anki 1. 下载并安装 Anki。 2. 创建一个新的词汇卡片集,添加单词和相应的定义或例句。 3. 开始学习,Anki 会根据你的记忆情况安排复习时间。 4. 定期打开 Anki 进行复习,确保在最佳时间点复习单词。 使用 Memrise 1. 注册并登录 Memrise。 2. 选择一个适合你的语言课程,或创建自己的词汇集。 3. 使用 Memrise 提供的多种学习模式(听力、阅读、拼写等)进行学习。 4. 利用AI生成的复习计划,坚持每日复习。 通过这些AI工具,你可以有效地提升单词记忆的效率和效果,使语言学习更加轻松和有趣。
2024-05-23