Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI Agents(智能体)

Answer

AI 智能体(Agents)是人工智能领域中一个重要的概念:

  1. 从 AGI 的发展等级来看,智能体不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。
  2. 作为大模型的主要发展方向之一,智能体中间的“智能体”其实就是大模型(LLM)。通过为 LLM 增加工具、记忆、行动、规划这四个能力来实现。目前行业里主要用到的是 langchain 框架,它把 LLM 与 LLM 之间以及 LLM 与工具之间通过代码或 prompt 的形式进行串接。
  3. 从智能体的起源探究来看,心灵社会理论认为智能是由许多简单的 Agent(分等级、分功能的计算单元)共同工作和相互作用的结果。这些 Agent 在不同层次上执行不同的功能,通过协作实现复杂的智能行为。心灵社会将智能划分为多个层次,每个层次由多个 Agent 负责,每个 Agent 类似于功能模块,专门处理特定类型的信息或执行特定任务。同时存在专家 Agent、管理 Agent、学习 Agent 等不同类型的 Agent 及其相应功能。从达特茅斯会议开始讨论人工智能,到马文·明斯基引入“Agent”概念,“AI”和“Agent”就彻底聚齐,往后被称之为 AI Agent。
Content generated by AI large model, please carefully verify (powered by aily)

References

问:AGI 的 5 个等级是什么?

OpenAI在其内部会议上分享了关于通用人工智能(AGI)的五个发展等级。OpenAI自2015年成立以来,一直将AGI作为其战略目标之一,随着ChatGPT、多模态大模型和AI Agent等技术的发展,我们似乎越来越接近实现这一目标。AGI的五个等级分别为:1.聊天机器人(Chatbots):具备基本对话能力的AI,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。2.推理者(Reasoners):具备人类推理水平的AI,能够解决复杂问题,如ChatGPT,能够根据上下文和文件提供详细分析和意见。3.智能体(Agents):不仅具备推理能力,还能执行全自动化业务的AI。目前许多AI Agent产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。4.创新者(Innovators):能够协助人类完成新发明的AI,如谷歌DeepMind的AlphaFold模型,可以预测蛋白质结构,加速科学研究和新药发现。5.组织(Organizations):最高级别的AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。

非技术背景,一文读懂大模型(长文)

agent算是从年前到现在,比较火的一个概念了,也被很多人认为是大模型的未来的一个主要发展方向。首先我们看这个很经典的一张图看起来还是蛮复杂的,然后市面上的很多描述agent的文章写的也比较复杂,说智能体是啥智能的最小单元,相较于copilot,是可以给他设定一个目标后主动完成任务的等等。当然这些说法都没错,但是我觉得还是有些不好理解的。所以我们依然先从原理着手去理解下,agent是个什么东西。首先这张图里,中间的“智能体”,其实就是llm,或者说大模型。四个箭头,分别是我们为llm增加的四个能力。工具、记忆、行动、规划。那么这个是怎么新增的呢?目前行业里主要用到的是一个叫langchain的框架,这个框架可以简单理解为,他把llm和llm之间,以及llm和工具之间,通过代码或prompt的形式,进行了串接。这个其实也像是在rag的基础上再进了一步。因为我们知道rag其实是给了大模型一个浏览器工具来使用嘛,那agent,其实就是给了大模型更多的工具。比如像是长期记忆,其实就是给了大模型一个数据库工具让其往里记录重要信息。规划和行动,其实就是在大模型的prompt层做的些逻辑,比如让其将目标进行每一步的拆解,拆解完成后,每一步去输出不同的固定格式action指令,给到工具作为输入。当然langchain或者说agent还不止这些,也会有很多其他的代码逻辑体现在其中,不过其主要的主干逻辑,其实还是在prompt层和工具层,完成的设计。

AI-Agent系列(一):智能体起源探究

核心思想:心灵社会理论认为,智能是由许多简单的Agent(分等级、分功能的计算单元)共同工作和相互作用的结果。这些Agent在不同层次上执行不同的功能,通过协作实现复杂的智能行为。多重层次:心灵社会将智能划分为多个层次,从低层次的感知和反应到高层次的规划和决策,每个层次由多个Agent负责。功能模块:每个Agent类似于功能模块,专门处理特定类型的信息或执行特定任务,如视觉处理、语言理解、运动控制等。分布式智能:智能不是集中在单一的核心处理单元,而是通过多个相互关联的Agent共同实现。这种分布式智能能够提高系统的灵活性和鲁棒性,应对复杂和多变的环境。同时,在《心灵社会》中,明斯基还详细描述了不同类型的Agent及其功能:专家Agent:拥有特定领域知识和技能的Agent,负责处理复杂的任务和解决特定问题。管理Agent:协调和控制其他Agent的活动,确保整体系统协调一致地运行。学习Agent:通过经验和交互,不断调整和优化自身行为,提高系统在不断变化环境中的适应能力。从达特茅斯会议开始讨论人工智能(Artificial Intelligence),到马文·明斯基引入“Agent”概念,到这里,“AI”和“Agent”就彻底聚齐了。往后,我们都将其称之为AI Agent。

Others are asking
有哪些好用的法律ai
以下是一些好用的法律 AI 应用场景和示例: 1. 诉讼策略制定: AI 将基于商标法等相关条款和案例法,为商标侵权案件提供诉讼策略,包括对原告商标权利的分析、被告侵权行为的评估、关键证据搜集建议、法律抗辩点及和解或调解策略。 其他例子: 为专利侵权案件制定诉讼策略,分析专利有效性、被告侵权行为及抗辩理由,提出证明侵权和计算损害赔偿的建议。 针对劳动合同纠纷案件,分析员工权益和雇主责任,提出诉讼策略,包括主张权益、证据收集重点及证明雇主违约行为。 在知识产权许可诉讼中,分析许可协议条款和双方权利义务,提出诉讼策略,包括证明许可协议违反、计算损失赔偿及可能的合同解除条件。 模拟法庭,如模拟商业合同违约的法庭审理,分析双方论点、证据和法律依据,预测判决结果,给出优化法庭陈述和证据呈现的建议。 2. 法律意见书撰写: AI 根据案件背景、证据材料和法律法规,自动撰写初步法律意见书,包含案件事实梳理、法律分析和结论。 其他例子: 针对商业秘密泄露案件,分析法律责任和赔偿范围,撰写法律意见书,提供应对策略。 为计划上市的公司提供关于公司治理结构的法律意见书,确保符合相关法规要求。 就消费者权益保护案件提供法律意见,分析商家赔偿责任和消费者维权途径,制定应对措施。 起草股权转让协议,包括转让方和受让方信息、股权转让份额、价格、支付方式和时间表、先决条件、双方权利义务、保密、违约责任和争议解决条款等。 3. 指令风格和技巧: 可指定 AI 模仿某位资深律师的逻辑严谨和言简意赅的风格,使其提供的信息更符合专业律师的沟通和表达习惯。 运用 PEMSSC 方法,如选择个性化的风格、给出参考或逻辑结构、从多个角度思考、进行总结概括、使用分隔符号区分等。 个性化风格:选择幽默且富有洞察力的风格,融入创新视角。 参考和逻辑结构:在提供法律建议时,采用 SWOT 分析法或 4P 原则等逻辑结构。 多角度思考:在分析商事诉讼时,从市场趋势、竞争对手行为、战略规划、财务状况和市场前景等角度思考诉讼策略。
2025-04-18
AI术语解释
以下是一些常见的 AI 术语解释: Agents(智能体):一个设置了一些目标或任务,可以迭代运行的大型语言模型。与大型语言模型在像 ChatGPT 这样的工具中的通常使用方式不同,Agent 拥有复杂的工作流程,模型本质上可以自我对话,无需人类驱动每一部分的交互。属于技术范畴。 ASI(人工超级智能):尽管存在争议,但通常被定义为超越人类思维能力的人工智能。属于通识范畴。 Attention(注意力):在神经网络的上下文中,有助于模型在生成输出时专注于输入的相关部分。属于技术范畴。 Bias(偏差):AI 模型对数据所做的假设。“偏差方差权衡”是模型对数据的假设与给定不同训练数据的模型预测变化量之间必须实现的平衡。归纳偏差是机器学习算法对数据的基础分布所做的一组假设。属于技术范畴。 Chatbot(聊天机器人):一种计算机程序,旨在通过文本或语音交互模拟人类对话。通常利用自然语言处理技术来理解用户输入并提供相关响应。属于通识范畴。 CLIP(对比语言图像预训练):由 OpenAI 开发的 AI 模型,用于连接图像和文本,使其能够理解和生成图像的描述。属于技术范畴。 TPU(张量处理单元):谷歌开发的一种微处理器,专门用于加速机器学习工作负载。属于技术范畴。 Training Data(训练数据):用于训练机器学习模型的数据集。属于技术范畴。 Transfer Learning(迁移学习):机器学习中的一种方法,其中对新问题使用预先训练的模型。属于技术范畴。 Validation Data(验证集):机器学习中使用的数据集的子集,独立于训练数据集和测试数据集。用于调整模型的超参数(即架构,而不是权重)。属于技术范畴。 Knowledge Distillation(数据蒸馏):数据蒸馏旨在将给定的一个原始的大数据集浓缩并生成一个小型数据集,使得在这一小数据集上训练出的模型,和在原数据集上训练得到的模型表现相似。在深度学习领域中被广泛应用,特别是在模型压缩和模型部署方面。可以帮助将复杂的模型转化为更轻量级的模型,并能够促进模型的迁移学习和模型集成,提高模型的鲁棒性和泛化能力。属于技术范畴。 RAG(检索增强生成):检索增强生成。属于技术范畴。 Forward Propagation(前向传播):在神经网络中,输入数据被馈送到网络并通过每一层(从输入层到隐藏层,最后到输出层)以产生输出的过程。网络对输入应用权重和偏差,并使用激活函数生成最终输出。属于技术范畴。 Foundation Model(基础模型):在广泛数据上训练的大型 AI 模型,旨在适应特定任务。属于技术范畴。 GAN(通用对抗网络):一种机器学习模型,用于生成类似于某些现有数据的新数据。使两个神经网络相互对抗:一个“生成器”,创建新数据,另一个“鉴别器”试图将数据与真实数据区分开来。属于技术范畴。 Generative AI/Gen AI(生成式 AI):AI 的一个分支,专注于创建模型,这些模型可以根据现有数据的模式和示例生成新的原创内容,例如图像、音乐或文本。属于通识范畴。 GPU(图形处理单元):一种特殊类型的微处理器,主要用于快速渲染图像以输出到显示器。在执行训练和运行神经网络所需的计算方面也非常高效。属于产品范畴。
2025-04-18
有没有能根据描述,生成对应的word模板的ai
目前有一些可以根据描述生成特定内容的 AI 应用和方法。例如: 在法律领域,您可以提供【案情描述】,按照给定的法律意见书模板生成法律意见书。例如针对商业贿赂等刑事案件,模拟不同辩护策略下的量刑结果,对比并推荐最佳辩护策略,或者为商业合同纠纷案件设计诉讼策略等。 在 AI 视频生成方面,有结构化的提示词模板,包括镜头语言(景别、运动、节奏等)、主体强化(动态描述、反常组合等)、细节层次(近景、中景、远景等)、背景氛围(超现实天气、空间异常等),以及增强电影感的技巧(加入时间变化、强调物理规则、设计视觉焦点转移等)。 一泽 Eze 提出的样例驱动的渐进式引导法,可利用 AI 高效设计提示词生成预期内容。先评估样例,与 AI 对话让其理解需求,提炼初始模板,通过多轮反馈直至达到预期,再用例测试看 AI 是否真正理解。 但需要注意的是,不同的场景和需求可能需要对提示词和模板进行针对性的调整和优化,以获得更符合期望的 word 模板。
2025-04-18
作为AI小白,需要一些AI常用专业术语的名词解释
以下是一些 AI 常用专业术语的名词解释: Agents(智能体):一个设置了一些目标或任务,可以迭代运行的大型语言模型。与大型语言模型在像 ChatGPT 这样的工具中的通常使用方式不同,Agent 拥有复杂的工作流程,模型本质上可以自我对话,无需人类驱动每一部分的交互。 ASI(人工超级智能):尽管存在争议,但通常被定义为超越人类思维能力的人工智能。 Attention(注意力):在神经网络的上下文中,有助于模型在生成输出时专注于输入的相关部分。 Bias(偏差):AI 模型对数据所做的假设。“偏差方差权衡”是模型对数据的假设与给定不同训练数据的模型预测变化量之间必须实现的平衡。归纳偏差是机器学习算法对数据的基础分布所做的一组假设。 Chatbot(聊天机器人):一种计算机程序,旨在通过文本或语音交互模拟人类对话。通常利用自然语言处理技术来理解用户输入并提供相关响应。 CLIP(对比语言图像预训练):由 OpenAI 开发的 AI 模型,用于连接图像和文本,使其能够理解和生成图像的描述。 Gradient Descent(梯度下降):在机器学习中,是一种优化方法,根据模型损失函数的最大改进方向逐渐调整模型的参数。 Hallucinate,Hallucination(幻觉):在人工智能的背景下,指模型生成的内容不是基于实际数据或与现实明显不同的现象。 Hidden Layer(隐藏层):神经网络中不直接连接到输入或输出的人工神经元层。 Hyperparameter Tuning(超参数调优):为机器学习模型的超参数(不是从数据中学习的参数)选择适当值的过程。 Inference(推理):使用经过训练的机器学习模型进行预测的过程。 Instruction Tuning(指令调优):机器学习中的一种技术,其中模型根据数据集中给出的特定指令进行微调。 Latent Space(潜在空间):在机器学习中,指模型创建的数据的压缩表示形式。类似的数据点在潜在空间中更接近。 Compute(计算):用于训练或运行 AI 模型的计算资源(如 CPU 或 GPU 时间)。 CNN(卷积神经网络):一种深度学习模型,通过应用一系列过滤器来处理具有网格状拓扑(例如图像)的数据。通常用于图像识别任务。 Data Augmentation(数据增强):通过添加现有数据的略微修改的副本来增加用于训练模型的数据量和多样性的过程。 Double Descent(双降):机器学习中的一种现象,其中模型性能随着复杂性的增加而提高,然后变差,然后再次提高。 EndtoEnd Learning(端到端学习):一种不需要手动设计功能的机器学习模型。该模型只是提供原始数据,并期望从这些输入中学习。 Expert Systems(专家系统):人工智能技术的应用,为特定领域的复杂问题提供解决方案。 XAI(可解释的人工智能):Explainable AI,人工智能的一个子领域专注于创建透明的模型,为其决策提供清晰易懂的解释。
2025-04-18
AI名词解释
以下是一些常见的 AI 名词解释: Compute:用于训练或运行 AI 模型的计算资源(如 CPU 或 GPU 时间)。 CNN:卷积神经网络,一种深度学习模型,通过应用一系列过滤器来处理具有网格状拓扑(例如图像)的数据。此类模型通常用于图像识别任务。 Data Augmentation:通过添加现有数据的略微修改的副本来增加用于训练模型的数据量和多样性的过程。 Double Descent:机器学习中的一种现象,其中模型性能随着复杂性的增加而提高,然后变差,然后再次提高。 EndtoEnd Learning:一种不需要手动设计功能的机器学习模型。该模型只是提供原始数据,并期望从这些输入中学习。 Expert Systems:人工智能技术的应用,为特定领域的复杂问题提供解决方案。 Agents:智能体,一个设置了一些目标或任务,可以迭代运行的大型语言模型。这与大型语言模型(LLM)在像 ChatGPT 这样的工具中“通常”的使用方式不同。在 ChatGPT 中,你提出一个问题并获得一个答案作为回应。而 Agent 拥有复杂的工作流程,模型本质上可以自我对话,而无需人类驱动每一部分的交互。 ASI:人工超级智能,尽管存在争议,但 ASI 通常被定义为超越人类思维能力的人工智能。 Attention:在神经网络的上下文中,注意力机制有助于模型在生成输出时专注于输入的相关部分。 Bias:AI 模型对数据所做的假设。“偏差方差权衡”是模型对数据的假设与给定不同训练数据的模型预测变化量之间必须实现的平衡。归纳偏差是机器学习算法对数据的基础分布所做的一组假设。 Chatbot:一种计算机程序,旨在通过文本或语音交互模拟人类对话。聊天机器人通常利用自然语言处理技术来理解用户输入并提供相关响应。 CLIP:对比语言图像预训练,由 OpenAI 开发的 AI 模型,用于连接图像和文本,使其能够理解和生成图像的描述。 TPU:张量处理单元,谷歌开发的一种微处理器,专门用于加速机器学习工作负载。 Training Data:用于训练机器学习模型的数据集。 Transfer Learning:机器学习中的一种方法,其中对新问题使用预先训练的模型。 Validation Data:机器学习中使用的数据集的子集,独立于训练数据集和测试数据集。它用于调整模型的超参数(即架构,而不是权重)。 Knowledge Distillation:数据蒸馏旨在将给定的一个原始的大数据集浓缩并生成一个小型数据集,使得在这一小数据集上训练出的模型,和在原数据集上训练得到的模型表现相似。数据蒸馏技术在深度学习领域中被广泛应用,特别是在模型压缩和模型部署方面。它可以帮助将复杂的模型转化为更轻量级的模型,并能够促进模型的迁移学习和模型集成,提高模型的鲁棒性和泛化能力。 RAG:检索增强生成。
2025-04-18
可以增强图片清晰的的ai
以下是一些可以增强图片清晰度的 AI 工具: 1. Magnific:https://magnific.ai/ 2. ClipDrop:https://clipdrop.co/imageupscaler 3. Image Upscaler:https://imageupscaler.com/ 4. Krea:https://www.krea.ai/ 更多工具可以查看网站的图像放大工具库:https://www.waytoagi.com/category/17 此外,PMRF 也是一种全新的图像修复算法,它具有以下特点: 擅长处理去噪、超分辨率、着色、盲图像恢复等任务,生成自然逼真的图像。 不仅提高图片清晰度,还确保图片看起来像真实世界中的图像。 能够应对复杂图像退化问题,修复细节丰富的面部图像或多重损坏的图片,效果优质。 详细介绍: 在线体验: 项目地址: 这些 AI 画质增强工具都具有不同的特点和功能,可以根据您的具体需求选择合适的工具进行使用。
2025-04-18
multi agents讲解
多智能体(MultiAgent)是由多个自主、独立的智能体(Agent)组成的系统。每个智能体都能感知环境、决策并执行任务,且它们之间能信息共享、任务协调与协同行动以实现整体目标。 随着大型语言模型(LLM)的出现,以 LLM 为核心构建的 Agent 系统受广泛关注。目前常见框架集中在单 Agent 场景,其核心是 LLM 与工具协同配合,可能需与用户多轮交互。而多 Agent 场景为不同 Agent 分配角色,通过协作完成复杂任务,与用户交互可能减少。 构建多 Agent 框架主要组成部分包括: 1. 环境:所有 Agent 处于同一环境,包含全局状态信息,Agent 与环境有信息交互与更新。 2. 阶段:采用 SOP 思想将复杂任务分解为多个子任务。 3. 控制器:可以是 LLM 或预先定义好的规则,负责环境在不同 Agent 和阶段间切换。 4. 记忆:因 Agent 数量增多,消息数量及每条消息的记录字段增加。 此外,吴恩达最新演讲提到四种 Agent 设计范式,Reflection 和 Tool Use 相对经典且广泛使用,Planning 和 Multiagent 较新颖有前景。Reflection 类似于 AI 自我纠错和迭代,如让 AI 写代码并自我检查修改。Tool Use 指大语言模型调用插件拓展能力。在一些场景中,Reflection 可用两个 Agent,一个写代码,一个 Debug。
2025-03-14
一个尽可能完美的AGI时代的多Agents协同工作平台应该具备怎样的能力设计?
一个尽可能完美的 AGI 时代的多 Agents 协同工作平台通常应具备以下能力设计: 1. 融合 RL(强化学习)与 LLM(大型语言模型)思想:在多 Agent 情境下,形成复杂多轮会话及协作行动过程,为系统二进行大规模的过程学习提供路径。同时,LLM 能从 RL 过程中习得新的、足够新颖的策略,例如像 AlphaGO 那样通过自博弈创新策略并快速反馈奖励,最终达成任务目标。 2. 具备多项优势: 适配国内外主流开源及闭源大语言模型,支持多模型混合使用,构建企业级场景服务生态,提供场景化解决方案。 拥有灵活可视化无代码应用构建、TexttoAgent 技术,构建便捷,上手简单,操作高效。 能够即时发布上线,支持发布为网页/小程序/API 等多种形态,快速部署 Agent 应用。 提供企业级安全访问控制,依据 Agent 权限控制数据访问,通信过程加密,防止数据泄露风险。 支持多 Agents 协作,构建知识工作者的人机协作流水线,满足复杂业务场景需求。 3. 允许使用自然语言制定 Agent 及其交互规则,并引入低延时的 Realtime API:即使没有专业编程技能,只要能用清晰的自然语言描述出各个 Agents 具备的行为和功能,就可以快速制作多 Agents 应用或创建代理式工作流。例如在一个简单场景中,可设置接待员和写诗的 Agents 并实现交互。
2025-03-12
实现一个简单的 function calling agents ,要求小白可以看懂
以下是一个关于实现简单的 function calling agents 的指导,以便小白能够理解: 实现原理: 提示词工程主要由提示词注入和工具结果回传两部分代码组成。提示词注入用于将工具信息及使用工具的提示词添加到系统提示中,它包含 TOOL_EAXMPLE、tools_instructions 和 REUTRN_FORMAT 三个部分。TOOL_EAXMPLE 用于提示 LLM 如何理解和使用工具,编写时应注意用无关紧要的工具作示例避免混淆。tools_instructions 是将通用工具字典转换成 LLM 可读的工具列表,实际使用时可动态调整。REUTRN_FORMAT 定义了调用 API 的格式。工具结果回传阶段利用正则表达式抓取输出中的“tool”和“parameters”参数,对于 interpreter 工具使用另一种正则表达式提取 LLM 输出的代码,通过识别 LLM 返回的调用工具的字典提取对应值传入工具函数,将工具返回结果以 observation 角色返回给 LLM,对于不接受相关角色的 LLM 接口可改为回传给 user 角色。 实现方式的比较与建议: 1. JSON Output:通过 Prompt 方式让模型输出 JSON 格式内容,但 Prompt 麻烦,输出不稳定,串业务成本高。 2. JSON Mode:官方 JSON Output,与 Tools 适用场景不同,JSON mode 为输出 JSON 存在,Tools 为 Call API 存在。 3. 从可控角度推荐 Function Calling 和 Tools 实现: 放弃 JSON mode,模型输出 JSON 仍可能出错,模型厂家对 Function Calling 有微调优化。 降低 System prompt 依赖,能在 Tools 里写的尽量写在里面。 API Response 增强 Prompt,准确率高。 尽量让模型做选择而非填空,减少 token 输出,提高速度和准确率。 利用 Tools 做 Route,构建 Multi Agent,术业有专攻。 此外,在初级菜鸟学习 Langchain 做简单 RAG 方面: 1. 没有用 Langchain 做 table 和 text 的 RAG: Table 表格:包括读入表格 markdown 格式嵌入 template 和直接使用 function call 两种方法。 Text 文字:包括文字相似度检索过程,涉及读入文字、清洗、切分、向量化、计算相似度等步骤。 2. 用 Langchain 做 table 和 text 的 RAG:包括运用 Agent 和 Chain 等方式。 3. 使用 Agent 把文本多种文档组合起来。 相关代码和示例可参考相应的链接。
2025-03-11
AI Agents的课程在哪里呢
以下是关于 AI Agents 课程的相关信息: 1. 在 AI 课程目录下新增了《》。 2. 同步更新到 1.8 版本,该图表由 E2b 团队制作。 3. 翻译了《》这篇文章,由 OpenAI 开发者关系负责人 Logan Kilpatrick 所写,介绍 Agents 是什么,这个领域的发展趋势,以及大量这种早期技术在实践中的精彩示例。 此外,如果您是新手学习 AI,还可以参考以下步骤: 1. 了解 AI 基本概念:首先,建议阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,这些文章通常会介绍 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅:在「」中,您将找到一系列为初学者设计的课程。这些课程将引导您了解生成式 AI 等基础知识,特别推荐李宏毅老师的课程。通过在线教育平台(如 Coursera、edX、Udacity)上的课程,您可以按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习:AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。建议您一定要掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品:与现有的 AI 产品进行互动是学习 AI 的另一种有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。通过与这些 AI 产品的对话,您可以获得对 AI 在实际应用中表现的第一手体验,并激发您对 AI 潜力的认识。 在通往 AGI 之路知识库中,还有关于 AI 相关技术与应用的介绍及活动分享: 1. AI agent 的介绍:大语言模型衍生出 AI agent,治理进阶可用此方式,如 GPTS、code、千帆百炼等,建议先吃透 prompt 再学习 AI agent,cost 平台有丰富教程和比赛,社区小伙伴参与能获奖。 2. AI 会话相关内容:通过关键词学设进行 AI 会话学习,如每日选词丢入稳定扩散模型,积累了大量提示词,建有飞书群供感兴趣的同学加入练习。 3. AI 视频相关词汇:收集了通过词汇控制 AI 视频的相关词典,如环绕、过曝、缩放等,更具象的描述词汇能让模型发挥更好效果。 4. AI 相关活动:包括 prompt battle、AI 神经大赛等,如 prompt battle 在每周六和周日晚上进行,有多种玩法,还有早晨的 PB 活动。
2025-01-13
Agents协作的系统架构图应该怎么画
以下是关于绘制 Agents 协作的系统架构图的一些参考信息: 首先,了解 Agent 的基本框架,即“Agent = LLM + 规划 + 记忆 + 工具使用”。其中大模型 LLM 扮演了 Agent 的“大脑”。 规划方面,主要包括子目标分解、反思与改进。子目标分解能将大型任务分解为较小可管理的子目标来处理复杂任务,反思和改进则可以对过去的行动进行自我批评和自我反思,从错误中学习并改进未来的步骤,从而提高最终结果的质量。 记忆分为短期记忆和长期记忆。短期记忆是将所有的上下文学习看成利用模型的短期记忆来学习;长期记忆提供了长期存储和召回信息的能力,通常通过利用外部的向量存储和快速检索来实现。 工具方面,不同的任务和场景需要选择合适的工具。 在生成式 AI 的人机协同中,分为 Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理)3 种产品设计模式,人与 AI 的协作流程有所差异。在 Agents 模式下,AI 完成大多数工作。 可以通过 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。例如,作为产品经理角色,可将产品功能设计需求通过 Agents 拆解成多个独立的任务,然后遵循不同的工作流,最后生成一份大致符合期望的输出结果,再进行修改完善。 此外,还可以参考一些实例探究,如提示 LLM 提供 100 个最新观察结果,并根据这些观测/陈述生成 3 个最重要的高层次问题,然后让 LLM 回答这些问题。规划和反应时要考虑主体之间的关系以及一个主体对另一个主体的观察,环境信息以树形结构呈现。
2024-08-18
生成图文公众号的agents
以下为您介绍一个名为《执笔者》的多 Agent 模式的全能写手: 成果展示:《执笔者》是通过多 Agent 协作搭建而成,总体用时不到 10 分钟(在之前的 bot 或者工作流已调试好的前提下)。目前只协作了三个 agent,每个 agent 都根据任务分工集成了不同的工作流、图像流等内容,各司其职,互不干扰,整体交互模式保持一致。 主要功能:执笔者当前支持小红书、公众号和头条平台的图文创作,简单使用一个“主题词+平台类型”即可召唤相关 bot 输出优质内容。 后续发展:《执笔者》不仅极大地提高了工作效率,也为创作者提供了更多时间和精力专注于内容创作。后续还会不断更新迭代(人物专栏、作文、书籍等),使其成为真正的全能优质写手。感兴趣的朋友欢迎前往试用,相信《执笔者》会成为创作路上的得力助手。链接:https://www.coze.cn/store/bot/7387404430825668643?panel=1&bid=6d1b1va9o1g18
2024-08-12
coze搭建智能体,用上传的文件和知识库的文件做对比,分析差异点。
以下是关于在 Coze 中搭建智能体的相关信息: 1. 证件照相关操作: 展示原图上传结果,基本脸型已换,生成效果与上传照片特征有关。 改背景可利用改图功能,一键改图效果更好,输出数据类型为图片。 豆包节点生成的是 URL 地址,与前者不同,在工作流使用有差异,可参考简单提示词。 介绍证件照工作流相关操作,包括通过提示词改背景颜色,设置输出方式为返回变量;讲解消耗 token 及保存结果相关问题;对按钮、表单添加事件并设置参数,限制上传文件数量;还涉及给表单和图片绑定数据,以及每次操作后刷新界面确保设置生效。 围绕操作讲解与优化展开,介绍 for meet 的设置,如表单事件操作、图片上传数量修改等,提及编程基础知识。还讲述成果图连接、绑定数据方法及注意事项。展示基本功能实现情况,分析换性别等问题成因,指出需在工作流优化提示词,也可尝试用视频模型解决,最后进入问答环节。 2. 多维表格的高速数据分析: 创建智能体,使用单 Agent 对话流模式。 编排对话流,创建新的对话流并关联智能体。 使用代码节点对两个插件获取的结果进行数据处理,注意代码节点输出的配置格式。 测试,找到一篇小红书笔记,试运行对话流,在对话窗口输入地址查看数据。 发布,选择多维表格,配置输出类型为文本,输入类型选择字段选择器,完善上架信息,可选择仅自己可用以加快审核。 3. 智能体与微信和微信群的连接: 创建知识库,可选择手动清洗数据提高准确性,包括在线知识库和本地文档。 在线知识库创建时,飞书在线文档中每个问题和答案以分割,可编辑修改和删除。 本地文档中注意拆分内容提高训练数据准确度,如将课程章节按固定方式人工标注和处理。 发布应用,确保在 Bot 商店中能够搜到。
2025-04-18
想要做一节讲如何用智能体做企业数字化转型的课程,如何设计
以下是关于如何设计用智能体做企业数字化转型课程的建议: 一、参考案例 1. 李国宝的相关经验 具有丰富的从业经验,包括通信工程、数据通信网络培训、创业、网络安全解决方案及培训、AI 课程开发与培训等。 开发过面向不同群体的 AI 课程,如《数字化转型实践》面向传统企业数字化、AI 赋能转型。 2. 90 分钟从 0 开始打造你的第一个 Coze 应用课程 从零开始教学做应用界面,先基础教学,再涉及特定应用。 介绍当前承接业务,包括辅导、培训、定制及企业 AI 落地等。 挖掘用户对 AI 应用的功能需求,如对交互界面的需求。 二、课程设计要点 1. 对于企业管理者 AI 辅助决策:在小规模决策中使用 AI 分析工具,以其分析结果作为决策参考。 员工培训计划:制定 AI 工具使用的培训计划,帮助团队成员了解日常工作中如何有效利用 AI。 流程优化:识别公司中可能受益于 AI 自动化的重复性任务,从小流程开始测试 AI 解决方案的效果。 AI 伦理和政策:制定公司的 AI 使用政策,确保 AI 应用符合伦理标准和法律要求。 2. 对于教育工作者 AI 辅助教案设计:尝试使用 AI 帮助设计课程大纲或生成教学材料 ideas,为课程带来新视角。 个性化学习路径:探索使用 AI 分析学生学习数据,为不同学生制定个性化学习计划。 创新教学方法:考虑将 AI 工具整合到课堂活动中,如使用 AI 生成的案例研究或模拟场景。 AI 素养教育:开发简单的课程模块,教导学生了解 AI 基础知识、应用领域及其对社会的影响。 三、注意事项 无论面向哪个群体,都应记住:与 AI 协作是一个学习过程。从小处着手,保持好奇心和开放态度,会发现 AI 不仅能提高工作效率,还能激发创造力,开拓新的可能性。最重要的是,始终保持批判性思维,将 AI 视为强大的工具,而不是完全依赖的解决方案。
2025-04-18
你是福州市政府工作人员,中国移动拟邀请福州市委书记参加中国移动人工智能生态大会并致辞,该大会是第八届数字峰会的组成部分,需要撰写市委书记的致辞稿,需要中国移动准备哪些素材,请告诉我提示词
以下是为您整理的相关内容: 《促进创新的人工智能监管方法》:包含了关于通用人工智能价值链、相关案例研究以及对人工智能监管框架的探讨等内容。 陶力文律师关于律师写好提示词用好 AI 的方法:包括初始化的欢迎语、遵循的规则、获取案例洞察报告和目标群体、输出纲要和写作方案、根据用户反馈调整等流程。 开幕式主持稿:涉及基地代表发言的时间、主题、物料配合和人员配合等信息。 但这些素材似乎与为中国移动准备市委书记致辞稿所需的素材关联不大。一般来说,为撰写市委书记在中国移动人工智能生态大会上的致辞稿,中国移动可能需要准备以下素材: 1. 本次大会的详细介绍,包括主题、目标、议程安排等。 2. 中国移动在人工智能领域的发展成果、战略规划和未来愿景。 3. 中国移动人工智能生态的构建情况,如合作伙伴、合作项目等。 4. 本次大会在第八届数字峰会中的地位和作用。 5. 相关行业的人工智能发展现状和趋势。 6. 福州市在人工智能领域的发展情况和与中国移动合作的展望。
2025-04-18
人工智能软件现在有哪些
以下是一些常见的人工智能软件: 1. 在自然语言处理和神经科学应用方面,大型语言模型取得了进展,拥有更先进的工具用于解码大脑状态和分析复杂脑部活动。 2. 在艺术创作领域,有涉及知识产权保护的相关软件,如软件工程师在设计时应确保生成内容合法合规、注重用户知识产权保护等。创作者使用此类软件时,应了解自身权利并做好保护。 3. 在线 TTS 工具方面,如 Eleven Labs(https://elevenlabs.io/)、Speechify(https://speechify.com/)、Azure AI Speech Studio(https://speech.microsoft.com/portal)、Voicemaker(https://voicemaker.in/)等。这些工具可将文本转换为语音,具有不同的特点和适用场景。但请注意,相关内容由 AI 大模型生成,请仔细甄别。
2025-04-15
什么是通用人工智能
通用人工智能(AGI)是指具有人类水平的智能和理解能力的 AI 系统。它有能力完成任何人类可以完成的智力任务,适用于不同的领域,同时拥有某种形式的意识或自我意识。 目前 AGI 还只是一个理论概念,没有任何 AI 系统能达到这种通用智能水平。 OpenAI 在其内部会议上分享了 AGI 的五个发展等级: 1. 聊天机器人(Chatbots):具备基本对话能力的 AI,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平的 AI,能够解决复杂问题,如 ChatGPT,能够根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务的 AI。目前许多 AI Agent 产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明的 AI,如谷歌 DeepMind 的 AlphaFold 模型,可以预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 常见名词解释: AGI:通用人工智能(Artificial General Intelligence)能够像人类一样思考、学习和执行多种任务的人工智能系统。 NLP:自然语言处理(Natural Language Processing),就是说人话。 LLM:大型语言模型(Large Language Model),数据规模很大,没钱搞不出来,大烧钱模型。
2025-04-15
微信智能客服
以下是零成本、零代码搭建一个智能微信客服的保姆级教程: 1. 起个好名字和给它头像 进入 Bot 主页并开始创建 Bot,网址:https://www.coze.cn/home 。 名字(Bot 名称):善良有爱专业的幼师。 头像(图标):AI 生成后,不喜欢可以重新生成,选择其中一个。 补充:创建 Bot 的方式有两种,点击创建 Bot 和 Coze Assistant。主页上包含这两种方式,示例中通过创建 Bot 创建。侧边导航栏一直有创建 Bot 的方式,仅主页有 Coze Assistant。两者区别在于: 创建 Bot 适合使用过 Bot 且想好名称和描述的人。 Coze Assistant 适合第一次创建 Bot 的人,从说“我想创建 bot”开始,Coze 助理会引导创建,自动生成名称、头像、人设与回复逻辑、开场白文案、开场白预设问题等。 2. 教她技能 如果通过 Coze Assistant 方式创建 Bot,Coze 助理已帮您教她技能,可按需修改完善。 起好名字和头像后进入教技能环节,先看整理布局,找到编排、预览与调试,在编排的人设与回复逻辑教她技能: 教她技能 1:认识自己。 教她技能 2:掌握专业技能。 教她技能 3:不能做什么。 3. 让她教别人 她学会技能后,使命及目标是通过互动方式教会请教的人。 找到高级下开场白,点击展开,填写开场白文案、开场白预置问题,设置 3 个问题。 勾选用户问题建议:在 Bot 回复后,根据 Prompt 提供最多 3 条用户提问建议。 添加语音选择:让她不仅会写,还会通过语音交流。 点击“发布”,选择发布平台:Bot Store、豆包、飞书、微信客服、微信公众号(服务号)、微信公众号(订阅号)、掘金。 Bot Store:Bot 会出现在 Coze Bot 商店中,获取更多曝光和流量。 豆包:一键发布到豆包 App,随时随地对话。 飞书:在飞书中直接@Bot 对话,提高工作生产力。 微信客服:微信沟通更高效,发布流程较复杂,下面是重新注册和解绑后重新配置的流程。 微信公众号(服务号):针对企业,不支持个人注册,订阅号运营主体可为企业或个人。 微信公众号(订阅号):托管公众号消息,助力微信运营。 掘金:在掘金社区 AI 聊天室圈子与 Bot 互动。
2025-04-15