直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

怎么搭建AI Agent

回答

搭建 AI Agent 主要包括以下几个方面:

  1. AI Agent 的概念:AI Agent 简单来说就是拥有各项能力的“打工人”来帮我们做特定的事情。它包含了自己的知识库、工作流、还可以调用外部工具,再结合大模型的自然语言理解能力,就可以完成比较复杂的工作。
  2. 构建数字人灵魂中的 AI Agent 工程实现:所需的记忆模块,工作流模块、各种工具调用模块的构建都是挑战。
  3. 驱动躯壳的实现:灵魂部分怎样去驱动躯壳部分,我们可以将灵魂部分的所有接口定义出来,然后躯壳部分通过 API 调用,调用方式可以是 HTTP、webSocket 等等,视躯壳部分的实现而定。但包含情绪的语音表达以及如何保证躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对来说成熟一些,但都是闭源的。
  4. 实时性:由于整个数字人的算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,所以算法一般会部署到额外的集群或者调用提供出来的 API,这里面就会涉及到网络耗时和模型推理耗时,如果响应太慢就会体验很差,所以低延时也是亟需解决的一个问题。
  5. 多元跨模态:仅仅是语音交互的数字人是远远不够的,人有五感(听觉、视觉、嗅觉、触觉、味觉),听觉只是其中一种,其他的感官可以根据实际需求来做。
  6. 拟人化场景:正常和人交流的时候不是线性对话,会有插话、转移话题等情况,这些情景如何通过工程丝滑处理。
  7. 制作 AI Agent 的方式:一般创建方式是 Prompt-tuning + Fine-tuning 相结合。单纯通过 Prompt 来构建大脑模块(Prompt-tuning),一般适合“无趣的灵魂”,即拟人化不是那么重的情况。针对“有趣的灵魂”,最直接的解决方式就是通过微调一个定向模型来达到上述效果。微调过程本质上是一个信息压缩和整合的过程,它能将例如三万条推特中的零散信息有效地整理并嵌入到大型模型的权重中,且权重占比不到 1%。这种方法不仅提高了信息提取的效率,还减少了每次查询或应用时所需处理的数据量,从而优化了性能和成本。

此外,像字节的扣子就是一个 AI Bot 开发平台,用户无论是否具备编程基础,都能在该平台上迅速构建基于 AI 模型的各类问答 Bot。创建智能体可以通过简单 3 步,首先起一个智能体的名称,然后写一段智能体的简单介绍,最后使用 AI 创建一个头像即可。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AI 数字人-定义数字世界中的你

[title]AI数字人-定义数字世界中的你[heading2]二、如何构建高质量的AI数字人[heading4]2.2构建数字人灵魂有了数字人躯壳,我们就需要构建数字人的灵魂,让数字人具备各种智能,比如记得你的个人信息,充当你的个人助手;在某个领域具备更专业的知识;能处理复杂的任务等等。这些能力实现有以下几个需要注意的工程关键点:1.AI Agent:我们要想数字人像人一样思考就需要写一个像人一样的Agent,工程实现所需的记忆模块,工作流模块、各种工具调用模块的构建都是挑战;2.驱动躯壳的实现:灵魂部分怎样去驱动躯壳部分,我们可以将灵魂部分的所有接口定义出来,然后躯壳部分通过API调用,调用方式可以是HTTP、webSocket等等,视躯壳部分的实现而定。但包含情绪的语音表达以及如何保证躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对来说成熟一些,但都是闭源的,效果可以参考Nvidia的Audio2Face(https://www.nvidia.cn/omniverse/apps/audio2face/)或则Live Link Face(Iphone APP)+ Face AR Sample(UE);3.实时性:由于整个数字人的算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,所以算法一般会部署到额外的集群或者调用提供出来的API,这里面就会涉及到网络耗时和模型推理耗时,如果响应太慢就会体验很差,所以低延时也是亟需解决的一个问题。4.多元跨模态:仅仅是语音交互的数字人是远远不够的,人有五感(听觉、视觉、嗅觉、触觉、味觉),听觉只是其中一种,其他的感官可以根据实际需求来做,比如视觉我们可以通过添加摄像头数据来获取数据,再通过系列CV算法做图像解析等;5.拟人化场景:我们正常和人交流的时候不是线性对话,会有插话、转移话题等情况,这些情景如何通过工程丝滑处理。

我用扣子做一个简单的智能体——竖起耳朵听

AI Agent也就是我们所说的AI智能体,那什么是AI智能体呢?简单来说就是拥有各项能力的打工人来帮我们做特定的事情。目前有不少大厂推出自己的AI智能体平台,像字节的扣子,阿里的魔搭社区等等,体验过GPT或者文心一言大模型的小伙伴应该都知道,现在基本可以用自然语言来编程了,相当于降低了编程的门槛,另外之前在使用GPT或者文心一言大模型的时候会出现胡编乱造的情况以及时效性、无法满足个性化需求等问题,如果这些不解决的话,AI很难被真正广泛应用,而AI智能体的出现正是解决这些问题的绝佳方式,AI智能体包含了自己的知识库、工作流、还可以调用外部工具,再结合大模型的自然语言理解能力,就可以完成比较复杂的工作。所以AI智能体的出现就是结合自己的业务场景,针对自己的需求,捏出自己的AI智能体来解决自己的事情。[heading2]扣子Coze[content]📢扣子官网:[https://www.coze.cn/](https://www.coze.cn/)扣子(Coze),作为字节跳动旗下的新一代一站式AI Bot开发平台,无论用户是否具备编程基础,都能在该平台上迅速构建基于AI模型的各类问答Bot。这些Bot的功能涵盖了从解决简单问答到处理复杂逻辑对话的广泛范围。当我们开发完成后,还可以将自己构建的Bot发布到各种社交平台和通讯软件上,让更广泛的用户群体能够与这些Bot进行交互聊天。[heading2]竖起耳朵听的创建[content]我们可以通过简单3步创建智能体,首先我们要起一个智能体的名称,然后写一段智能体的简单介绍,最后使用AI创建一个头像即可。

AI-Agent系列(一):智能体起源探究

图10.1.1创建AI Agent的两种手段(来自李博杰的个人博客)不过,虽然Prompt在激活和运用AI Agent的“大脑模块”中扮演着关键角色,但它并非没有缺点。一个很直观的问题是:使用的Prompt越长,消耗的Token也就越多。一个公众人物公开披露的个人信息(身份、言行等),转换成Token数可能高达数百万。这还不考虑模型是否能够处理这么多Token的问题,仅仅是每次推理所需支付的成本——无论是金钱还是时间——都可能非常高昂。所以,单纯通过Prompt来构建大脑模块(Prompt-tuning),一般适合“无趣的灵魂”,即拟人化不是那么重的情况。紧接上面的总结,那”有趣的灵魂"咋办呢?目前,针对"有趣的灵魂"最直接的解决方式就是通过微调一个定向模型来达到上述效果。与Prompt相比,基于微调的方法可以视为将信息直接“记忆”在AI的“大脑模块”中。微调过程本质上是一个信息压缩和整合的过程,它能将例如三万条推特中的零散信息有效地整理并嵌入到大型模型的权重中,且权重占比不到1%。这种方法不仅提高了信息提取的效率,还减少了每次查询或应用时所需处理的数据量,从而优化了性能和成本。"面对有趣的灵魂",一般创建方式是两种结合,即Prompt-tuning +Fine-tuning。

其他人在问
AI基础学习课程
以下是为新手提供的 AI 基础学习课程相关内容: 了解 AI 基本概念:建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 开始 AI 学习之旅:在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。还可以通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习并获取证书。 选择感兴趣的模块深入学习:AI 领域广泛,比如图像、音乐、视频等,可根据兴趣选择特定模块深入学习,同时掌握提示词技巧。 实践和尝试:理论学习后,实践是巩固知识的关键,可尝试使用各种产品创作作品,知识库中有很多实践后的作品和文章分享。 体验 AI 产品:与如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式。 此外,还有以下具体的课程推荐: 【野菩萨】课程:预习周课程包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。基础操作课涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等内容。核心范式课程涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。SD WebUi 体系课程包括 SD 基础部署、SD 文生图、图生图、局部重绘等。ChatGPT 体系课程有 ChatGPT 基础、核心 文风、格式、思维模型等内容。ComfyUI 与 AI 动画课程包含部署和基本概念、基础工作流搭建、动画工作流搭建等。应对 SORA 的视听语言课程涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。若想免费获得该课程,可参与 video battle,每期冠军奖励 4980 课程一份,亚军奖励 3980 课程一份,季军奖励 1980 课程一份,入围奖励 598 野神殿门票一张。扫码添加菩萨老师助理可了解更多课程信息。 微软 AI 初学者入门课程:包括特定的机器学习云框架,如了解更多详情。深度学习背后的深层数学(Deep Mathematics)可参考 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 合著的《深度学习》(Deep Learning)一书,该书可在 https://www.deeplearningbook.org/上获取。
2024-12-19
AI有哪些技术
AI 技术包括以下方面: 技术发展历程: 早期阶段(1950s 1960s):专家系统、博弈论、机器学习初步理论。 知识驱动时期(1970s 1980s):专家系统、知识表示、自动推理。 统计学习时期(1990s 2000s):机器学习算法(决策树、支持向量机、贝叶斯方法等)。 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等。 当前前沿技术点: 大模型(Large Language Models):GPT、PaLM 等。 多模态 AI:视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 自监督学习:自监督预训练、对比学习、掩码语言模型等。 小样本学习:元学习、一次学习、提示学习等。 可解释 AI:模型可解释性、因果推理、符号推理等。 机器人学:强化学习、运动规划、人机交互等。 量子 AI:量子机器学习、量子神经网络等。 AI 芯片和硬件加速。 如果您想在 AI 领域深入学习,学习路径如下: 偏向技术研究方向: 数学基础:线性代数、概率论、优化理论等。 机器学习基础:监督学习、无监督学习、强化学习等。 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 自然语言处理:语言模型、文本分类、机器翻译等。 计算机视觉:图像分类、目标检测、语义分割等。 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 科研实践:论文阅读、模型实现、实验设计等。 偏向应用方向: 编程基础:Python、C++等。 机器学习基础:监督学习、无监督学习等。 深度学习框架:TensorFlow、PyTorch 等。 应用领域:自然语言处理、计算机视觉、推荐系统等。 数据处理:数据采集、清洗、特征工程等。 模型部署:模型优化、模型服务等。 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。 此外,在健身领域,以下是一些 AI 产品: Keep:中国最大的健身平台,为用户提供全面的健身解决方案,以帮助用户实现其健身目标。https://keep.com/ Fiture:沸彻魔镜由核心 AI 技术打造,集硬件、丰富课程内容、明星教练和社区于一体。https://www.fiture.com/ Fitness AI:利用人工智能进行锻炼,增强力量和速度。https://www.fitnessai.com/ Planfit:健身房家庭训练与 AI 健身计划,AI 教练是专门针对健身的生成式人工智能,使用 800 多万条文本数据和 ChatGPT 实时提供指导。https://planfit.ai/
2024-12-19
AI领域最前沿技术的最核心的论文
以下是为您整理的关于 AI 领域最前沿技术核心论文的相关内容: 1. 《Attention is All You Need》:这篇由 Google Brain 团队撰写的论文介绍了 Transformer 架构,彻底改变了 AI 领域的格局。它能够处理未标记的、混乱的数据,并且比以前的方法更加高效。 2. 杰弗里·辛顿(Geoffrey E. Hinton)的相关论文: 描述极化子的“The Contribution of Excitons to the Complex Dielectric Constant of Crystals”(1958 年)。 描述长程电子转移量子力学的“Electron transfer between biological molecules by thermally activated tunneling”(1974 年)。 “Kinetic Proofreading:1974 年)。 “神经网络和具有突发性集体计算能力的物理系统”(1982 年)(被称为 Hopfield 网络)。 与 D.W.Tank 合著的“优化问题中决策的神经计算”(1985 年)。 在这篇文章中,作者分享了一份用于更深入了解现代 AI 的精选资源列表,称其为“AI 典藏”。这些论文、博客文章、课程和指南在过去几年中对该领域产生了巨大影响。同时,还介绍了 AI 技术的发展历程,如 2015 年 AI 系统的局限性,以及 Transformer 架构出现后为 OpenAI 发展带来的影响。
2024-12-19
流程图有哪些工具可以制作,流程图主要用于展示一个过程或系统的步骤和决策点。图中通过不同形状的框(如椭圆形、矩形)和箭头来表示各种步骤、条件判断和流程走向, 有哪些AI工具可以直接制作吗
以下是一些可以制作流程图的 AI 工具: 1. Lucidchart: 注册并登录:。 选择模板:在模板库中搜索“项目管理流程图”。 编辑图表:根据项目需求添加和编辑图形和流程步骤。 优化布局:利用 AI 自动布局功能,优化图表的外观。 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 2. ChatGPT: 确定制作目标。 通过自然语法描述逻辑,生成 Mermaid 图形语法。 在线校验测试是否成功。
2024-12-19
上面的流程图有哪些工具可以制作,流程图主要用于展示一个过程或系统的步骤和决策点。图中通过不同形状的框(如椭圆形、矩形)和箭头来表示各种步骤、条件判断和流程走向, 有哪些AI工具可以直接制作吗
以下是一些可以制作您所描述的流程图的 AI 工具: Lucidchart: 1. 注册并登录: 2. 选择模板:在模板库中搜索“项目管理流程图”。 3. 编辑图表:根据您的项目需求添加和编辑图形和流程步骤。 4. 优化布局:利用 AI 自动布局功能,优化图表的外观。 5. 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 此外,文中还提到了关于智能体和人工智能在解决科学问题方面的一些相关内容,但未直接涉及流程图制作工具的更多信息。
2024-12-19
我是一名计算机专业学生,给我一份进入ai行业的指南
以下是为您提供的进入 AI 行业的指南: 一、学习计划 如果您想入门强化学习,可以将搞懂 DQN 算法作为目标。参考链接:https://github.com/ty4z2008/Qix/blob/master/dl.md 。但需注意,其中资料众多,如同大海捞针,所以在学习前要先明确目的。 二、信息源 1. 简报 TLDR AI: The Sequence: Deep Learning Weekly: Ben’s Bites: Last week in ai: Your guide to AI: 2. 播客 No Priors podcast hosted by Sarah Guo 和 Elad Gil Robot Brains Podcast hosted by Pieter Abbeel Lex Fridman Podcast hosted by Lex Fridman The Gradient podcast hosted by Daniel Bashir Generally Intelligent hosted by Kanjun Qiu Last Week in AI 3. 会议 World AI Cannes Festival 三、知识获取 欢迎来到“AI 企业落地应用”专栏,这里会分享 AI 技术在商业场景中的应用案例和经验。为方便不同背景的读者,文章会采用通俗有趣的方式讲解知识,可能存在专业性不严谨的情况,会有标注提示。对于超纲或专业的内容,也会有标注,可放心跳过。文末会有论文推荐导引,帮助您了解技术细节。
2024-12-19
目前我已经有了一个可以文生视频或者图生视频的模型但是只能6秒,我要如何利用agent自动流实现这个模型可以生成更长,更可靠质量的视频呢
要利用 agent 自动流实现生成更长、更可靠质量的视频,您可以参考以下几种模型和方法: 1. PixVerse V2 模型: 8 秒的视频生成需要花费 30 Credits,5 秒的视频生成需要花费 15 Credits,且只能使用 PixVerse V2 模型,生成时请注意模型选择。 目前仅支持 16:9 画面比例的视频生成。 文生视频:点击“Text to Video”,在“Model”选择“PixVerse V2”,视频时长。PixVerse V2 支持多风格的视频生成,您可以通过在提示词中加入“Anime”,“Realistic”等词语做到这点。 图生视频:点击“Image to Video”,在“Model”选择“PixVerse V2”,视频时长。图生视频暂不支持“Magic Brush”、“Camera Motion”、“Motion Strength”等功能,如需要使用上述功能,请将模型切换至“PixVerse V1”。 2. Meta Movie Gen 模型: Movie Gen 由视频生成和音频生成两个模型组成。 Movie Gen Video:30B 参数 Transformer 模型,可以从单个文本提示生成 16 秒、16 帧每秒的高清视频,相当于 73K 个视频 tokens。对于精确视频编辑,它可以执行添加、删除或替换元素,或背景替换、样式更改等全局修改。对于个性化视频,它在保持角色身份一致性和运动自然性方面取得 SOTA 性能。 Movie Gen Audio:13B 参数 Transformer 模型,可以接受视频输入以及可选的文本提示,生成与视频同步的高保真音频。 Movie Gen Video 通过预训练微调范式完成,在骨干网络架构上,它沿用了 Transformer,特别是 Llama3 的许多设计。预训练阶段在海量的视频文本和图像文本数据集上进行联合训练,学习对视觉世界的理解。微调阶段研究人员精心挑选了一小部分高质量视频进行有监督微调,以进一步提升生成视频的运动流畅度和美学品质。为了进一步提高效果,模型还引入了流匹配(Flow Matching)作为训练目标,这使得视频生成的效果在精度和细节表现上优于扩散模型。 3. Sora 模型: 文生视频,图生视频,视频生视频,支持多种视频定制选项,如分辨率(从 480p 到 1080p)、视频长度(从 5 秒到更长时间)和视频风格。用户可以浏览社区共享的视频,获取灵感和学习技巧(直接抄别人 prompt)。 故事板:允许用户通过时间线指导视频中的多个动作,创建更加复杂的视频序列。 混音和编辑:提供视频混音功能,允许用户将视频转换成新的风格。支持视频的延伸和剪辑,以及创建循环视频。 高级功能:包括混合功能,可以将两个视频场景合并成一个新的场景。 对于已经拥有 OpenAI Plus 或 Pro 账户的用户,Sora 的使用是包含在现有订阅中的,无需额外支付费用。OpenAI Plus 订阅每月 50 次视频生成次数;OpenAI Pro 订阅无限次慢速队列生成,500 次正常速度的视频生成次数。用户可以根据需要选择更高分辨率的视频生成,但这可能会减少每月的使用次数。Sora 的发布初期,对于某些地区(如欧洲和英国)可能会有延迟。
2024-12-19
如何确保agent按要求调用插件
要确保 Agent 按要求调用插件,可以参考以下方法: 1. 构建稳定可用的 AI Agent 是一个需要不断调试和迭代的过程。通常从当前性能最强的 LLM(如 ChatGPT4 和 Claude 3.5 sonnet)着手,先用单条 Prompt 或 Prompt Chain 来测试任务的执行质量和稳定性。然后,根据实际执行情况、最终投产使用的 LLM,逐步拆解子任务,降低 LLM 执行单任务的难度,直到达成工程目标。 2. 一般而言,对于场景多样、结构复杂、对输出格式要求严格的内容,基本可以预见到需要将其拆解为工作流。此外,鉴于 LLM 只能处理文本输入输出的特性,如果涉及生成多媒体内容或从网络自主获取额外信息等能力,必然需要通过工作流来调用相应的插件。 3. 在插件中心确定需要的插件时,先用关键词进行尝试性搜索,根据插件名称、插件介绍页、描述、参数、示例,判断是否可能满足需求。有多个插件同时可选时,一般优选官方/高收藏/高成功率的插件,提升使用效果。如果实际试用效果不行,则换用其他插件,或自己编写上架插件。 例如,在搜索 TTS 文字转语音插件时,可以使用“语音”“文字转语音”“TTS”等相关关键词;在搜索思维导图插件时,可以使用“脑图”“树图”“导图”“mindmap”等关键词。
2024-12-17
agent
智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 智能体的定义: 智能体是自主系统,通过感知环境(通常通过传感器)并采取行动(通常通过执行器)来达到目标。在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并辅以几个关键组成部分,包括规划、子目标和分解、反思和完善、记忆(短期记忆和长期记忆)、工具使用。 智能体的类型: 1. 简单反应型智能体(Reactive Agents):根据当前感知输入直接采取行动,不维护内部状态,不考虑历史信息。例如温控器。 2. 基于模型的智能体(Modelbased Agents):维护内部状态,对当前和历史感知输入进行建模,能推理未来状态变化并据此行动。例如自动驾驶汽车。 3. 目标导向型智能体(Goalbased Agents):具有明确目标,能根据目标评估不同行动方案并选择最优行动。例如机器人导航系统。 4. 效用型智能体(Utilitybased Agents):不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动优劣并权衡利弊。例如金融交易智能体。 5. 学习型智能体(Learning Agents):能通过与环境交互不断改进性能,学习模型、行为策略以及目标函数。例如强化学习智能体。 相关链接: 1. 2. 3. 4. 5. 6.
2024-12-17
基于知识库做备考AI Agent,我该怎么做
以下是基于知识库为您提供的备考 AI Agent 的建议: 首先,建议您先吃透 prompt,这对于学习 AI Agent 很重要。 在 cost 平台有丰富的教程和比赛,您可以参与其中。 了解到 AI agent 是大语言模型衍生出的智能体,用于解决大模型在处理复杂任务时存在的一些问题,如无法获取最新外部信息、缺少规划、没有记忆能力等。 明天银海老师将详细讲解 AI agent,您可以关注。 此外,知识库中还提到了一些相关的活动和内容,如 prompt battle、AI 神经大赛等,您可以根据自己的兴趣参与。 对于与 AI 会话相关的内容,您可以通过关键词学设进行学习,比如每日选词丢入稳定扩散模型,积累大量提示词,还建有飞书群供感兴趣的同学加入练习。 在 AI 绘画方面,是视觉基础,有针对 AI 绘画学社做的关键词词库精选活动。同时,还收集了 AI 视频类词汇和相关词典,更具象的描述词汇能让模型发挥更好效果。 希望以上内容对您备考 AI Agent 有所帮助。
2024-12-16
怎么做一个搜索ai新闻的agent
要做一个搜索 AI 新闻的 agent,您可以参考以下步骤: 1. 设定 Bot 的人设与回复逻辑。 2. 为 Bot 配置技能: 在 Bot 编排页面的技能区域,单击插件功能对应的“+”图标。 在添加插件页面,选择阅读新闻>头条新闻>getToutiaoNews,然后单击新增。 3. 修改人设与回复逻辑,指示 Bot 使用 getToutiaoNews 插件来搜索 AI 新闻。 4. (可选)为 Bot 添加开场白,让用户更好地了解 Bot 的功能。开场白功能目前支持豆包、微信公众号(服务号)。 5. 测试您的 Bot:配置好 Bot 后,在预览与调试区域中测试 Bot 是否符合预期。可单击清除图标清除对话记录。 6. 发布您的 Bot: 在 Bot 的编排页面右上角,单击发布。 在发布页面输入发布记录,并勾选发布渠道。 单击发布。 更多内容,请访问 Coze 官方文档: 英文版:https://www.coze.com/docs/welcome.html 中文版:https://www.coze.cn/docs/guides/welcome
2024-12-12
现在有多少个agent平台
以下是一些常见的 Agent 平台: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具以拓展 Bot 能力边界。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体平台,支持开发者根据需求打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 此外,随着 AI 的发展,还有一些相关的研究和报告,如生成式 AI 季度数据报告 2024 月 1 3 月中提到的 Agents a16z 图谱等。但需要注意的是,这些平台都有各自的局限性。您可以根据自己的需求选择适合的平台进行进一步探索和应用。
2024-12-12
怎么用扣子搭建一个仿写文章的智能体
以下是关于用扣子搭建仿写文章智能体的相关信息: 生物医药小助手:这是生物医药垂直领域的第一个智能体,其创建者将个人发布的大量生物医药文章转化为可交互数据库,以解决读者咨询占用过多时间的问题。通过扣子平台,解决了高成本搭建问题,并实现了一问一答的形式,用户可在扣子的 bot 商店或公众号中发起问答。 手搓插件:可参考相关文章和链接,了解在扣子中手搓插件的方法,包括 API 参数测试等步骤。 竖起耳朵听智能体:其编排包括插件、工作流和知识库。插件如同工具箱,可添加现有或自制的 API 以增强智能体能力;工作流像可视化拼图游戏,由多个节点组成,可组合各种功能创建复杂稳定的业务流程。 如果您想进一步了解具体的搭建步骤和细节,还需要您提供更明确的需求。
2024-12-19
零基础模板化搭建 AI 聊天机器人
以下是零基础模板化搭建 AI 微信聊天机器人的相关内容: 开始搭建 1. 配置腾讯云轻量应用服务器 重点在于修改 dockercompose.yml 文件中的具体配置,以串联微信号和已创建好的 AI 机器人。配置参考来源为:https://docs.linkai.tech/cow/quickstart/config 。 配置参数中,名称的全大写描述需对应编排模板,如 open_ai_api_key 对应 OPEN_AI_API_KEY ,model 对应 MODEL 等。 私聊或群聊交流时,最好加上前缀触发机器人回复,如配置的 ,即 SINGLE_CHAT_PREFIX ,私聊或群里发消息包含 bot 或 @bot 才会触发机器人回复。在群组里,对应配置参数是 GROUP_CHAT_PREFIX ,机器人只会回复群里包含 @bot 的消息。 GROUP_NAME_WHITE_LIST 用于配置哪些群组的消息需要自动回复,例如 ,即只有这些群组的消息才会自动回复。 2. 配置部署 COW 组件 假设对接的微信号名称叫安仔机器人,更新最终版的配置参数(GROUP_NAME_WHITE_LIST 参数根据交互的群组进行具体修改),查看无误后点击保存,编排模板创建成功。 切换到容器编排界面,基于创建的模板进行 COW 服务部署,点击添加后等待部署完成。 疑问解答 1. 容器编排模板是一种配置文件,定义了如何在 Docker 中部署和管理多个容器。通过编排模板,可一键部署复杂的应用环境,无需手动配置每个容器细节。本文中通过容器编排模板配置了 COW 组件,使其能与微信和极简未来平台交互。 2. Docker 提供隔离运行环境,确保应用程序在任何环境稳定运行。通过 Docker 部署 COW 组件,可简化安装和配置过程,确保每次部署环境一致,且易管理和维护。 3. 配置多个前缀(如“bot”、“@bot”)可确保只有特定情况下机器人才会回复,避免在群聊或私聊中频繁干扰,提高响应准确性和用户体验。 4. 扫码登录失败时,可尝试以下步骤: 重启 Docker 容器:在宝塔面板中找到对应的容器,点击“重启”。 检查网络连接:确保服务器和微信客户端能正常访问互联网。 重新扫描二维码:等待容器重新启动后,重新扫描日志中生成的二维码。 5. 实际上使用不会很贵。极简未来平台按使用量收费,对于一般用户费用相对低廉,充值少量费用通常可用很长时间。同时,平台还提供每天签到免费领取积分的福利,进一步降低使用成本。 6. 极简未来平台创建 AI 机器人的费用,具体因使用量而异。
2024-12-18
搭建一个专业的律师智能体
搭建一个专业的律师智能体需要考虑以下几个方面: 1. 多智能体的通信问题:不同智能体之间的通信至关重要,包括如何传递信息以及传递哪些信息。之前的很多多智能体开源框架存在效率低下和 token 消耗大的问题,而像 OpenAI 官方开源的多智能体框架「Swarm」在「Handoffs」方面处理得较为优雅。 2. 智能体的角色和职责:以客服多智能体为例,只需要准备如普通接线客服和宽带客服这样必要的 Agent,并明确其职责和交接逻辑。 3. 提示词的编写:对于律师智能体,写好提示词很重要。例如,在写作时需要对文章中出现的案例进行脱敏处理,替换具体的人物姓名、时间和地点。同时,注意深化写作时的分段和字数要求。 4. 遵循特定的规则和要求:像令中规定的初始化问候语、牢记并遵守全部要求等。 5. 决策智能体的应用:决策智能体在企业自动化中发挥作用,如在复杂、多步骤的推理流程中导航并做出业务决策。以 Anterior 为例,将付款方规则转换为有向无环图,利用智能体遍历决策树并评估相关文件。其他领域如 Norm AI 和 Parcha 也在利用决策智能体。
2024-12-17
有哪些入门级的搭建工作流术语
以下是一些入门级的搭建工作流术语及相关内容: 在典型应用场景中,入门级场景可能仅添加一个节点来构建简单工作流。例如,使用获取新闻插件构建一个获取新闻列表的工作流;使用大模型节点接收并处理用户问题等。 端口设置方法:通过神秘代码让所有联网操作应用指定端口,端口号一般在代理选项中,将其填入相关代码,在 CMD 中复制粘贴代码回车,无反应即成功,需安装 Git。 工作流搭建过程:从零开始搭建工作流,如加载 checkpoint loader、prompt 等节点,按颜色连接,未连接会报错,连接后填写提示词即可生成图像。 工作流原理讲解:以做菜为例,空的 latent 是锅,代表图片大小;模型是食材,正反向提示词是菜谱,VE 是调料,按颜色连接各部分。 使用他人工作流:从工作流网站下载 json 文件,拖入相关界面,若有爆红说明有节点未安装,可在 manager 中安装缺失节点。 工作流本地与在线使用方法:介绍了工作流在本地和在线的使用步骤,如安装、处理报错、放置模型文件等。 解决工作流依赖冲突:讲解了通过修改 cast NODE 里的 requirements 来解决依赖冲突的方法。 网页版工具的使用:指出很多工具都有网页版,本地没有工具时可用网页版。 涉及的应用领域包括大摩托车商业应用、学会 AI 工具、自主搭建工作流、生图制作、视频制作、AI 设计创作、3D 动画、建筑方案图、个人应用、人物一致性出视频、设计工作流、各种实践应用、工作流的设计思路、家装和游戏设计、商业和生活、娱乐、综合应用、实现个人想法、游戏美术全流程等。
2024-12-15
如何搭建一个RAG应用?
搭建一个 RAG 应用可以使用 LangChain 平台,以下是相关步骤和组件: 1. 数据加载器(DocumentLoader):这是一个对象,能从数据源加载数据并转换为包含 page_content(文本内容)和 metadata(元数据,如标题、作者、日期等)的文档对象。 2. 文本分割器(DocumentSplitter):可将文档对象分割成多个较小的文档对象,方便后续检索和生成,因为大模型输入窗口有限,短文本更易找到相关信息。 3. 文本嵌入器(Embeddings):能将文本转换为高维向量的嵌入,用于衡量文本相似度以实现检索功能。 4. 向量存储器(VectorStore):可存储和查询嵌入,通常使用 Faiss 或 Annoy 等索引技术加速检索。 5. 检索器(Retriever):能根据文本查询返回相关文档对象,常见实现是向量存储器检索器,利用向量存储器的相似度搜索功能检索。 6. 聊天模型(ChatModel):可根据输入序列生成输出消息,通常基于大模型如 GPT3 实现文本生成功能。 使用 LangChain 构建 RAG 应用的一般流程如下: 首先,使用合适的数据加载器根据数据源类型加载数据。例如,数据源是网页可用 WebBaseLoader 加载和解析网页得到文档对象。 然后,用合适的文本分割器将文档对象分割成较小的符合要求的文档对象。如文本是博客文章,可用 RecursiveCharacterTextSplitter 分割。 接下来,用文本嵌入器将文档对象转换为嵌入,并存储到向量存储器中。可根据嵌入质量和速度选择合适的嵌入器和存储器,如 OpenAIEmbeddings 和 ChromaVectorStore。 之后,创建向量存储器检索器,传递向量存储器对象和文本嵌入器对象作为参数。 最后,创建聊天模型,根据性能和成本选择合适的模型,如 OpenAIChatModel。 以下是一个使用 LangChain 构建 RAG 应用的示例代码。
2024-12-15
什么是用ai搭建工作流
AI 工作流指的是将 AI 工具融入到工作的各个环节中,以提高工作效率。搭建 AI 工作流需要具备三层能力: 1. 了解各种 AI 工具,清楚其特点和用途。 2. 学会写提示词,这对于能否向 AI 清晰表述任务至关重要。 3. 搭建 AI 智能体,使多个 AI 工具协同工作,替代人工自动完成任务。 搭建 AI 工作流有一套简单的工作流: 1. 找到一个熟悉的工作场景,例如写文章、做 PPT 等。 2. 拆解工作流程,比如写文章可拆分为选题、写稿、改稿、写标题等步骤。 3. 针对每个步骤嵌入合适的 AI 工具,想不到时可参考他人做法,要灵活选择最优解,以提高工作效率为目的,而非单纯追求工作的含 AI 量。 此外,近期出现的各类 AI 搜索引擎不断颠覆传统搜索引擎,如 perplexity.ai、metaso、360 搜索、ThinkAny 等,能辅助高效处理信息,智能摘要功能可帮助快速筛选信息。自然语言描述就能生成美观可用的图片,降低了创作门槛和周期,也促使新型产品设计方式出现,如使用 AI 进行用户画像、竞品调研、设计产品测试用例、绘制产品功能流程图等。每个人应先了解自己的日常工作流,再根据工作节点线索找到适合自己的工具。关于 AI Agent 的未来,技术迭代会不断向前,曾被认为异想天开的想法都可能成为现实。
2024-12-14