Chat with Wiki - 如何训练自己的智能体

Answer

训练自己的智能体可以参考以下步骤：

创建智能体
- 知识库
  - 手动清洗数据：上节课程是自动清洗数据，自动清洗数据可能出现数据不准的情况，本节尝试手动清洗数据以提高准确性。参考【智能体】用 Coze 在微信里搭建一个机器人，还能挖掘销售线索。
  - 在线知识库：点击创建知识库，创建一个画小二课程的 FAQ 知识库。飞书在线文档中每个问题和答案以###分割，选择飞书文档、自定义的自定义，输入###，可编辑修改和删除，添加 Bot 后可在调试区测试效果。
  - 本地文档：对于本地 word 文件，注意拆分内容以提高训练数据准确度，例如对于画小二的 80 节课程，分为 11 个章节，不能一股脑全部放进去训练，要先将大章节名称内容放进来，章节内详细内容按固定方式人工标注和处理，然后选择创建知识库自定义清洗数据。
- 发布应用：点击发布，确保在 Bot 商店中能够搜到，没有通过发布无法获取 API。
参考谷歌发布的世界模型 Genie：或许有一天，Genie 可以被用作训练多任务智能体的基础世界模型。在图 14 中，作者展示了该模型已经可以用于在给定起始帧的全新 RL 环境中生成不同的轨迹。
了解基础通识课中的相关内容：
- 流式训练方式提升训练速度和质量。
- 多种 AI 生成工具，如输入简单提示词就能创作音乐的 so no 音频生成工具，能创建个人 AI 智能体的豆包，输入文本可生成播客的 Notebook LN。
- 端侧大模型的特点。
- AI 工程平台，如 define，涉及数据清洗管道、数据存储和检索、编辑生成平台、构建 prompt 技巧、智能体概念、插件调用、运维平台、模型层和缓存机制等，还能接入多家大模型。
- AI 工程平台 coach 的应用，包括新手教程和文档，可创建智能体，通过工作流节点调用和 prompt 构建提示词，还能调用插件、图像流、知识库等，商城中有各种智能体和插件模板，知识库可添加多种格式内容。
- 模型社区介绍，如魔搭社区等。
- AI 建站预告。

Content generated by AI large model, please carefully verify (powered by aily)

References

本次创建知识库使用手动清洗数据，上节课程是自动清洗数据：[【智能体】用Coze在微信里搭建一个机器人，还能挖掘销售线索](https://a1i1hjmvcf0.feishu.cn/docx/JSdDd8ybLo7OHqxmePwcHlbLn3b?from=from_copylink),自动清洗数据会出现目前数据不准的情况，本节视频就尝试使用手动清洗数据，提高数据的准确性。[heading3]3.1在线知识库[content]点击创建知识库，创建一个画小二课程的FAQ知识库知识库的飞书在线文档，其中每个问题和答案以###分割，暂时不要问为什么。选择飞书文档选择自定义的自定义输入###然后他就将飞书的文档内容以###区分开来，这里可以点击编辑修改和删除。点击添加Bot添加好可以在调试区测试效果[heading3]3.2本地文档[content]本地word文件，这里要注意了~~~如何拆分内容，提高训练数据准确度，将海报的内容训练的知识库里面画小二这个课程80节课程，分为了11个章节，那训练数据能不能一股脑全部放进去训练呢。答案是~~不能滴~~~正确的方法，首先将11章的大的章节名称内容放进来，如下图所示。章节内详细内容格式如下如所示，如果你再分节的内容，依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理然后选择创建知识库自定义清洗数据，这里不再赘述。[heading3]3.3发布应用[content]点击发布确保在Bot商店中能够搜到，如图所示可以搜索到画小二智能小助手，这个很重要，没有通过发布的获取不到API的。

谷歌发布世界模型Genie

智能体训练。或许有一天，Genie可以被用作训练多任务智能体的基础世界模型。在图14中，作者展示了该模型已经可以用于在给定起始帧的全新RL环境中生成不同的轨迹。作者在程序生成的2D平台游戏环境CoinRun中进行评估，并与能够访问专家操作作为上限的预言机行为克隆(BC)模型进行比较。消融研究。选择在设计潜在动作模型时，作者仔细考虑了要使用的输入类型。虽然最终选择使用原始图像（像素），但作者在设计Genie时针对使用标记化图像的替代方案（在图5中用z替换x）来评估这一选择。这种替代方法称为「token输入」模型（参见表2）。分词器架构消融。作者比较了三种分词器选择的性能，包括1)（仅空间）ViT、2）（时空）ST-ViViT和3）（时空）CViViT（表3）。来源：机器之心https://mp.weixin.qq.com/s/TyevzSaWihfxRA4ZZ0F1fg

02-基础通识课

[heading2]总结AI技术的发展与应用流式训练方式提升训练速度和质量：将孔明灯换成泡泡，通过流式训练方式提高了整体训练的过程速度和质量，基于Transformer模型进行流匹配，这种方式优于扩大模型。多种AI生成工具：如输入简单提示词就能创作音乐的so no音频生成工具，能创建个人AI智能体的豆包，输入文本可生成播客的Notebook LN。端侧大模型的特点：端侧大模型能部署在手机端等设备，参数量小，可利用手机自带芯片或处理器运算，主要通过压缩来解决存储和性能问题，如减少模型参数量和计算复杂度，知识蒸馏模型有教师模型和学生模型。AI工程平台：AI工程平台对模型和应用有要求，像define是典型的工程平台，涉及数据清洗管道、数据存储和检索、编辑生成平台、构建prompt技巧、智能体概念、插件调用、运维平台、模型层和缓存机制等，还能接入多家大模型。AI工程平台coach的应用：coach平台新版本有很多模板，如名画照相馆，有众多插件工具，包括必应搜索、链接读取、代码执行器等，还有工作流，可创建应用APP。AI相关工具与平台的介绍及应用coach平台的使用：介绍了coach平台的新手教程和文档，可创建智能体，通过工作流节点调用和prompt构建提示词，还能调用插件、图像流、知识库等，商城中有各种智能体和插件模板，知识库可添加多种格式内容。模型社区介绍：提到魔搭社区等几个为大模型提供数据、企业模型和算力服务的平台，有按任务划分的模型库、数据集和在线应用供体验。AI建站预告：为后续AI建站做预告，需要在今明两天安装vs code等基础软件，以简单步骤帮助文科生和无基础人员完成建站，获得正反馈。