以下是使用 API 结合 cherry studio 建立本地知识库后训练使 AI 更聪明的方法:
此外,在训练 AI 时,还需要注意以下几点:
希望以上内容对您有所帮助。
本次创建知识库使用手动清洗数据,上节课程是自动清洗数据:[【智能体】用Coze在微信里搭建一个机器人,还能挖掘销售线索](https://a1i1hjmvcf0.feishu.cn/docx/JSdDd8ybLo7OHqxmePwcHlbLn3b?from=from_copylink),自动清洗数据会出现目前数据不准的情况,本节视频就尝试使用手动清洗数据,提高数据的准确性。[heading3]3.1在线知识库[content]点击创建知识库,创建一个画小二课程的FAQ知识库知识库的飞书在线文档,其中每个问题和答案以###分割,暂时不要问为什么。选择飞书文档选择自定义的自定义输入###然后他就将飞书的文档内容以###区分开来,这里可以点击编辑修改和删除。点击添加Bot添加好可以在调试区测试效果[heading3]3.2本地文档[content]本地word文件,这里要注意了~~~如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面画小二这个课程80节课程,分为了11个章节,那训练数据能不能一股脑全部放进去训练呢。答案是~~不能滴~~~正确的方法,首先将11章的大的章节名称内容放进来,如下图所示。章节内详细内容格式如下如所示,如果你再分节的内容,依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理然后选择创建知识库自定义清洗数据,这里不再赘述。[heading3]3.3发布应用[content]点击发布确保在Bot商店中能够搜到,如图所示可以搜索到画小二智能小助手,这个很重要,没有通过发布的获取不到API的。
大语言模型:是一个学习过无数本书、拥有无穷智慧的人。他读过无数的书、看过无数的段子,因此对公共知识、学识技能、日常聊天十分擅长。然而,在工作场景下,只会聊天侃大山可不行,你想让他帮你干活。这个时候,就需要“提示词”出场了,提示词:是你告诉这个全知全能的人,他是一个什么样的角色、他要专注于哪些技能,让他能够按照你的想法,变成一个你需要的“员工”。知识库:相当于你给这个“聪明”员工的发放了一本工作手册。即使是看过再多的书、浏览过再多的文字,也不会准确的知道见到老板娘过来吃饭要打三折,张梦飞过去吃饭要打骨折。而知识库,就是把这些内容写在了工作手册上。让这个聪明的员工,见到有人来的时候,就翻一翻手册,然后再做出反应。我的设定:AI模型:这里使用的是阿里千问模型。提示词:这里设定的角色是“美嘉”,是按照美嘉的人设、背景和对话风格做的设定。知识库:这里放的是《爱情公寓》全季的剧情,让“美嘉”拥有了自己过往的“记忆”,知道自己做过什么、好朋友是谁等等。图中右侧是一个十分简单的问答,我问:“你是谁?你和子乔在台球厅吵架那次是为了什么吵架?”她的回复是:“我是陈美嘉,那次在台球厅和吕子乔吵架是因为他约会被人撞见,我讽刺他脸大影响信号,他还反击我。后来谈到过去的事情,我指责他忘恩负义,他就说我平。最后,我伤心地说要分手,因为他之前甩过我。”
[01:57:41](https://waytoagi.feishu.cn/minutes/obcnxm53m6nzpp16a89r5c8s?t=7061000)大模型及知识库使用讲解与问题解答本章节许键介绍模型API调用方法与知识库创建。告知获取API key位置及调用设置,详细讲解创建Rag应用(知识库)流程,包括上传非结构化文件、数据解析、切分段落等操作,还回答诸多问题,如知识库访问权限、智能体接收文档等,并提及作业是构建常用应用。[02:15:10](https://waytoagi.feishu.cn/minutes/obcnxm53m6nzpp16a89r5c8s?t=8110000)工作流创建、模型能力及相关问题探讨本章节主要讨论工作流相关问题。涉及历史版本功能,如对话流不支持上传文档,可向百练提需求;探讨了根据小说写序章、英文翻译、文字校对等工作流搭建;解释了模型能力、query概念;还提到工作流发布渠道、联网搜索网站设置及根据用户语言回复等内容。[02:22:50](https://waytoagi.feishu.cn/minutes/obcnxm53m6nzpp16a89r5c8s?t=8570000)通义千问相关应用及明天课程安排交流本章节主要讨论智能体相关内容,包括图片识别后让大语言模型回答防治方法,智能体应用及工作流概念、工具添加等。还提及明天将教Deepseek本地部署、蒸馏模型部署及微调,分享了发布智能体消耗token等情况,最后回答了一些问题并预告通义千问推理模型进展。