Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何创建个人专属知识库

Answer

以下是创建个人专属知识库的相关内容:

  • 私人知识库中的内容通常包括从互联网收集的优质信息以及个人日常的思考和分享。
  • 基于私人知识库打造个人专属的 ChatGPT 常见有两种技术方案:
    • 训练专有大模型:可以使用个人知识库训练专有大模型,但此方案并非当下主流,存在高成本、更新难度大等缺陷。
    • 利用 RAG(检索增强生成)技术:先将文本拆分成若干小文本块并转换为 embeddings 向量,保存在向量储存库中。当用户提出问题时,将问题转换为向量与储存库中的向量比对,提取关联度高的文本块与问题组合成新的 prompt 发送给 GPT API。
    • 搭建基于 GPT API 的定制化知识库时,由于 GPT-3.5 一次交互支持的 Token 有限,OpenAI 提供了 embedding API 解决方案。embeddings 是一个浮点数字的向量,向量之间的距离衡量关联性,小距离表示高关联度。
Content generated by AI large model, please carefully verify (powered by aily)

References

这可能是讲 Coze 的知识库最通俗易懂的文章了

私人知识库中内容一般有两种:日常从互联网收集的优质信息个人日常的思考以及分享如果我想基于这套知识库打造个人专属的ChatGPT该怎么做呢?这里面常见的会有两种技术方案1.训练专有大模型2.利用RAG(检索增强生成)技术初次听到这两个名词你可能有点懵,不要慌,接下来我会通俗易懂的语言让你了解他们的原理。[heading3]训练专有大模型[content]KimiChat和ChatGPT等AI聊天软件为什么能够精准的回答问题,因为他们使用了整个互联网的语料进行了训练,从而拥有了整个互联网的知识。看到这里你应该知道我想要讲什么了,对,既然能用整个互联网的知识训练出KimiChat和ChatGPT等大模型,那我能不能使用我的知识库来训练一个专有的大模型呢?当然可以!而且这样的效果是最好的。但是这并不是当下主流的方案,因为他有以下几个缺陷:高成本:训练和维护一个大型专有模型的成本非常高,需要大量的计算资源和专业知识。更新难度:如果需要更新模型的知识,需要重新训练或微调模型,这可能是一个复杂且耗时的过程下面让我们来看另一个方案:RAG(检索增强生成)

从零开始,用GPT打造个人知识库

上面将文本转换成向量(一串数字)能大大节省空间,它不是压缩,可简单理解为索引(Index)。接下来就有意思了。比如我有一个大文本,可以先把它拆分成若干个小文本块(也叫chunk),通过embeddings API将小文本块转换成embeddings向量,这个向量是跟文本块的语义相关。在一个地方(向量储存库)中保存这些embeddings向量和文本块,作为问答的知识库。当用户提出一个问题时,该问题先通过embeddings API转换成问题向量,然后将这问题向量与向量储存库的所有文本块向量比对,查找距离最小的几个向量,把这几个向量对应的文本块提取出来,与原有问题组合成为新的prompt(问题/提示词),发送给GPT API。这样一来就不用一次会话中输入所有领域知识,而是输入了关联度最高的部分知识。一图胜千言,转一张原理图。再举一个极其简单的例子,比如有一篇万字长文,拆分成Chrunks包含:文本块1:本文作者:越山。xxxx。文本块2:公众号越山集的介绍:传播效率方法,分享AI应用,陪伴彼此在成长路上,共同前行。文本块3:《反脆弱》作者塔勒布xxxx。文本块4:“科技爱好者周刊”主编阮一峰会记录每周值得分享的科技内容,周五发布。...文本块n如果提问是”此文作者是谁?“。可以直观的看出上面的文本块1跟这个问题的关联度最高,文本块3次之。通过比较embeddings向量也可以得到这结论。那最后发送给GPT API的问题会类似于”此文作者是谁?从以下信息中获取答案:本文作者:越山。xxxx。《反脆弱》作者塔勒布xxxx。“这样一来,大语言大概率能回答上这个问题。

从零开始,用GPT打造个人知识库

要搭建基于GPT API的定制化知识库,涉及到给GPT输入(投喂)定制化的知识。但GPT-3.5,也就是当前免费版的ChatGPT一次交互(输入和输出)只支持最高4096个Token,约等于3000个单词或2300个汉字。这点容量对于绝大多数领域知识根本不够。为了使用GPT的语言能力来处理大量的领域知识,OpenAI提供了embedding API解决方案。参考OpenAI embedding documents。[heading2]理解embeddings[content]embeddings(直译为嵌入)是一个浮点数字的向量(列表)。两个向量之间的距离衡量它们的关联性。小距离表示高关联度,大距离表示低关联度。进一步解释:向量(列表):向量是数学中表示大小和方向的一个量,通常用一串数字表示。在计算机科学和数据科学中,向量通常用列表(list)来表示。列表是一种数据结构,它包含一组有序的元素。例如,一个二维向量可以表示为[2,3],这意味着沿着两个轴的分量分别为2和3。在这里,"list"是一种编程术语,意味着一系列有序的数据。向量之间的距离:向量之间的距离是一种度量两个向量相似性的方法。有多种方式可以计算两个向量之间的距离,最常见的是欧几里得距离。欧几里得距离计算方法是将两个向量的对应元素相减,然后取平方和,再开平方。例如,向量A =[1,2]和向量B =[4,6]之间的欧几里得距离为sqrt((4-1)^2 +(6-2)^2)= 5。较小距离意味着高相关性,因为向量间相似度高。在OpenAI词嵌入中,靠近向量的词语在语义上相似。例如,“猫”和“狗”距离近,它们都是宠物,与“汽车”距离远,相关性低。文档上给了创建embeddings的示例上面的命令访问embeddings API接口,将input语句,转化成下面这一串浮点数字。

Others are asking
我是小白用户,已经建立cherry studio本地知识库,我想更自动化的使用知识库,有什么具体操作方法
以下是关于更自动化使用 cherry studio 本地知识库的具体操作方法: 使用知识库: 将知识库直接与 Bot 进行关联用于响应用户回复,或者在工作流中添加知识库节点,成为工作流中的一环。 在 Bot 内使用知识库: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 4. 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 5. (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项。 配置项说明: 最大召回数量:Bot 在调用知识库匹配用户输入内容时,返回的数据片段数量,数值越大返回的内容越多。 最小匹配度:Bot 在调用知识库匹配用户输入内容时,会将达到匹配度要求的数据片段进行召回。如果数据片段未达到最小匹配度,则不会被召回。 调用方式:知识库的调用方式。 自动调用:每轮对话将自动从所有关联的知识库中匹配数据并召回。 按需调用:您需要在人设与回复逻辑中提示 Bot 调用 RecallKnowledge 方法,以约束 Bot 在指定时机从知识库内匹配数据。 6. (可选)在预览与调试区域调试 Bot 能力时,扩展运行完毕的内容可以查看知识库命中并召回的分片内容。 在工作流内使用 Knowledge 节点: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在页面顶部进入工作流页面,并打开指定的工作流。 4. 在左侧基础节点列表内,选择添加 Knowledge 节点。 创建知识库并上传文本内容: |上传方式|操作步骤| ||| |本地文档|1. 在文本格式页签下,选择本地文档,然后单击下一步。<br>2. 将要上传的文档拖拽到上传区,或单击上传区域选择要上传的文档。<br>目前支持上传.txt,.pdf,.docx 格式的文件内容。<br>每个文件不得大于 20M。<br>一次最多可上传 10 个文件<br>1. 当上传完成后单击下一步。<br>2. 选择内容分段方式:<br>2.1. 自动分段与清洗:系统会对上传的文件数据进行自动分段,并会按照系统默认的预处理规则处理数据。<br>2.2. 自定义:手动设置分段规则和预处理规则。<br>分段标识符:选择符合实际所需的标识符。<br>分段最大长度:设置每个片段内的字符数上限。<br>文本预处理规则:<br>替换掉连续的空格、换行符和制表符<br>删除所有 URL 和电子邮箱地址<br>1. 单击下一步完成内容上传和分片。| 创建知识库并上传表格数据: |上传方式|操作步骤| ||| |本地文档|选择将本地文件中的表格数据上传至知识库中。<br>1. 在表格格式页签下,选择本地文档,然后单击下一步。<br>2. 将要上传的文档拖拽到上传区,或单击上传区域选择要上传的文档,然后单击下一步。<br>目前支持上传.csv 和.xlsx 格式的文件内容,且表格内需要有列名和对应的数据。<br>每个文件不得大于 20M。<br>一次最多可上传 10 个文件。<br>1. 配置数据表信息后,单击下一步。<br>1.1. 指定数据范围:通过选择数据表、表头、数据起始行指定数据范围。<br>1.2. 确认表结构:系统已默认获取了表头的列名,您可以自定义修改列名,或删除某一列名。<br>1.3. 指定语义匹配字段:选择哪个字段作为搜索匹配的语义字段。在响应用户查询时,会将用户查询内容与该字段内容的内容进行比较,根据相似度进行匹配。<br>2. 查看表结构和数据,确认无误后单击下一步。<br>3. 完成上传后,单击确定。|
2025-03-06
小白用户,使用API结合cherry studio建立本地知识库之后,应该怎么训练使AI更聪明
以下是使用 API 结合 cherry studio 建立本地知识库后训练使 AI 更聪明的方法: 1. 在线知识库: 点击创建知识库,创建一个画小二课程的 FAQ 知识库。 知识库的飞书在线文档中,每个问题和答案以分割。 选择飞书文档,选择自定义的自定义,输入。 编辑修改和删除内容,添加 Bot 并在调试区测试效果。 2. 本地文档: 注意拆分内容,提高训练数据准确度。 对于画小二课程,将 80 节课程分为 11 个章节,不能一股脑全部放进去训练。 首先将 11 章的大章节名称内容放进来,章节内详细内容按照固定方式进行人工标注和处理。 然后选择创建知识库自定义清洗数据。 3. 发布应用: 点击发布,确保在 Bot 商店中能够搜到。 此外,在训练 AI 时,还需要注意以下几点: 提示词:告诉 AI 它的角色和要专注的技能。 知识库:相当于给 AI 发放工作手册,例如可以放入特定的剧情等内容。 希望以上内容对您有所帮助。
2025-03-06
结合API建立本地知识库,具体什么操作比较容易
要结合 API 建立本地知识库,以下是较为容易的操作步骤: 1. 进入知识库页面,单击创建知识库。 2. 在弹出的页面配置知识库名称、描述,并单击确认。需注意一个团队内的知识库名称不可重复,必须是唯一的。 3. 在单元页面,单击新增单元。 4. 在弹出的页面,选择表格格式。 5. 选择 API 上传方式: 获取在线 API 的 JSON 数据,将 JSON 数据上传至知识库。 在表格格式页签下,选择 API,然后单击下一步。 单击新增 API。 输入网址 URL 并选择数据的更新频率,然后单击下一步。 输入单元名称或使用自动添加的名称,然后单击下一步。 配置数据表信息后,单击下一步。 确认表结构:系统已默认获取了表头的列名,您可以自定义修改列名,或删除某一列名。 指定语义匹配字段:选择哪个字段作为搜索匹配的语义字段。在响应用户查询时,会将用户查询内容与该字段内容的内容进行比较,根据相似度进行匹配。 查看表结构和数据,确认无误后单击下一步。 完成上传后,单击确定。 您也可以选择自定义上传方式: 在表格格式页面下,选择自定义,然后单击下一步。 输入单元名称。 在表结构区域添加字段,单击增加字段添加多个字段。 设置列名,并选择指定列字段作为搜索匹配的语义字段。 单击确定。 单击创建分段,然后在弹出的页面输入字段值,然后单击保存。
2025-03-06
如何将一个网页或者网站的内容作为知识库导入?
将网页或网站的内容作为知识库导入主要有以下几种方式及操作步骤: 1. Notion: 在文本格式页签下,选择 Notion,然后单击下一步。 单击授权。首次导入 Notion 数据和页面时,需要进行授权。 在弹出的页面完成登录,并选择要导入的页面。 选择要导入的数据,然后单击下一步。 选择内容分段方式: 自动分段与清洗:系统会对上传的文件数据进行自动分段,并会按照系统默认的预处理规则处理数据。 自定义:手动设置分段规则和预处理规则。分段标识符:选择符合实际所需的标识符。分段最大长度:设置每个片段内的字符数上限。文本预处理规则:替换掉连续的空格、换行符和制表符,删除所有 URL 和电子邮箱地址。 单击下一步完成内容上传和分片。 2. 在线数据: 自动采集方式:适用于内容量大,需要批量快速导入的场景。 在文本格式页签下,选择在线数据,然后单击下一步。 单击自动采集。 单击新增 URL。在弹出的页面完成以下操作:输入要上传的网站地址;选择是否需要定期同步网站内容,如果需要选择内容同步周期;单击确认。 当上传完成后单击下一步。系统会自动根据网站的内容进行内容分片。 手动采集:适用于需要精准采集网页上指定内容的场景。 安装扩展程序,详情请参考。 在文本格式页签下,选择在线数据,然后单击下一步。 点击手动采集,然后在弹出的页面点击权限授予完成授权。 在弹出的页面输入要采集内容的网址,然后单击确认。 在弹出的页面上,点击页面下方文本标注按钮,开始标注要提取的内容,然后单击文本框上方的文本或链接按钮。 单击查看数据查看已采集的内容,确认无误后再点击完成并采集。 3. 本地文档: 在文本格式页签下,选择本地文档,然后单击下一步。 将要上传的文档拖拽到上传区,或单击上传区域选择要上传的文档。目前支持上传.txt、.pdf、.docx 格式的文件内容。每个文件不得大于 20M。一次最多可上传 10 个文件。 当上传完成后单击下一步。 选择内容分段方式: 自动分段与清洗:系统会对上传的文件数据进行自动分段,并会按照系统默认的预处理规则处理数据。 自定义:手动设置分段规则和预处理规则。分段标识符:选择符合实际所需的标识符。分段最大长度:设置每个片段内的字符数上限。文本预处理规则:替换掉连续的空格、换行符和制表符,删除所有 URL 和电子邮箱地址。 单击下一步完成内容上传和分片。
2025-03-06
我也想做一个有关于数据的知识库,做完之后可以让他帮我分析数据
以下是关于创建和使用数据知识库的相关信息: 智能体: 创建智能体的知识库时,可选择手动清洗数据,手动清洗数据能提高数据准确性。手动清洗数据包括创建在线知识库和本地文档。 在线知识库:点击创建知识库,创建画小二课程的 FAQ 知识库,飞书在线文档中每个问题和答案以分割,可编辑修改和删除,添加 Bot 后可在调试区测试效果。 本地文档:注意拆分内容以提高训练数据准确度,例如对于画小二课程,将其章节内容按固定方式人工标注和处理。 完成创建后点击发布,确保在 Bot 商店中能够搜到,只有通过发布才能获取 API。 安装 Coze Scraper: 安装扩展程序至浏览器后,可按以下步骤采集数据上传到知识库: 1. 登录。 2. 在左侧菜单栏选择一个工作区。 3. 在工作区内,单击知识库页签。 4. 创建一个知识库或点击一个已存在的知识库。 5. 在知识库页面,单击新增单元。 6. 在文本格式页签下,选择在线数据,然后单击下一步。 7. 单击手动采集,完成授权。 8. 输入要采集内容的网址,确认。 9. 标注要提取的内容,查看数据确认无误后再点击完成并采集。 Obsidian 加 Cursor: 用 Trae 查询笔记内容:Obsidian 虽支持多种搜索方式,但基于关键字搜索在笔记库较大时存在困难。可在 Trae 右侧的 Chat 输入框输入相关问题进行模糊搜索,如输入「」然后选择剪藏文件夹,提问特定内容。 用 Trae 和 Obsidian 辅助研究:可对多个不同的笔记文件进行比较或综合整理研究,在 Chat 输入框提问时用「」分别引用指定的笔记文件或文件夹。还可根据需求和内容发散更多用法,如用于学习和复习,或分析结构化数据。
2025-03-06
有没有好用的知识库
以下是一些好用的知识库介绍: 扣子:其知识库功能强大,可上传和存储外部知识内容,提供多种查找知识的方法。能解决大模型有时出现的幻觉或专业领域知识不足的问题,支持多种格式文件,如文本格式。在智能体中使用时,回答用户前会先检索知识库内容。还可添加开场白提升体验。 扣子提供的存储和记忆外部数据的方式包括: 知识库:大量知识分片,通过语义匹配为模型补充知识。例如车型数据,每个知识库分段保存一种车型基础数据,用户提问时能匹配对应分段获取信息。 数据库:类似传统软件开发的数据库功能,以表格结构存储信息,通过 NoSQL 方式使用,目前提供关系型数据库,有多种应用场景。 AI 便签:记录用户提交的便签,支持提交、查询操作,通过 NL2SQL 完成。 单词本:记录用户背过的单词及未记住的单词等。 Coze 中创建知识库的步骤: 路径:个人空间 知识库 创建知识库。 支持的文档类型:本地文档、在线数据、飞书文档、Notion 等,本次使用【本地文档】。 按照操作指引上传文档、分段设置、确认数据处理。 小技巧:知识库的好用程度与内容切分粒度有关,可在内容中加特殊分割符如“”便于自动切分数据,分段标识符号选择“自定义”,内容填“”。最终的知识库结果中,同一颜色代表同一个数据段,有误可编辑或删除。
2025-03-05
如果我想让deepseek成为我专属的公文写作助手,需要输入什么提示词
如果您想让 DeepSeek 成为您专属的公文写作助手,可以参考以下提示词: 1. 首先借助 AI 分析好的文章: 找出您最喜欢的文章,投喂给 DeepSeek R1(理论上来说适合大多数 AI,尤其是有推理模型)。 第一次询问:请从写作角度分析这篇文章。 第二次询问:请再从读者角度分析这篇文章。 第三次询问:这篇文章还存在什么缺点和不足,有什么改善和提升的空间。 对作者进行侧写,分析成长背景、个人经历和知识结构对文章的影响。 2. 让 AI 对您写的文章进行点评:“现在我希望你是一名资深中文写作教师/小学语文老师/中学语文老师/公文写作培训师,拥有 30 年教育经验,是一名传授写作技巧的专家。请先阅读我提供给你的文章,然后对文章进行分析,然后教我如何提升写作水平。请给出详细的优缺点分析,指出问题所在,并且给出具体的指导和建议。为了方便我能理解,请尽量多举例子而非理论陈述。” 3. 根据文章内容对作者进行心理侧写:“我希望你扮演一个从业 20 多年,临床诊治过两千多例心理分析案例的人性洞察和意识分析方面的专家,精通心理学、人类学、文史、文化比较。先阅读后附文章全文,然后对作者进行人格侧写。要尖锐深刻,不要吹捧包装,不要提出一些只能充当心理安慰的肤浅的见解。包括作者的基本画像、核心性格特质、认知与价值观、潜在心理动机、行为模式推测、矛盾与盲点、文化符号映射。”
2025-03-06
如何建立一个行业的知识库,并建立这个行业的专属AI模型?
建立一个行业的知识库并建立专属 AI 模型可以参考以下步骤: 1. 明确行业需求和目标:确定知识库和 AI 模型要解决的具体问题和实现的功能。 2. 收集和整理数据:包括行业相关的各种信息、文档、案例等,为知识库提供素材。 3. 设计提示词:明确 AI 模型的角色和专注的技能,使其能够按照设定进行工作。 4. 构建知识库:将行业特定的规则、流程、案例等内容整理成工作手册,供 AI 模型参考。 5. 选择合适的 AI 模型:例如可以使用阿里千问模型等。 6. 进行模型训练和优化:根据收集的数据和设定的提示词、知识库对模型进行训练,并不断优化。 7. 融合实际场景:让人类专家配备可穿戴设备,收集现实世界的互动供 AI 学习,避免复制危险的偏见。 8. 持续评估和改进:根据实际应用效果,对知识库和 AI 模型进行评估和改进。 例如,在医疗保健领域,开发具有潜在空间层次结构的堆叠 AI 模型,反映对每个基本元素的理解或预测能力。创建专门从事医疗保健特定领域的 AI,让其接触到顶级从业人员的多样化视角。在财经领域,依托中央财经大学的资源优势,基于内容增强型知识插槽技术构建高质量知识库,与客户自有知识库结合,实现全业务场景的支撑,可实现快速的专家级 Agent 构建与管理维护。在文档处理领域,如上海普米智图智能科技有限公司,自主研发的数据框架 Ananke 和 Agent 框架 Moros,利用智能体技术提升工作流效率。
2025-03-01
如何对扣子智能体做专属训练
对扣子智能体进行专属训练时,需要注意以下要点: 1. 跳转设置:扣子在节点切换提供了独立和非独立两种识别模式。独立识别模式中每个节点都有一个独立识别模型,非独立模式则直接使用当前智能体模型进行判断,实际使用中推荐独立模式。 2. 独立模式的选择:独立模式有两种选择。第一种是面对通用指令时,选择已经训练好的、专门用于节点切换的大型模型,其优点是经过特定训练,无需额外操心设计。第二种是在遇到非常复杂的情景时,使用自定义的大型模型,可根据需求定制模型和编写特定提示词以适应复杂交互场景,但实际测试效果不理想,所以推荐使用第一种。 3. 关键注意点:在使用专门训练的意图识别模型进行节点切换时,要特别注意两个关键点。一是每个智能体的用途必须清晰明确,在设计和实现时要清楚标注其功能和目的,以确保系统能准确识别和响应用户意图。二是智能体的名称非常重要,应清晰、易于识别,便于系统识别和记忆。
2025-01-27
如何做一款专属某行业的AI
要开发一款专属某行业的 AI ,可以参考以下要点: 1. 学习模式:AI 应像人类一样学习,例如在医疗保健领域,创建具有潜在空间层次结构的堆叠 AI 模型,反映对每个基本元素的理解或预测能力,可能会以与人脑皮层类似的方式发展,并针对特定任务专门设计神经架构。 2. 特定领域专家 AI:创建特定领域的专家 AI 比创建全能 AI 更容易,预计会创造许多专家 AI ,它们在编码、数据和测试方面采用多样化方法,并提供多种意见。 3. 现实世界互动:让熟练的人类专家配备可穿戴设备,收集现实世界的互动供 AI 学习,同时避免复制危险的偏见。 4. 模型生态系统:以医疗保健为例,应投资创建像优秀医生和药物开发者那样学习的“专家”AI 模型生态系统。成为顶尖人才通常从多年密集信息输入和正规教育开始,再通过学徒实践,AI 学习也应如此,通过堆叠模型训练,而非仅依靠大量数据。 5. 行业调研报告: 步骤:让 AI 阅读学习优秀行业调研报告,总结方法论和操作框架;询问收集行业数据时所用的一手和二手数据及靠谱资料收集网站;要求 AI 推荐行业信息网站和微信公众号,并输出行业调研报告框架;丰富框架每一章节内容。 注意事项:使报告有深度可通过自身对行业的了解整理深度洞察和见解,或深度咨询 AI 并借助其知识学习、研究和总结。 以上是关于如何做一款专属某行业的 AI 的相关内容。
2025-01-22
我想训练一个专属Agent该怎么做?
要训练一个专属 Agent,以下是一些关键步骤和要点: 1. 明确目标:确定您希望 Agent 实现的特定目标,这将为训练提供方向。 2. 理解智能体的定义:智能体是能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 3. 规划:将大型任务分解为更小、可管理的子目标,以有效处理复杂任务。 4. 反思和完善:让 Agent 能够对过去的行为进行自我批评和反思,从错误中吸取教训,并针对未来步骤进行完善,提高最终结果质量。 5. 记忆管理:包括短期记忆,利用模型的短期记忆进行学习;长期记忆,通过外部向量存储和快速检索实现长时间信息保留和回忆。 6. 工具使用:训练 Agent 学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。 7. 评估工具使用能力:从调用 API 的能力、检索 API 的能力以及计划 API 超越检索和调用的能力这三个层面进行评估。 在训练过程中,还需要注意模型的上下文窗口长度有限,输入的剧集应足够短以构建多剧集历史,2 4 个剧集的多剧集上下文对于学习近乎最优的上下文强化学习算法是必要的,且上下文强化学习的涌现需要足够长的上下文。
2025-01-17
部署Agent专属的web端应用
以下是关于部署 Agent 专属的 web 端应用的相关内容: 在 Linux 上部署较为简单,前提是您有一张 4G 以上显存的 GPU 显卡。步骤如下: 1. 下载代码仓库。 2. 安装依赖(注意有两个依赖未放在 requirements.txt 里)。 3. 启动 webui 的 demo 程序,然后用浏览器登陆服务器的 ip:8080 就能试玩。此 demo 提供了 3 个参数: server_name:服务器的 ip 地址,默认 0.0.0.0。 servic_port:即将开启的端口号。 local_path:模型存储的本地路径。 4. 第一次启动生成语音时,需查看控制台输出,会下载一些模型文件,可能因网络问题失败,但首次加载成功后后续会顺利。 5. 基于此基础可拓展,比如集成到 agent 的工具中,结合 chatgpt 做更拟人化的实时沟通。 6. webui 上可设置的几个参数说明: text:指需要转换成语音的文字内容。 Refine text:选择是否自动对输入的文本进行优化处理。 Audio Seed:语音种子,是一个用于选择声音类型的数字参数,默认值为 2,是很知性的女孩子的声音。 Text Seed:文本种子,是一个正整数参数,用于 refine 文本的停顿,实测文本的停顿设置会影响音色、音调。 额外提示词(可写在 input Text 里):用于添加笑声、停顿等效果,例如。 以下是一些 Agent 构建平台: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具拓展 Bot 能力边界。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体(Agent)平台,支持开发者根据需求打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,提供环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 以上信息仅供参考,您可根据自身需求选择适合的平台。
2025-01-07
怎么创建属于自己的数字人
以下是创建属于自己的数字人的方法: 1. 利用剪映生成数字人: 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。 软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,剪映会生成对应音视频并添加到轨道中。 左下角会提示渲染完成时间,可点击预览按钮查看效果。 2. 增加背景图片: 删除先前导入的文本内容。 点击左上角“媒体”菜单,“导入”按钮选择本地图片上传。 点击图片右下角加号将图片添加到视频轨道(会覆盖数字人)。 点击轨道最右侧竖线向右拖拽,直到与视频对齐。 在显示区域拖动背景图的角将图片放大到适合尺寸,并将数字人拖动到合适位置。 3. 增加字幕: 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 4. 数字人“私有化”(换脸): 准备谷歌账号(可在淘宝或“”购买)。 第一步:打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”。 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 第三步:等待专属数字人视频出炉。 有关数字人使用上的问题,欢迎在底部评论区留言交流。同时如果对数字人课程感兴趣,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程: 课程内容: 在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0
2025-03-06
如何创建claude智能体
以下是创建 Claude 智能体的步骤: 1. 第一步,创建智能体时使用单 Agent 对话流模式。 2. 编排对话流:点击创建新的对话流并与智能体关联。在获取笔记详情节点和笔记评论节点配置 cookie,note_link 使用开始节点的 USER_INPUT。使用代码节点对两个插件获取的结果进行数据处理,注意代码节点输出的配置格式。工作流的结束节点选择使用代码的返回数据。 3. 测试:找到一篇小红书笔记,试运行对话流,在对话窗口输入地址,看到数据即为成功。回到智能体的编排页面同样测试,确保对话流执行成功。 4. 发布:点击发布后选择多维表格,然后进行配置。配置页面中,输出类型选文本,输入类型选择字段选择器。完善上架信息,填写表格,选择发布范围(可选择仅自己可用以加快审核)。提交上架信息后,返回配置界面显示已完成,即可完成最终提交。 另外,Claude AI 是由 Anthropic 公司开发的 AI 助手,是基于自然语言处理技术和人工智能算法的聊天机器人。注册 Claude.ai 可按以下步骤: 1. 访问 Claude 的官方网站。 2. 点击注册或登录界面中的“Sign Up”或“Continue with email”选项。 3. 填写邮箱地址并设置密码,提交表单。 4. 系统会向邮箱发送验证邮件,打开邮件使用其中的验证码完成邮箱验证。 若注册过程中遇到需要海外手机号接收验证码的问题,可采取以下解决方案: 1. 使用虚拟海外号服务,如 SMSActivate、SMSPool 等,购买海外虚拟手机号接收验证码。 2. 借助第三方服务网站如 uiuihao.com 完成注册。 3. 若有海外朋友,可请其帮忙接收验证码并告知。 完成注册后,若希望升级到 Claude Pro 版本获取更强大功能和更高 API 调用限额,需填写支付信息并选择合适订阅计划。需注意,订阅 Claude Pro 可能需要使用海外支付方式。Claude.ai 目前处于公开测试阶段,未付费用户使用平台可能会受到一些限制。
2025-03-05
想学怎么让创建的智能体给我让我满意的结果
要让创建的智能体给出令您满意的结果,可以参考以下步骤: 1. 智能体测试: 将已发布的工作流添加到创建好的智能体,并设定人设与回复逻辑,然后进行测试。 2. 添加工作流: 3. 设定人设与回复逻辑: 4. 测试:查看测试效果。 5. 发布智能体: 选择右上角,填写发布信息,选择发布渠道,确认发布,等待审核完成,发布成功。 发布成功之后,点击分享,复制访问链接给朋友。 6. 用 Coze 的工作流创建智能体: 打开 Coze 官网 https://www.coze.cn/home 。 创建图像工作流,图像流分为智能生成、智能编辑、基础编辑三类。 空间风格化插件有相关参数,如 image_url 是毛坯房的图片地址;Strength 是提示词强度,影响效果图;Style 是生成效果的风格,如新中式、日式、美式、欧式、法式等;user_prompt 是用户输入的 Promot 提示词。 按照构架配置工作流,调试工作流毛坯房测试用例:https://tgi1.jia.com/129/589/29589741.jpg 。 开始节点对应配置三项内容。 7. 用扣子创建智能体: 插件:扣子平台有多种类型插件,如看新闻、规划旅行、提高办公效率、理解图片内容的 API,还可自制插件添加所需 API 。 工作流:工作流像可视化拼图游戏,由多个节点组成,可创造复杂稳定业务流程,开始和结束有特定节点,不同节点可能需要不同信息。在智能体中可使用多个节点以获得更好回答结果。 知识库:
2025-03-05
创建智能体
创建智能体的步骤如下: 1. 使用单 Agent 对话流模式: 点击创建新的对话流,并与智能体关联。 在获取笔记详情节点和笔记评论节点分别配置 cookie,note_link 使用开始节点的 USER_INPUT。 使用代码节点进行数据处理,注意代码节点输出的配置格式。 2. 测试: 找到一篇小红书笔记,试运行对话流,在对话窗口输入地址查看数据。 回到智能体的编排页面进行测试,确保对话流执行成功。 3. 发布: 点击发布,选择多维表格,然后进行配置。 输出类型选文本,输入类型选择字段选择器。 完善上架信息,填写表格,发布范围可选仅自己可用以加快审核。 提交上架信息,返回配置界面显示已完成,即可完成最终提交。 另外,创建智能体还包括以下方式: 1. 打开扣子官网(https://www.coze.cn/),“画小二智能小助手”Coze 商店体验地址(https://www.coze.cn/store/bot/7371793524687241256?panel=1&bid=6cqnnu5qo7g00),点击创建 Bot,在对话框中工作空间选择“个人空间”,命名为画小二智能小助手,并设置提示词。 2. 创建一个智能体,输入人设等信息,放上相关工作流。但注意工作流中如【所有视频片段拼接】节点使用的插件 api_token 填的是个人 token 时,不能直接发布,可将 api_token 作为工作流最开始的输入,用户购买后输入 api_token 再发布。
2025-02-27
目前市面上有哪些ai可以实现免费创建并训练大模型,以满足个人需求
目前市面上有以下一些可以免费创建并训练大模型以满足个人需求的途径: 1. 免费云服务器: 阿里、腾讯对新用户提供免费试用服务器,如腾讯云的。服务器系统配置可选择【宝塔】系统。 2. 免费大模型接口: 阿里的接口,创建 API key 即可。 也有免费接口,但国内大模型通常限制一定免费额度的 Token。 谷歌的来学习如何给服务器科学上网及使用海外版 Coze。 此外,关于大模型的相关知识: 1. 架构方面: encoderonly 模型通常适用于自然语言理解任务,如分类和情感分析,最知名的代表模型是 BERT。 encoderdecoder 模型同时结合了 Transformer 架构的 encoder 和 decoder 来理解和生成内容,代表是谷歌的 T5。 decoderonly 模型更擅长自然语言生成任务,目前熟知的众多 AI 助手基本都来自此类架构。 2. 大模型的特点: 预训练数据非常大,往往来自于互联网上,包括论文、代码、公开网页等,一般用 TB 级别的数据进行预训练。 参数非常多,Open 在 2020 年发布的 GPT3 就已经达到 170B 的参数。 在技术原理方面: 1. 生成式 AI 生成的内容叫做 AIGC。 2. 相关技术名词: AI 即人工智能。 机器学习包括监督学习、无监督学习、强化学习。监督学习有标签的训练数据,算法目标是学习输入和输出之间的映射关系,包括分类和回归。无监督学习学习的数据没有标签,算法自主发现规律,经典任务包括聚类。强化学习从反馈里学习,最大化奖励或最小化损失。深度学习参照人脑有神经网络和神经元,神经网络可用于多种学习方式。 生成式 AI 可以生成文本、图片、音频、视频等内容形式。LLM 即大语言模型,生成图像的扩散模型不是大语言模型,对于大语言模型,生成只是其中一个处理任务。 3. 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制来处理序列数据,而不需要依赖于循环神经网络或卷积神经网络。
2025-02-26
如何更好的创建提示词
以下是关于如何更好创建提示词的相关内容: 创建提示词是一个关键步骤,决定了 AI 模型如何理解并生成文本。以下是一些建议: 1. 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 2. 提供上下文:若任务需特定背景知识,提供足够信息。 3. 使用清晰语言:用简单、清晰的语言描述,避免模糊或歧义词汇。 4. 给出具体要求:如有特定格式或风格,在提示词中明确指出。 5. 使用示例:提供期望结果的示例,帮助 AI 模型理解需求。 6. 保持简洁:简洁明了,避免过多信息导致模型困惑。 7. 使用关键词和标签:有助于模型理解任务主题和类型。 8. 测试和调整:生成文本后检查结果,根据需要调整提示词,可能需多次迭代。 此外,不同的工具和场景中创建提示词还有一些特定要点: 在星流一站式 AI 设计工具中: 输入语言方面,通用大模型与部分基础模型使用自然语言,部分基础模型使用单个词组,支持中英文输入。 写好提示词要做到内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等。 可调整负面提示词,帮助 AI 理解不想生成的内容。 利用“加权重”功能让 AI 明白重点内容,还可使用预设词组、辅助功能如翻译、删除所有提示词、会员加速等。 在文本补全(Text completion)中: 遵循展示和告诉、提供高质量数据、检查设置这三个基本准则。 故障排除时,需明确生成的预期结果、提供足够示例、检查示例有无错误、正确使用温度和 top_p。 希望这些内容能帮助您更好地创建提示词。
2025-02-25
基于--cref的多个人物角色出现在一个画布中,具体该如何操作?我想要详细的步骤
基于 cref 在一个画布中放置多个人物角色的操作步骤如下: 1. 使用 /settings 将 Remix 打开,然后选择 。 2. 选择将包含第二个字符的图像,然后使用 U 将其从网格中分离出来。 3. 寻找蓝色小箭头(⬆️⬇️⬅️➡️),每个箭头都会在现有图像中添加一条新图像。选择新角色的前进方向并输入提示及其 cref。这将缝合一条新的画布。 需要注意的是: cref 命令适用于单一主题、单一角色的图像。如果计划在场景中添加多个角色,需要使用平移按钮来添加。 设置画布以描绘两个人的开场提示。 您的 cref 图像中应只包含一个角色。如果 cref 图像中有多个人物形象,Midjourney 将它们混合在一起,并混合到输出中。 语雀里面整理了 211 篇文档,共有 412731 字有关 AIGC 的相关文章,MJ 手册的规范使用说明,文章包含了很多大厂经验总结。无偿且标注了文章来源,地址:https://www.yuque.com/frannnk7/aidesign?《AIGC Design 手册》
2025-03-06
怎么用飞书搭建一个人工智能知识库
以下是使用飞书搭建人工智能知识库的相关内容: 1. 参考文章: 《这可能是讲 Coze 的知识库最通俗易懂的文章了》:介绍了一系列关于 AI 知识库的知识,包括“通往 AGI 之路”这个使用飞书软件搭建的 AI 知识库,以及相关文章对 AI 时代知识库的讲解,读完可收获 AI 时代知识库的概念、实现原理、能力边界等内容。 《【智能体】让 Coze 智能体机器人连上微信和微信群详细配置文档》:其中提到创建知识库时可使用手动清洗数据,包括在线知识库和本地文档的处理方式,如在线知识库需创建飞书在线文档,每个问题和答案以“”分割等;还介绍了发布应用时要确保在 Bot 商店中能搜到。 《「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人》:提到创建知识库的路径为个人空间知识库创建知识库,文档类型支持本地文档、在线数据、飞书文档、Notion 等,本次使用本地文档,可按照操作指引上传文档、分段设置、确认数据处理,同时提到知识库内容切分粒度的小技巧,如使用特殊分割符“”。 2. 总体步骤: 确定所需的数据清洗方式,如手动或自动清洗。 对于在线知识库,创建飞书在线文档,每个问题和答案以特定方式分割,选择飞书文档、自定义等选项,并可编辑修改和删除。 对于本地文档,注意拆分内容以提高训练数据准确度,按照固定方式进行人工标注和处理。 完成创建后可发布应用,确保在 Bot 商店中能搜到。
2025-03-04
用deepseek打造个人知识库
以下是关于用 DeepSeek 打造个人知识库的相关信息: 可以先将文本拆分成若干小文本块(chunk),通过 embeddings API 将其转换成与语义相关的 embeddings 向量,并在向量储存库中保存这些向量和文本块作为问答的知识库。当用户提出问题时,将问题也转换成向量,与储存库中的向量比对,提取关联度高的文本块,与问题组合成新的 prompt 发送给 GPT API,从而提高回答的准确性和相关性。例如对于“此文作者是谁?”的问题,可以直观或通过比较 embeddings 向量找到关联度最高的文本块,如“本文作者:越山。xxxx。”。 在 RAGFlow 中,可配置本地部署的 DeepSeek 模型。选择 Ollama 并配置相关信息,导入嵌入模型用于文本向量化。设置系统模型后,可创建知识库,导入文件(可设置文件夹)并解析,解析速度取决于本机 GPU 性能。解析完成后进行检索测试,没问题即可进入聊天界面,还可自行设置助理。 此外,AI 编程与炼金术中也涉及 DeepSeek 的相关知识,如在不同章节中的应用,包括给老外起中文名、驱动 Life Coach 等,具体内容可通过相关链接进一步查看。
2025-03-04
coze如何复制别人的工作流到自己个人空间
要在 Coze 上复制别人的工作流到自己个人空间,您可以按照以下步骤进行操作: 1. 在 Coze 上新建一个工作流,逐步导入别人项目的核心流程。整个工作流分为若干个节点,每个节点完成一个特定的任务。 2. 工作流被分为了初始翻译、反思优化、结果输出等几个主要部分,每一部分都对应了若干个节点。 3. 首先是开始节点,在这里需要选择翻译的源语言和目标语言,还可以设置一些其他参数,如翻译的语言特色等,此参数会影响翻译效果和效率,建议根据实际情况调整。 4. 接下来是初步的翻译大模型节点,选择一个大模型对源语言文本进行初始翻译。 5. 进入 Coze,点击「个人空间 工作流 创建工作流」,打开创建工作流的弹窗。 6. 根据弹窗要求,自定义工作流信息,点击确认后完成工作流的新建。 7. 左侧「选择节点」模块中,根据子任务需要,实际用上的有插件(提供一系列能力工具,拓展 Agent 的能力边界)、大模型(调用 LLM,实现各项文本内容的生成)、代码(支持编写简单的 Python、JS 脚本,对数据进行处理)。 8. 编辑面板中的开始节点、结束节点,分别对应分解子任务流程图中的原文输入和结果输出环节。接下来,按照流程图,在编辑面板中拖入对应的 LLM 大模型、插件、代码节点,即可完成工作流框架的搭建。
2025-03-04
AI或者智能体能不能部署在个人NAS上
AI 或者智能体是可以部署在个人 NAS 上的。端侧大模型能部署在手机端等设备,参数量小,可利用自带芯片或处理器运算,主要通过压缩来解决存储和性能问题,如减少模型参数量和计算复杂度。此外,像 coach 等 AI 工程平台新版本有很多模板,可创建智能体,还能通过工作流节点调用和 prompt 构建提示词,调用插件、图像流、知识库等。OpenAI 会陆续更新 ChatGPT 应用,让其具备 Assistant Agent 能力,Google 也计划推出类似功能。智能体除了端到端的多模态和实时性特点外,还能让终端参与分担一部分模型的计算量。在这种趋势下,能设计新硬件产品或重新设计现有产品,如让 Google Glass 复活,改变手机的设计和交互方式等。
2025-03-04
利用AI打造个人知识库
利用 AI 打造个人知识库可以通过以下方式实现: 1. 使用 GPT 打造个人知识库: 将大文本拆分成若干小文本块(chunk),通过 embeddings API 将小文本块转换成与语义相关的 embeddings 向量,并在向量储存库中保存这些向量和文本块作为问答的知识库。 当用户提出问题时,将问题转换成向量,与向量储存库中的向量比对,提取距离最小的几个向量对应的文本块,与问题组合成新的 prompt 发送给 GPT API。 例如对于“此文作者是谁?”的问题,可直观或通过比较 embeddings 向量得出关联度最高的文本块,如“本文作者:越山。xxxx。”“《反脆弱》作者塔勒布xxxx。”,最后发送给 GPT API 的问题类似于“此文作者是谁?从以下信息中获取答案:本文作者:越山。xxxx。《反脆弱》作者塔勒布xxxx。” 2. 搭建基于 GPT API 的定制化知识库: 涉及给 GPT 输入定制化知识,但 GPT3.5 一次交互支持的 Token 有限,OpenAI 提供了 embedding API 解决方案。 Embeddings 是浮点数字的向量,两个向量之间的距离衡量关联性,小距离表示高关联度,大距离表示低关联度。 向量是用一串数字表示的量,在计算机科学中常用列表表示,向量间距离有多种计算方式,如欧几里得距离。 3. 小七姐提出的 AI 时代知识管理体系构建: 包括读书时看到有触动的文本作为书摘。 对书摘整理归纳、标记重点、打赏标签放入笔记系统,准备深度思考和实践。 基于笔记提到的 AI 对人的赋能模式展开深度实践,如通过 AI 信息杠杆迅速掌握相关知识。 基于实践生成自己的观点和决策,并打造成体系化的内容产品实现价值。 最终把碎片化知识在知识库中流转,从书摘变成体系化内容,把“别人说的话”变成“自己的智慧”。 希望以上内容能帮助您打造个人知识库。
2025-03-01