Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

飞书搭建AI知识库

Answer

以下是关于飞书搭建 AI 知识库的相关内容:

  • 对于知识库,一系列的信息和知识聚集在一起就可以构成。比如“通往 AGI 之路”就是一个使用飞书软件搭建的 AI 知识库,在飞书大群中跟机器人对话就能获取对应资料。
  • 在“大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库”中,以 AI 时代的知识库作为例子进行了讲解,读完可收获:AI 时代的知识库的概念、实现原理以及能力边界;通往 AGI 之路大群中通过对话获取知识库中资料的原理;更好地使用 Coze 等 AI Agent 平台中的知识库组件,打造更强大的智能体。
  • 搭建步骤:
    • 确定功能范围。
    • 编写【prompt】提示词,设定 Bot 的身份和目标。
    • 创建【知识库】,整理“关键字”与“AI 相关资料链接”的对应关系并存储。创建知识库路径为:个人空间-知识库-创建知识库。知识库文档类型支持本地文档、在线数据、飞书文档、Notion 等,本次使用【本地文档】。按照操作指引上传文档、分段设置、确认数据处理。小技巧:知识库好不好用跟内容切分粒度有很大关系,可以在内容中加上特殊分割符比如“###”,以便于自动切分数据。分段标识符号选择“自定义”,内容填“###”。最终的知识库结果中,同一颜色代表同一个数据段,若内容有误需要编辑,可点击具体内容,鼠标右键会看到“编辑”和“删除”按钮进行操作。
Content generated by AI large model, please carefully verify (powered by aily)

References

这可能是讲 Coze 的知识库最通俗易懂的文章了

大家好,我是大圣,一个致力于使用AI技术将自己打造为超级个体的程序员。对于知识库大家并不陌生,一系列的信息和知识聚集在一起就可以构成知识库。比如我最心爱的[通往AGI之路](https://waytoagi.feishu.cn/wiki/QPe5w5g7UisbEkkow8XcDmOpn8e)就是一个使用飞书软件搭建的AI知识库。当你需要了解AI某一领域知识的时候,你只需要在AGI的飞书大群中,跟机器人对话就能获取对应的资料。而在我的[大圣:胎教级教程:万字长文带你使用Coze打造企业级知识库](https://waytoagi.feishu.cn/wiki/CT3UwDM8OiVmOOkohPbcV3JCndb)也是以AI时代的知识库作为例子进行了讲解。这篇文章的目的就是帮助非编程人士来理解AI时代的知识库,读完本文你会收获:1.AI时代的知识库的概念、实现原理以及能力边界2.通往AGI之路大群中的通过对话就能获取知识库中资料的原理3.更好的使用Coze等AI Agent平台中的知识库组件,打造更加强大的智能体请允许我自卖自夸:我这篇文章可以说是知识库文章中Coze讲的最好的,讲Coze的文章中知识库讲的最好的。另外做个预告,我正在规划一个关于AI时代你应该具备的编程基础系列,大纲如下:数据库|让Coze拥有了记忆的组件1知识库|让Coze拥有了记忆的组件2变量|让Coze拥有了记忆的组件3JSON|让你更好的使用Coze插件API|外部应用程序该如何接入Coze操作系统与服务器|那些接入了Coze的微机器人都是运行在哪里的Docker|让你用最简单的方式部署微信机器人

「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人

[heading5]3)创建【知识库】,整理“关键字”与“AI相关资料链接”的对应关系,并将信息存储起来。创建知识库路径:个人空间-知识库-创建知识库知识库文档类型支持:本地文档、在线数据、飞书文档、Notion等,本次使用【本地文档】按照操作指引上传文档、分段设置、确认数据处理。💡小技巧:知识库好不好用,跟内容切分粒度有很大关系,我们可以在内容中加上一些特殊分割符,比如“###”,以便于自动切分数据。分段标识符号要选择“自定义”,内容填“###”。最终的知识库结果如下,同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。

「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人

[heading5]3)创建【知识库】,整理“关键字”与“AI相关资料链接”的对应关系,并将信息存储起来。创建知识库路径:个人空间-知识库-创建知识库知识库文档类型支持:本地文档、在线数据、飞书文档、Notion等,本次使用【本地文档】按照操作指引上传文档、分段设置、确认数据处理。💡小技巧:知识库好不好用,跟内容切分粒度有很大关系,我们可以在内容中加上一些特殊分割符,比如“###”,以便于自动切分数据。分段标识符号要选择“自定义”,内容填“###”。最终的知识库结果如下,同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。

Others are asking
人工智能生成内容(AIGC)感悟600字
以下是为您生成的 600 字左右关于人工智能生成内容(AIGC)的感悟: AIGC 作为当今科技领域的热门话题,正以惊人的速度改变着我们的生活和工作方式。 AIGC 强调的是利用人工智能技术生成各种内容,包括文本、图像、音频和视频等。它并非简单的技术堆砌,而是多种先进技术融合的成果。例如,Transformer 模型在语言处理和多模态领域的应用,为 AIGC 提供了强大的支撑。 从原理上看,AIGC 涉及多种生成算法,如 VAE、GAN、FlowModel 和 Diffusion Model 等。这些算法使得机器能够创造出具有一定质量和创意的内容。同时,还有像 IS 和 FID 这样的评价指标来衡量生成图片的质量。 在实际应用中,AIGC 展现出了巨大的潜力。它可以自动撰写新闻文章,为媒体行业带来效率的提升;能够生成艺术画作,为艺术创作注入新的活力;可以创作音乐,丰富音乐领域的多样性;还能制作视频游戏内容,为娱乐产业增添新的元素。 ChatGPT 作为 AIGC 在文本生成领域的杰出代表,充分展示了 AIGC 的强大能力。它通过预训练和大量的数据投喂,能够与用户进行流畅且相关的文本交流,仿佛在玩“文字接龙游戏”。 然而,AIGC 也面临一些挑战和问题。比如生成内容的准确性和可靠性需要进一步提高,版权和伦理问题也需要引起重视。但不可否认的是,AIGC 为我们开启了一扇充满无限可能的大门,让我们对未来充满期待。随着技术的不断进步和完善,相信 AIGC 将在更多领域发挥重要作用,为人类创造更多的价值。
2025-03-01
人工智能生成内容(AIGC)的突破、对齐及产业培育,感悟
以下是关于人工智能生成内容(AIGC)的突破、对齐及产业培育的感悟: 一、原理与概念 1. 人工智能(AI):是一种目标,让机器展现智慧,简称 AI。 2. 生成式人工智能(GenAI):目标是让机器产生复杂有结构的内容,简称 GenAI。 3. 机器学习:一种手段,让机器自动从资料中找到公式,包括监督学习、无监督学习、强化学习。 监督学习:有标签的训练数据,学习输入和输出之间的映射关系,包括分类和回归。 无监督学习:学习的数据没有标签,算法自主发现规律,如聚类。 强化学习:从反馈里学习,最大化奖励或最小化损失,类似训小狗。 4. 深度学习:一种更厉害的手段,参照人脑有神经网络和神经元(因有很多层所以叫深度),神经网络可用于多种学习方式。 5. 大语言模型(LLM):是一类具有大量参数的“深度学习”模型。 6. ChatGPT:是 AIGC 技术的一个应用实例,是美国 OpenAI 公司开发的基于大型语言模型的对话机器人,能根据用户输入生成连贯且相关的文本回复。 二、AIGC 的特点与应用 AIGC 是利用人工智能技术生成内容的新型生产方式,包括文本、图像、音频和视频等内容。其技术可用于多种应用,如自动撰写新闻文章、生成艺术画作、创作音乐、制作视频游戏内容等。 三、相关概念的关系与区别 AGI、GenAI、AIGC 几个概念有所区别与联系,具体可参考相关图示。更多概念可问 Kimi、通义千问、文心一言等大模型。 四、技术里程碑 2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,首次提出了 Transformer 模型,它完全基于自注意力机制处理序列数据,不依赖于循环神经网络或卷积神经网络。
2025-03-01
你觉得谷歌浏览器中的免费AI有哪些
谷歌浏览器中的免费 AI 功能包括: 1. 智能组织标签页。 2. 借助文本生成图像模型生成个性化壁纸图片。 3. 写作辅助。 4. 免费 AI 编程助手 Gemini Code Assist 发布,每月免费提供 180,000 次代码补全,支持 Python、Java、Go、Rust 等全部语言,具备强大代码审查和智能聊天助手功能,兼容 VS Code 与 JetBrains IDE,拥有 128k 超长上下文窗口,能精准理解大型本地代码库。
2025-03-01
你觉得谷歌浏览器中的免费网页AI有哪些
以下是谷歌浏览器中一些常见的免费网页 AI 相关信息: 大语言模型方面: OpenAI 有 3.5 和 4 两个主要模型。3.5 模型于 11 月启动了当前的 AI 热潮,4.0 模型在春季首次发布,功能更强大。新的变种使用插件可连接到互联网和其他应用程序。Code Interpreter 是一个强大的 ChatGPT 版本,能运行 Python 程序。若未为 OpenAI 付费,只能使用 3.5 模型。除插件变种和暂时停用的带有浏览功能的 GPT4 版本外,这些模型未连接到互联网。 微软的 Bing 使用 4 和 3.5 的混合,通常是 GPT4 家族中首个推出新功能的模型,例如能创建和查看图像,且能在网页浏览器中阅读文档,并连接到互联网。 谷歌一直在测试自己的人工智能 Bard,由各种基础模型驱动,最近是 PaLM 2 模型。 Anthropic 发布了 Claude 2,其特点是有非常大的上下文窗口。 PDF 翻译方面: DeepL(网站):点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 沉浸式翻译(浏览器插件):安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML/TXT 文件」、「翻译本地字幕文件」。 Calibre(电子书管理应用):下载并安装 calibre,并安装翻译插件「Ebook Translator」。 谷歌翻译(网页):使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 百度翻译(网页):点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费)。 彩云小译(App):下载后点击「文档翻译」,可以直接导入 PDF、DOC、DOCX、PPT、PPTX、TXT、epub、srt 等格式的文档并开始翻译(有免费次数限制且进阶功能需要付费)。 微信读书(App):下载 App 后将 PDF 文档添加到书架,打开并点击页面上方「切换成电子书」,轻触屏幕唤出翻译按钮。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-03-01
我是一个普通本科的大二学生,学的是软件工程专业,但是我本身编程能力不是很好,我对ai拥有浓厚的兴趣,喜欢去学习并运用ai,我想未来all in ai并成为一个产品经理,我想给你分享一下我的计划,我想今年下半年考过英语四级,并且参加苹果26年的swift 学生挑战赛,我是零基础但是我愿意学习,希望你帮我制定一个包含实施策略、里程碑和最佳实践的详细框架,以帮助我有效地实现这些目标!
以下是为您制定的包含实施策略、里程碑和最佳实践的详细框架,以帮助您有效地实现目标: 一、英语四级考试 实施策略: 1. 制定学习计划,每天安排一定时间学习英语,包括词汇、语法、听力、阅读和写作。 2. 多做历年真题,熟悉考试题型和难度。 3. 参加英语学习社群或找学习伙伴,互相监督和鼓励。 里程碑: 1. 每月进行一次模拟考试,评估学习进度。 2. 两个月内完成词汇和语法的系统学习。 最佳实践: 1. 利用碎片时间背单词,如在公交车上、课间等。 2. 听力练习时,反复听同一篇材料,直到完全听懂。 3. 写作练习后请老师或同学帮忙批改,总结错误和不足。 二、参加苹果 26 年的 Swift 学生挑战赛 实施策略: 1. 从零基础开始学习 Swift 编程语言,通过在线课程、书籍等资源进行系统学习。 2. 参与相关的编程实践项目,提升实际操作能力。 3. 关注苹果官方网站和社区,了解挑战赛的最新动态和要求。 里程碑: 1. 三个月内掌握 Swift 编程语言的基础知识。 2. 半年内完成一个小型的 Swift 项目开发。 最佳实践: 1. 遇到问题及时在技术论坛或社区寻求帮助。 2. 定期回顾和总结所学知识,加深理解和记忆。 3. 参考优秀的 Swift 项目案例,学习他人的编程思路和技巧。 三、成为 AI 产品经理 实施策略: 1. 学习 AI 相关的基础知识,包括机器学习、深度学习等。 2. 了解产品经理的职责和工作流程,通过实践项目积累经验。 3. 关注行业动态,参加相关的研讨会和培训课程。 里程碑: 1. 一年内掌握 AI 基础知识和产品经理的基本技能。 2. 参与实际的 AI 项目开发,担任产品经理助理角色。 最佳实践: 1. 多与行业内的专业人士交流,获取经验和建议。 2. 不断提升自己的沟通和协调能力,以更好地推动项目进展。 3. 学会从用户需求出发,设计具有创新性和实用性的 AI 产品。 希望以上框架对您有所帮助,祝您顺利实现目标!
2025-03-01
我想借助ai学习法语,我应该如何进行?
以下是借助 AI 学习法语的一些方法和推荐的工具: 1. 语言学习平台: FluentU:使用真实世界的视频,通过 AI 生成个性化的词汇和听力练习。选择学习语言,观看视频并完成相关练习,积累词汇和提升听力理解能力。 Memrise:结合 AI 技术,根据学习者的记忆曲线提供复习和练习,增强记忆效果。选择学习语言,使用应用提供的词汇卡和练习进行学习。 2. 发音和语法检查: Speechling:提供口语练习和发音反馈,帮助学习者改进口音和发音准确性。录制语音,提交给 AI 系统或人类教练,获取反馈和改进建议。 Grammarly:可以帮助提高写作的语法和词汇准确性,支持多种语言。将写作内容粘贴到 Grammarly 编辑器中,获取语法和词汇改进建议。 3. 实时翻译和词典工具: Google Translate:提供实时翻译、语音输入和图像翻译功能,适合快速查找和学习新词汇。输入或语音输入需要翻译的内容,查看翻译结果和示例句子。 Reverso Context:提供单词和短语的翻译及上下文例句,帮助理解和学习用法。输入单词或短语,查看翻译和例句,学习实际使用场景。 4. 语言学习应用: Duolingo:使用 AI 来个性化学习体验,根据进度和错误调整练习内容。通过游戏化的方式提供词汇、语法、听力和口语练习。下载应用,选择要学习的语言,并按照课程指引进行学习。 Babbel:结合 AI 技术,提供个性化的课程和练习,重点在于实际交流所需的语言技能。注册账户,选择语言课程,按照学习计划进行学习。 Rosetta Stone:使用动态沉浸法,通过 AI 分析学习进度,提供适合的练习和反馈。注册并选择学习语言,使用多种练习模式(听力、口语、阅读和写作)进行学习。 5. AI 对话助手: ChatGPT:可以用来模拟对话练习,帮助提高语言交流能力。在聊天界面选择目标语言,与 AI 进行对话练习。可以询问语法、词汇等问题,甚至模拟实际交流场景。 Google Assistant:支持多种语言,可以用来进行日常对话练习和词汇学习。设置目标语言,通过语音命令或文本输入与助手进行互动,练习日常用语。
2025-03-01
飞书加多维表格生成短视频文案
以下是关于输入观点一键生成文案短视频的详细介绍: 基于其它博主开源的视频生成工作流进行了功能优化,实现了视频的全自动创建。 先看效果: 功能:通过表单输入主题观点,提交后自动创建文案短视频,创建完成后推送视频链接到飞书消息。 涉及工具: 1. Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成) 2. 飞书(消息) 3. 飞书多维表格(字段捷径、自动化流程) 大体路径: 1. 通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频。 2. 发布 coze 智能体到飞书多维表格。 工作流调试完成后,加入到智能体中。可以选择工作流绑定卡片数据,智能体则通过卡片回复。 选择发布渠道为飞书多维表格,填写上架信息(为了快速审核,选择仅自己可用),等待审核。审核通过后,即可在多维表格中使用。 3. 在多维表格中使用字段捷径,引用该智能体。 创建飞书多维表格,添加相关字段。配置后选择“自动更新”,输入相关字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 表单分享,实现填写表单自动创建文案短视频的效果。 4. 点击多维表格右上角的“自动化”,创建想要的自动化流程。 希望以上内容对您有所帮助。
2025-03-01
deepseek加飞书多维表格,制作短视频
以下是关于使用 deepseek 加飞书多维表格制作短视频的详细步骤和相关信息: 概述: 基于其他博主开源的视频生成工作流进行功能优化,实现了视频的全自动创建。感谢开源,现提供教程供参考。 先看效果: 可查看 功能: 通过表单输入主题观点,提交后自动创建文案短视频,并将创建完成的视频链接推送至飞书消息。 涉及工具: 1. Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成) 2. 飞书(消息) 3. 飞书多维表格(字段捷径、自动化流程) 大体路径: 1. 通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频。 2. 发布 coze 智能体到飞书多维表格。 3. 在多维表格中使用字段捷径,引用该智能体。 4. 在多维表格中创建自动化流程,推送消息给指定飞书用户。 智能体发布到飞书多维表格: 1. 工作流调试完成后,加入到智能体中。可以选择工作流绑定卡片数据,智能体通过卡片回复。绑定卡片数据可自行研究,不明白可留言。 2. 发布时选择需要的发布渠道,重点是飞书多维表格。记得智能体提示词的 4 个变量,发布时会自动出现。目的是为了在多维表格中选择关联字段,控件要选择“字段选择器”。填写上架信息(为快速审核,选择仅自己可用),确认发布等待审核。审核通过后,即可在多维表格中使用。 多维表格的字段捷径使用: 1. 创建飞书多维表格,添加相关字段。配置后使用字段捷径功能,使用自己创建的 Coze 智能体。选择“自动更新”,输入前边的 4 个字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 2. 表单分享,实现“填写表单,自动创建文案短视频”的效果。 自动化推送: 点击多维表格右上角的“自动化”,创建想要的自动化流程。
2025-03-01
飞书多维表格xDeepSeek R1实用提示词
以下是关于飞书多维表格 x DeepSeek R1 实用提示词的相关信息: 《雪梅 May 的 AI 学习日记》中,在专题“飞书多维表格 + deepseek R1”的 DAY107 练习中,提到可在相关链接中找到与短视频相关的模板,使用如【视频脚本生成】【企业家 IP 视频脚本生成】等提示词制作多维表格,还可模仿,感受是制作体验丝滑流畅,仅用提示词就能编排多维表格实现强大功能。 同样在该专题的 DAY108 练习中,针对直播场景,可参考的直播相关多维表格,作者将小红书、短视频制作、直播等场景都做了一套放入同一个飞书多维表格,形成媒体内容生产与管理系统。 此外,还有 deepseek 论文解读的相关内容,包括直播视频回放、相关论文下载以及万能提示词的技巧分享等。若官网搜索不能用一直崩溃,可使用火山的满血版,其在视频最后 10 分钟左右有手把手教程。
2025-02-28
如何搭建一个自动把录音文件转文字的agent,然后发布到飞书多维表格字段捷径
搭建一个自动把录音文件转文字的 agent 并发布到飞书多维表格字段捷径的步骤如下: 1. 工作流调试完成后,加入到智能体中。可以选择工作流绑定卡片数据,智能体通过卡片回复。绑定卡片数据可自行研究,如有疑问可留言。 2. 发布:选择需要的发布渠道,重点是飞书多维表格。记得智能体提示词的 4 个变量,填写上架信息(为快速审核,选择仅自己可用),确认发布并等待审核。审核通过后即可在多维表格中使用。 3. 创建飞书多维表格,添加相关字段。配置选择“自动更新”,输入 4 个字段后,“文案视频自动化”字段捷径会自动调用工作流,生成视频。 4. 表单分享,实现“填写表单,自动创建文案短视频”的效果。 5. 点击多维表格右上角的“自动化”,创建想要的自动化流程。 此外,关于 Coze 应用与多维表格的结合还有以下相关内容: 1. Coze 智能体(字段捷径)获取笔记+评论信息:创建智能体,使用单 Agent 对话流模式,编排对话流,配置相关节点和插件,进行数据处理和测试,最后发布。 2. Coze 应用:完成后端准备工作后,创建应用,设计界面和工作流,包括读取博主笔记列表的工作流,进行相关配置和参数设置。
2025-02-27
我打算用windsurf、coze、飞书多维表格来搭建自动流程,重新为我推荐相关学习内容
以下是为您推荐的相关学习内容: 一泽 Eze:Coze+飞书多维表格,打造专属 AI 智能体,享受 10 倍知识管理效率 逐步搭建 AI 智能体: 搭建选择内容推荐流,用于根据用户输入的“想看 xxx 内容”,在飞书多维表格的稍后读存储地址中检索现有的收藏记录,匹配符合阅读兴趣的内容记录。 新建工作流「recommendRead」,根据弹窗要求自定义工作流信息。 工作流全局流程设置: 4.1 开始节点:输入想阅读的内容主题。收到用户输入的“想看 xxx 内容”这类指令即开始流程,判断哪些用户输入是在交代想阅读的内容主题交由外层 bot 的大模型判断。 4.2 变量节点:引入 bot 变量中保存的飞书多维表格地址,添加变量节点并设置。 4.3 插件节点:添加「飞书多维表格search_records」插件,设置{{app_token}}参数,在{{app_token}}引用变量节点的{{app_token}},输出结果的{{items}}里会返回所需查询结果,也可通过额外配置定向检索未读状态的收藏记录。 4.4 大模型节点:采用批处理对检索出来的收藏记录逐个进行相关性匹配,可优化用户提示词提升匹配精准度。 输入观点一键生成文案短视频 基于其它博主开源的视频生成工作流做了功能优化,实现视频全自动创建。 功能:通过表单输入主题观点,提交后自动创建文案短视频,并推送视频链接到飞书消息。 涉及工具:Coze 平台(工作流、DeepSeek R1、文生图、画板、文生音频、图+音频合成视频、多视频合成)、飞书(消息)、飞书多维表格(字段捷径、自动化流程) 大体路径: 通过 coze 创建智能体,创建工作流,使用 DeepSeek R1 根据用户观点创建文案,再创建视频。 发布 coze 智能体到飞书多维表格。 在多维表格中使用字段捷径,引用该智能体。 在多维表格中创建自动化流程,推送消息给指定飞书用户。
2025-02-26
关于飞书表格和deepseek联动的设计
以下是关于飞书表格和 DeepSeek 联动的相关内容: 1. 《喂饭级教程:飞书多维表格+DeepSeek=10 倍速用 AI》介绍了将飞书多维表格与 DeepSeek R1 结合,实现批量处理信息、提升工作效率的方法。用户可批量转换文风、快速回复消息,甚至利用 AI 生成文案,操作简单便捷,让普通人无需编程知识也能轻松使用 AI。 2. 在一场全国 23 城近 4000 人玩转 DeepSeek 的活动中,展示了飞书多维表格和 DeepSeek 的结合的强大之处,DeepSeek R1 大模型已全面融入飞书多维表格等多款产品。
2025-02-25
本地知识库
以下是关于本地知识库的相关内容: 一、本地知识库进阶 如果想要对知识库进行更加灵活的掌控,需要使用额外的软件 AnythingLLM。它包含了所有 Open WebUI 的能力,并额外支持选择文本嵌入模型和向量数据库。 安装地址:https://useanything.com/download 。安装完成后进入配置页面,主要分为三步: 1. 第一步:选择大模型。 2. 第二步:选择文本嵌入模型。 3. 第三步:选择向量数据库。 二、构建本地知识库 AnythingLLM 中有 Workspace 的概念,可以创建自己独有的 Workspace 与其他项目数据隔离。 1. 首先创建一个工作空间。 2. 上传文档并且在工作空间中进行文本嵌入。 3. 选择对话模式,提供了两种模式: Chat 模式:大模型会根据自己的训练数据和上传的文档数据综合给出答案。 Query 模式:大模型仅仅会依靠文档中的数据给出答案。 4. 测试对话,完成上述配置后即可与大模型进行对话。 三、RAG 是什么 利用大模型的能力搭建知识库是 RAG 技术的应用。在进行本地知识库搭建实操前,需先了解 RAG。 RAG 实现方法是检索增强生成(Retrieval Augmented Generation),过程包括文档加载、文本分割、存储、检索和输出。 文档加载可从多种来源加载,包括非结构化、结构化和代码等数据。 文本分割将文档切分为指定大小的块。 存储涉及将文档块嵌入转换成向量形式并存储到向量数据库。 检索通过算法找到与输入问题相似的嵌入片。 输出是将问题和检索出的嵌入片提交给 LLM 生成答案。 四、Obsidian 与 Cursor 结合 因为 Obsidian 浏览器剪藏插件强大而开始玩 Obsidian,想打造本地知识库加 AI 加持。Obsidian 的 AI 插件配置复杂,体验不佳。 发现 Cursor 能解决问题,主要有三类作用: 1. 用模糊问题检索笔记库,而非关键字。 2. 基于笔记库进行研究,结合多个笔记软件给出建议。 3. 生成和修改笔记,如生成整个笔记文件或修改笔记文案。教程中为照顾多数人会用默认中文且免费的 Trae 演示,其他 AI IDE 也大同小异。
2025-03-01
如何建立一个行业的知识库,并建立这个行业的专属AI模型?
建立一个行业的知识库并建立专属 AI 模型可以参考以下步骤: 1. 明确行业需求和目标:确定知识库和 AI 模型要解决的具体问题和实现的功能。 2. 收集和整理数据:包括行业相关的各种信息、文档、案例等,为知识库提供素材。 3. 设计提示词:明确 AI 模型的角色和专注的技能,使其能够按照设定进行工作。 4. 构建知识库:将行业特定的规则、流程、案例等内容整理成工作手册,供 AI 模型参考。 5. 选择合适的 AI 模型:例如可以使用阿里千问模型等。 6. 进行模型训练和优化:根据收集的数据和设定的提示词、知识库对模型进行训练,并不断优化。 7. 融合实际场景:让人类专家配备可穿戴设备,收集现实世界的互动供 AI 学习,避免复制危险的偏见。 8. 持续评估和改进:根据实际应用效果,对知识库和 AI 模型进行评估和改进。 例如,在医疗保健领域,开发具有潜在空间层次结构的堆叠 AI 模型,反映对每个基本元素的理解或预测能力。创建专门从事医疗保健特定领域的 AI,让其接触到顶级从业人员的多样化视角。在财经领域,依托中央财经大学的资源优势,基于内容增强型知识插槽技术构建高质量知识库,与客户自有知识库结合,实现全业务场景的支撑,可实现快速的专家级 Agent 构建与管理维护。在文档处理领域,如上海普米智图智能科技有限公司,自主研发的数据框架 Ananke 和 Agent 框架 Moros,利用智能体技术提升工作流效率。
2025-03-01
如何用AI搭建个人知识库
以下是用 AI 搭建个人知识库的方法: 首先,要搭建基于 GPT API 的定制化知识库,需要给 GPT 输入(投喂)定制化的知识。但 GPT3.5(即当前免费版的 ChatGPT)一次交互(输入和输出)只支持最高 4096 个 Token,约等于 3000 个单词或 2300 个汉字,容量对于绝大多数领域知识往往不够。为解决此问题,OpenAI 提供了 embedding API 解决方案。 embeddings 是一个浮点数字的向量(列表),两个向量之间的距离衡量它们的关联性,小距离表示高关联度,大距离表示低关联度。比如,向量是数学中表示大小和方向的一个量,通常用一串数字表示,在计算机科学和数据科学中,向量通常用列表(list)来表示。向量之间的距离是一种度量两个向量相似性的方法,最常见的是欧几里得距离。在 OpenAI 词嵌入中,靠近向量的词语在语义上相似。 具体操作时,可将大文本拆分成若干个小文本块(也叫 chunk),通过 embeddings API 将小文本块转换成 embeddings 向量,并在一个地方(向量储存库)中保存这些 embeddings 向量和文本块,作为问答的知识库。当用户提出一个问题时,该问题先通过 embeddings API 转换成问题向量,然后将这问题向量与向量储存库的所有文本块向量比对,查找距离最小的几个向量,把这几个向量对应的文本块提取出来,与原有问题组合成为新的 prompt,发送给 GPT API。 例如,有一篇万字长文,拆分成多个 Chrunks 包含不同内容。如果提问是“此文作者是谁?”,可以直观地看出与问题关联度最高的文本块,通过比较 embeddings 向量也能得到结论。最后发送给 GPT API 的问题会类似于“此文作者是谁?从以下信息中获取答案:本文作者:越山。xxxx。《反脆弱》作者塔勒布xxxx。” 此外,还有案例展示了如何在 AI 时代把碎片化信息内化为自己的知识/智慧。比如在读书时看到有触动的文本,将其整理归纳,标记重点,打赏标签,放入笔记系统,准备展开深度思考和实践。基于笔记中提到的 AI 对人的赋能模式,展开深度实践,生成自己的观点和决策,并打造成体系化的内容产品,实现价值。通过一个碎片化知识在左侧知识库中的“点、线、面、体”式的流转,从一个书摘变成一个体系化内容或课程,把“别人说的话”变成“自己的智慧”。
2025-02-28
从知识库中查询与:DeepSeek相关的热门资讯信息
以下是关于 DeepSeek 的热门资讯信息: 媒体报道和网络文章方面: 通往 AGI 之路:关于 DeepSeek 的所有事情【知识库持续更新中】,链接:https://mp.weixin.qq.com/s/n0WrrJL0fVX6zLeTBWpZXA 数字生命卡兹克:DeepSeek 的提示词技巧,就是没有技巧。链接:https://zhuanlan.zhihu.com/p/20544736305 (错误) 宝玉:教你如何破解 DeepSeek R1 系统提示词,类型为提示词破解,链接:https://mp.weixin.qq.com/s/vAp2wI5ozTw7R6jreLMw 橘子汽水铺:中国开源,震撼世界:DeepSeek R1 的变革、启示与展望,类型为基础认知,链接:https://mp.weixin.qq.com/s/yGUgehbxKisVaHlOkxhuaw 橘子汽水铺:自学成才之路,DeepSeek R1 论文解读,类型为基础认知,链接:https://mp.weixin.qq.com/s/gmdHyh6fsUdj1JhM1sV9bg 新智元:史上首次,DeepSeek 登顶中美 AppStore!NYU 教授:全球「AI 霸权」之争已结束,类型为基础认知,链接:https://mp.weixin.qq.com/s/ybvV8RMX0yyS5YfG1qNWgg 一支烟花 AI:用流程图对比 DeepSeekR1,OpenAI O1,Claude 说明强化学习在 AI 大模型训练、推理的创新和意义,类型为基础认知,链接:https://mp.weixin.qq.com/s/mdGtOcg1RuQOEBn31KhxQ 腾讯科技:一文读懂|DeepSeek 新模型大揭秘,为何它能震动全球 AI 圈,类型为基础认知,链接:https://mp.weixin.qq.com/s/cp4rQx09wygE9uHBadI7RA 张小珺腾讯科技:一场关于 DeepSeek 的高质量闭门会:比技术更重要的是愿景,类型为进阶思考,链接:https://mp.weixin.qq.com/s/a7C5NjHbMGh2CLYk1bhfYw 全新 AI 整活计划方面: DeepSeek 模型热度很高,微信指数达 10 亿多次,引发大众关注。 元子使用 Monica 时发现电脑版双击能显示思考过程,且注意不能直接换 agent,否则可能会干掉搜索功能。 财猫曾为相关平台做 AI 顾问,设计整套提示词,写小说等,其公众号因相关内容被封 15 天,19 号恢复。 旧模型有过度道德说教和正面描述趋势,DeepSeek 模型能力强,在文学创作上更出色,能给予更多自由发挥空间。 好的文字能引起生理共鸣和情绪,AI 可写出好文字,大语言模型预训练数据丰富,能引发人类共鸣和情绪。 Deepseek 模型的文风显著,文笔优秀,能触达情感,有哲学思考,在写作方面表现出色,如写小说、写诗、写骈文等。 Deepseek 模型喜欢使用大词,文风欢脱,有独特的语言风格,易于辨别。 Deepseek 模型有极强的发散能力,但较难收敛,有时会出现幻觉,但从创作角度看有利。
2025-02-28
如何将大量记录的文本内容输入知识库,并且形成有效问答问答
要将大量记录的文本内容输入知识库并形成有效问答,可参考以下方法: 1. 使用 embeddings 技术: 将文本转换成向量(一串数字),可理解为索引。 把大文本拆分成若干小文本块(chunk),通过 embeddings API 将小文本块转换成 embeddings 向量,这些向量与文本块的语义相关。 在向量储存库中保存 embeddings 向量和文本块。 当用户提出问题时,将问题转换成向量,与向量储存库的向量比对,查找距离最小的几个向量,提取对应的文本块,与问题组合成新的 prompt 发送给 GPT API。 2. 创建知识库并上传文本内容: 在线数据: 自动采集:适用于内容量大、需批量快速导入的场景。 在文本格式页签选择在线数据,单击下一步。 单击自动采集。 单击新增 URL,输入网站地址,选择是否定期同步及周期,单击确认。 上传完成后单击下一步,系统自动分片。 手动采集:适用于精准采集网页指定内容的场景。 安装扩展程序,参考。 在文本格式页签选择在线数据,单击下一步。 点击手动采集,完成授权。 输入采集内容网址,标注提取内容,查看数据确认后完成采集。 本地文档: 在文本格式页签选择本地文档,单击下一步。 拖拽或选择要上传的文档,支持.txt、.pdf、.docx 格式,每个文件不大于 20M,一次最多上传 10 个文件。 上传完成后单击下一步,选择内容分段方式,包括自动分段与清洗(系统自动处理)和自定义(手动设置分段规则和预处理规则)。
2025-02-28
怎么针对知识库提问
知识库问答是机器人的基础功能,其利用了大模型的 RAG 机制。RAG 机制全称为“检索增强生成”(RetrievalAugmented Generation),是一种结合了检索和生成两种主要人工智能技术的自然语言处理技术,用于提高机器对话和信息处理的能力。 简单来说,RAG 机制先从大型数据集中检索与问题相关的信息,然后利用这些信息生成更准确、相关的回答。可以想象成当问复杂问题时,RAG 机制先在巨大图书馆里找相关书籍,再基于这些书籍信息给出详细回答。这种方法结合大量背景信息和先进语言模型能力,使生成内容更精确,提升对话 AI 的理解力和回答质量。 基于 RAG 机制实现知识库问答功能,首先要创建包含大量社区 AI 相关文章和资料的知识库,通过手工录入方式上传文章内容,如创建有关 AI 启蒙和信息来源的知识库。在设计 Bot 时,添加知识库并设置合适的搜索策略、最大召回数量和最小匹配度,以更好地利用知识库返回的内容进行结合回答。 具体步骤包括: 1. 上传文档:支持 txt、pdf、docx 等格式,将文档转换为 Markdown 格式。 2. 文本切割:将长文本切割为小块(chunk)以便分析和处理。 3. 文本向量化:通过 embedding 技术将切割的 chunk 转换为算法可处理的向量,存入向量数据库。 4. 问句向量化:用户提问后,将问句向量化。 5. 语义检索匹配:将用户问句与向量数据库中的 chunk 匹配,找出最相似的 top k 个。 6. 提交 Prompt 至 LLM:将匹配出的文本和问句添加到配置好的 prompt 模板中,提交给 LLM。 7. 生成回答:LLM 生成回答并返回给用户。 RAG 研究范式不断发展,分为基础 RAG(Naive RAG)、高级 RAG(Advanced RAG)和模块化 RAG(Modular RAG)三种类型。
2025-02-28
如何搭建Ai工作流?
搭建 AI 工作流可以从以下几个方面入手: 1. 搭建 AI 工作流所需的能力: 熟悉各种 AI 工具:了解不同 AI 工具的特点和用途,根据具体任务选择合适的工具。例如,写标题可用 ChatGPT,写文章可用 Claude,检查文本中的错别字和病句可用秘塔写作猫的 AI 纠错功能。 编写提示词:提示词是搭建人与 AI 之间“沟通桥梁”的关键,要用 AI 能理解的语言清晰说明需求、任务内容和步骤。 搭建 AI 智能体。 2. 搭建 AI 工作流的工作流: 找到一个工作场景:选择熟悉的工作场景,如写文章、做 PPT 等。 拆解工作流程:将工作拆解成几个小步骤,如写文章可拆分为选题、写稿、改稿、写标题。 给每一个步骤嵌入工具:针对每个小步骤,选择合适的 AI 工具,可参考他人的做法,灵活选择最优解,以提高工作效率为目的。 此外,还有一些具体的操作示例,如在 Comfyui 界面中搭建工作流,包括打开界面后右键找到目录,手动连接节点或直接拖拽工作流文件一键复刻提示词工程实验。启动 ollama 时,从其 github 仓库找到对应版本并下载,在 cmd 中输入相应指令,将默认 base URL 和 api_key 填入 LLM 加载器节点即可调用模型进行实验。若出现 ollama 连接不上的报错,可能是代理服务器的问题,需将 127.0.0.1:11434 添加到不使用代理服务器的列表中。
2025-02-28
如何搭建AI知识库
以下是搭建 AI 知识库的步骤: 1. 设计您的 AI 机器人,确定其功能范围。 2. 编写【prompt】提示词,设定 Bot 的身份和目标。 3. 创建【知识库】: 整理“关键字”与“AI 相关资料链接”的对应关系,并将信息存储起来。 创建知识库路径:个人空间 知识库 创建知识库。 知识库文档类型支持本地文档、在线数据、飞书文档、Notion 等,本次使用【本地文档】。 按照操作指引上传文档、分段设置、确认数据处理。 小技巧:知识库好不好用,跟内容切分粒度有很大关系,我们可以在内容中加上一些特殊分割符,比如“”,以便于自动切分数据。分段标识符号要选择“自定义”,内容填“”。 最终的知识库结果如下,同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。 此外,您还可以参考相关文章,如《大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库》,以获取更深入的理解和帮助。
2025-02-28
基础搭建的知识库效果很差,模型答案的幻觉很严重,我应该怎么改进?(Deepseek调用api接入本地faiss的rag库)
以下是一些改进基础搭建的知识库效果、减轻模型答案幻觉问题的建议: 1. 更换大模型:例如从 ChatGLM26B 替换成 baichuan213b,针对您的场景,后者的性能可能提升一倍左右。 2. 更换 embedding 模型:将 embedding 模型从 LangChain Chatchat 默认的 m3ebase 替换为 bgelargezh,后者可能更优。 3. 测试不同 Top k 的值:比较 Top 5、Top 10、Top 15 的结果,发现 Top 10 时效果可能最优。 4. 对文档名称进行处理:人工对文件进行重命名,上传相同文件构建知识库,同时在构建知识库时勾选【开启中文标题加强】选项,虽然重命名文件对结果的提升效果不明显,但勾选该选项后,回答的无关信息可能减少,效果有所提升。 RAG(RetrievalAugmented Generation)即检索增强生成,由检索器和生成器两部分组成。检索器从外部知识中快速找到与问题相关的信息,生成器利用这些信息制作精确连贯的答案,适合处理需要广泛知识的任务。 在大模型中,向量可想象成空间中的点位,每个词或短语对应一个点。系统通过查看词在虚拟空间中点的位置,寻找直线距离最近的点来检索语义上接近的词语或信息。理解向量后,当收到一个对话时,RAG 的完整工作流程为:检索器从外部知识中检索相关信息,生成器利用这些信息生成答案。 要优化幻觉问题和提高准确性,需要了解从“问题输入”到“得到回复”的过程,针对每个环节逐个调优,以达到最佳效果。
2025-02-27
如何用扣子搭建自己的智能体
用扣子搭建自己的智能体可以参考以下步骤: 1. 创建智能体: 输入智能体的人设等信息。 为智能体起一个名称。 写一段智能体的简单介绍,介绍越详细越好,系统会根据介绍智能生成符合主题的图标。 2. 配置工作流: 放上创建的工作流。 对于工作流中的特定节点,如【所有视频片段拼接】,注意插件 api_token 的使用,避免直接发布导致消耗个人费用,可以将其作为工作流的输入,让用户自行购买后输入使用。 3. 测试与发布: 配置完成后进行测试。 确认无误后再发布。 扣子(Coze)是字节跳动旗下的新一代一站式 AI Bot 开发平台,无论是否具备编程基础,都能在该平台上迅速构建基于 AI 模型的各类问答 Bot。开发完成后还可发布到各种社交平台和通讯软件上供用户交互聊天。同时,像菠萝作词家这样的智能体,是专为特定需求设计的,能够帮助解决相关领域的问题。
2025-02-27