Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我想建立一个知识库,有什么工具可以使用吗

Answer

以下是一些可用于建立知识库的工具及相关步骤:

使用 Dify 构建知识库的步骤:

  1. 准备数据:收集需要纳入知识库的文本数据,包括文档、表格等格式。对数据进行清洗、分段等预处理,确保数据质量。
  2. 创建数据集:在 Dify 中创建一个新的数据集,并将准备好的文档上传至该数据集。为数据集编写良好的描述,描述清楚数据集包含的内容和特点。
  3. 配置索引方式:Dify 提供了三种索引方式供选择,包括高质量模式、经济模式和 Q&A 分段模式。根据实际需求选择合适的索引方式,如需要更高准确度可选高质量模式。
  4. 集成至应用:将创建好的数据集集成到 Dify 的对话型应用中,作为应用的上下文知识库使用。在应用设置中,可以配置数据集的使用方式,如是否允许跨数据集搜索等。
  5. 持续优化:收集用户反馈,对知识库内容和索引方式进行持续优化和迭代。定期更新知识库,增加新的内容以保持知识库的时效性。

使用扣子创建并上传文本内容到知识库的方式:

  1. 在线数据:
    • 自动采集方式:适用于内容量大,需要批量快速导入的场景。
      • 在文本格式页签下,选择在线数据,然后单击下一步。
      • 单击自动采集。
      • 单击新增 URL。在弹出的页面完成以下操作:
        • 输入要上传的网站地址。
        • 选择是否需要定期同步网站内容,如果需要选择内容同步周期。
        • 单击确认。
      • 当上传完成后单击下一步。系统会自动根据网站的内容进行内容分片。
    • 手动采集:适用于需要精准采集网页上指定内容的场景
      • 安装扩展程序,详情请参考安装 Coze Scraper
      • 在文本格式页签下,选择在线数据,然后单击下一步。
      • 点击手动采集,然后在弹出的页面点击权限授予完成授权。
      • 在弹出的页面输入要采集内容的网址,然后单击确认。
      • 在弹出的页面上,点击页面下方文本标注按钮,开始标注要提取的内容,然后单击文本框上方的文本或链接按钮。
      • 单击查看数据查看已采集的内容,确认无误后再点击完成并采集。

使用 Coze 智能体创建知识库:

  1. 手动清洗数据:
    • 在线知识库:点击创建知识库,创建一个画小二课程的 FAQ 知识库。知识库的飞书在线文档,其中每个问题和答案以###分割。选择飞书文档、自定义的自定义,输入###,然后可编辑修改和删除。点击添加 Bot,添加好可以在调试区测试效果。
    • 本地文档:本地 word 文件,注意拆分内容以提高训练数据准确度。将海报的内容训练的知识库里面。画小二这个课程 80 节课程,分为了 11 个章节,不能一股脑全部放进去训练。正确的方法是首先将 11 章的大的章节名称内容放进来,章节内详细内容依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理,然后选择创建知识库自定义清洗数据。
  2. 发布应用:点击发布,确保在 Bot 商店中能够搜到。
Content generated by AI large model, please carefully verify (powered by aily)

References

问:Dify 构建知识库的具体步骤

使用Dify构建知识库的具体步骤如下:1.准备数据:收集需要纳入知识库的文本数据,包括文档、表格等格式。对数据进行清洗、分段等预处理,确保数据质量。2.创建数据集:在Dify中创建一个新的数据集,并将准备好的文档上传至该数据集。为数据集编写良好的描述,描述清楚数据集包含的内容和特点。3.配置索引方式:Dify提供了三种索引方式供选择:高质量模式、经济模式和Q&A分段模式。根据实际需求选择合适的索引方式,如需要更高准确度可选高质量模式。4.集成至应用:将创建好的数据集集成到Dify的对话型应用中,作为应用的上下文知识库使用。在应用设置中,可以配置数据集的使用方式,如是否允许跨数据集搜索等。5.持续优化:收集用户反馈,对知识库内容和索引方式进行持续优化和迭代。定期更新知识库,增加新的内容以保持知识库的时效性。总的来说,Dify提供了一个可视化的知识库管理工具,使得构建和维护知识库变得相对简单。关键步骤包括数据准备、数据集创建、索引配置,以及将知识库集成到应用中并持续优化。内容由AI大模型生成,请仔细甄别

创建并使用知识库

|上传方式|操作步骤||-|-||在线数据|扣子支持自动抓取指定URL的内容,也支持手动采集指定页面上的内容,上传到数据库。<br>自动采集方式:该方式适用于内容量大,需要批量快速导入的场景。<br>1.在文本格式页签下,选择在线数据,然后单击下一步。<br>2.单击自动采集。<br>3.单击新增URL。在弹出的页面完成以下操作:<br>3.1.输入要上传的网站地址。<br>3.2.选择是否需要定期同步网站内容,如果需要选择内容同步周期。<br>3.3.单击确认。<br>4.当上传完成后单击下一步。<br>系统会自动根据网站的内容进行内容分片。<br>手动采集:该方式适用于需要精准采集网页上指定内容的场景<br>1.安装扩展程序,详情请参考[安装Coze Scraper](https://www.coze.cn/docs/guides/scraper)。<br>2.在文本格式页签下,选择在线数据,然后单击下一步。<br>3.点击手动采集,然后在弹出的页面点击权限授予完成授权。<br>4.在弹出的页面输入要采集内容的网址,然后单击确认。<br>5.在弹出的页面上,点击页面下方文本标注按钮,开始标注要提取的内容,然后单击文本框上方的文本或链接按钮。<br>6.单击查看数据查看已采集的内容,确认无误后再点击完成并采集。<br>|

【智能体】让Coze智能体机器人连上微信和微信群详细配置文档

本次创建知识库使用手动清洗数据,上节课程是自动清洗数据:[【智能体】用Coze在微信里搭建一个机器人,还能挖掘销售线索](https://a1i1hjmvcf0.feishu.cn/docx/JSdDd8ybLo7OHqxmePwcHlbLn3b?from=from_copylink),自动清洗数据会出现目前数据不准的情况,本节视频就尝试使用手动清洗数据,提高数据的准确性。[heading3]3.1在线知识库[content]点击创建知识库,创建一个画小二课程的FAQ知识库知识库的飞书在线文档,其中每个问题和答案以###分割,暂时不要问为什么。选择飞书文档选择自定义的自定义输入###然后他就将飞书的文档内容以###区分开来,这里可以点击编辑修改和删除。点击添加Bot添加好可以在调试区测试效果[heading3]3.2本地文档[content]本地word文件,这里要注意了~~~如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面画小二这个课程80节课程,分为了11个章节,那训练数据能不能一股脑全部放进去训练呢。答案是~~不能滴~~~正确的方法,首先将11章的大的章节名称内容放进来,如下图所示。章节内详细内容格式如下如所示,如果你再分节的内容,依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理然后选择创建知识库自定义清洗数据,这里不再赘述。[heading3]3.3发布应用[content]点击发布确保在Bot商店中能够搜到,如图所示可以搜索到画小二智能小助手,这个很重要,没有通过发布的获取不到API的。

Others are asking
waytoagi的知识库基于哪个LLM创建的
目前没有明确的信息表明 waytoagi 的知识库基于哪个 LLM 创建。但以下信息可能对您有所帮助: AnythingLLM 包含了所有 Open WebUI 的能力,并且额外支持选择文本嵌入模型、选择向量数据库等。安装地址为:https://useanything.com/download 。安装完成后配置主要分为三步,包括选择大模型、选择文本嵌入模型、选择向量数据库。AnythingLLM 中有 Workspace 的概念,可创建自己独有的 Workspace 跟其他项目数据进行隔离,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式和 Query 模式)等。 GitHubDaily 开源项目列表中提到了 AnythingLLM,它是一个可打造成企业内部知识库的私人专属 GPT,可以将任何文档、资源或内容转换为大语言模型(LLM)知识库。
2025-02-19
用飞书搭建知识库并进行AI问答
以下是关于用飞书搭建知识库并进行 AI 问答的相关内容: 知识库问答是机器人的基础功能,可根据用户问题从知识库中找到最佳答案,这利用了大模型的 RAG 机制。RAG 机制全称为“检索增强生成”(RetrievalAugmented Generation),是一种用于自然语言处理的技术,结合了检索和生成两种主要的人工智能技术,以提高机器对话和信息处理的能力。 简单来说,RAG 机制先从大型数据集中检索与问题相关的信息,然后利用这些信息生成更准确、相关的回答。可以想象成当问复杂问题时,RAG 机制先在巨大图书馆里找相关书籍,再基于这些书籍信息给出详细回答。这种方法结合大量背景信息和先进语言模型能力,使生成内容更精确,提升对话 AI 的理解力和回答质量。 基于 RAG 机制实现知识库问答功能,首先要创建包含大量社区 AI 相关文章和资料的知识库,比如创建有关 AI 启蒙和信息来源的知识库,通过手工录入方式上传栏目所有文章内容,陆续将社区其他板块文章和资料导入。在设计 Bot 时,添加知识库,并设置合适的搜索策略、最大召回数量和最小匹配度,以更好地利用知识库返回内容结合回答。 另外,全程白嫖拥有一个 AI 大模型的微信助手的搭建步骤如下: 1. 搭建,用于汇聚整合多种大模型接口,方便后续更换使用各种大模型,并获取白嫖大模型接口的方法。 2. 搭建,这是个知识库问答系统,放入知识文件,接入上面的大模型作为分析知识库的大脑来回答问题。若不想接入微信,搭建到此即可使用,它有问答界面。 3. 搭建,其中的 cow 插件能进行文件总结、MJ 绘画。
2025-02-19
有哪些比较好的AI知识库学习网站
以下是一些比较好的 AI 知识库学习网站及相关学习建议: 通往 AGI 之路知识库: 提供了全面系统的 AI 学习路径,帮助您了解从 AI 常见名词到 AI 应用等各方面知识。 包含关于 AI 知识库使用及 AIPO 活动的介绍、AIPO 线下活动及 AI 相关探讨、way to AGI 社区活动与知识库介绍等内容。 信息来源有赛博蝉星公众号、国外优质博主的 blog 或 Twitter 等,推荐大家订阅获取最新信息并投稿。 有社区共创项目,如 AIPU、CONFIUI 生态大会,每月有切磋大会等活动,还发起了新活动 AIPO。 学习路径方面,有李弘毅老师的生成式 AI 导论等高质量学习内容,可系统化学习或通过社区共创活动反推学习,鼓励整理学习笔记并分享交流。 有经典必读文章,如介绍 GPT 运作原理、Transformer 模型、扩散模型等的文章,还包括软件 2.0 时代相关内容。 初学者入门推荐看 open AI 的官方 Cookbook,小琪姐做了中文精读翻译,也可查看 cloud 的相关内容。 有历史脉络类资料,整理了 open AI 的发展时间线和万字长文回顾等。 网站:ytoAGI.com 相关渠道:公众号“通往 AGI 之路”、 在线教育平台:如 Coursera、edX、Udacity 等,上面有一系列为初学者设计的课程,您可以按照自己的节奏学习,并有机会获得证书。 对于新手学习 AI,建议: 了解 AI 基本概念:阅读「」部分,熟悉 AI 的术语和基础概念。了解什么是人工智能,它的主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 开始 AI 学习之旅:在「」中,找到一系列为初学者设计的课程。特别推荐李宏毅老师的课程。 选择感兴趣的模块深入学习:AI 领域广泛(比如图像、音乐、视频等),根据自己的兴趣选择特定的模块进行深入学习。掌握提示词的技巧,它上手容易且很有用。 实践和尝试:理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 体验 AI 产品:与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。
2025-02-18
有什么提升 RAG 知识库问答的好的 prompt
以下是一些提升 RAG 知识库问答的好的 prompt 相关内容: RAG 在 Natural Questions、WebQuestions 和 CuratedTrec 等基准测试中表现出色,在使用 MSMARCO 和 Jeopardy 问题进行测试时,生成的答案更符合事实、具体且多样,FEVER 事实验证使用 RAG 后也有更好结果,说明 RAG 是可行方案,能增强知识密集型任务中语言模型的输出,基于检索器的方法常与 ChatGPT 等流行 LLM 结合提高能力和事实一致性,可在 LangChain 文档中找到相关例子。 RAG 能显著提高大模型在处理私域知识或垂直领域问答时的效果。其流程包括:上传文档(支持多种格式,会转换为 Markdown 格式)、文本切割、文本向量化(存入向量数据库)、问句向量化、语义检索匹配(匹配出与问句向量最相似的 top k 个)、提交 Prompt 至 LLM、生成回答返回给用户。RAG 研究范式分为基础 RAG、高级 RAG 和模块化 RAG。 高级 RAG 特点:支持多模态数据处理,增强对话性,具备自适应检索策略,能进行知识融合,扩展了基础 RAG 功能,解决复杂任务局限,在广泛应用中表现出色,推动自然语言处理和人工智能发展。 模块化 RAG 侧重于提供更高定制性和灵活性,将系统拆分成多个独立模块或组件,每个组件负责特定功能,便于根据不同需求灵活组合和定制。
2025-02-18
怎么做一个知识库智能问答机器人?
要做一个知识库智能问答机器人,主要基于大模型的 RAG 机制,具体步骤如下: 1. 理解 RAG 机制:RAG 机制全称为“检索增强生成”(RetrievalAugmented Generation),是一种用于自然语言处理的技术,结合了检索和生成两种主要的人工智能技术,以提高机器对话和信息处理的能力。它先从大型数据集中检索与问题相关的信息,然后利用这些信息生成更准确、相关的回答。可以想象成在巨大图书馆里找相关书籍,再基于书籍信息给出详细回答,这种方法结合大量背景信息和先进语言模型能力,使生成内容更精确,提升对话 AI 的理解力和回答质量。 2. 创建知识库:创建包含大量社区 AI 相关文章和资料的知识库,例如创建有关 AI 启蒙和信息来源的知识库,通过手工录入方式上传文章内容,并陆续将社区其他板块的文章和资料导入。 3. 设计 Bot:在设计中添加知识库,并设置合适的搜索策略、最大召回数量和最小匹配度,尽可能利用好知识库返回的内容进行结合回答。 此外,在飞书中,还可以利用飞书智能伙伴创建平台(Aily)来搭建 FAQ 机器人,它是飞书团队旗下的企业级 AI 应用开发平台,能为企业提供简单、安全且高效的环境,帮助轻松构建和发布 AI 应用。
2025-02-18
知识库搭建
知识库搭建主要包括以下几个方面: 1. “拎得清、看得到、想得起、用得上”的核心步骤: 拎得清:主动选择和判断高质量、与目标相关的信息源,利用 AI 搜索引擎、加入优质社群和订阅号等建立信息通路,具备信息嗅探能力。 看得到:确保所选信息能频繁且不经意地触达个人,通过浏览器插件、笔记工具等组织信息,使其易于检索和浏览。 想得起:强调信息的内化和知识线索建立,做好标记(关键词、tag)、选择合适存放位置,推荐使用 PARA 笔记法等方法组织串联信息。 用得上:将积累的知识转化为实际行动和成果,在解决问题或创造价值时能从知识库中调取相应信息。 2. RAG 技术: 利用大模型的能力搭建知识库是 RAG 技术的应用。 RAG 是当需要依靠不包含在大模型训练集中的数据时的主要方法,首先检索外部数据,然后在生成步骤中将其传递给 LLM。 RAG 应用包括文档加载、文本分割、存储(包括嵌入和向量数据存储)、检索、输出(把问题及检索出的嵌入片提交给 LLM 生成答案)。 文本加载器是将用户提供的文本加载到内存中以便后续处理。 3. 智能体知识库创建: 手动清洗数据,提高数据准确性。 在线知识库:创建画小二课程的 FAQ 知识库,飞书在线文档中每个问题和答案以分割,可编辑修改和删除,添加 Bot 并在调试区测试效果。 本地文档:注意拆分内容,提高训练数据准确度,按章节进行人工标注和处理。 发布应用:确保在 Bot 商店中能搜到。
2025-02-18
考研相关的AI工具
以下是一些与考研相关的 AI 工具: 1. 文献管理和搜索: Zotero:结合 AI 技术,能自动提取文献信息,便于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 提供文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,方便进行数据分析和可视化。 Knitro:用于数学建模和优化,助力复杂数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:检测潜在抄袭问题。 以下是一些与思维导图相关的 AI 工具: 1. GitMind:免费跨平台,可通过 AI 自动生成思维导图,支持多种模式。 2. ProcessOn:国内思维导图与 AIGC 结合,能利用 AI 生成。 3. AmyMind:轻量级在线工具,无需注册登录,支持自动生成节点。 4. Xmind Copilot:基于 GPT 的助手,可一键拓展思路,生成文章大纲。 5. TreeMind:输入需求由 AI 自动生成思维导图。 6. EdrawMind:提供 AI 头脑风暴功能,提升生产力。 以下是一些 AI 博主素材相关的工具: 1. AI 研究工具:Claude、ChatGPT、Bing Chat、Perplexity。 2. 图片处理:DallE、Leonardo、BlueWillow、Midjourney。 3. 版权写作:Rytr、Copy AI、Wordtune、Writesonic。 4. 设计:Canva、Clipdrop、Designify、Microsoft Designer。 5. 网站搭建:10Web、Framer、Hostinger、Landingsite。 6. 视频处理:Klap、Opus、Invideo、Heygen。 7. 音频处理:Murf、LovoAI、Resemble、Eleven Labs。 8. SEO 优化:Alli AI、BlogSEO、Seona AI、Clearscope。 9. Logo 设计:Looka、LogoAI、Brandmark、Logomaster。 10. 聊天机器人:Droxy、Chatbase、Voiceflow、Chatsimple。 11. 自动化工具:Make、Zapier、Bardeen、Postman。 12. 市场营销。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-19
量化投资工具
以下是为您提供的关于量化投资工具的相关信息: 幻方时代: 算力军备竞赛: 2019 年,萤火一号,投入规模 2 亿元,GPU 数量 1100,算力水平相当于 4 万台 PC 算力。 2021 年,萤火二号,投入规模 10 亿元,GPU 数量 10000+,算力是萤火一号的 18 倍。 量化投资的范式革命: 技术特征包括全流程 AI 决策系统、实时处理 PB 级市场数据、自适应动态风控模型。 DeepSeek: 颠覆性技术架构:相关内容可通过获取。 震撼业界的里程碑: 2024.05,DeepSeek V2 引发行业价格战,一周后全部模型集体降价。 2024.12,DeepSeek V3 685B 超越 Llama3.2,训练成本 600 万美元(Meta 同级别 1/9),性能指标为 MTBench 8.7,MMLU 83.5。 AIGC Weekly53 中的量化投资工具: Composer Trading 平台: 是一个旨在改变个人创建和管理投资策略方式的平台。 提供由人工智能驱动的策略创建工具,用户可用自然语言解释目标、策略和风险关注点,AI 辅助创建策略。 自动化处理交易策略的执行和再平衡。 提供各种类别的预构建策略选择,如长期、技术重点和多样化等。 作为经纪商,提供全自动交易执行,无佣金模式,通过简单固定月度订阅透明定价,用户可免费测试。 具有定制特性,每个策略完全可编辑,用户可用无代码视觉编辑器修改策略、调整参数等。 支持回测,帮助用户学习并调整战略,可与基准或其他战略比较,计算费用、滑点以及战术最终价值,提供潜在结果全面视图。
2025-02-19
有没有把视频截取成图片的或者剪辑的AI工具
以下是一些可以将视频截取成图片或进行剪辑的 AI 工具: 1. Clipfly :可用于视频编辑与合成。 2. VEED.IO :能帮助进行视频编辑。 3. MMVid :这是一个集成的视频理解系统,能处理和理解长视频内容并进行问答,可应用于快速的视频剪辑等场景。 4. 可灵 AI :例如通过其图生视频功能进行相关操作。 此外,在进行视频剪辑时,还可以使用剪映等工具,具体步骤如下: 1. 在右上方点击抠像按钮。 2. 鼠标选中要处理的素材。 3. 把带绿幕的素材先放入下面主视频轨道。 4. 导入需要的素材,将扣好的绿幕和下方黑色咖啡的素材合成一个片段,最后点击新建的复合片段,调整对应的参数。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-02-19
图片生成工具
以下是一些常见的图片生成工具: 1. Tripo AI:由 VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型,基于数十亿参数级别的 3D 大模型,实现快速的 2D 到 3D 转换,提供 AI 驱动的精准度和细节。 2. Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成,用户可上传图片并描述材质和风格来生成高质量 3D 模型。 3. CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象再转换为 3D 模型。 4. Sudo AI:支持通过文本和图像生成 3D 模型,特别适用于游戏领域的模型生成,用户可上传图片或输入文本提示词来生成。 5. VoxCraft:由生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供图像到 3D、文本到 3D 和文本到纹理等多种功能。 此外,谷歌图像生成工具具有理解能力强、生成速度快、可调整提示词和选项等特点,但有使用门槛,不能输入中文,每日免费 500 次。纳米搜索反推提示词工具可上传图片反推 midjourney 提示词,输出效果好,能调用多种模型,可用于查阅资料。 OpenAI 的图像生成端点允许在给定文本提示的情况下创建原始图像,生成的图像大小可为 256x26、512x512 或 1024x1024 像素,较小尺寸生成速度更快,可使用参数一次请求 1 10 张图像,描述越详细越可能获得想要的结果。其图像编辑端点允许通过上传蒙版来编辑和扩展图像。 这些工具通常具有用户友好的界面,无需专业 3D 建模技能即可简单操作,广泛应用于游戏开发、动画制作、3D 打印、视觉艺术等领域。
2025-02-19
帮助产品经理根据产品原型截图写产品需求文档的AI工具和提示词有哪些
以下是一些帮助产品经理根据产品原型截图写产品需求文档的 AI 工具和提示词: AI 工具: 1. 产品管理工具:如 Aha!、ProductPlan 等,帮助管理整个产品生命周期。 2. 协作工具:如 Google Docs、Microsoft Office 365,支持团队协作和文档共享。 3. 项目管理软件:如 JIRA、Trello,用于任务分配和进度跟踪。 4. 市场研究工具:如 Google Trends、SEMrush,分析市场趋势和用户行为。 5. 用户调研工具:如 SurveyMonkey、Typeform,收集用户反馈和需求。 6. 数据分析工具:如 Tableau、Power BI,对市场数据进行可视化分析。 7. 思维导图软件:如 MindMeister、XMind,帮助组织思路和概念。 8. 流程图软件:如 Lucidchart、Visio,绘制产品功能和流程图。 提示词: 1. 行业洞察分析:对行业现状、趋势和未来发展方向进行深入研究和预测。 2. 方法论专家:精通各类管理和研发方法论,能根据具体情况选择和应用最佳方法。 3. 头脑风暴:团队成员自由提出各种想法和见解,快速产出创意解决方案。 4. 需求文档设计:根据产品特性和用户需求,设计产品需求文档。 5. 功能价值分析:评估产品各项功能的重要性和价值,辅助优化资源配置。 6. 竞品分析报告:对竞争对手的产品进行全面的分析比较,找出优劣势。 7. 流程图/图表设计:直观地呈现业务流程、组织结构或统计数据。 8. 思维导图设计:以树状图形式展示思路和知识框架。 9. 解决方案专家:根据问题分析,提供切实可行的解决方案。 10. 周报生成器:自动化生成工作周报,提高工作效率。 学习 Prompt 提示词可以参考这份文档:https://www.promptingguide.ai/zh 。 在写提示词时,要注意以下几点: 1. 提示词内容准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等,比如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 2. 调整负面提示词,帮助 AI 理解不想生成的内容,比如:不好的质量、低像素、模糊、水印。 3. 利用“加权重”功能,让 AI 明白重点内容,可在功能框增加提示词,并进行加权重调节,权重数值越大,更优先。 4. 对于星流一站式 AI 设计工具,其提示词用于描绘画面,支持中英文输入,启用提示词优化后能更生动地描述画面内容,小白用户可以点击提示词上方官方预设词组进行生图。 使用这些提示词和工具,可以帮助产品经理更高效地撰写产品需求文档,确保文档全面覆盖了市场和产品的关键方面。同时,它们也有助于提高团队之间的沟通效率和文档的可管理性。但请注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-19
可以自动生成PPT的工具
以下是一些可以自动生成 PPT 的工具: 1. WonderGPT:把颜值和交互体验做到极致,简单而美观。网址:https://wondergpt.co/ 2. StabilityGPT:在 GPT4 中运行 Stable Diffusion,作者做了一个 ChatGPT 插件,可以在 ChatGPT 发出提示词后返回 SD 生成的图像,能与 ChatGPT 原有的能力深度结合。 3. Graph Maker:上传数据之后通过自然语言对数据内容进行分析输出结果,包括生成可视化的图表分析。网址:https://www.graphma 4. Coda AI:Coda 发布的 AI 能力,在帮助写文档润色内容方面和 Notion 差不多,强大的功能是能够获取跟 Coda 链接的很多应用里的数据进行整合和分析甚至联动。网址:https://coda.io/prod 5. Motion Go:国产工具,原来是做 PPT 附加插件的,现在可以通过自然语言自动生成 PPT 页面和对应内容智能增加动画。网址:https://motion.yooai.com 6. Triple whale:AI 电商助手,支持广告的数据监测,创意数据的跟踪和分析、跟踪和管理与 KOL 的营销活动,AI 整合分析进行异常检测并给出建议。网址:https://www.triplewhale.com/ 7. Prompt Storm:ChatGPT 提示词浏览器扩展,一个简单易用的谷歌浏览器扩展。网址:https://promptstorm 此外,使用 Process ON 自动生成 PPT 的思路和步骤如下: 网址:https://www.processon.com/ 输入大纲和要点: 导入大纲和要点: 手动复制,相对较耗时间。 导入方式: 复制最终大纲内容到本地 txt 文件,将后缀改为.md。若看不见后缀,自行搜索开启后缀。 打开 Xmind 软件,将 md 文件导入 Xmind 文件中。 在 Process ON 导入 Xmind 文件。 输入主题自动生成大纲和要求:新增思维导图,输入主题,点击 AI 帮我创作。 选择模版并生成 PPT:点击下载,选择导入格式为 PPT 文件,选择模版再点击下载。若喜欢用 Process ON 且没有会员,可在某宝买一天会员。
2025-02-19
通往agi之路的网站啥时候建立的?
通往 AGI 之路(WayToAGI)于 2023 年 4 月 26 日诞生。
2025-02-19
怎么建立自己的知识库
要建立自己的知识库,可以参考以下两种方法: 方法一:用 GPT 打造个人知识库 1. 理解 embeddings: Embeddings 是一个浮点数字的向量(列表),两个向量之间的距离衡量它们的关联性。小距离表示高关联度,大距离表示低关联度。 向量是数学中表示大小和方向的一个量,通常用一串数字表示。在计算机科学和数据科学中,向量通常用列表(list)来表示。 向量之间的距离是一种度量两个向量相似性的方法,最常见的是欧几里得距离。 2. 使用 embeddings: 将大文本拆分成若干个小文本块(chunk),通过 embeddings API 将小文本块转换成 embeddings 向量。 在一个地方(向量储存库)中保存这些 embeddings 向量和文本块,作为问答的知识库。 当用户提出一个问题时,该问题先通过 embeddings API 转换成问题向量,然后将这问题向量与向量储存库的所有文本块向量比对,查找距离最小的几个向量,把这几个向量对应的文本块提取出来,与原有问题组合成为新的 prompt(问题/提示词),发送给 GPT API。 方法二:用 Coze 免费打造自己的微信 AI 机器人 1. 设计你的 AI 机器人: 确定功能范围。 编写【prompt】提示词,设定 Bot 的身份和目标。 2. 创建知识库: 整理“关键字”与“AI 相关资料链接”的对应关系,并将信息存储起来。 创建知识库路径:个人空间 知识库 创建知识库。 知识库文档类型支持:本地文档、在线数据、飞书文档、Notion 等,本次使用【本地文档】。 按照操作指引上传文档、分段设置、确认数据处理。 小技巧:知识库好不好用,跟内容切分粒度有很大关系,可以在内容中加上一些特殊分割符,比如“”,以便于自动切分数据。分段标识符号要选择“自定义”,内容填“”。最终的知识库结果中,同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。
2025-02-14
建立本地AI知识库有什么意义
建立本地 AI 知识库具有以下重要意义: 1. 灵活掌控:通过使用像 AnythingLLM 这样的软件,可以对知识库进行更灵活的管理和操作。例如选择文本嵌入模型、向量数据库等。 2. 数据隔离:在 AnythingLLM 中创建独有的 Workspace,能与其他项目数据进行隔离,保障数据的独立性和安全性。 3. 多样对话模式:提供 Chat 模式和 Query 模式。Chat 模式综合大模型训练数据和上传文档数据给出答案,Query 模式仅依靠文档数据回答。 4. 深入理解技术:虽然大多数人不需要自行部署大模型,但通过本地部署和搭建知识库的实操,可以更深入地了解相关技术,如 RAG 技术,包括其文档加载、文本分割、存储、检索和输出等过程,以及文本加载器的作用。 5. 个性化定制:可以根据个人需求上传文档并进行文本嵌入,实现个性化的知识储备和应用。 6. 测试与优化:完成配置后可进行对话测试,不断优化和改进知识库的性能和回答质量。
2025-02-14
如何建立自己知识库
建立自己的知识库可以参考以下方法: 1. 利用 GPT 打造个人知识库: 给 GPT 输入(投喂)定制化的知识,但需注意 GPT3.5(即当前免费版的 ChatGPT)一次交互(输入和输出)只支持最高 4096 个 Token,约等于 3000 个单词或 2300 个汉字,容量对于绝大多数领域知识可能不够。 OpenAI 提供了 embedding API 解决方案,embeddings 是一个浮点数字的向量(列表),两个向量之间的距离衡量它们的关联性,小距离表示高关联度,大距离表示低关联度。向量是数学中表示大小和方向的一个量,通常用一串数字表示,在计算机科学和数据科学中,向量通常用列表(list)来表示。向量之间的距离是一种度量两个向量相似性的方法,最常见的是欧几里得距离。 可以先把大文本拆分成若干个小文本块(也叫 chunk),通过 embeddings API 将小文本块转换成 embeddings 向量,这个向量跟文本块的语义相关。在一个地方(向量储存库)中保存这些 embeddings 向量和文本块,作为问答的知识库。当用户提出一个问题时,该问题先通过 embeddings API 转换成问题向量,然后将这问题向量与向量储存库的所有文本块向量比对,查找距离最小的几个向量,把这几个向量对应的文本块提取出来,与原有问题组合成为新的 prompt,发送给 GPT API。 2. 本地部署大模型以及搭建个人知识库: 利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用,在进行本地知识库的搭建实操之前,需要先对 RAG 有一个大概的了解。 RAG 应用包括文档加载(从多种不同来源加载文档,LangChain 提供了 100 多种不同的文档加载器)、文本分割(把 Documents 切分为指定大小的块)、存储(将切分好的文档块进行嵌入转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库)、检索(通过某种检索算法找到与输入问题相似的嵌入片)、Output(把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案)。 文本加载器就是将用户提供的文本加载到内存中,便于进行后续的处理。
2025-02-13
如何用ai建立自己的知识库?
以下是用 AI 建立自己知识库的方法: 1. 使用 GPT 建立: 将大文本拆分成若干小文本块(chunk)。 通过 embeddings API 将小文本块转换成与语义相关的 embeddings 向量,并在向量储存库中保存这些向量和文本块作为问答的知识库。 当用户提出问题时,将问题转换成问题向量,与向量储存库中的文本块向量比对,提取距离最小的几个向量对应的文本块,与问题组合成新的 prompt 发送给 GPT API。 例如,对于一篇万字长文,拆分成多个文本块,如“文本块 1:本文作者:越山。xxxx。”等,当提问“此文作者是谁?”时,通过比较 embeddings 向量,提取关联度高的文本块发送给 GPT API 回答问题。 2. 使用 Coze 建立: 确定功能范围,编写 prompt 提示词,设定 Bot 的身份和目标。 创建知识库,整理“关键字”与“AI 相关资料链接”的对应关系,并将信息存储起来。创建知识库路径为:个人空间 知识库 创建知识库。支持的文档类型包括本地文档、在线数据、飞书文档、Notion 等,本次可使用本地文档。按照操作指引上传文档、分段设置、确认数据处理。小技巧:在内容中加上特殊分割符“”,分段标识符号选择“自定义”,内容填“”,以便于自动切分数据。 创建工作流,告诉 AI 机器人按流程处理信息。创建工作流路径为:个人空间 工作流 创建工作流。工作流设计好后,先点击右上角“试运行”,测试无误后点击发布。如果任务和逻辑复杂,可以结合左边“节点”工具来实现,如调用大模型总结分析知识库内容、调用数据库存储用户输入信息、调用代码处理复杂逻辑等。个人建议:工作流不必复杂,能实现目的即可,所以在设计 Bot 前“确定目的”和“确定功能范围”很重要。
2025-02-13
利用deep seek建立知识库应用
以下是关于利用 deep seek 建立知识库应用的相关内容: RAG 技术: 利用大模型的能力搭建知识库是 RAG 技术的应用。在需要依靠不包含在大模型训练集中的数据时,主要通过检索增强生成 RAG 实现。RAG 应用可抽象为 5 个过程: 1. 文档加载:从多种来源加载文档,LangChain 提供 100 多种文档加载器,包括非结构化、结构化数据和代码等。 2. 文本分割:文本分割器把文档切分为指定大小的块。 3. 存储:包括将切分好的文档块嵌入转换成向量形式,并将向量数据存储到向量数据库。 4. 检索:通过检索算法找到与输入问题相似的嵌入片。 5. 输出:把问题及检索出来的嵌入片提交给 LLM,生成更合理答案。 创建知识库应用的具体步骤: 1. 地址输入浏览器:http://这里替换为你宝塔左上角的那一串:3000/ 2. 进入后,点击应用并创建,选择 qwen 模型。 3. 创建知识库。点击知识库 选择 qwen Embedding 1 点击确认创建。 4. 上传文件,等待处理,文本状态为“已就绪”即可。 5. 回到创建的应用,关联创建的知识库。 6. 点击两个发布,之前第一个叫做保存。 7. 点击新建,创建 key。创建后保存同时将 API 根地址最后加上/v1 并保存下来。 此外,在安装并接入 cow 方面: 1. 回到宝塔,打开【终端】。 2. 依次粘贴并回车:cd/root 、git clone https://github.com/zhayujie/chatgptonwechat (注意粘贴完整)。 3. 出现特定样子表示成功,失败或无反应则刷新重试。 4. 继续依次输入:cd chatgptonwechat/ 、pip install r requirements.txt 。 5. 等待执行完成后,继续粘贴:pip install r requirementsoptional.txt 。 6. 到“文件”菜单中执行,点击文件 找到 root,进入 root 文件夹,找到 chatgptonwechat 文件夹并进入。
2025-02-10
0到1使用大语言模型
以下是关于 0 到 1 使用大语言模型的相关内容: Ollama 框架: 1. 支持多种大型语言模型,如通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同应用场景。 2. 易于使用,适用于 macOS、Windows 和 Linux 系统,同时支持 CPU 和 GPU。 3. 提供模型库,用户可从中下载不同参数和大小的模型,通过 https://ollama.com/library 查找。 4. 支持用户自定义模型,例如修改温度参数调整创造性和连贯性,或设置特定系统消息。 5. 提供 REST API 用于运行和管理模型,以及与其他应用程序的集成选项。 6. 社区贡献丰富,包括多种集成插件和界面,如 Web 和桌面应用、Telegram 机器人、Obsidian 插件等。 7. 安装完后,确保 ollama 后台服务已启动(在 mac 上启动 ollama 应用程序,在 linux 上通过 ollama serve 启动),可通过 ollama list 确认。 大模型安全: 1. 通过对齐(指令调优)使语言模型更好理解人类意图并增加安全保障,可拆解为监督微调、获取 reward model 和强化学习调整输出分布两部分。 2. LLAMA2 专门使用安全有监督微调确保语言模型安全。 3. 强化学习通过引入人类反馈数据调整模型输出分布,使模型面对训练分布外数据时能拒绝不当回答。 4. 但 Alignment 并不足以防护所有安全问题,存在越狱(Jailbreak)情况,导致模型对齐失效。 5. 还需关注隐私问题。 大模型架构与特点: 1. 包括 encoderonly、encoderdecoder 和 decoderonly 三种架构,目前熟知的 AI 助手多为 decoderonly 架构。 2. 大模型预训练数据量大,来自互联网,参数多,如 Open 在 2020 年发布的 GPT3 已达 170B 参数。 3. GPT3 可根据任务描述和示例完成任务,ChatGPT 则通过对话完成任务,二者在形式和安全性上有差别。
2025-02-19
我想做一个产品(生涯规划领域的垂直大模型),这个产品服务的对象是所有人:帮助所有人进行更好的职业规划。每个人都能通过使用这个产品更好地了解自己,了解自己的天赋、兴趣、优势,然后找到自己的热爱的领域和热爱的事业,并且能够个性化地推荐相关的行业和职业,包括职业的主要工作内容和核心能力要求等等。 请对这个产品进行可行性分析,并给出产品的发展规划,别忘了给这个项目起一个名字。
以下是对您提出的生涯规划领域垂直大模型产品的可行性分析和发展规划,并为项目取名为“生涯智途”。 可行性分析: 1. 需求广泛:帮助人们进行职业规划是一个普遍存在的需求,涵盖了各个年龄段和职业阶段的人群。 2. 数据可用性:可以通过各种渠道收集大量与职业相关的数据,包括行业报告、职位描述、人才需求等。 3. 技术支持:当前大模型技术的发展为实现这样的产品提供了可能,能够处理和分析大量复杂的数据。 发展规划: 1. 数据收集与整理:广泛收集各类职业数据,建立丰富的数据库,确保数据的准确性和完整性。 2. 模型训练与优化:利用收集到的数据进行模型训练,不断优化模型,提高预测和推荐的准确性。 3. 功能开发: 个性化测评:开发能够准确评估用户天赋、兴趣、优势的功能模块。 精准推荐:根据用户的特点,提供个性化的行业和职业推荐,并详细介绍职业的工作内容和核心能力要求。 持续学习与更新:随着行业变化,及时更新数据和模型,以提供最新的职业信息。 4. 用户体验优化:设计简洁、易用的界面,提供良好的用户交互体验。 5. 市场推广:通过线上线下多种渠道进行推广,提高产品的知名度和用户覆盖面。 希望以上分析和规划对您有所帮助。
2025-02-18
请介绍一下如何使用AI进行PPT生成
以下是使用 AI 进行 PPT 生成的方法: 1. 利用闪击: 访问国内网站 https://ppt.isheji.com/?code=ysslhaqllp&as=invite ,无需魔法。 选择模板。 将准备的大纲转换成适配闪击的语法,可参考官方使用指南:https://zhuanlan.zhihu.com/p/607583650 。 点击文本转 PPT,并在提示框中选择确定,得到转换后的 PPT。 可在线编辑,但导出有会员限制。 2. 以爱设计为例: 导入大纲到工具生成 PPT,其他工具操作方式大同小异,基本基于 Markdown 语法的内容来完成 PPT 生成。 优化整体结构,按照公司要求自行优化字体、图片等元素,针对下载后的 PPT 可删改内容。 3. 结合 GPT4、WPS AI 和 chatPPT: 先让 GPT4 生成 PPT 大纲。 把大纲导入到 WPS 当中,启用 WPS AI 一键生成 PPT。 让 chatPPT 添加一些动画。 手动修改细节,如字体、事实性错误等。
2025-02-18
动漫制作中如何使用ai辅助工作
在动漫制作中使用 AI 辅助工作,大致流程如下: 1. 面临时间和金钱的双重压力,需找到适合的制作捷径。AI 目前主要是辅助工具,负责搞定图和片,其他部分仍依赖人工。 2. 效率至关重要。和视频相关的所有内容、资料都记录在飞书文档里。 3. 分工方面,有人负责前期的内容构思和脚本编写,有人主要负责图片、视频生成和视频剪辑。 4. Midjourney 提示词围绕皮克斯、迪士尼、3D 风格来写,例如:"a small white Chiense dragon,anthropomorphic,Smile with surprise,wearing a school uniform,looking at a blurry gift box in the foreground,super closeup shot,camera focus on his face,3D render,Unreal Engine,Pixar 3D style,blurry classroom scene,bright sunshinear 16:9niji 6",重点是"a small white Chiense dragon,anthropomorphic,3D render,Unreal Engine,Pixar 3D style",尺寸比例 16:9,模型选择 niji 6,其他根据需求调整。 5. 动画制作主要使用 Runway,因其控制笔刷有优势。
2025-02-18
哪一款AI 可以实现参考一张柱状图,使用我提供的数据,生成同样的柱状图
以下两款 AI 可以实现参考一张柱状图,使用您提供的数据生成同样的柱状图: 1. PandasAI:这是让 Pandas DataFrame“学会说人话”的工具,在 GitHub 已收获 5.4k+星。它并非 Pandas 的替代品,而是将 Pandas 转换为“聊天机器人”,用户可以以 Pandas DataFrame 的形式提出有关数据的问题,它会以自然语言、表格或者图表等形式进行回答。目前仅支持 GPT 模型,OpenAI API key 需自备。例如,输入“pandas_ai.run”,即可生成相关柱状图。链接:https://github.com/gventuri/pandasai 2. DataSquirrel:这是一款自动进行数据清理并可视化执行过程的数据分析工具,能帮助用户在无需公式、宏或代码的情况下快速将原始数据转化为可使用的分析/报告。目前平台提供的用例涵盖了 B2B 电子商务、人力资源、财务会计和调查数据分析行业。平台符合 GDPR/PDPA 标准。链接:https://datasquirrel.ai/
2025-02-18
deepseek使用小技巧
以下是关于 DeepSeek 使用的一些小技巧: 1. 高阶能力调用: 文风转换矩阵:包括作家风格移植(如“用鲁迅杂文风格写职场 PUA 现象”)、文体杂交(如“将产品说明书改写成《史记》列传格式”)、学术口语化(如“把这篇论文摘要翻译成菜市场大妈能听懂的话”)。 领域穿透技术。 2. 场景化实战策略:包括商业决策支持、创意内容生成、技术方案论证。 3. 效能增强技巧: 对话记忆管理:如上下文锚定(“记住当前讨论的芯片型号是麒麟 9010”)、信息回溯(“请复述之前确认的三个设计原则”)、焦点重置(“回到最初讨论的供应链问题”)。 输出质量控制:针对不同问题类型进行修正,如过度抽象(“请具体说明第三步操作中的温度控制参数”)、信息过载(“用电梯演讲格式重新组织结论”)、风格偏移(“回归商务报告语气,删除比喻修辞”)。 4. 特殊场景解决方案: 长文本创作:如分段接力法(“先完成故事大纲→逐章扩展→最后进行伏笔校验”)、逻辑粘合剂(“确保新章节与前文的三处细节呼应”)。 敏感内容处理:如概念脱敏法(“用经济学原理类比说明网络审查机制”)、场景移植法(“假设在火星殖民地讨论该议题”)。 5. 通用于任何大模型的提示词针对性技巧: 身份定位技巧:目的是让 AI 理解您的背景和专业水平,例如“作为一名刚入职的电商运营,需要为天猫美妆店铺制定 618 活动方案”。 场景描述技巧:提供具体的应用场景和限制条件,例如“为新上市的儿童智能手表写一篇朋友圈文案,目标用户是 25 35 岁的年轻父母,预算 3000 以内,需强调安全定位功能”。 结构化输出技巧:指定具体的输出格式和内容结构,例如“请用表格对比 2024 年 Q1 特斯拉、比亚迪的销量数据,包含以下维度:月度销量、同比增长、市场份额,并在表格下方总结三个关键发现”。 分步骤提问技巧:将复杂问题拆解为可管理的小任务,例如“请分三步指导新手做美食短视频:前期准备:需要哪些设备和技能 拍摄阶段:关键场景和机位选择 后期制作:剪辑节奏和音乐配合建议”。 反馈优化技巧:通过追问获得更精准的答案。 深度思考引导技巧:获得更深入的分析和见解。 6. 万能提示词:您是一名顶尖的提示词优化专家,请按以下步骤优化下方提示: 分析原提示的模糊性、冗余项和潜在歧义。 基于,重构提示结构(可参考 CRISPE/BROKE 框架)。 生成 3 个优化版本,并解释每版的改进逻辑。 7. 如果官网的搜索不能用,一直崩溃,可以用火山的满血版,在视频的最后 10 分钟左右有手把手教程。 8. 关于 DeepSeek 的论文解读,有直播视频回放和相关论文下载,如。
2025-02-18