Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

有哪些ai知识库

Answer

以下是一些常见的 AI 知识库:

  1. 通往 AGI 之路:这是一个由开发者、学者和有志人士等参与的学习社区和开源的 AI 知识库。在这里,您既是知识的消费者,也是知识的创作者。它不仅是一个知识库,还是连接学习者、实践者和创新者的社区,让大家在这里碰撞思想,相互鼓舞,一同成长。
  2. 华佗 GPT:https://www.huatuogpt.cn/ 华佗 GPT 是一款由 AI 驱动的医学知识库,是一个基于广泛的中文医学主料库训练的大型语言模型(LLM)的资源库。旨在通过 HuatuoGPT 为医疗咨询场景构建更专业的“ChatGPT”。
  3. MathGPT:https://math-gpt.org/
  4. AI-Scientist:https://github.com/SakanaAI/AI-Scientist The AI Scientist:Towards Fully Automated Open-Ended Scientific Discovery
  5. 扣子提供的知识库:大量知识分片,通过语义匹配,给模型补充知识。以车型数据为例,每个知识库的分段中,保存了一种车型的基础数据。当用户提问时,能匹配到对应车型的分段,然后模型从中获取到相关信息。
  6. 扣子提供的数据库:类似传统软件开发的数据库功能,以表格结构存储信息,通过 NoSQL 方式使用。目前提供的是关系型数据库,有多种应用场景。
  7. 扣子提供的 AI 便签:记录用户提交的便签,支持提交、查询操作,这些操作都是通过 NL2SQL 完成。
  8. 扣子提供的单词本:记录用户背过哪些单词,其中哪些单词还没有记住等。
Content generated by AI large model, please carefully verify (powered by aily)

References

知识库有什么|感谢银海 inhai

“我们都知道,探索知识善如磨刀,面对复杂多元的在人工智能(AGI)领域,如何打破条条框框,去捕捉每一丝有价值的信息和知识呢?那么我相信答案就是:通往AGI之路「WaytoAGI」,一个由开发者、学者和有志人士等等参与的学习社区和开源的AI知识库。在这里,你既是知识的消费者,也是知识的创作者。这个世界上有很多走走停停的探索者,所以,我们以"无弯路,全速前进"为目标,助力每一个怀揣AI梦想的人能疾速前行。每一份崭新的尝试都值得赞美,每一份坚毅的付出都应得到鼓励。AI知识库的生长正得益于每一个你平凡而坚持的时间,因为你们的一致肯定和支持,我们才充满信心,不断修炼,探寻AGI领域的无限可能。「通往AGI之路」不仅是一个知识库,它是连接学习者、实践者和创新者的社区,让大家在这里碰撞思想,相互鼓舞,一同成长。我们在共创计划的道路上,不断收获,快速成长。对于一切,我们都满怀期待,乐观向阳。继续坚持,信息世界中你我皆是探索者。感谢您对“通往AGI之路”的持续关注!通过举办的活动和分享,我们有幸获得了一些奖项和媒体报道,这一切都离不开大家的鼎力支持。我们深感荣幸,并期待在未来的旅程中,能够持续为大家带来更多、更好的内容。

AI4Science

|文本|链接|简介|附件||-|-|-|-||华佗GPT|[https://www.huatuogpt.cn/](https://www.huatuogpt.cn/)|华佗GPT(HuatuoGPT)是一款由AI驱动的医学知识库,是一个基于广泛的中文医学主料库训练的大型语言模型(LLM)的资源库。旨在通过HuatuoGPT为医疗咨询场景构建更专业的"ChatGPT“|||MathGPT|[https://math-gpt.org/](https://math-gpt.org/)||||[AI-Scientist](https://github.com/SakanaAI/AI-Scientist)|[https://github.com/SakanaAI/AI-Scientist](https://github.com/SakanaAI/AI-Scientist)|The AI Scientist:Towards Fully Automated<br>Open-Ended Scientific Discovery|||Manim|[https://www.manim.community/](https://www.manim.community/)|A community maintained Python library for creating mathematical animations.||

概述

扣子提供了以下几种方式来存储和记忆外部数据,这样Bot便可以使用这些外部数据来精准回复用户。知识库:是大量知识分片,通过语义匹配,给模型补充知识。以车型数据为例,每个知识库的分段中,保存了一种车型的基础数据。当用户问宝马X3的售价是多少?,能匹配到对应车型的分段,然后模型从中获取到售价信息。数据库:类似传统软件开发的数据库功能,以表格结构存储信息,通过NoSQL方式使用。目前提供的是关系型数据库,下面列举一些应用场景:AI便签:记录用户提交的便签,支持提交、查询操作,这些操作都是通过NL2SQL完成。单词本:记录用户背过哪些单词,其中哪些单词还没有记住等。

Others are asking
最近的ai趋势
以下是最近的 AI 趋势: 1. 技术创新方面: 大模型创新:架构优化加速涌现,融合迭代成为趋势。 Scaling Law 泛化:推理能力成为关键,推动计算和数据变革。 AGI 探索:视频生成引发关注,空间智能统一虚拟和现实。 2. 应用格局方面: 第一轮洗牌结束,聚焦 20 赛道 5 大场景。 多领域竞速,运营重要性大于技术,AI 助手竞争激烈。 AI+X 赋能类产品发展迅速,原生 AI 爆款难求。 多模态上马,Agent 席卷一切,高度个性化需求凸显。 变革生产力,重塑行业生态。 行业渗透率受数据基础和用户需求影响。 3. 产品设计和商业化方面: 从通用能力向专业化细分发展,如图像生成(Midjourney、Stable Diffusion 等)、视频制作(Pika、Runway 等)、音频处理等领域不断提升核心能力。 商业模式不断创新,如 ToB 市场深耕(如针对内容创作者的 ReadPo)、新型广告模式(如天宫搜索的“宝典彩页”)。 4. 行业大事记方面: 模型领域,DeepSeek 开源 R1 模型将大模型行业推进到推理时代,引发全球影响。 图像模型整体往更快、更便宜方向发展,AI 图像生成成为常用生产力工具。 视频模型底层架构无大变化,在细节优化上,如视频音效生成逐渐成为标配。
2025-04-15
AI如何促进企业增长,该从哪些层面入手
以下是关于 AI 促进企业增长及入手层面的相关内容: 1. 从宏观环境来看: 2024 年,AI 已在多个领域取得显著进展,其在推进人类知识方面的作用得到认可,如在物理学、化学的诺贝尔奖及图灵奖中有所体现。同时,企业对 AI 的投资在经历短暂放缓后反弹,新成立的生成式 AI 初创公司数量大幅增加,AI 已从边缘位置成为企业价值的核心驱动因素。 各国政府也在加大对 AI 的投入,出台相关政策和举措,推动 AI 发展。 2. 从监管层面来看: 适当的监管能激励企业在解决重要问题的同时控制风险,从而增加创新。例如,产品安全立法促进了更安全产品和服务的创新。 应采取基于情境、适度的监管方法,平衡风险与机会、效益,增强公众信任,促进 AI 应用。 3. 从企业自身来看: 启动试点项目以获取动能,选择易成功而非最具价值的项目,在 6 12 个月内展示成效,项目可内部或外包进行。 建立公司内部的 AI 团队,搭建集中统一的团队并选派人员协助各业务部门,方便统一管理。 构建全公司范围的平台,如软件平台、工具或数据基础设施,单个部门可能缺乏权限和资源完成此类平台建设。 提供广泛的 AI 培训,包括高层了解 AI 策略和资源分配,部门领导掌握项目方向设置、资源分配与进度监控,培养内部工程师开展相关工作。 制定 AI 策略,结合自身业务深度了解后制定,设置与 AI 良性循环一致的公司策略,如网络搜索或农业公司的案例。同时考虑创建数据策略,包括战略数据采集、构建统一数据仓库等。
2025-04-15
有AI硬件相关的内容吗
以下是为您提供的关于 AI 硬件的相关内容: 《2025 年 AI 指数报告,斯坦福.pdf》中包含对 AI 硬件演变情况的深入分析,以及对推理成本的新估计和 AI 出版与专利趋势的新分析等。 《Will's GenAI 硬件榜 2024 年 8 月》介绍了 GenAI 硬件的定义、榜单受众、标的、初心等。该榜单以北美市场的视角,基于销量和影响力,涵盖了如亚马逊销量等信息。本次更新包括了对亚马逊销量、独立站流量、新品发布、融资信息的更新,排序标准从媒体综合指数改为 Tiktok 热度,并完善了挂件、戒指、眼镜等分类榜数据。总共 15 个重要榜单,更多榜单可通过文末“阅读原文”免费访问或直接访问飞书链接:https://zw73xyquvv.feishu.cn/wiki/IqcqwTDiYiKttNktBg3cg8HgnLh 。数据来源包括 google、tiktok、twitter、亚马逊。对于榜单内容有疑问想交流的 GenAI 硬件创始人,或者想合作转载内容的公众号博主,可加微信或在本文末留言。
2025-04-15
用数据作图的ai软件有哪些
以下是一些用数据作图的 AI 软件: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,用户可通过拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,如逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 3. ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图创建,可与 Archi 工具配合使用,该工具提供图形化界面创建模型。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 6. draw.io(现称为 diagrams.net):免费的在线图表软件,允许创建各种类型图表,包括软件架构图,支持创建逻辑视图和部署视图等。 7. PlantUML:文本到 UML 的转换工具,通过编写描述性文本自动生成序列图、用例图、类图等,帮助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 9. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包括逻辑视图和部署视图。 此外,还有一些辅助或自动生成 CAD 图的 AI 工具: 1. CADtools 12:Adobe Illustrator 插件,为 AI 添加 92 个绘图和编辑工具。 2. Autodesk Fusion 360:集成了 AI 功能的云端 3D CAD/CAM 软件,能创建复杂几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,可根据用户输入的设计目标和约束条件自动生成 3D 模型。 5. 主流 CAD 软件(如 Autodesk 系列、SolidWorks 等)中的生成设计工具,可根据用户输入自动产生多种设计方案。 在 AI 绘图方面,目前市面上主流的有 Stable Diffusion 和 Midjourney。Stable Diffusion 开源免费、可本地化部署、创作自由度高,但需要较好电脑配置,尤其是显卡;Midjourney 操作简单方便,创作内容丰富,但需要科学上网且付费,每月费用约 200 多元。前期想要了解的可以试试 Stable Diffusion,具体安装方法可参考 B 站【秋葉 aaaki】的视频。
2025-04-15
用数据作图的ai
以下是为您整理的关于用数据作图的 AI 相关内容: 在 AI 绘画方面,其运行机制通常有三层。第一层是基础逻辑层,能完成风格迁移。第二层是数据库,需要大量“喂图”供 AI 深度学习,以获得不同图像参数范例。第三层是创造性输出,能产出符合文字描述且具美学逻辑的图像。例如在 AI 绘画服务中,存在爬取大量数据以供后续深度学习使用的情况。在美国版权法中,获取使用网络数据的行为在一定条件下被纳入合理使用范畴。我国虽未明确规定“转换性使用”概念,但司法实践中已有参考适用案例。然而,针对 AI 爬取网络数据的行为,实际上并不完全符合我国《著作权法》中对于合理使用的规定,且举证困难。 在教师使用 AI 小技巧方面,如生成关于特定问题的统计数据图,如“此前你是否使用过生成式 AI 大语言模型?”的柱状图或饼图,并标注数据比例。 在 UI 设计中,Midjourney 可生成相关图片,但可能存在不规范和文字混乱的情况,目前只能作为风格参考。网上已有不少 AI 生成的 UI 设计软件开始内测。
2025-04-15
公共议题:AI如何助力HR业务? 研讨目标: 深入理解:深入探讨 AI在人力资源管理领域的应用、薪酬管理、员工关系、公司文化、包括人才获取与配置、学习与发展、组织与人才培、HR共享与HRIS等各模块的可应用场景 机会识别与场景落地:基于组织现状,识别出业务价值高、可落地的 A 应用场景; 研讨成果(输出物): 请输出5个业务价值高、具备可行性的AI应用场景介绍,并说明what(场景是什么)、why(为什么值得做)、How(如何落地);
以下是 5 个业务价值高、具备可行性的 AI 应用场景介绍: 场景一:AI 在人才获取与配置中的应用 What:利用 AI 技术对求职者的简历和技能进行自动筛选和匹配,以快速找到最适合岗位的人才。 Why:节省招聘时间和成本,提高招聘效率和准确性,确保企业能够吸引到最合适的人才。 How:通过收集和分析大量的求职者数据,训练 AI 模型来识别关键技能和经验;将企业的岗位需求与求职者的简历进行智能匹配。 场景二:AI 在薪酬管理中的应用 What:借助 AI 分析市场数据和员工绩效,为企业提供合理的薪酬建议。 Why:确保薪酬公平合理,提高员工满意度,有助于吸引和留住优秀人才。 How:收集同行业薪酬数据和员工绩效数据,利用 AI 算法进行分析和预测;根据分析结果为企业制定个性化的薪酬方案。 场景三:AI 在员工关系管理中的应用 What:使用 AI 监测员工的情绪和满意度,及时发现问题并提供解决方案。 Why:改善员工工作体验,增强员工忠诚度,减少员工流失。 How:通过员工在工作中的交流、反馈等数据,运用自然语言处理技术分析员工情绪;根据分析结果采取相应的措施,如组织团队活动、提供心理支持等。 场景四:AI 在学习与发展中的应用 What:利用 AI 为员工提供个性化的培训课程和学习计划。 Why:提升员工的能力和绩效,促进员工的职业发展,适应企业的发展需求。 How:分析员工的技能水平和职业发展目标,利用 AI 推荐适合的学习资源和课程;跟踪员工的学习进度和效果,不断优化学习计划。 场景五:AI 在 HR 共享与 HRIS 中的应用 What:通过 AI 实现 HR 流程的自动化和智能化,如请假审批、福利申请等。 Why:提高 HR 工作效率,减少人工错误,提升服务质量。 How:将 HR 流程进行数字化和标准化,利用 AI 技术实现自动审批和处理;建立智能客服,解答员工常见的 HR 问题。
2025-04-15
搜索 waytoagi知识库,论文降重的提示词有哪些?
以下是一些关于论文降重的提示词相关信息: 提示词的重要性:与大语言模型对话基础认知是提示词,通过详细结构化的提示词能获得更优质的解释内容。 最佳实践中的提示词:最佳实践收录了很多写好的提示词,如李继刚老师将提示词玩到新高度,可复制使用,还能通过改变形成自己的见解和应用。 提示词的创作思路:李继刚老师会在 13 号带领大家学习提示词的创作思路。 提示词的应用场景:涵盖产品经理、工程、游戏等领域,可用提示词写游戏、做互动游戏等。 学习提示词的资源:包括方法论、论文精读、博主的 6 大策略、社区共学课程及直播回放等。 但需要注意的是,知识库中未直接提供专门针对论文降重的提示词,您可以参考上述通用的提示词相关知识,结合论文降重的需求进行灵活运用和创新。
2025-04-15
知识库怎么构建
构建知识库的方法主要有以下几种: 1. 使用 Flowith 构建: 选择“Manage Your Knowledge Base”,进入知识库管理页面。 点击左上角的加号添加新的知识库,为其起一个便于分辨的名字。 点击添加文件,建议使用 Markdown 格式的文件。 等待 Flowith 对文件进行抽取等处理,处理完毕后可在知识库管理页面测试检索。 2. 使用 Dify 构建: 准备数据:收集文本数据,进行清洗、分段等预处理。 创建数据集:在 Dify 中创建新数据集,上传准备好的文档并编写描述。 配置索引方式:根据需求选择高质量模式、经济模式或 Q&A 分段模式。 集成至应用:将数据集集成到对话型应用中,配置数据集的使用方式。 持续优化:收集用户反馈,更新知识库内容和优化索引方式。 3. 本地部署大模型并搭建个人知识库(涉及 RAG 技术): 了解 RAG 技术:大模型训练数据有截止日期,RAG 可通过检索外部数据并在生成步骤中传递给 LLM 来解决依赖新数据的问题。 RAG 应用的 5 个过程: 文档加载:从多种来源加载文档,如 PDF、SQL 等。 文本分割:把文档切分为指定大小的块。 存储:包括将文档块嵌入转换成向量形式,并将向量数据存储到向量数据库。 检索:通过检索算法找到与输入问题相似的嵌入片。 输出:将问题和检索出的嵌入片提交给 LLM 生成答案。 文本加载器:将用户提供的文本加载到内存中以便后续处理。
2025-04-15
如何搭建知识库
搭建知识库的方法如下: 使用 flowith 搭建: 选择“Manage Your Knowledge Base”,进入知识库管理页面。 点击左上角的加号添加新的知识库,给知识库起一个便于分辨的名字。 点击添加文件,建议使用 Markdown 格式的文件。 Flowith 会对文件进行抽取等处理,处理完毕后可在知识库管理页面测试检索。 使用 Dify 搭建: 准备数据:收集文本数据,进行清洗、分段等预处理。 创建数据集:在 Dify 中创建新数据集,上传准备好的文档并编写描述。 配置索引方式:提供三种索引方式,根据需求选择,如高质量模式、经济模式和 Q&A 分段模式。 集成至应用:将数据集集成到对话型应用中,配置数据集的使用方式。 持续优化:收集用户反馈,更新知识库内容和优化索引方式。 使用 Coze 智能体搭建: 手动清洗数据: 在线知识库:点击创建知识库,创建 FAQ 知识库,选择飞书文档,输入区分问题和答案,可编辑修改和删除,添加 Bot 并在调试区测试效果。 本地文档:注意拆分内容,提高训练数据准确度,按章节进行人工标注和处理,然后创建自定义清洗数据。 发布应用:点击发布,确保在 Bot 商店中能搜到。
2025-04-14
如何搭建自己的知识库
以下是搭建自己知识库的方法: 1. 选择“Manage Your Knowledge Base”,进入知识库管理页面。 2. 在页面左上角点击加号,添加新的知识库,并为其起一个易于分辨的名字。 3. 点击添加文件,建议使用 Markdown 格式的文件。 4. 等待 Flowith 对文件进行抽取等处理。 5. 处理完毕后,可在知识库管理页面测试检索,输入关键词过滤相关内容。 此外,搭建本地知识库还需了解 RAG 技术: 1. RAG 是一种当需要依靠不包含在大模型训练集中的数据时所采用的主要方法,即先检索外部数据,然后在生成步骤中将这些数据传递给 LLM。 2. 一个 RAG 的应用包括文档加载、文本分割、存储、检索和输出 5 个过程。 文档加载:从多种不同来源加载文档,LangChain 提供了 100 多种不同的文档加载器。 文本分割:把 Documents 切分为指定大小的块。 存储:将切分好的文档块进行嵌入转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库。 检索:通过某种检索算法找到与输入问题相似的嵌入片。 输出:把问题以及检索出来的嵌入片一起提交给 LLM,生成更合理的答案。 对于基于 GPT API 搭建定制化知识库,涉及给 GPT 输入定制化的知识。由于 GPT3.5 一次交互支持的 Token 有限,OpenAI 提供了 embedding API 解决方案。Embeddings 是一个浮点数字的向量,两个向量之间的距离衡量它们的关联性,小距离表示高关联度。在 OpenAI 词嵌入中,靠近向量的词语在语义上相似。文档上有创建 embeddings 的示例。
2025-04-14
我想做一个,基于我个人知识库的chatbot,以供我随时搜索和提问,且优先搜索知识库内的内容而非联网搜索,你有什么建议吗?
以下是为您提供的关于创建基于个人知识库的 chatbot 的建议: 1. 选择合适的平台和工具:例如可以考虑使用飞书智能伙伴创建平台(Aily)或扣子(https://www.coze.cn/home)等。 2. 数据分段储存:由于大模型的上下文长度有限制,需要将上传的资料根据特定符号或字符长度进行分段,如将 8000 字文档按每 800 字分成一个片段储存。 3. 增强检索:当用户输入问题,大模型会根据相似度检索出若干最相关的数据片段,再据此生成答案,这一技术称为 RAG(检索增强生成)。 4. 配置知识库: 在 Bot 内使用知识库: 登录相关平台。 在左侧导航栏的工作区区域,选择进入指定团队。 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 (可选)添加知识库后,可以在自动调用下拉界面内,调整知识库的配置项,如最大召回数量、最小匹配度、调用方式等。 在工作流内使用 Knowledge 节点: 登录相关平台。 在左侧导航栏的工作区区域,选择进入指定团队。 在页面顶部进入工作流页面,并打开指定的工作流。 在左侧基础节点列表内,选择添加 Knowledge 节点。 5. 注意使用限制:单用户最多创建 1000 个知识库,文本类型知识库下最多支持添加 100 个文档,单用户每月最多新增 2GB 数据,累计上限是 10GB。 此外,知识库可以解决大模型幻觉、专业领域知识不足的问题,提升大模型回复的准确率。您可以将知识库直接与 Bot 进行关联用于响应用户回复,也可以在工作流中添加知识库节点,成为工作流中的一环。
2025-04-14
搭建在线知识库,在线客服
以下是关于搭建在线知识库和在线客服的相关内容: RAG 流程: 自顶向下,RAG 的流程分为离线数据处理和在线检索两个过程。 离线数据处理的目的是构建知识库,知识会按照某种格式及排列方式存储在其中等待使用。 在线检索是利用知识库和大模型进行查询的过程。 以构建智能问答客服为例,了解 RAG 流程中的“是什么”与“为什么”同等重要。 创建智能体: 手动清洗数据创建知识库: 点击创建知识库,创建画小二课程的 FAQ 知识库。 知识库的飞书在线文档中,每个问题和答案以“”分割。 选择飞书文档、自定义,输入“”,可编辑修改和删除。 点击添加 Bot,可在调试区测试效果。 本地文档: 注意拆分内容以提高训练数据准确度。 以画小二课程为例,先放入大章节名称内容,再按固定方式细化处理每个章节。 发布应用:点击发布,确保在 Bot 商店中能搜到。 开发:GLM 等大模型外接数据库: 项目启动:包括 web 启动(运行 web.py,显存不足调整模型参数,修改连接)、API 模式启动、命令行模式启动。 上传知识库:在左侧知识库问答中选择新建知识库,可传输 txt、pdf 等。可以调整 prompt,匹配不同的知识库,让 LLM 扮演不同的角色,如上传公司财报充当财务分析师、上传客服聊天记录充当智能客服等。MOSS 同理。
2025-04-13