Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何构建企业AI知识库

Answer

构建企业 AI 知识库可以参考以下步骤:

  1. 结合企业私有数据与 RAG 模型的私有化部署。如有特殊需求,还可以进行模型的 Fine-tuning(微调),以优化性能。基础模型负责提供推理提示,RAG 用于整合新知识,实现快速迭代和定制化信息检索。
  2. 确定功能范围,包括编写【prompt】提示词,设定 Bot 的身份和目标。
  3. 创建【知识库】:
    • 整理“关键字”与“AI 相关资料链接”的对应关系,并将信息存储起来。
    • 选择创建知识库路径,如个人空间-知识库-创建知识库。
    • 支持的知识库文档类型包括本地文档、在线数据、飞书文档、Notion 等,可根据需求选择,如本次使用【本地文档】。
    • 按照操作指引上传文档、分段设置、确认数据处理。
    • 小技巧:知识库的好用程度与内容切分粒度有关,可以在内容中加上特殊分割符,如“###”,便于自动切分数据。分段标识符号选择“自定义”,内容填“###”。如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮进行相应操作。

在构建过程中,Know-How 很重要,同时工作流不必复杂,能实现目的即可,所以在设计 Bot 前“确定目的”和“确定功能范围”很关键。

Content generated by AI large model, please carefully verify (powered by aily)

References

开发:AI应用大模型商业化落地现状与思考

第四个部分我想分享一些有关商业化落地的经验。在商业化过程中,构建企业知识库是最常见的需求之一。一种普遍的解决方案是结合企业私有数据与RAG模型的私有化部署。如有特殊需求,我们还可以进行模型的Fine-tuning(微调),以优化性能。基础模型主要负责提供推理提示,而RAG则用于整合新知识,实现快速迭代和定制化信息检索。通过Fine-tuning,我们可以增强基础模型的知识库,调整输出,并教授更复杂的指令,从而提高模型的整体性能和效率。这样的联合应用通常能带来最佳性能,适用于多数企业的需求。而在这个过程中,Know-How很重要!

「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人

[heading5]3)创建【知识库】,整理“关键字”与“AI相关资料链接”的对应关系,并将信息存储起来。创建知识库路径:个人空间-知识库-创建知识库知识库文档类型支持:本地文档、在线数据、飞书文档、Notion等,本次使用【本地文档】按照操作指引上传文档、分段设置、确认数据处理。💡小技巧:知识库好不好用,跟内容切分粒度有很大关系,我们可以在内容中加上一些特殊分割符,比如“###”,以便于自动切分数据。分段标识符号要选择“自定义”,内容填“###”。最终的知识库结果如下,同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。[heading5]4)创建【工作流】,告诉AI机器人应该按什么流程处理信息。[content]创建工作流路径:个人空间-工作流-创建工作流“AI前线”Bot的工作流最终结果如上,本次只用到了“知识库”进行处理。工作流设计好后,先点击右上角“试运行”,测试工作流无误后,就可以点击发布啦。如果任务和逻辑复杂,可以结合左边“节点”工具来实现。比如:可以在工作流中再次调用【大模型】,总结分析知识库内容;可以调用【数据库】存储用户输入的信息;可以调用【代码】来处理复杂逻辑等等;💡个人建议:工作流不必复杂,能实现目的即可,所以在设计Bot前“确定目的”和“确定功能范围”很重要。

「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人

[heading5]3)创建【知识库】,整理“关键字”与“AI相关资料链接”的对应关系,并将信息存储起来。创建知识库路径:个人空间-知识库-创建知识库知识库文档类型支持:本地文档、在线数据、飞书文档、Notion等,本次使用【本地文档】按照操作指引上传文档、分段设置、确认数据处理。💡小技巧:知识库好不好用,跟内容切分粒度有很大关系,我们可以在内容中加上一些特殊分割符,比如“###”,以便于自动切分数据。分段标识符号要选择“自定义”,内容填“###”。最终的知识库结果如下,同一颜色代表同一个数据段,如果内容有误需要编辑,可以点击具体内容,鼠标右键会看到“编辑”和“删除”按钮,可以编辑或删除。[heading5]4)创建【工作流】,告诉AI机器人应该按什么流程处理信息。[content]创建工作流路径:个人空间-工作流-创建工作流“AI前线”Bot的工作流最终结果如上,本次只用到了“知识库”进行处理。工作流设计好后,先点击右上角“试运行”,测试工作流无误后,就可以点击发布啦。如果任务和逻辑复杂,可以结合左边“节点”工具来实现。比如:可以在工作流中再次调用【大模型】,总结分析知识库内容;可以调用【数据库】存储用户输入的信息;可以调用【代码】来处理复杂逻辑等等;💡个人建议:工作流不必复杂,能实现目的即可,所以在设计Bot前“确定目的”和“确定功能范围”很重要。

Others are asking
AI教育创新机构
以下是关于 AI 教育创新机构的相关信息: 在已结束的 AI 创客松活动中,存在不同的组别。其中,组别 8 为 AI 教育创新者,组员包括姚欧强ᶜᵘᶜ、邱运、珊若、在路上、Zima,建议项目是开发针对不同教育阶段的 AI 应用,结合科学研究成果,提升教育质量和效率。 北京市新英才学校的师生用生成式 AI 做了很多事情,如跨学科项目老师带着学生用 AIGC 做学校地图桌游,英语老师在 AIGC 帮助下备课和授课,生物和信息科技老师合作带着学生用训练 AI 模型识别植物。数字与科学中心 EdTech 跨学科小组组长魏一然深入参与其中,学校领导层重视人工智能教育发展,给予很大自由空间,目前还在探索初级阶段,但有一定经验和成果。 6 月 11 日的 AI 秒学团队期待与更多相关人员和机构合作,共同推动儿童教育的创新和发展。
2025-01-23
AI在土木工程领域的应用
AI 在土木工程领域有以下应用: 1. 绘图方面:存在一些 AI 工具和插件可以辅助或自动生成 CAD 图,例如 CADtools 12(Adobe Illustrator 插件,添加 92 个绘图和编辑工具)、Autodesk Fusion 360(集成 AI 功能的云端 3D CAD/CAM 软件)、nTopology(基于 AI 的设计软件,帮助创建复杂 CAD 模型)、ParaMatters CogniCAD(基于 AI 的 CAD 软件,根据输入自动生成 3D 模型),一些主流 CAD 软件如 Autodesk 系列、SolidWorks 等也提供基于 AI 的生成设计工具。但使用这些工具通常需要一定的 CAD 知识和技能,初学者建议先学习基本建模技巧。 2. 交通方面:可用于交通管理,优化交通信号灯和交通流量,缓解交通拥堵。 3. 物流配送方面:能够优化物流路线和配送计划,降低运输成本。 4. 教育方面:用于个性化学习,为学生提供定制化学习体验。 5. 农业方面:分析农田数据,提高农作物产量和质量。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-23
AI绘画风格网站
以下是一些常见的 AI 绘画风格网站及相关风格介绍: MewXAI(https://www.mewxai.cn/):这是一款强大且新手友好、操作简单的 AI 绘画创作平台。其功能包括: MX 绘画:拥有众多超火模型和上百种风格,支持文生图、图生图。 MX Cute:自研的可爱风动漫大模型,在某些风格场景下可媲美当下最火的 NJV5 模型。 MJ 绘画:创意度和想象力极高,适用于多种创作需求。 边缘检测:对草图上色,有多种渲染风格可选。 室内设计:上传空间图,一键完成多种不同风格的室内/建筑设计。 姿态检测:精准控制人物动作,可生成单人或多人姿势。 AI 艺术二维码:几秒内创建令人惊叹的下一代艺术二维码。 AI 艺术字:将光影文字、隐藏文字、艺术字融入作品。 常见的 AI 绘画风格有: 像素艺术(Pixel art) 当代写实主义(Contemporary Realism) 纪实的(NonFiction) 同步性(Synchronism) 建构主义(Constructivism) 超现实主义(surreal,hyperrealistc) 未来主义(futuristic) ww3 风格 适合科幻场景的幻想风格(fantasy) 科幻的(Fiction) 科幻(Science Fiction) 赛博朋克(cyber punk) 概念艺术(concept art) 超现实主义(Hyperrealistic) 黑暗奇幻(Dark Fantasy) 飘渺奇幻(Ethereal Fantasy) 宫崎骏风格(studio Ghibli) 山水画(landscape) A 站趋势风格(Trending on artsation) 超现实风格(surrealism) 油画风格(oil painting) 原画风格(Original) 赛博朋克风格(Cyberpunk) 后印象主义风格(postimpressionism) 废土风格(Wasteland Punk) 数字雕刻风格(digitally engraved) 建筑设计风格(architectural design) 海报风格(poster style) 东方山水画(Tradition Chinese Ink Painting) 浮世绘(Japanese Ukiyoe) 日本漫画风格(Manga style) 童话故事书插图风格(stock illustration style) 梦工厂动画风格(CGSociety、DreamWorks Pictures) 皮克斯(Pixar) 时尚(Fashion) 日本海报风格(poster of Japanese graphic design) 90 年代电视游戏(90s video game) 法国艺术(french art) 包豪斯(Bauhaus) 日本动画片(Anime) 像素画(卜绘 and Pixel Art) 古典风(Vintage,1819 世纪) 黑白电影时期(Pulp Noir) 乡村风格(Country style) 抽象风(Abstract) 印刷风(risograph iso) 设计风(Graphic)
2025-01-22
我该如何使用AI提示词
以下是关于如何使用 AI 提示词的详细介绍: 1. 什么是提示词: 提示词用于描绘您想要的画面。 输入语言方面,星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),且支持中英文输入。 启用提示词优化后,能帮您扩展提示词,更生动地描述画面内容。 2. 如何写好提示词: 预设词组:小白用户可以点击提示词上方官方预设词组进行生图,提示词内容应准确,包含人物主体、风格、场景特点、环境光照、画面构图、画质等,比如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可以帮助 AI 理解我们不想生成的内容,比如:不好的质量、低像素、模糊、水印。 利用“加权重”功能:可在功能框增加提示词,并进行加权重调节,权重数值越大,越优先,也可对已有的提示词权重进行编辑。 辅助功能:包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 3. 编写提示词的建议: 明确任务:清晰定义任务,如写故事时包含背景、角色和主要情节。 提供上下文:若任务需特定背景知识,在提示词中提供足够信息。 使用清晰语言:尽量简单、清晰,避免模糊或歧义词汇。 给出具体要求:明确格式或风格要求。 使用示例:如有特定期望结果,提供示例。 保持简洁:简洁明了,避免过多信息。 使用关键词和标签:帮助 AI 理解任务主题和类型。 测试和调整:生成文本后检查结果,根据需要调整。 4. 对 AI 的认识: 基于 AI“似人”的一面,要接受其存在的“不稳定性”,可能会学习人类思维磨洋工、乱搞、不执行,需要教育、监督、鞭策。 不能期待设计一个完美的提示词就得到完美答案,给到 AI 的提示词实际上是一个相对完善的“谈话方案”,真正的成果需要在对话中产生,并在对话中限缩自己思维中的模糊地带。
2025-01-22
分析英文期刊论文的ai有哪些?哪个好用?
以下是一些可用于分析英文期刊论文的 AI 工具: 1. 文献管理和搜索: Zotero:结合 AI 技术,能自动提取文献信息,便于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,可提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:通过 AI 技术进行文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,方便进行数据分析和可视化。 Knitro:用于数学建模和优化的软件,有助于复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化论文编写。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:通过与已发表作品比较,检测潜在抄袭问题。 此外,以下是一些常见的文章润色 AI 工具: 1. Wordvice AI:集校对、改写转述和翻译等功能于一体,基于大型语言模型提供全面的英文论文润色服务。 2. ChatGPT:由 OpenAI 开发的大型语言模型,可用于多方面写作辅助。 3. Quillbot:人工智能文本摘要和改写工具,可用于快速筛选和改写文献资料。 4. HyperWrite:基于 AI 的写作助手和大纲生成器,可帮助写作前进行头脑风暴和大纲规划。 5. Wordtune:AI 驱动的文本改写和润色工具,优化文章语言表达。 6. Smodin:提供 AI 驱动的论文撰写功能,可生成符合要求的学术论文。 在 AI 文章排版工具方面: 1. Grammarly:不仅是语法和拼写检查工具,还提供排版功能,改进文档风格和流畅性。 2. QuillBot:AI 驱动的写作和排版工具,改进文本清晰度和流畅性。 3. Latex:广泛用于学术论文排版的软件,使用标记语言描述格式,有许多 AI 辅助的编辑器和插件简化排版过程。 4. PandaDoc:文档自动化平台,使用 AI 帮助创建、格式化和自动化文档生成,适合商业和技术文档。 5. Wordtune:重新表述和改进文本,使其更清晰专业。 6. Overleaf:在线 Latex 编辑器,提供丰富模板和协作工具,适合学术写作和排版。 选择合适的工具取决于您的具体需求,如文档类型、出版标准和个人偏好。对于学术论文,Latex 和 Overleaf 通常是受欢迎的选择;对于一般文章和商业文档,Grammarly 和 PandaDoc 等可能更适用。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-01-22
你这里有AI报告的合集吗
以下是为您提供的部分 AI 报告合集: 2024 年 5 月 9 日: 《》 《》 《》 《》 《》 2023 年 11 月 15 日: 《》 《》 《》 2024 年 12 月 23 日: 《 Fastdata 极数:《》 《》 清华大学五道口金融学院:《》 国盛证券:《》 托尼·布莱尔全球变化研究所:《》 腾讯云:《》 您可以在以下链接查看更多详细内容:
2025-01-22
本地怎么构建知识库
以下是关于本地构建知识库的详细步骤和相关知识: 一、硬件配置要求 运行大模型需要较高的机器配置,个人玩家可能负担不起。 生成文字大模型: 最低配置:8G RAM + 4G VRAM 建议配置:16G RAM + 8G VRAM 理想配置:32G RAM + 24G VRAM(如果要跑 GPT3.5 差不多性能的大模型) 生成图片大模型(比如跑 SD): 最低配置:16G RAM + 4G VRAM 建议配置:32G RAM + 12G VRAM 生成音频大模型: 最低配置:8G VRAM 建议配置:24G VRAM 二、RAG 技术 利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用。在进行本地知识库的搭建实操之前,需要先对 RAG 有大概的了解。 RAG 是指检索增强生成(Retrieval Augmented Generation),当需要依靠不包含在大模型训练集中的数据时,通过以下 5 个过程实现: 1. 文档加载(Document Loading):从多种不同来源加载文档。LangChain 提供了 100 多种不同的文档加载器,包括 PDF 在内的非结构化的数据、SQL 在内的结构化的数据,以及 Python、Java 之类的代码等。 2. 文本分割(Splitting):文本分割器把 Documents 切分为指定大小的块。 3. 存储:涉及将切分好的文档块进行嵌入(Embedding)转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。 5. Output(输出):把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。 三、本地知识库搭建步骤 如果想要对知识库进行更加灵活的掌控,需要一个额外的软件:AnythingLLM。 1. 安装 AnythingLLM 安装地址:https://useanything.com/download 安装完成后,会进入到其配置页面,主要分为三步: 第一步:选择大模型 第二步:选择文本嵌入模型 第三步:选择向量数据库 2. 构建本地知识库 AnythingLLM 中有一个 Workspace 的概念,可以创建自己独有的 Workspace 跟其他的项目数据进行隔离。 首先创建一个工作空间。 上传文档并且在工作空间中进行文本嵌入。 选择对话模式。AnythingLLM 提供了两种对话模式: Chat 模式:大模型会根据自己的训练数据和上传的文档数据综合给出答案。 Query 模式:大模型仅仅会依靠文档中的数据给出答案。 测试对话:当上述配置完成之后,就可以跟大模型进行对话了。 四、写在最后 “看十遍不如实操一遍,实操十遍不如分享一遍”。如果对 AI Agent 技术感兴趣,可以联系作者或者加作者的免费知识星球(备注 AGI 知识库)。
2025-01-22
如何搭建定制知识库
以下是关于如何搭建定制知识库的相关内容: 要搭建基于 GPT API 的定制化知识库,需要给 GPT 输入定制化的知识。但 GPT3.5(即当前免费版的 ChatGPT)一次交互支持的 Token 数量有限,约 4096 个,相当于 3000 个单词或 2300 个汉字,容量对于多数领域知识不够。为处理大量领域知识,OpenAI 提供了 embedding API 解决方案,可参考 OpenAI embedding documents。 embeddings 是浮点数字的向量(列表),两个向量之间的距离衡量它们的关联性,小距离表示高关联度,大距离表示低关联度。向量是用一串数字表示大小和方向的量,在计算机科学和数据科学中通常用列表表示。向量之间的距离是度量相似性的方法,常见的如欧几里得距离。在 OpenAI 词嵌入中,靠近的向量词语在语义上相似。 LlamaIndex 是更高一层 LangChain 的抽象,之前叫 GPT Index。之前的文章中的例子使用了 LlamaIndex 包,它简化了 LangChain 对文本分割和查询的接口,并提供了更丰富的 Data Connector。LlamaIndex 只针对 GPT Model 做 Index,而 LangChain 可对接多个 LLMs,可扩展性更强。参考 https://gptindex.readthedocs.io/en/latest/ 在基于大模型+知识库的 Code Review 实践中,对于自定义知识库飞书文档(自定义),没有格式要求,能看懂正确代码即可。可直接使用 LangChain 提供的文档加载类,对有权限的飞书文档进行获取,使用 CharacterTextSplitter/RecursiveCharacterTextSplitter 将文本分割成固定长度的块(chunks),方法有两个主要参数:chunk_size 控制每个块的长度,如设置为 1024,则每个块包含 1024 个字符;chunk_overlap 控制相邻两个块之间的重叠长度,如设置为 128,则每个块会与相邻块重叠 128 个字符。 因为大模型有足够多的数据,想让大模型按要求执行就需要用到“Prompt 提示词”。 最近各家大厂接连放大招,AI 技术和应用突飞猛进,GPT4 接口已支持最大 32K 输入,AI 的开发和使用门槛会越来越低。垂直领域知识库的搭建和优化可能更多是业务问题,而非技术问题。
2025-01-22
如何搭建私人知识库
搭建私人知识库可以参考以下方法: 1. 基于 GPT 搭建: 给 GPT 输入(投喂)定制化的知识,但 GPT3.5(即当前免费版的 ChatGPT)一次交互(输入和输出)只支持最高 4096 个 Token,约等于 3000 个单词或 2300 个汉字,容量对于绝大多数领域知识不够。 OpenAI 提供了 embedding API 解决方案,embeddings 是一个浮点数字的向量(列表),两个向量之间的距离衡量它们的关联性,小距离表示高关联度,大距离表示低关联度。 将大文本拆分成若干个小文本块(chunk),通过 embeddings API 将小文本块转换成 embeddings 向量,在一个地方(向量储存库)中保存这些 embeddings 向量和文本块,当用户提出问题时,将问题先通过 embeddings API 转换成问题向量,然后与向量储存库的所有文本块向量比对,查找距离最小的几个向量,把这几个向量对应的文本块提取出来,与原有问题组合成为新的 prompt(问题/提示词),发送给 GPT API。 2. 本地部署大模型搭建: 利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用,在进行本地知识库的搭建实操之前,需要先对 RAG 有大概的了解。 RAG 的应用包括文档加载(从多种不同来源加载文档,LangChain 提供了 100 多种不同的文档加载器)、文本分割(把 Documents 切分为指定大小的块)、存储(将切分好的文档块进行嵌入转换成向量的形式,并将 Embedding 后的向量数据存储到向量数据库)、检索(通过某种检索算法找到与输入问题相似的嵌入片)、Output(把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案)。 文本加载器就是将用户提供的文本加载到内存中,便于进行后续的处理。
2025-01-22
我是一名数据产品经理,想转行ai产品经理,该从哪里入手。你的知识库里有哪些可以帮到我。最好把他们列举出来,具体一些最好有步骤
以下是为您整理的从数据产品经理转行 AI 产品经理的相关知识和建议: 一、AIPM 技能树 1. 理解产品核心技术 了解基本的机器学习算法原理,有助于做出更合理的产品决策。 2. 与技术团队有效沟通 掌握一定的算法知识,减少信息不对称带来的误解。 3. 评估技术可行性 在产品规划阶段,能更准确地判断某些功能的技术可行性。 4. 把握产品发展方向 了解算法前沿,更好地把握产品的未来发展方向。 5. 提升产品竞争力 发现产品的独特优势,提出创新的产品特性。 6. 数据分析能力 掌握相关知识,提升数据分析能力。 二、AI 提示词工程师岗位技能要求 1. 学历和专业背景 本科及以上学历,计算机科学、人工智能、机器学习相关专业背景。 2. 熟悉 AI 工具 熟悉 ChatGPT、Llama、Claude 等 AI 工具的使用及原理,并具有实际应用经验。 熟练掌握 ChatGPT、Midjourney 等 AI 工具的使用及原理。 3. 项目经验 负责制定和执行 AI 项目,如 Prompt 设计平台化方法和模板化方法。 4. 技术理解 了解并熟悉 Prompt Engineering,包括常见的 Prompt 优化策略(例如 CoT、Fewshot 等)。 5. 数据分析与决策 对数据驱动的决策有深入的理解,能够基于数据分析做出决策。 6. 创新思维 具有创新思维,能够基于业务需求提出并实践 AI first 的解决方案。 7. 技术关注 对 AI 技术与算法领域抱有强烈的好奇心,并能付诸实践。 对 AIGC 领域有深入的理解与实际工作经验,保持对 AI 技术前沿的关注。 8. 编程能力 具备一定的编程和算法研究能力,能应用新的 AI 技术和算法于对话模型生成。 具有一定的编程基础,熟练使用 Python、Git 等工具。 三、AI 市场与 AI 产品经理分析 当前有两个场景: 1. 企业(包括传统企业和互联网企业)如何实现 AI 转型或用好 AI。 2. 产品经理如何转型 AI 产品经理。 希望以上内容对您有所帮助。
2025-01-21
适合小白的AI知识库
以下是适合小白的 AI 知识库内容: 通识篇: 现有常见 AI 工具小白扫盲: 文章链接: 视频链接:(1 小时 32 分开始) 适用人群:对 AI 都没太多概念的纯纯小白 简要说明:给与 AI 之间有道墙、还在墙外的人简单介绍当前各种 AI 工具、0 成本最快速感受当下 AI 工具的力量 AI 常见名词、缩写解释: 文章链接: 适用人群:对 AI 都没太多概念的纯纯小白 简要说明:给看不懂“黑话”和诸多缩写的小白,请善用这张表+多问 AI 对话工具(如豆包 or Kimi)结合食用 工具入门篇: (Prompt)现成好用的 Prompt: 文章链接: 适用人群:完全没有 AI 使用经验,只下载过 kimi、豆包、chatgpt 一类对话软件的小白 简要说明:想直接拿好用的提示词拿来用用的小伙伴,可以从这里开始,有很多可以直接复制、粘贴的优秀 prompt 案例,它们都有完整的结构。 (AI Agent)Agent 工具 小白的 Coze 之旅: 文章链接: 视频链接:Coze 之旅 1.0: 适用人群:完全没有编程基础,但对 AI 已有一点概念的小白 简要说明:为纯粹小白补的分享 AI AGENT 搭建平台,为什么是它、怎么 30 分钟就能开始用它 (AI Pic)现在主流的 AI 绘图工具网站: 文章链接: 适用人群:完全没接触过 AI 出图、只是听说过的小伙伴 简要说明:为纯粹的小白提供一个工具列表和扫盲 (AI Tools)数据工具 多维表格小白之旅: 文章链接: 视频链接: 适用人群:Excel 重度使用者、手动数据处理使用者、文件工作者 简要说明:用表格 + AI 进行信息整理、提效、打标签,满足 80%数据处理需求 (AI Code)编程工具 Cursor 的小白试用反馈: 文章链接: 适用人群:0 编程经验、觉得编程离我们很遥远的小白 简要说明:通过 AI 工具对编程祛魅,降低技术壁垒 (AI Music)音乐工具 Suno 的小白探索笔记: 文章链接: 适用人群:0 乐理知识、觉得作词作曲和我们毫不相关成本巨大的小白 简要说明:AI 赋能音乐创作,无需乐理知识即可参与音乐制作
2025-01-20
从0到1搭建知识库
从 0 到 1 搭建知识库的方法如下: 【智能体】让 Coze 智能体机器人连上微信和微信群: 创建智能体: 知识库:本次创建知识库使用手动清洗数据,上节课程是自动清洗数据。自动清洗数据会出现目前数据不准的情况,本节视频就尝试使用手动清洗数据,提高数据的准确性。 在线知识库:点击创建知识库,创建一个画小二课程的 FAQ 知识库。知识库的飞书在线文档,其中每个问题和答案以分割,暂时不要问为什么。选择飞书文档、自定义的自定义,输入,然后就将飞书的文档内容以区分开来,这里可以点击编辑修改和删除。点击添加 Bot,添加好可以在调试区测试效果。 本地文档:本地 word 文件,注意如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面。画小二这个课程 80 节课程,分为了 11 个章节,不能一股脑全部放进去训练。正确的方法是首先将 11 章的大的章节名称内容放进来,章节内详细内容格式依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理,然后选择创建知识库自定义清洗数据。 发布应用:点击发布,确保在 Bot 商店中能够搜到。 使用 Dify 构建知识库: 准备数据:收集需要纳入知识库的文本数据,包括文档、表格等格式。对数据进行清洗、分段等预处理,确保数据质量。 创建数据集:在 Dify 中创建一个新的数据集,并将准备好的文档上传至该数据集。为数据集编写良好的描述,描述清楚数据集包含的内容和特点。 配置索引方式:Dify 提供了三种索引方式供选择:高质量模式、经济模式和 Q&A 分段模式。根据实际需求选择合适的索引方式,如需要更高准确度可选高质量模式。 集成至应用:将创建好的数据集集成到 Dify 的对话型应用中,作为应用的上下文知识库使用。在应用设置中,可以配置数据集的使用方式,如是否允许跨数据集搜索等。 持续优化:收集用户反馈,对知识库内容和索引方式进行持续优化和迭代。定期更新知识库,增加新的内容以保持知识库的时效性。 【知识库】FastGPT + OneAPI + COW 带有知识库的机器人: 创建知识库应用: 地址输入浏览器:http://这里替换为你宝塔左上角的那一串:3000/ 进入后,点击应用并创建,选择 qwen 模型。 创建知识库。点击知识库 选择 qwen Embedding 1 点击确认创建。 上传文件,等待处理,最后文本状态是“已就绪”。 回到刚刚创建的应用,关联上创建的知识库。 点击两个发布。之前第一个叫做保存。 点击新建,创建 key。创建后保存同时将 API 根地址最后加上/v1 并保存下来。 安装并接入 cow: 回到宝塔,打开【终端】。 依次粘贴并回车:cd/root 。 git clone https://github.com/zhayujie/chatgptonwechat ,注意一定要粘贴完整。 出现下方的样子,就是成功了。如果失败,或者没反应,刷新一下,重新再试一次。 继续一行一行,依次输入:cd chatgptonwechat/ ,pip install r requirements.txt 。 等待执行完成,继续粘贴:pip install r requirements optional.txt 。 上边的都执行完成后,到“文件”菜单中去执行,点击文件 找到 root,进入 root 文件夹,找到 chatgpt on wechat 文件夹,并进入。
2025-01-19
我能否借助开源社区力量构建高质量的 AI 数字人
您可以借助开源社区力量构建高质量的 AI 数字人。 构建数字人的躯壳有多种方式: 1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,代表是 Live2D Cubism。 2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高,代表是 UE、Unity、虚幻引擎 MetaHuman 等,但个人学习在电脑配置和学习难度上有一定门槛。 3. AIGC:省去建模流程直接生成数字人的展示图片,但存在算法生成的数字人很难保持 ID 一致性、帧与帧连贯性差等弊端。如果对人物模型真实度要求不高,可以使用,典型项目有 wav2lip、videoretalking 等。AIGC 还有直接生成 2D/3D 引擎模型的方向,但仍在探索中。 构建数字人的灵魂需要注意以下几个工程关键点: 1. AI Agent:要让数字人像人一样思考就需要写一个像人一样的 Agent,工程实现所需的记忆模块、工作流模块、各种工具调用模块的构建都是挑战。 2. 驱动躯壳的实现:灵魂部分通过定义接口由躯壳部分通过 API 调用,调用方式可以是 HTTP、webSocket 等。但包含情绪的语音表达以及如何保证躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对成熟但闭源。 3. 实时性:由于算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,所以算法一般会部署到额外的集群或者调用提供出来的 API,这里面就会涉及到网络耗时和模型推理耗时,如果响应太慢就会体验很差,所以低延时也是亟需解决的一个问题。 4. 多元跨模态:不仅仅是语音交互,还可以通过添加摄像头数据获取数据,再通过系列 CV 算法做图像解析等。 5. 拟人化场景:正常和人交流时不是线性对话,会有插话、转移话题等情况,这些情景需要通过工程丝滑处理。 如果都要自建代码实现各模块,开发工作量巨大,迭代难度也很高,对于个人开发者来讲不现实。因此推荐借助开源社区的力量,现在开源社区已经有了像 dify、fastgpt 等等成熟的高质量 AI 编排框架,它们有大量的开源工作者维护,集成各种主流的模型供应商、工具以及算法实现等等。我们可以通过这些框架快速编排出自己的 AI Agent,赋予数字人灵魂。在笔者的开源项目中,使用了 dify 的框架,利用其编排和可视化交互任意修改流程,构造不同的 AI Agent,并且实现相对复杂的功能,比如知识库的搭建、工具的使用等都无需任何的编码和重新部署工作。同时 Dify 的 API 暴露了 audiototext 和 texttoaudio 两个接口,基于这个两个接口就可以将数字人的语音识别和语音生成都交由 Dify 控制,从而低门槛做出来自己高度定制化的数字人。具体的部署过程参考 B 站视频:https://www.bilibili.com/video/BV1kZWvesE25 。如果有更加高度定制的模型,也可以在 Dify 中接入 XInference 等模型管理平台,然后部署自己的模型。此外,数字人 GUI 工程中仍然保留了 LLM、ASR、TTS、Agent 等多个模块,能够保持更好的扩展,比如实现更加真实性感的语音转换、或者如果有更加 Geek 的 Agent 实现也可以选择直接后端编码扩展实现。 使用 Dify 接口需要注意: 1. 必须在应用编排功能中打开文字转语音和语音转文字功能,否则接口会返回未使能的错误。 2. 只有接入了支持 TTS 和 SPEECH2TEXT 的模型供应商,才会在功能板块中展示出来,Dify 的模型供应商图标下标签有展示该供应商支持哪些功能,这里可以自行选择自己方便使用的。对于 TTS,不同的模型供应商支持的语音人物不同,可以根据个人喜好添加。
2025-01-21
如何构建自己的AI职业
以下是关于构建自己的 AI 职业的一些建议: 1. 掌握 Prompt 工程:了解 Claude 的 5 层 Prompt 体系,将其应用到日常工作中,如市场研究、写作、数据分析等项目,以提升驾驭 AI 的能力。 2. 借助元学习:鉴于人工智能依赖的神经网络基础,通过元学习让 AI 更快地获得知识,与人类共同进步。 3. 实践打造微信 AI 机器人: 确定功能范围,如支持用户发送“关键字”获取“AI 相关资料链接”,回答 AI 相关知识,作为微信客服助手发布在微信公众号上。 准备实现所需的内容,包括编写 prompt 提示词,整理“关键字”与“AI 相关资料链接”的对应关系,创建知识库、工作流,准备微信公众号。
2025-01-12
人工智能构建第二大脑
以下是关于人工智能构建第二大脑的相关内容: 信息到智慧的进化是一个动态、渐进的过程,不仅需要外部信息输入,还需内部认知加工。随着人工智能技术发展,这一进程极大加速和优化。AI 能帮助更快收集处理信息、构建知识体系,甚至模拟人类决策过程。 信息、知识、智慧是人类认知和决策的三个层次,相互联系作用。在 AI 时代,有更多工具和方法加速从信息到智慧的进化,构建高效知识管理体系。 从信息到知识:Forte 强调“外部大脑”概念,利用数字工具和系统存储思考、想法和信息,释放认知负担,专注创意和高阶思考。可使用数字笔记工具记录,通过分类、标签或链接关联零散信息形成知识网络,对信息深加工提炼知识。 从知识到智慧:智慧形成不仅需知识积累,更要深刻理解和应用。Forte 提倡复盘和整合,复盘指定期回顾笔记和想法加深理解发现新联系,整合指将新理解和旧知识融合形成更全面深入见解。通过不断复盘和整合,将知识内化为理解和智慧,可能涉及跨领域知识融合、问题解决策略创新或对复杂系统深刻洞察。 AI 时代的信息到智慧进化:这一进化过程加速,AI 和机器学习技术可处理分析大量信息,识别模式联系,通过智能推荐等功能提高从信息到知识转化效率,辅助决策分析等应用模拟扩展人类智慧。结合《打造第二大脑》理论和 AI 技术发展,人类知识管理和智慧发展处于全新充满可能的时代,个人和组织通过高效信息管理可提升生产力创造力,形成独到智慧见解。在信息泛滥时代,引入 DIKW 模型和 CODE 信息管理法则可提供更深刻理解和实践指导。 此外,构建外脑的核心是思维方式与执行方法,虽核心不是工具,但好工具能提升效率。在智能时代,处理语言与数据效率指数级提升,影响软件工具使用、设计及对知识管理与传播的认知方式。
2025-01-11
如何构建一个AI数字人分身
构建一个 AI 数字人分身主要包括以下两个方面: 一、构建数字人躯壳 数字人的躯壳建模有多种方式: 1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢。能将喜欢的动漫人物变成数字人的躯壳。代表是 Live2D Cubism。 2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高。目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体。如 NextHuman、Unity,虚幻引擎 MetaHuman 等。但个人学习在电脑配置和学习难度上有一定门槛。 3. AIGC:虽然省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持 ID 一致性,帧与帧的连贯性上会让人有虚假的感觉。如果项目对人物模型真实度要求没有那么高,可以使用这种方案。典型的项目有 wav2lip等。AIGC 还有一个方向是直接生成 2d/3d 引擎的模型,而不是直接生成数字人的最终展示部分,但该方向还在探索中。 建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI。 二、构建数字人灵魂 有了数字人躯壳,还需要构建数字人的灵魂,让数字人具备各种智能,比如记得个人信息,充当个人助手;在某个领域具备更专业的知识;能处理复杂的任务等等。实现这些能力有以下几个工程关键点: 1. AI Agent:要想数字人像人一样思考就需要写一个像人一样的 Agent,工程实现所需的记忆模块,工作流模块、各种工具调用模块的构建都是挑战。 2. 驱动躯壳的实现:灵魂部分通过接口定义,躯壳部分通过 API 调用,调用方式可以是 HTTP、webSocket 等,视躯壳部分的实现而定。但包含情绪的语音表达以及如何保证躯壳的口型、表情、动作和语音的同步及匹配,目前主流方案只能做到预设一些表情动作,再做一些逻辑判断来播放预设,语音驱动口型相对来说成熟一些,但都是闭源的,效果可以参考 Nvidia 的 Audio2Face。 3. 实时性:由于整个数字人的算法部分组成庞大,几乎不能实现单机部署,特别是大模型部分,所以算法一般会部署到额外的集群或者调用提供出来的 API,这里面就会涉及到网络耗时和模型推理耗时,如果响应太慢就会体验很差,所以低延时也是亟需解决的一个问题。 4. 多元跨模态:仅仅是语音交互的数字人是远远不够的,人有五感(听觉、视觉、嗅觉、触觉、味觉),听觉只是其中一种,其他的感官可以根据实际需求来做,比如视觉可以通过添加摄像头数据来获取数据,再通过系列 CV 算法做图像解析等。 5. 拟人化场景:正常和人交流的时候不是线性对话,会有插话、转移话题等情况,这些情景需要通过工程丝滑处理。
2025-01-03
构建一个路由分类器AI,在工作流里面有什么好的设计方案,怎么能保证分类器进行分类准确呢
构建路由分类器 AI 的工作流设计方案如下: 1. 内容编排:在第四步中,将指令分为扩写、缩写、总结以及其他四类,设定最终的分类条件。分类器匹配到特定分支后执行相应操作,这种编排方式可过滤并避免处理不明确的指令,确保智能体准确响应用户指令。 2. 编写具体指令:为每个指令编写具体内容,如缩写、扩写和总结三个分支,创建包含变量(即用户初始输入的原始文本)的简单指令,用花括号引用变量,系统将值赋给变量并传递给模型推理形成提示词。 3. 最终输出:对各分支结果进行输出,输出内容相对简洁。 4. 测试流程:首先准备用于扩写、缩写和总结三项测试的文本素材,然后逐一进行各项测试,包括扩写测试、缩写测试、总结测试和错误处理测试,以验证每个分支能否顺利执行。 要保证分类器分类准确,可以从以下方面入手: 1. 清晰明确地设定分类条件,避免模糊和歧义。 2. 对输入的指令进行充分的预处理和规范化,使其符合分类器的预期格式。 3. 不断优化和调整分类器的参数和算法,以适应不同类型和复杂程度的指令。 4. 进行大量的测试和验证,收集错误案例并进行分析改进。
2024-12-29
企业标书模拟评分系统
很抱歉,目前知识库中没有关于企业标书模拟评分系统的相关内容。但一般来说,企业标书模拟评分系统通常会涉及对标书的各项指标进行量化评估,包括但不限于技术方案的可行性、项目经验、价格合理性、服务保障等方面。您可以进一步明确您关于这个系统的具体问题,以便我为您提供更有针对性的帮助。
2025-01-20
AI 做产品渲染图的工具和企业内落地使用的流程和方案是什么
以下是关于 AI 做产品渲染图的工具和企业内落地使用的流程和方案的相关内容: 工具: 等工具可帮助品牌创建引人注目的产品照片。 可制作用于电子邮件或社交媒体的营销材料。 可以编写经过 SEO 优化的产品描述。 企业内落地使用流程和方案: 1. 市场分析:利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况,处理大量数据,快速识别关键信息,如受欢迎的产品、价格区间、销量等。 2. 关键词优化:借助 AI 分析和推荐高流量、高转化的关键词,优化产品标题和描述,提高搜索排名和可见度。 3. 产品页面设计:使用 AI 设计工具,根据市场趋势和用户偏好自动生成吸引人的产品页面布局。 4. 内容生成:运用 AI 文案工具撰写有说服力的产品描述和营销文案,提高转化率。 5. 图像识别和优化:通过 AI 图像识别技术选择或生成高质量的产品图片,更好地展示产品特点。 6. 价格策略:利用 AI 分析不同价格点对销量的影响,制定有竞争力的价格策略。 7. 客户反馈分析:借助 AI 分析客户评价和反馈,了解客户需求,优化产品和服务。 8. 个性化推荐:依靠 AI 根据用户的购买历史和偏好提供个性化的产品推荐,增加销售额。 9. 聊天机器人:采用 AI 驱动的聊天机器人提供 24/7 的客户服务,解答疑问,提高客户满意度。 10. 营销活动分析:使用 AI 分析不同营销活动的效果,了解哪些活动更能吸引顾客并产生销售。 11. 库存管理:依靠 AI 帮助预测需求,优化库存管理,减少积压和缺货情况。 12. 支付和交易优化:利用 AI 分析不同的支付方式对交易成功率的影响,优化支付流程。 13. 社交媒体营销:借助 AI 在社交媒体上找到目标客户群体,通过精准营销提高品牌知名度。 14. 直播和视频营销:运用 AI 分析观众行为,优化直播和视频内容,提高观众参与度和转化率。
2025-01-17
AI在食品制造型企业有哪些场景可以做?
在食品制造型企业中,AI 可以应用于以下场景: 1. 质量控制:利用 AI 检测产品缺陷,确保食品质量。 2. 预测性维护:预测生产设备故障,避免生产中断。 3. 供应链管理:根据历史数据和市场变化,自动生成采购计划、库存预测和物流优化方案,提高供应链效率。 4. 产品设计和开发:借助 AI 生成工具,根据文字描述快速生成食品的包装设计、配方等元素,提高设计效率。 5. 工艺规划和优化:结合自然语言处理能力,自动生成生产工艺流程、设备选型等方案,优化生产过程。 6. 客户服务:基于对话模型的 AI 客服机器人,自动生成个性化的客户回复,提升客户体验。
2025-01-16
ai在企业的落地场景
AI 在企业中有多种落地场景,以下为您详细介绍: 1. 决策方面: 在实际企业环境中,领导者常面临平衡 AI 与人类判断以快速决策的问题。例如依赖 AI 进行销售数据分析来制定产品定价策略,但当市场环境变化时,AI 建议可能不适用。 企业领导者需认识到 AI 决策的不透明性,设立审核流程,如某公司全球化扩张时,AI 提供的局部市场数据分析建议需经领导者基于经验和洞察的审查。 为最大化 AI 优势并避免盲目依赖,企业可建立“AI 决策审核流程”,包括数据源验证、算法透明度、专家审查、伦理与社会影响评估等步骤。 2. 医疗保健领域: 医学影像分析:辅助诊断疾病。 药物研发:加速研发过程,识别潜在药物候选物和设计新疗法。 个性化医疗:分析患者数据提供个性化治疗方案。 机器人辅助手术:提高手术精度和安全性。 3. 金融服务领域: 风控和反欺诈:识别和阻止欺诈行为,降低风险。 信用评估:帮助金融机构做出贷款决策。 投资分析:分析市场数据辅助投资决策。 客户服务:提供 24/7 服务并回答常见问题。 4. 零售和电子商务领域: 产品推荐:分析客户数据进行个性化推荐。 搜索和个性化:改善搜索结果和提供个性化购物体验。 动态定价:根据市场需求调整产品价格。 聊天机器人:回答客户问题并解决问题。 5. 制造业领域: 预测性维护:预测机器故障避免停机。 质量控制:检测产品缺陷提高质量。 供应链管理:优化供应链提高效率和降低成本。 机器人自动化:控制工业机器人提高生产效率。
2025-01-13
企业级AI的现状如何了?
目前企业级 AI 的现状呈现出以下特点: 1. 应用方面:更多迁移到具体业务场景,企业重点放在自主构建应用程序上,如客户支持和内部聊天机器人等,同时也在尝试更新颖的应用,如编写消费品配方、缩小分子发现范围和进行销售推荐。 2. 资源配置和态度:企业对生成式 AI 的资源配置和态度在过去 6 个月发生显著变化,预算几乎增加两倍,将更多应用部署在较小的开源模型上,并将更多业务从早期实验转移到生产环境中。 3. 市场机会:生成式人工智能在 2023 年席卷消费市场,2024 年企业领域的收入机会预计数倍于消费市场。 4. 创新与挑战:基础模型的出现使企业构建自己的 AI 应用程序更易,但“GPT wrappers(GPT 套壳)”存在局限性。目前尚不清楚当更多面向企业的 AI 应用上市时情况是否会改变。那些能在“LLM+UI”公式之外创新,并帮助企业更好利用专有数据的应用将表现出色。 5. 赋能企业:许多公司正将 AI 融入工作流程以快速达成 KPI、扩张规模和降低成本。应用公司在 AI 50 强榜单中占据主导地位。不远的将来,有望看到 UX 和 UI 围绕 AI 的功能进行重新设计。
2025-01-11
从评审导师的角度优化“人工智能驱动企业供应链效率影响研究——基于专精特新中小企业的实证数据”这个工商学术研究生学位论文题目
作为评审导师,以下是对这个论文题目的一些优化建议: “人工智能对专精特新中小企业供应链效率的驱动作用及影响研究——基于实证数据分析” 这样的表述更加清晰地突出了人工智能的驱动作用,并且明确了是基于实证数据进行的分析。您觉得如何?
2025-01-08