Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何建立一个行业的知识库,并建立这个行业的专属AI模型?

Answer

建立一个行业的知识库并建立专属 AI 模型可以参考以下步骤:

  1. 明确行业需求和目标:确定知识库和 AI 模型要解决的具体问题和实现的功能。
  2. 收集和整理数据:包括行业相关的各种信息、文档、案例等,为知识库提供素材。
  3. 设计提示词:明确 AI 模型的角色和专注的技能,使其能够按照设定进行工作。
  4. 构建知识库:将行业特定的规则、流程、案例等内容整理成工作手册,供 AI 模型参考。
  5. 选择合适的 AI 模型:例如可以使用阿里千问模型等。
  6. 进行模型训练和优化:根据收集的数据和设定的提示词、知识库对模型进行训练,并不断优化。
  7. 融合实际场景:让人类专家配备可穿戴设备,收集现实世界的互动供 AI 学习,避免复制危险的偏见。
  8. 持续评估和改进:根据实际应用效果,对知识库和 AI 模型进行评估和改进。

例如,在医疗保健领域,开发具有潜在空间层次结构的堆叠 AI 模型,反映对每个基本元素的理解或预测能力。创建专门从事医疗保健特定领域的 AI,让其接触到顶级从业人员的多样化视角。在财经领域,依托中央财经大学的资源优势,基于内容增强型知识插槽技术构建高质量知识库,与客户自有知识库结合,实现全业务场景的支撑,可实现快速的专家级 Agent 构建与管理维护。在文档处理领域,如上海普米智图智能科技有限公司,自主研发的数据框架 Ananke 和 Agent 框架 Moros,利用智能体技术提升工作流效率。

Content generated by AI large model, please carefully verify (powered by aily)

References

【AI+知识库】商业化问答场景,让AI回复更准确,一篇专为所有“小白”讲透RAG的实例教程(上篇)

大语言模型:是一个学习过无数本书、拥有无穷智慧的人。他读过无数的书、看过无数的段子,因此对公共知识、学识技能、日常聊天十分擅长。然而,在工作场景下,只会聊天侃大山可不行,你想让他帮你干活。这个时候,就需要“提示词”出场了,提示词:是你告诉这个全知全能的人,他是一个什么样的角色、他要专注于哪些技能,让他能够按照你的想法,变成一个你需要的“员工”。知识库:相当于你给这个“聪明”员工的发放了一本工作手册。即使是看过再多的书、浏览过再多的文字,也不会准确的知道见到老板娘过来吃饭要打三折,张梦飞过去吃饭要打骨折。而知识库,就是把这些内容写在了工作手册上。让这个聪明的员工,见到有人来的时候,就翻一翻手册,然后再做出反应。我的设定:AI模型:这里使用的是阿里千问模型。提示词:这里设定的角色是“美嘉”,是按照美嘉的人设、背景和对话风格做的设定。知识库:这里放的是《爱情公寓》全季的剧情,让“美嘉”拥有了自己过往的“记忆”,知道自己做过什么、好朋友是谁等等。图中右侧是一个十分简单的问答,我问:“你是谁?你和子乔在台球厅吵架那次是为了什么吵架?”她的回复是:“我是陈美嘉,那次在台球厅和吕子乔吵架是因为他约会被人撞见,我讽刺他脸大影响信号,他还反击我。后来谈到过去的事情,我指责他忘恩负义,他就说我平。最后,我伤心地说要分手,因为他之前甩过我。”

为了在医疗保健中产生真正的改变,AI 需要像我们一样学习

开发这些具有潜在空间层次结构的堆叠AI模型——复杂数据的简化地图,以帮助AI模型理解模式和关系——将反映对每个基本元素的理解或预测能力。我相信,这最初可能会平行于人类教育和教育范例,但随着时间的推移,它可能会专门发展,以在AI学习中培养新型的专业知识。这些堆叠模型可能会以与人脑皮层类似的方式发展。但是,与人类拥有视觉皮层和运动皮层不同,AI可能会拥有生物皮层和药物设计皮层——在这两种情况下,都是针对特定任务专门设计的神经架构。具有讽刺意味的是,创建专门从事诸如医疗保健这样的特定领域的AI可能比创建更接近HAL 9000的东西——具有跨领域的典型人类水平知识——更容易。实际上,我们更需要特定领域的专家AI,而不是一个能做任何普通人能做的事情的全能AI。我预计不仅会创造一个专家AI,而且会创造许多专家AI,它们在编码、数据和测试方面采用多样化的方法,以便在需要时这些模型可以提供第二个(或第三个、第四个)意见。同时,我们必须将AI从其在线基础上摘下,并将其投入到原子的世界中。我们应该让我们最熟练的人类专家配备可穿戴设备,以收集微妙的、现实世界的互动,供AI学习,就像我们即将崭露头角的学术和行业明星一样。解决健康和医学领域最复杂和不确定的问题在位元的世界中根本不存在。必须让这些专家AI接触到顶级从业人员的多样化视角,以避免复制危险的偏见。但AI的黑盒性远不如大众想象中的那么强;我们今天依赖的人类决策,正如我以前[指出的](https://www.nytimes.com/2018/01/25/opinion/artificial-intelligence-black-box.html),可以说更加不透明。我们不能因为对传播人类偏见的恐惧而限制我们探索AI如何帮助我们民主化我们的人类专家知识的意愿,而这些专家是不幸地无法扩展的。

受邀参加了智谱 AI Z Demo Day,让我再一次相信 AGI!

依托中央财经大学的资源优势,专注于解决大模型应用的最后一公里问题,重点场景包括双碳、财金领域。核心技术:基于内容增强型知识插槽技术构建高质量知识库,与客户自有知识库结合,实现全业务场景的支撑,可实现快速的专家级Agent构建与管理维护。快速形成新领域的高质量知识库,效果超过通用大模型的能力;与业务场景深度融合,支持业务流程的AI化改造。API部署、私有化部署,价格低于同类产品50%,性能更好。Prismer.AI项目简介死文档变为活资产项目陈述上海普米智图智能科技有限公司(Prismer.AI)致力于以文档为切入点,打造智能体应用。公司自主研发的数据框架Ananke,成功成为首个将连接主义和符号主义统一融合的自动化表示框架,并建立了容纳200万篇以上文档的表示库。基于Ananke,自研了Agent框架Moros,实现了可信的数学求解、工程代码生成和算力节点调度等功能,在文档的间接信息价值与直接资产化价值之间建立了闭环。依托这两项核心技术,推出DocBrew.AI产品。该产品利用智能体技术,将算法验证、金融量化分析、数学科学计算验证和代码服务化等不同群体的工作流效率提升了一个数量级以上。艾语智能项目简介个人无抵押信贷资产处置领域是一个超级市场,每年的佣金规模超过2000亿!这个行业有超过180万的从业人员,他们长期在压抑的环境中工作。在处置过程中,他们需要与大量的借款人以及法院进行对话,同时还需要处理海量的文档生成和识别需求,从技术角度说是特别适合LLM的场景。

Others are asking
设计面向青少年的AI课程大纲,核心是围绕以DeepSeek技术专题为核心的各类技术到应用的设计
很抱歉,目前没有关于以 DeepSeek 技术专题为核心设计面向青少年的 AI 课程大纲的相关内容。但我可以为您提供一个通用的以技术到应用为思路的 AI 课程大纲框架供您参考: 一、课程简介 介绍课程的目标、重要性以及学习 AI 对青少年的益处。 二、基础知识 1. 什么是 AI 及其发展历程 2. 常见的 AI 应用领域 三、DeepSeek 技术基础 1. DeepSeek 技术的原理 2. 相关算法和模型 四、技术应用实践 1. 利用 DeepSeek 技术进行图像识别项目 2. 基于 DeepSeek 的自然语言处理应用 五、案例分析 1. 成功运用 DeepSeek 技术的实际案例 2. 案例中的创新点和可借鉴之处 六、创新与拓展 1. 鼓励学生提出基于 DeepSeek 技术的新应用想法 2. 小组讨论和展示 七、课程总结与回顾 复习重点知识,总结学习成果。 您可以根据实际需求和教学条件对上述大纲进行调整和完善。
2025-03-01
如何通过ai制作图表
以下是通过 AI 制作图表的相关信息: 一、推荐的 AI 工具和平台 1. Creately 简介:在线绘图和协作平台,利用 AI 功能简化图表创建过程,适合绘制流程图、组织图、思维导图等。 功能:智能绘图功能,可自动连接和排列图形;丰富的模板库和预定义形状;实时协作功能,适合团队使用。 官网:https://creately.com/ 2. Whimsical 简介:专注于用户体验和快速绘图的工具,适合创建线框图、流程图、思维导图等。 功能:直观的用户界面,易于上手;支持拖放操作,快速绘制和修改图表;提供多种协作功能,适合团队工作。 官网:https://whimsical.com/ 3. Miro 简介:在线白板平台,结合 AI 功能,适用于团队协作和各种示意图绘制,如思维导图、用户流程图等。 功能:无缝协作,支持远程团队实时编辑;丰富的图表模板和工具;支持与其他项目管理工具(如 Jira、Trello)集成。 官网:https://miro.com/ 4. Lucidchart 简介:强大的在线图表制作工具,集成了 AI 功能,可以自动化绘制流程图、思维导图、网络拓扑图等多种示意图。 功能:拖放界面,易于使用;支持团队协作和实时编辑;丰富的模板库和自动布局功能。 官网:https://www.lucidchart.com/ 5. Microsoft Visio 简介:专业的图表绘制工具,适用于复杂的流程图、组织结构图和网络图。其 AI 功能可以帮助自动化布局和优化图表设计。 功能:集成 Office 365,方便与其他 Office 应用程序协同工作;丰富的图表类型和模板;支持自动化和数据驱动的图表更新。 官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware 6. Diagrams.net 简介:免费且开源的在线图表绘制工具,适用于各种类型的示意图绘制。 功能:支持本地和云存储(如 Google Drive、Dropbox);多种图形和模板,易于创建和分享图表;可与多种第三方工具集成。 官网:https://www.diagrams.net/ 二、使用 AI 绘制示意图的步骤 1. 选择工具:根据具体需求选择合适的 AI 绘图工具。 2. 创建账户:注册并登录该平台。 3. 选择模板:利用平台提供的模板库,选择适合需求的模板。 4. 添加内容:根据需求,添加并编辑图形和文字。利用 AI 自动布局功能优化图表布局。 5. 协作和分享:如果需要团队协作,可以邀请团队成员一起编辑。完成后导出并分享图表。 示例:假设需要创建一个项目管理流程图,可以按照以下步骤使用 Lucidchart: 1. 注册并登录:https://www.lucidchart.com/ 2. 选择模板:在模板库中搜索“项目管理流程图”。 3. 编辑图表:根据项目需求添加和编辑图形和流程步骤。 4. 优化布局:利用 AI 自动布局功能,优化图表的外观。 5. 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 利用这些 AI 工具,您可以快速、高效地创建专业的示意图,满足各种工作和项目需求。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-03-01
AI抠图工具
以下为关于 AI 抠图工具的相关内容: 可以使用 remove 直接抠图,也可以安装在 PS 里进行操作。图片上传即可抠图,可用于制作一些素材,如叶子飘落、战斗时石头等素材,以辅助制作氛围动画。 对于复杂的图片,如多人多活动的图,可采取以下步骤: 首先将长图分多个模块。 第二步进行智能抠图,用工具把要动的内容去除掉,用 AI 生成图片部分。 第三步将要动起来的部分抠出,放在绿幕背景里或者画的背景颜色,导出图片。 第四步用 AI 视频生成工具写入提示词让图片动起来,如即梦、海螺、混元等工具,不停尝试抽卡。 第五步用剪映把抽卡合格的视频放在去掉内容的背景图片,通过视频的背景用色度抠图调整去掉背景。多个视频放在背景图片,一起动即可。
2025-03-01
AI抠图
以下是关于 AI 抠图的相关内容: 可以直接抠图,也可以安装在 PS 里进行操作。图片上传即可抠图,可用于制作一些素材,如叶子飘落、战斗时石头等素材,以辅助做一些氛围动画。 对于复杂的多人多活动的图,可采取以下步骤: 图片分模块:将长图分成多个模块。 抠出背景图:用工具把要动的内容去除掉,用 AI 生成图片部分。 绿幕处理前景图:将要动起来的部分抠出,放在绿幕背景里或者画的背景颜色,导出图片。 前景图动态生成视频:使用 AI 视频生成工具写入提示词让图片动起来,如即梦、海螺、混元等工具,不停尝试抽卡。 生成视频去掉背景:用剪映把抽卡合格的视频放在去掉内容的背景图片上,通过色度抠图调整去掉视频背景。多个视频放在背景图片上一起动。 如果图片有水印,可以把图片向下拓展一部分然后截掉。
2025-03-01
Monica和Openai的记忆功能是如何让大模型产生记忆的?是什么原理?
大模型的记忆功能实现方式较为复杂,不同的模型可能有所不同。 OpenAI 的模型中,大模型 LLM 扮演了“大脑”的角色,其记忆功能可能通过“Agent = LLM + 规划 + 记忆 + 工具使用”的基础架构来实现。但需要注意的是,对于 ChatGPT 这类模型,实际上其本质上并没有直接的记忆功能。它能理解之前的交流内容,是因为每次将之前的对话内容作为新的输入重新提供给模型。这种记忆功能并非由大型模型直接实现,而是通过在别处进行存储来达成。 如果对话内容过长,可能会影响模型的整体性能。解决这个问题的一个简单方法是启动另一个对话框。对于之前的数据,通常只能进行总结。
2025-03-01
AI编程工具推荐
以下是为您推荐的一些 AI 编程工具: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议,助其更快、更少地编写代码。 2. 通义灵码:阿里巴巴团队推出,基于通义大模型,提供行级/函数级实时续写、自然语言生成代码等多种能力。 3. CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,为开发人员实时提供代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型,可快速生成代码提升开发效率。 5. Cody:代码搜索平台 Sourcegraph 推出,借助强大的代码语义索引和分析能力,了解开发者的整个代码库。 6. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供的免费 AI 代码助手,基于自研的基础大模型微调的代码大模型。 7. Codeium:一个由 AI 驱动的编程助手工具,通过提供代码建议等帮助软件开发人员提高编程效率和准确性。 更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同,您可以根据自身需求选择最适合的工具。 此外,使用 AI 编程工具(如 Cursor)的关键技能包括:准确描述需求、具备架构能力、专业编程能力和调试能力。关于不同 AI 编程工具的讨论和使用策略,您可以参考以下内容: 对于 Cursor,不同用户态度不一,有人觉得好用离不开,有人担心依赖心理或认为不好用,还有人对 AI 代码生成存在信任问题。作者建议使用 Git 管理代码版本,对 AI 代码进行 Review,任务分解为单一模块,借助 AI 生成测试代码等。 在 v0 与 Claude 的对比方面,Claude 在纯 UI 场景的生成效果往往更好,而 v0 和 Cursor 会因系统提示词和上下文猜测添加大量无关内容。v0 的优势在于傻瓜式操作。建议结合使用,当 Cursor、v0 效果不佳时,可将问题抽象独立出来,切换到 Claude、ChatGPT 或 Gemini 进行处理。
2025-03-01
本地知识库
以下是关于本地知识库的相关内容: 一、本地知识库进阶 如果想要对知识库进行更加灵活的掌控,需要使用额外的软件 AnythingLLM。它包含了所有 Open WebUI 的能力,并额外支持选择文本嵌入模型和向量数据库。 安装地址:https://useanything.com/download 。安装完成后进入配置页面,主要分为三步: 1. 第一步:选择大模型。 2. 第二步:选择文本嵌入模型。 3. 第三步:选择向量数据库。 二、构建本地知识库 AnythingLLM 中有 Workspace 的概念,可以创建自己独有的 Workspace 与其他项目数据隔离。 1. 首先创建一个工作空间。 2. 上传文档并且在工作空间中进行文本嵌入。 3. 选择对话模式,提供了两种模式: Chat 模式:大模型会根据自己的训练数据和上传的文档数据综合给出答案。 Query 模式:大模型仅仅会依靠文档中的数据给出答案。 4. 测试对话,完成上述配置后即可与大模型进行对话。 三、RAG 是什么 利用大模型的能力搭建知识库是 RAG 技术的应用。在进行本地知识库搭建实操前,需先了解 RAG。 RAG 实现方法是检索增强生成(Retrieval Augmented Generation),过程包括文档加载、文本分割、存储、检索和输出。 文档加载可从多种来源加载,包括非结构化、结构化和代码等数据。 文本分割将文档切分为指定大小的块。 存储涉及将文档块嵌入转换成向量形式并存储到向量数据库。 检索通过算法找到与输入问题相似的嵌入片。 输出是将问题和检索出的嵌入片提交给 LLM 生成答案。 四、Obsidian 与 Cursor 结合 因为 Obsidian 浏览器剪藏插件强大而开始玩 Obsidian,想打造本地知识库加 AI 加持。Obsidian 的 AI 插件配置复杂,体验不佳。 发现 Cursor 能解决问题,主要有三类作用: 1. 用模糊问题检索笔记库,而非关键字。 2. 基于笔记库进行研究,结合多个笔记软件给出建议。 3. 生成和修改笔记,如生成整个笔记文件或修改笔记文案。教程中为照顾多数人会用默认中文且免费的 Trae 演示,其他 AI IDE 也大同小异。
2025-03-01
飞书搭建AI知识库
以下是关于飞书搭建 AI 知识库的相关内容: 对于知识库,一系列的信息和知识聚集在一起就可以构成。比如“通往 AGI 之路”就是一个使用飞书软件搭建的 AI 知识库,在飞书大群中跟机器人对话就能获取对应资料。 在“大圣:胎教级教程:万字长文带你使用 Coze 打造企业级知识库”中,以 AI 时代的知识库作为例子进行了讲解,读完可收获:AI 时代的知识库的概念、实现原理以及能力边界;通往 AGI 之路大群中通过对话获取知识库中资料的原理;更好地使用 Coze 等 AI Agent 平台中的知识库组件,打造更强大的智能体。 搭建步骤: 确定功能范围。 编写【prompt】提示词,设定 Bot 的身份和目标。 创建【知识库】,整理“关键字”与“AI 相关资料链接”的对应关系并存储。创建知识库路径为:个人空间知识库创建知识库。知识库文档类型支持本地文档、在线数据、飞书文档、Notion 等,本次使用【本地文档】。按照操作指引上传文档、分段设置、确认数据处理。小技巧:知识库好不好用跟内容切分粒度有很大关系,可以在内容中加上特殊分割符比如“”,以便于自动切分数据。分段标识符号选择“自定义”,内容填“”。最终的知识库结果中,同一颜色代表同一个数据段,若内容有误需要编辑,可点击具体内容,鼠标右键会看到“编辑”和“删除”按钮进行操作。
2025-03-01
如何用AI搭建个人知识库
以下是用 AI 搭建个人知识库的方法: 首先,要搭建基于 GPT API 的定制化知识库,需要给 GPT 输入(投喂)定制化的知识。但 GPT3.5(即当前免费版的 ChatGPT)一次交互(输入和输出)只支持最高 4096 个 Token,约等于 3000 个单词或 2300 个汉字,容量对于绝大多数领域知识往往不够。为解决此问题,OpenAI 提供了 embedding API 解决方案。 embeddings 是一个浮点数字的向量(列表),两个向量之间的距离衡量它们的关联性,小距离表示高关联度,大距离表示低关联度。比如,向量是数学中表示大小和方向的一个量,通常用一串数字表示,在计算机科学和数据科学中,向量通常用列表(list)来表示。向量之间的距离是一种度量两个向量相似性的方法,最常见的是欧几里得距离。在 OpenAI 词嵌入中,靠近向量的词语在语义上相似。 具体操作时,可将大文本拆分成若干个小文本块(也叫 chunk),通过 embeddings API 将小文本块转换成 embeddings 向量,并在一个地方(向量储存库)中保存这些 embeddings 向量和文本块,作为问答的知识库。当用户提出一个问题时,该问题先通过 embeddings API 转换成问题向量,然后将这问题向量与向量储存库的所有文本块向量比对,查找距离最小的几个向量,把这几个向量对应的文本块提取出来,与原有问题组合成为新的 prompt,发送给 GPT API。 例如,有一篇万字长文,拆分成多个 Chrunks 包含不同内容。如果提问是“此文作者是谁?”,可以直观地看出与问题关联度最高的文本块,通过比较 embeddings 向量也能得到结论。最后发送给 GPT API 的问题会类似于“此文作者是谁?从以下信息中获取答案:本文作者:越山。xxxx。《反脆弱》作者塔勒布xxxx。” 此外,还有案例展示了如何在 AI 时代把碎片化信息内化为自己的知识/智慧。比如在读书时看到有触动的文本,将其整理归纳,标记重点,打赏标签,放入笔记系统,准备展开深度思考和实践。基于笔记中提到的 AI 对人的赋能模式,展开深度实践,生成自己的观点和决策,并打造成体系化的内容产品,实现价值。通过一个碎片化知识在左侧知识库中的“点、线、面、体”式的流转,从一个书摘变成一个体系化内容或课程,把“别人说的话”变成“自己的智慧”。
2025-02-28
从知识库中查询与:DeepSeek相关的热门资讯信息
以下是关于 DeepSeek 的热门资讯信息: 媒体报道和网络文章方面: 通往 AGI 之路:关于 DeepSeek 的所有事情【知识库持续更新中】,链接:https://mp.weixin.qq.com/s/n0WrrJL0fVX6zLeTBWpZXA 数字生命卡兹克:DeepSeek 的提示词技巧,就是没有技巧。链接:https://zhuanlan.zhihu.com/p/20544736305 (错误) 宝玉:教你如何破解 DeepSeek R1 系统提示词,类型为提示词破解,链接:https://mp.weixin.qq.com/s/vAp2wI5ozTw7R6jreLMw 橘子汽水铺:中国开源,震撼世界:DeepSeek R1 的变革、启示与展望,类型为基础认知,链接:https://mp.weixin.qq.com/s/yGUgehbxKisVaHlOkxhuaw 橘子汽水铺:自学成才之路,DeepSeek R1 论文解读,类型为基础认知,链接:https://mp.weixin.qq.com/s/gmdHyh6fsUdj1JhM1sV9bg 新智元:史上首次,DeepSeek 登顶中美 AppStore!NYU 教授:全球「AI 霸权」之争已结束,类型为基础认知,链接:https://mp.weixin.qq.com/s/ybvV8RMX0yyS5YfG1qNWgg 一支烟花 AI:用流程图对比 DeepSeekR1,OpenAI O1,Claude 说明强化学习在 AI 大模型训练、推理的创新和意义,类型为基础认知,链接:https://mp.weixin.qq.com/s/mdGtOcg1RuQOEBn31KhxQ 腾讯科技:一文读懂|DeepSeek 新模型大揭秘,为何它能震动全球 AI 圈,类型为基础认知,链接:https://mp.weixin.qq.com/s/cp4rQx09wygE9uHBadI7RA 张小珺腾讯科技:一场关于 DeepSeek 的高质量闭门会:比技术更重要的是愿景,类型为进阶思考,链接:https://mp.weixin.qq.com/s/a7C5NjHbMGh2CLYk1bhfYw 全新 AI 整活计划方面: DeepSeek 模型热度很高,微信指数达 10 亿多次,引发大众关注。 元子使用 Monica 时发现电脑版双击能显示思考过程,且注意不能直接换 agent,否则可能会干掉搜索功能。 财猫曾为相关平台做 AI 顾问,设计整套提示词,写小说等,其公众号因相关内容被封 15 天,19 号恢复。 旧模型有过度道德说教和正面描述趋势,DeepSeek 模型能力强,在文学创作上更出色,能给予更多自由发挥空间。 好的文字能引起生理共鸣和情绪,AI 可写出好文字,大语言模型预训练数据丰富,能引发人类共鸣和情绪。 Deepseek 模型的文风显著,文笔优秀,能触达情感,有哲学思考,在写作方面表现出色,如写小说、写诗、写骈文等。 Deepseek 模型喜欢使用大词,文风欢脱,有独特的语言风格,易于辨别。 Deepseek 模型有极强的发散能力,但较难收敛,有时会出现幻觉,但从创作角度看有利。
2025-02-28
如何将大量记录的文本内容输入知识库,并且形成有效问答问答
要将大量记录的文本内容输入知识库并形成有效问答,可参考以下方法: 1. 使用 embeddings 技术: 将文本转换成向量(一串数字),可理解为索引。 把大文本拆分成若干小文本块(chunk),通过 embeddings API 将小文本块转换成 embeddings 向量,这些向量与文本块的语义相关。 在向量储存库中保存 embeddings 向量和文本块。 当用户提出问题时,将问题转换成向量,与向量储存库的向量比对,查找距离最小的几个向量,提取对应的文本块,与问题组合成新的 prompt 发送给 GPT API。 2. 创建知识库并上传文本内容: 在线数据: 自动采集:适用于内容量大、需批量快速导入的场景。 在文本格式页签选择在线数据,单击下一步。 单击自动采集。 单击新增 URL,输入网站地址,选择是否定期同步及周期,单击确认。 上传完成后单击下一步,系统自动分片。 手动采集:适用于精准采集网页指定内容的场景。 安装扩展程序,参考。 在文本格式页签选择在线数据,单击下一步。 点击手动采集,完成授权。 输入采集内容网址,标注提取内容,查看数据确认后完成采集。 本地文档: 在文本格式页签选择本地文档,单击下一步。 拖拽或选择要上传的文档,支持.txt、.pdf、.docx 格式,每个文件不大于 20M,一次最多上传 10 个文件。 上传完成后单击下一步,选择内容分段方式,包括自动分段与清洗(系统自动处理)和自定义(手动设置分段规则和预处理规则)。
2025-02-28
怎么针对知识库提问
知识库问答是机器人的基础功能,其利用了大模型的 RAG 机制。RAG 机制全称为“检索增强生成”(RetrievalAugmented Generation),是一种结合了检索和生成两种主要人工智能技术的自然语言处理技术,用于提高机器对话和信息处理的能力。 简单来说,RAG 机制先从大型数据集中检索与问题相关的信息,然后利用这些信息生成更准确、相关的回答。可以想象成当问复杂问题时,RAG 机制先在巨大图书馆里找相关书籍,再基于这些书籍信息给出详细回答。这种方法结合大量背景信息和先进语言模型能力,使生成内容更精确,提升对话 AI 的理解力和回答质量。 基于 RAG 机制实现知识库问答功能,首先要创建包含大量社区 AI 相关文章和资料的知识库,通过手工录入方式上传文章内容,如创建有关 AI 启蒙和信息来源的知识库。在设计 Bot 时,添加知识库并设置合适的搜索策略、最大召回数量和最小匹配度,以更好地利用知识库返回的内容进行结合回答。 具体步骤包括: 1. 上传文档:支持 txt、pdf、docx 等格式,将文档转换为 Markdown 格式。 2. 文本切割:将长文本切割为小块(chunk)以便分析和处理。 3. 文本向量化:通过 embedding 技术将切割的 chunk 转换为算法可处理的向量,存入向量数据库。 4. 问句向量化:用户提问后,将问句向量化。 5. 语义检索匹配:将用户问句与向量数据库中的 chunk 匹配,找出最相似的 top k 个。 6. 提交 Prompt 至 LLM:将匹配出的文本和问句添加到配置好的 prompt 模板中,提交给 LLM。 7. 生成回答:LLM 生成回答并返回给用户。 RAG 研究范式不断发展,分为基础 RAG(Naive RAG)、高级 RAG(Advanced RAG)和模块化 RAG(Modular RAG)三种类型。
2025-02-28
如何对扣子智能体做专属训练
对扣子智能体进行专属训练时,需要注意以下要点: 1. 跳转设置:扣子在节点切换提供了独立和非独立两种识别模式。独立识别模式中每个节点都有一个独立识别模型,非独立模式则直接使用当前智能体模型进行判断,实际使用中推荐独立模式。 2. 独立模式的选择:独立模式有两种选择。第一种是面对通用指令时,选择已经训练好的、专门用于节点切换的大型模型,其优点是经过特定训练,无需额外操心设计。第二种是在遇到非常复杂的情景时,使用自定义的大型模型,可根据需求定制模型和编写特定提示词以适应复杂交互场景,但实际测试效果不理想,所以推荐使用第一种。 3. 关键注意点:在使用专门训练的意图识别模型进行节点切换时,要特别注意两个关键点。一是每个智能体的用途必须清晰明确,在设计和实现时要清楚标注其功能和目的,以确保系统能准确识别和响应用户意图。二是智能体的名称非常重要,应清晰、易于识别,便于系统识别和记忆。
2025-01-27
如何做一款专属某行业的AI
要开发一款专属某行业的 AI ,可以参考以下要点: 1. 学习模式:AI 应像人类一样学习,例如在医疗保健领域,创建具有潜在空间层次结构的堆叠 AI 模型,反映对每个基本元素的理解或预测能力,可能会以与人脑皮层类似的方式发展,并针对特定任务专门设计神经架构。 2. 特定领域专家 AI:创建特定领域的专家 AI 比创建全能 AI 更容易,预计会创造许多专家 AI ,它们在编码、数据和测试方面采用多样化方法,并提供多种意见。 3. 现实世界互动:让熟练的人类专家配备可穿戴设备,收集现实世界的互动供 AI 学习,同时避免复制危险的偏见。 4. 模型生态系统:以医疗保健为例,应投资创建像优秀医生和药物开发者那样学习的“专家”AI 模型生态系统。成为顶尖人才通常从多年密集信息输入和正规教育开始,再通过学徒实践,AI 学习也应如此,通过堆叠模型训练,而非仅依靠大量数据。 5. 行业调研报告: 步骤:让 AI 阅读学习优秀行业调研报告,总结方法论和操作框架;询问收集行业数据时所用的一手和二手数据及靠谱资料收集网站;要求 AI 推荐行业信息网站和微信公众号,并输出行业调研报告框架;丰富框架每一章节内容。 注意事项:使报告有深度可通过自身对行业的了解整理深度洞察和见解,或深度咨询 AI 并借助其知识学习、研究和总结。 以上是关于如何做一款专属某行业的 AI 的相关内容。
2025-01-22
我想训练一个专属Agent该怎么做?
要训练一个专属 Agent,以下是一些关键步骤和要点: 1. 明确目标:确定您希望 Agent 实现的特定目标,这将为训练提供方向。 2. 理解智能体的定义:智能体是能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 3. 规划:将大型任务分解为更小、可管理的子目标,以有效处理复杂任务。 4. 反思和完善:让 Agent 能够对过去的行为进行自我批评和反思,从错误中吸取教训,并针对未来步骤进行完善,提高最终结果质量。 5. 记忆管理:包括短期记忆,利用模型的短期记忆进行学习;长期记忆,通过外部向量存储和快速检索实现长时间信息保留和回忆。 6. 工具使用:训练 Agent 学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。 7. 评估工具使用能力:从调用 API 的能力、检索 API 的能力以及计划 API 超越检索和调用的能力这三个层面进行评估。 在训练过程中,还需要注意模型的上下文窗口长度有限,输入的剧集应足够短以构建多剧集历史,2 4 个剧集的多剧集上下文对于学习近乎最优的上下文强化学习算法是必要的,且上下文强化学习的涌现需要足够长的上下文。
2025-01-17
部署Agent专属的web端应用
以下是关于部署 Agent 专属的 web 端应用的相关内容: 在 Linux 上部署较为简单,前提是您有一张 4G 以上显存的 GPU 显卡。步骤如下: 1. 下载代码仓库。 2. 安装依赖(注意有两个依赖未放在 requirements.txt 里)。 3. 启动 webui 的 demo 程序,然后用浏览器登陆服务器的 ip:8080 就能试玩。此 demo 提供了 3 个参数: server_name:服务器的 ip 地址,默认 0.0.0.0。 servic_port:即将开启的端口号。 local_path:模型存储的本地路径。 4. 第一次启动生成语音时,需查看控制台输出,会下载一些模型文件,可能因网络问题失败,但首次加载成功后后续会顺利。 5. 基于此基础可拓展,比如集成到 agent 的工具中,结合 chatgpt 做更拟人化的实时沟通。 6. webui 上可设置的几个参数说明: text:指需要转换成语音的文字内容。 Refine text:选择是否自动对输入的文本进行优化处理。 Audio Seed:语音种子,是一个用于选择声音类型的数字参数,默认值为 2,是很知性的女孩子的声音。 Text Seed:文本种子,是一个正整数参数,用于 refine 文本的停顿,实测文本的停顿设置会影响音色、音调。 额外提示词(可写在 input Text 里):用于添加笑声、停顿等效果,例如。 以下是一些 Agent 构建平台: 1. Coze:新一代一站式 AI Bot 开发平台,适用于构建基于 AI 模型的各类问答 Bot,集成丰富插件工具拓展 Bot 能力边界。 2. Microsoft 的 Copilot Studio:主要功能包括外挂数据、定义流程、调用 API 和操作,以及将 Copilot 部署到各种渠道。 3. 文心智能体:百度推出的基于文心大模型的智能体(Agent)平台,支持开发者根据需求打造产品能力。 4. MindOS 的 Agent 平台:允许用户定义 Agent 的个性、动机、知识,以及访问第三方数据和服务或执行工作流。 5. 斑头雁:2B 基于企业知识库构建专属 AI Agent 的平台,适用于客服、营销、销售等场景,提供多种成熟模板,功能强大且开箱即用。 6. 钉钉 AI 超级助理:依托钉钉强大的场景和数据优势,提供环境感知和记忆功能,在处理高频工作场景如销售、客服、行程安排等方面表现出色。 以上信息仅供参考,您可根据自身需求选择适合的平台。
2025-01-07
AI+交易:来定制专属于你的私人高级交易顾问吧!
以下是关于“AI+交易:来定制专属于你的私人高级交易顾问吧!”的相关内容: 原本是一名 AIGC 创作者,在接触交易后,希望将交易与 AIGC 相结合,打造私人高级交易顾问。学习交易知识后认识到,单纯迷信技术分析提高胜率实现长期稳定盈利对个人投资者不可行,心态关键。新人对交易理论不熟悉更致命,成熟交易员单一策略熟练运用能找进出点、良好心态能长期盈利,但不熟悉行情只能观望。借助 AI 分析行情,期望在不熟悉市场时找到合适进场点,提高资金使用效率,多种策略配合提高理论胜率(有统计数据显示几千名专业交易员一年里平均胜率 70)。 此外,还有以下 AI 与工作场景结合的案例: 1. 销售方面:包括话术总结优缺点、定制销售解决方案。 2. 客服方面:定制客服话术,有关键词库,如产品知识、使用方法等。 3. HR 方面:团队绩效管理,根据绩效数据输出考评和改进建议;面试工具,如使用 GPT4 技术的实时转录工具帮助求职者生成回答。 另外,在七大行业的商业化应用中: 1. 企业运营:包括日常办公文档撰写整理、营销对话机器人等。 2. 教育:协助评估学生学习情况、定制学习内容等。 3. 游戏/媒体:如定制化游戏、出海文案生成等。 4. 零售/电商:包括舆情监测分析、品牌营销内容撰写等。 5. 金融/保险:如个人金融理财顾问、识别欺诈活动风险等。
2024-12-17
如何打造专属自己的ai智能体?让保存的文献资料为自己专属分析只用?
打造专属自己的 AI 智能体并让保存的文献资料为自己专属分析,可参考以下步骤: 1. 设计 AI 智能体架构:先构思整个 AI 智能体的架构。 2. 规定稍后读阅读清单的元数据:新建一个飞书多维表格,根据稍后读的管理需要,定义元数据字段,如“内容(超链接格式,显示页面标题,可点击跳转具体的页面)”“摘要(根据具体内容,总结内容主题、关键信息、阅读价值,并指出适合的读者群体)”“作者”“平台”“状态(阅读状态,收藏的默认态为“仅记录”)”“发布日期”“收集时间”等。您也可以直接复制准备好的模板:【模板】稍后读管理 3. 搭建整理入库工作流: 首先在 Coze 中逐步搭建 AI 智能体,搭建整理入库工作流。这是支撑整个 AI 稍后读服务的前置流程。 新建工作流「url2table」,根据弹窗要求自定义工作流信息。 工作流全局流程设置: 开始节点:输入 url。由于希望收到用户输入的待收藏 url 就开始流程,所以不需要额外配置。 变量节点:引入 bot 变量中保存的飞书多维表格地址。为便于维护充当稍后读存储地址的飞书多维表格链接,需要将这个链接存储在 bot 的变量中,并在工作流运行时进行引用。 插件节点:获取页面内容。这一步直接把开始节点的{{BOT_USER_INPUT}}引入到参数{{url}}中,随便设置{{timeout}}为 60000。
2024-11-29
ai和保险行业
以下是关于 AI 和保险行业的相关内容: 人工智能和机器学习在金融服务行业的应用已有十多年,促成了从更好的信贷评估到更精确的基础欺诈评分等一系列改进。大型语言模型通过生成式人工智能代表着重大飞跃,正在改变多个领域。金融服务公司拥有大量历史金融数据,若用其微调大型语言模型或从零开始训练模型,能迅速回答几乎任何金融问题。金融服务行业已准备好使用生成式人工智能来实现五个目标:个性化的消费者体验、成本效益高的运营、更好的合规性、改进的风险管理以及动态的预测和报告。 在保险行业,文章探讨了人工智能如何提升保险服务的价值链。AI 的医疗大模型与真人医生的治疗方案达到了 96%的一致性。保险销售基于信任交易,用户体验和满意度是信任累积关键,未来 GPT 可视为业务人员的个人助理。优化保险服务链需考虑在线与远程服务体验、独特的用户分类方法、数字化服务体系、用户心理状态、路径设计以及保险营销员的实际需求等,以实现用户财务需求与保险商品的双赢。
2025-02-28
我是一名港口行业国有企业职工培训专员,想结合当前AI技术应用,出一份既涵盖管理人员序列、职能人员序列,又包括技能操作序列职工的,可直接执行的年度培训计划文案,字数不超过1000字。
以下是为您提供的一份结合当前 AI 技术应用的港口行业国有企业职工年度培训计划文案,希望对您有所帮助: 一、培训目标 提升管理人员、职能人员和技能操作序列职工在 AI 技术应用方面的知识和技能,增强企业整体竞争力。 二、培训对象 管理人员序列、职能人员序列、技能操作序列职工。 三、培训内容 1. 管理人员序列 AI 技术在企业管理中的应用趋势与案例分析。 基于 AI 的决策支持系统的使用与解读。 2. 职能人员序列 AI 办公软件的应用技巧,如自动化流程处理。 利用 AI 进行数据分析与报告生成。 3. 技能操作序列职工 港口智能化设备中 AI 技术的原理与操作维护。 基于 AI 的安全监控系统的操作与应急处理。 四、培训方式 1. 线上课程:利用网络平台提供相关课程,方便职工自主学习。 2. 线下讲座:邀请专家进行现场讲解和互动交流。 3. 实践操作:在实际工作场景中进行模拟训练和实际操作。 五、培训时间安排 1. 每月安排一次线上课程。 2. 每季度组织一次线下讲座。 3. 不定期进行实践操作培训,根据实际工作需求灵活安排。 六、培训效果评估 通过考试、实际操作考核、项目成果评估等方式,检验职工的学习成果,并将其与绩效考核挂钩,激励职工积极参与培训。
2025-02-28
ai在自媒体行业的应用
AI 在自媒体行业有广泛的应用,主要包括以下方面: 写作方面: 1. 项目启动:确定目标客户群体,如大学生、职场人士、自媒体从业者等,并选择合适的 AI 写作工具以满足不同客户需求。 2. 准备阶段:学习并实践 AI 写作技术,通过书籍、在线课程等资源提升写作技能,同时构建团队,培养和扩充团队成员以提高运营效率。 3. 商业模式构建:确定服务内容,如提供论文、报告、文案等直接写作服务,并制定质量控制标准以确保写作内容满足客户要求。 4. 运营与推广:在淘宝等电商平台上开设店铺展示并销售写作服务,建立写作培训社群分享写作技巧和 AI 应用经验以提升品牌影响力,通过社交媒体和线下活动进行品牌和社群建设,与绘画团队、其他写作工作室等合作共同开发新项目。 5. 项目优化与发展:持续关注 AI 技术进展以提升服务质量和效率,根据市场需求拓展新的服务和产品,并收集客户反馈不断优化和改进服务。 AI 绘画方面: 1. 个体成为自媒体博主。 2. 个体商户应用。 3. 实体印刷(如 T 恤、杯子实物等)。 4. AI 摄影。 5. 设计接单。 6. AI 定制萌娃头像。 7. 电商商品。 8. 自媒体素材。 9. AI 服装预售。 10. AI 视频接单。 11. 培训老师。 公司方面: 1. 设计质量和效率提升。 2. AI 绘画相关应用开发。 3. CV 方面算法应用。 此外,还有以 AI 主题自媒体短视频创作工作坊为例的应用: 1. 开场介绍(15 分钟):主持人介绍活动目的、流程和期望成果,并展示相关案例激发创意思路。 2. 案例和工具介绍(30 分钟):进行案例展示和工具介绍。 3. 创意策划与制作准备(45 分钟):团队成员分工,明确各自负责的部分,讨论并撰写用于辅助制作的 prompts,制定具体的制作计划和时间表。 4. 短视频制作(1 小时):各组根据策划进行视频拍摄、编辑和制作,主持人巡回指导提供必要帮助。 5. 成品展示与评估(30 分钟):各组展示完成的短视频,共享反馈和建议互相学习提升。 6. 总结讨论(15 分钟):总结学习经验,分享创作心得,讨论 AI 在自媒体领域的应用前景。 该工作坊具有案例激发、团队协作、实践指导、创意自由和综合能力提升等特色。通过本次工作坊,参与者不仅能够掌握如何创作吸引人的 AI 主题短视频,还能提升团队协作和创意思维能力,为未来的自媒体创作和 AI 应用奠定坚实基础。
2025-02-28
ai在新媒体行业的应用
以下是 AI 在新媒体行业的一些应用: 1. 广告营销:分众传媒携手阿里通义大模型,推出“众智 AI”产品,为千万中小广告主解决营销难题,降低广告投放门槛,精准高效投放线下广告流量。线下品牌广告通常以大客户投放为主,传统服务方式需要以更科学和数据化智能化的策略辅助。对于中小广告主,尽管分众有技术能力和本地化场景,但他们往往因营销预算和能力有限,无法有效传播。 2. 电影制作:Junie 作为多媒体创作者,在多部作品中运用 AI 技术重塑影像表达。AI 技术虽不能完全替代传统影视制作中的现实主义创作,但能在影视前期策划中扮演重要角色,帮助创作者进行分镜预演和效果测试,提高创作效率,提供更多创意空间。 3. 游戏开发:AI 技术在游戏开发中的应用逐渐落地,为游戏行业提供了新的增长空间,成本、效率和质量同步上升。 4. 影视行业:移动互联网时代后,影视行业的创作、分发和消费方式已被深度重塑,为 AI 技术落地创造基础。AI 技术的应用逐渐渗透到产业各环节,正经历着一场内容生产、分发和消费模式的深刻革命。例如,以 Sora 为代表的视频生成产品推动着影视行业供给侧技术变革。
2025-02-28
都有哪些 关于制造行业的AI应用
在制造业领域,AI 有以下应用: 1. 产品设计和开发:利用 AI 生成工具如 Adobe Firefly、Midjourney 等,可根据文字描述快速生成产品的 3D 模型、渲染图、插图等设计元素,大幅提高产品设计效率。 2. 工艺规划和优化:结合大语言模型的自然语言处理能力,能自动生成制造工艺流程、设备选型、质量控制等方案,优化生产过程。 3. 设备维护和故障诊断:利用 AI 模型分析设备运行数据,可预测设备故障,并自动生成维修建议,提高设备可靠性。 4. 供应链管理:AI 可根据历史数据和市场变化,自动生成采购计划、库存预测、物流优化等内容,提高供应链管理效率。 5. 客户服务:基于对话模型的 AI 客服机器人,能自动生成个性化的客户回复,提升客户体验。 总的来说,AIGC 技术正在制造业各环节得到广泛应用,从产品设计到生产管理再到客户服务,都能发挥重要作用,提高企业的效率和竞争力。 此外,在汽车行业,AI 的应用案例包括: 1. 自动驾驶技术:利用 AI 进行图像识别、传感器数据分析和决策制定,自动驾驶汽车能够自主导航和驾驶。 2. 车辆安全系统:AI 用于增强车辆的安全性能,如自动紧急制动(AEB)、车道保持辅助(LKA)和盲点检测系统。 3. 个性化用户体验:AI 可根据驾驶员的偏好和习惯来调整车辆设置,如座椅位置、音乐选择和导航系统。 4. 预测性维护:通过分析车辆的实时数据,AI 能预测潜在的故障和维护需求,减少停机时间和维修成本。 5. 生产自动化:在汽车制造过程中,AI 用于自动化生产线,提高生产效率和质量控制。 6. 销售和市场分析:汽车公司使用 AI 分析市场趋势、消费者行为和销售数据,以便更好地理解客户需求,制定营销策略和优化产品定价。 7. 电动化和能源管理:AI 在电动汽车(EV)的电池管理和充电策略中发挥作用,优化电池使用和充电时间来提高能源效率和延长电池寿命。 8. 共享出行服务:AI 支持的共享出行服务,如 Uber 和 Lyft,使用 AI 优化路线规划、调度车辆和定价策略,提高服务效率和用户满意度。 9. 语音助手和车载娱乐:AI 驱动的语音助手,如 Amazon Alexa Auto 和 Google Assistant,允许驾驶员通过语音命令控制车辆功能、获取信息和娱乐内容。 10. 车辆远程监控和诊断:AI 系统可以远程监控车辆状态,提供实时诊断和支持,帮助车主及时了解车辆状况并采取相应措施。
2025-02-27
行业大模型构建
以下是关于行业大模型构建的相关信息: 优秀模型案例介绍: SuperCLUE2.0 是通用大模型综合性测评基准 SuperCLUE1.0 的能力延展,融合行业场景属性和大模型落地特点,为行业应用及开发者构建评估框架,促进大模型供需两侧的进一步对齐。 SuperCLUE 持续构建行业测评基准,包括已发布的汽车行业测评基准,以及筹备中的金融、教育、娱乐、手机、政务、医疗等行业测评基准。 SuperCLUE 持续构建专项测评基准,已发布的有 Safety 安全测评基准、Agent 智能体测评基准,筹备中的有个性化中文测评基准、角色扮演测评基准、中文多模态测评基准、RAG 检索增强测评基准、办公场景测评基准等。 优化路径: 广义上的大模型优化包括完整训练一个大模型,但从策略上建议先从提示词工程到微调开始,因为涉及大模型训练成本极高。在分析出问题所在后,可按需选用或综合运用缺失知识用 RAG、准确度或模式遵循度不足用微调等技术进行性能优化。 国内大模型落地情况: Gartner 预测到 2028 年至少有 15%的日常工作决策将由代理型 AI(AI 智能体)自主做出。 2024 年被称为国内大模型落地元年,“百模大战”后,国内大模型行业主要玩家包括百度、阿里、字节等科技大厂和创业“AI 六小虎”。 2024 年 1 至 11 月,国内大模型中标项目数量和金额大幅增长,中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。在金融行业,百度也以 14 个中标数量、3734.4 万元中标金额排名第一,科大讯飞居第二。
2025-02-27