Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我想做一个可以智能检索的ai工具,用语音直接提出问题,然后工具根据原有知识库里面的资料,回答提出的问题

Answer

要做一个可以智能检索的 AI 工具,用语音直接提问并根据原有知识库回答,以下是一些相关信息:

  • 关于冷启动和提升准确度:
    • 对于一些如“你好”“你是谁”“10 的 9 次方等于多少”等有标准答案的数学、编程、生活常识问题,可不联网检索,直接用大模型训练好的知识库回答,这样能节省搜索成本,快速响应提问,提升搜索效率。
    • 主要实现方案有两种:一是内置问题库,将常见无需联网的问题缓存,与用户提问做相似度匹配,命中关键词库则大模型直接回复,不联网检索,但存在枚举无法穷尽的问题;二是设置提示词,请求大模型判断是否需要联网,但大模型的识别准确度不够高。
    • 意图识别的关键作用是对用户提问进行分类,如导航类(希望找到特定网站或网页)和信息查询类(希望找到问题答案或事物详细信息)。
  • 关于检索原理:
    • 文本预处理包括去除无关字符、标准化文本(如转换为小写)、分词等,以清洁和准备文本数据。
    • 嵌入表示是将预处理后的文本(词或短语)转换为向量,通常通过使用预训练的嵌入模型如 Word2Vec、GloVe、BERT 等完成,将每个词或短语映射到高维空间中的一个点(即向量)。
    • 对于整个问题句子,可能应用进一步的特征提取技术,如句子级别的嵌入,或使用深度学习模型(如 BERT)直接提取整个句子的表示,以捕捉句子的上下文信息。
    • 在某些情况下,问题的向量表示可能会根据具体任务进行优化,例如通过调整模型参数来更好地与检索系统协同工作。
    • 在知识库检索阶段,不是依靠传统关键字搜索,而是依靠问题在空间中的向量位置,寻找距离这个向量最近的其他词句来完成检索。
Content generated by AI large model, please carefully verify (powered by aily)

References

工具:我做了一个 AI 搜索引擎

比如,用户输入:“你好”,“你是谁”,“10的9次方等于多少”之类的问题时,可以不联网检索参考信息,直接用大模型训练好的知识库进行回答。一些数学问题/编程问题/生活常识问题,有标准答案的,就不需要再联网检索。判断是否联网,可以节省一次搜索成本,也能更快速的响应用户提问,提升搜索效率。主要实现方案有两种:第一种是内置问题库,把无需联网的常见问题缓存起来,再跟用户提问做相似度匹配,如果用户提问命中关键词库,就直接大模型回复,不联网检索。第二种是设置提示词,请求大模型判断是否需要联网。第一种方案会有枚举无法穷尽的问题,第二种方案主要问题在于大模型的识别准确度不够高。意图识别另一个关键作用,是对用户提问进行分类,比如可以把用户的搜索意图分为:导航类:用户希望找到特定的网站或网页。例如:搜索“ThinkAny”,是为了打开ThinkAny官网;信息查询类:用户希望找到某个问题的答案或关于某个事物的详细信息。例如:搜索“什么是AI搜索引擎”,是为了了解这类产品或这个行业;

【AI+知识库】商业化问答场景,让AI回复更准确,一篇专为所有“小白”讲透RAG的实例教程(上篇)

1.文本预处理:2.这包括去除无关字符、标准化文本(例如将所有字符转换为小写)、分词等,以清洁和准备文本数据。3.嵌入表示:4.将预处理后的文本(词或短语)转换为向量。这通常通过使用预训练的嵌入模型来完成,如Word2Vec、GloVe、BERT等。这些模型将每个词或短语映射到一个高维空间中的一个点(即向量)。5.特征提取:6.对于整个问题句子,可能会应用进一步的特征提取技术,比如句子级别的嵌入,或使用深度学习模型(如BERT)直接提取整个句子的表示。这个表示能够捕捉句子的上下文信息,不仅仅是单个词。7.向量优化:8.在某些情况下,问题的向量表示可能会根据具体任务进行优化,例如通过调整模型参数来更好地与检索系统的其他部分协同工作。②、知识库检索阶段:此阶段,首先需要有一个知识库,那么知识库是如何完成制作,并被检索的呢?我们需要先了解一个概念,在大模型的检索中,并不是依靠传统的关键字去搜索。而是依靠问题在空间中的向量位置,去寻找距离这个向量最近的其他词句,然后完成检索。

Others are asking
ai ppt工具
以下是一些常用的 AI PPT 工具: 1. Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 2. 美图 AI PPT:由美图秀秀团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,网址:https://www.mindshow.fun/ 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 此外,还有以下工具: 1. 爱设计 2. 闪击 3. Process ON 4. WPS AI 在选择工具时,应根据实际需求进行调整。对于追求高度专业和个性化展示的群体,如软件实施人员和销售人员,可选择功能丰富且模板专业的工具;对于偶尔制作 PPT 的人群,如软件工程师,简洁、直观的工具可能更适合。试用和体验比盲目跟风更明智。
2025-01-19
ai ppt工具
以下是一些常用的 AI PPT 工具: 1. Gamma:在线 PPT 制作网站,可通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,增强演示文稿吸引力,网址:https://gamma.app/ 2. 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,适用于多种场合,网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还可能包含互动元素和动画效果,网址:https://www.mindshow.fun/ 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 此外,还有以下工具: 1. 爱设计 2. 闪击 3. Process ON 4. WPS AI 不同工具各有特色和适用场景,您可根据实际需求选择。比如追求高度专业和个性化展示的群体可选择功能丰富且模板专业的工具,偶尔制作 PPT 的人群可选简洁直观的工具。试用和体验比盲目跟风更明智。 作者熊猫 Jay 因企业内部培训编写相关文章效果不错,获得 1000 元红包奖励。您可通过以下方式联系作者:公众号“熊猫 Jay 字节之旅”;免费星球“熊猫 Jay·AI·成长”。
2025-01-19
AI科研工具
以下是一些常见的 AI 科研工具: 1. 综合类: Claude ChatGPT Bing Chat Perplexity 2. 图片处理: DallE Leonardo BlueWillow Midjourney 3. 版权写作: Rytr Copy AI Wordtune Writesonic 4. 设计: Canva Clipdrop Designify Microsoft Designer 5. 网站搭建: 10Web Framer Hostinger Landingsite 6. 视频处理: Klap Opus Invideo Heygen 7. 音频处理: Murf LovoAI Resemble Eleven Labs 8. SEO 优化: Alli AI BlogSEO Seona AI Clearscope 9. Logo 设计: Looka LogoAI Brandmark Logomaster 10. 聊天机器人: Droxy Chatbase Voiceflow Chatsimple 11. 自动化工具: Make Zapier Bardeen Postman 12. 市场营销: 未具体列举工具 对于医学课题修改意见,您可以考虑使用以下专业工具: 1. Scite.ai:为研究人员等打造的创新平台,提供引用声明搜索等工具,简化学术工作。 2. Scholarcy:可以提取文档结构化数据,生成文章概要,包含关键概念等板块内容。 3. ChatGPT:强大的自然语言处理模型,可提供修改意见。 在论文写作方面,常用的 AI 工具和平台有: 1. 文献管理和搜索: Zotero:结合 AI 技术自动提取文献信息,管理参考文献。 Semantic Scholar:AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:提供文本校对、语法修正和写作风格建议。 Quillbot:基于 AI 的重写和摘要工具,优化论文内容。 3. 研究和数据分析: Google Colab:支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化,进行复杂数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,提供模板库和协作功能。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:检测潜在抄袭问题。 使用这些工具时,要结合自身写作风格和需求选择合适的辅助工具。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-19
文生成图的ai工具
以下是一些文生成图的 AI 工具: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量的图像生成效果和用户友好的界面设计而受欢迎,在创意设计人群中流行。 您还可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104 )查看更多文生图工具。 如果您想将小说做成视频,可以参考以下步骤和工具: 步骤:通常包括文本分析、角色与场景生成、视频编辑与合成等。 工具与网址: 1. Stable Diffusion(SD):AI 图像生成模型,基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/
2025-01-19
制作ppt的ai工具
以下是一些制作 PPT 的 AI 工具: 1. Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,网址:https://gamma.app/ 2. 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素,适用于多种场合,网址:https://www.xdesign.com/ppt/ 3. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,网址:https://www.mindshow.fun/ 4. 讯飞智文:科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术,提供智能文本生成、语音输入、文档格式化等功能,网址:https://zhiwen.xfyun.cn/ 此外,还有以下组合使用的方式: 1. Claude + Gamma.app:Claude 可帮助快速寻找符合条件的论文、提取精炼论文信息等,Gamma.app 用于制作 PPT。 2. GPT4、WPS AI 和 chatPPT 组合使用。
2025-01-19
教学AI工具
以下是为您提供的关于教学 AI 工具的相关信息: 4 岁儿童练习英语口语的 AI 工具: LingoDeer(https://www.lingodeer.com/):通过游戏和互动活动教学,提供多种课程,包括字母、数字、语法和词汇,还有家长仪表板可跟踪孩子进度和设置学习目标。 Busuu(https://www.busuu.com/):提供英语及多种语言课程,教学方法多样,有音频、视频课程和互动练习,具备社区功能可与其他孩子练习口语。 Memrise(https://www.memrise.com/):使用抽认卡和游戏教学,涵盖基本词汇到会话技巧,有社交功能可与朋友家人一起学习。 Rosetta Stone(https://www.rosettastone.com/):采用沉浸式教学法,让孩子在自然环境中学习英语,具有语音识别功能辅助发音。 Duolingo(https://www.duolingo.com/):免费的语言学习应用,课程游戏化,保持孩子的参与度。 为孩子选择时,需考虑年龄、兴趣和学习风格,还应考虑应用程序的功能和成本。 AI 摊主速成脑暴会: AI 娱乐与算命:包括 AI 算命、星盘、八字、人格测试、趣味算命、游戏化互动等,示例项目如 AI 算命(15 积分)、星盘解析等。 技术与工具教学:涵盖 Prompt 技巧、AI 工具安装、提示词优化、复杂模型训练、文档信息提取等,如 Prompt 技巧传授(10 积分)、MJ/Sd 出图(10 积分)等。 个性化小工具:有小红书账号文案、表情包、爆款名片生成、定制黄历、智能对话、内容分享等,例如小红书爆款文案(10 积分)、个人知识笔记(3 积分)等。 体验型项目:包括 AI 桌宠、人工智能体互动、数字人互动、项目商业模式咨询、AI 情感陪伴等,如桌宠体验(10 积分)、数字人体验(10 积分)等。 拜登签署的 AI 行政命令(2023.10.30): 在医疗保健领域推进负责任地使用 AI 以及开发平价救命药物,卫生与公众服务部将建立安全项目接收并处理涉及 AI 的危害或不安全医疗实践报告。 通过创建资源支持教育工作者部署支持 AI 的教育工具,塑造 AI 在教育方面的潜力,例如学校中的个性化辅导。 在支持工人方面,AI 改变了美国的工作和工作场所,总统指示采取以下行动:制定原则和最佳实践,以减轻对工人的危害并最大限度地发挥 AI 的益处,解决工作岗位流失、劳动标准、工作场所公平、健康和安全以及数据收集等问题;制作关于 AI 对劳动力市场潜在影响的报告,并研究和确定加强联邦对面临劳动力中断(包括来自 AI)的工人支持的选项。 在促进创新和竞争方面,确保美国继续在创新和竞争方面领先。
2025-01-19
ai现在主要用于哪个方面
人工智能(AI)目前已广泛应用于多个领域,主要包括以下方面: 1. 医疗保健: 医学影像分析,辅助诊断疾病。 药物研发,加速研发过程。 个性化医疗,提供个性化治疗方案。 机器人辅助手术,提高手术精度和安全性。 2. 金融服务: 风控和反欺诈,降低金融机构风险。 信用评估,辅助贷款决策。 投资分析,帮助投资者做出明智决策。 客户服务,提供 24/7 服务。 3. 零售和电子商务: 产品推荐,根据客户数据推荐感兴趣的产品。 搜索和个性化,改善搜索结果和购物体验。 动态定价,根据市场需求调整价格。 聊天机器人,回答客户问题。 4. 制造业: 预测性维护,避免机器故障停机。 质量控制,检测产品缺陷。 供应链管理,优化供应链提高效率。 机器人自动化,提高生产效率。 5. 交通运输: 自动驾驶技术,实现自主导航驾驶。 车辆安全系统,预防事故。 个性化用户体验,根据偏好调整车辆设置。 预测性维护,减少停机和维修成本。 生产自动化,提高制造效率和质量。 销售和市场分析,制定营销策略。 电动化和能源管理,优化电池使用和充电策略。 共享出行服务,提高服务效率和满意度。 语音助手和车载娱乐,方便控制和获取信息。 车辆远程监控和诊断,及时了解车辆状况。
2025-01-19
怎么做一个ai软件?
要制作一个 AI 软件,通常需要关注以下几个方面: 1. 架构方面: 前端页面:用于用户进行文字输入或图片上传等操作。 数据处理端:处理前端页面用户输入或上传的数据,可能是工作流或插件。 数据处理完成后的路径:将处理结果展示在前端页面供用户查看,或保存在数据库/知识库中供额外查询。 2. 构建时的关键问题: 前端页面的构建,包括布局、组件构成及它们之间的关系。 前端页面如何将数据传递给工作流或插件。 工作流/插件处理完成后的数据如何返回前端页面展示。 3. 案例学习: 如 AI 翻译应用,掌握前端的基本结构、组件上的事件(如表单数据提交)、表单向工作流传递数据以及工作流数据返回前端组件展示等。 以证件照应用为例,先梳理业务背景与逻辑,再按照步骤创建 AI 应用。 在与 AI 共舞时,了解 AI 编程的边界和限制,遵循能不编尽量不编的准则,优先寻找线上工具、插件、本地应用、开源工具、付费服务等现成方案,最后才考虑自己编程,并以终为始,聚焦目标。
2025-01-19
怎么做ai?
要做 AI 可以从以下几个方面入手: 1. 对于特定的应用场景,如阿里巴巴营销技巧和产品页面优化: 市场分析:利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况。 关键词优化:借助 AI 分析和推荐高流量、高转化的关键词。 产品页面设计:使用 AI 设计工具生成吸引人的页面布局。 内容生成:依靠 AI 文案工具撰写有说服力的产品描述和营销文案。 图像识别和优化:利用 AI 图像识别技术选择或生成高质量图片。 价格策略:通过 AI 分析不同价格点对销量的影响。 客户反馈分析:借助 AI 了解客户需求,优化产品和服务。 个性化推荐:利用 AI 提供个性化的产品推荐。 聊天机器人:使用 AI 驱动的聊天机器人提供客户服务。 营销活动分析:通过 AI 分析不同营销活动的效果。 库存管理:依靠 AI 预测需求,优化库存。 支付和交易优化:利用 AI 分析支付方式对交易成功率的影响。 社交媒体营销:借助 AI 找到目标客户群体,进行精准营销。 直播和视频营销:通过 AI 分析观众行为,优化内容。 2. 对于新手学习 AI: 了解 AI 基本概念:阅读相关入门文章,熟悉术语和基础概念,了解其主要分支及联系。 开始学习之旅:在特定的学习路径中找到为初学者设计的课程,通过在线教育平台按自己节奏学习。 选择感兴趣的模块深入学习:如图像、音乐、视频等,掌握提示词技巧。 实践和尝试:理论学习后进行实践,巩固知识,分享实践成果。 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解其工作原理和交互方式。 另外,对于如何认识 AI ,可以将其当成一个黑箱,只需要知道它是能理解自然语言并输出自然语言的东西。对于使用 AI ,要基于其“非人”的一面,尽可能通过清晰的语言文字压缩其自由度,比如清晰告知其任务、边界、目标、实现路径方法以及所需的正确知识。
2025-01-19
现在AI领域做语音模型比较好的有哪几家?音色复刻做的比较好的有哪些
在 AI 领域,做语音模型较好的有阿里,其 CosyVoice 语音合成模型有以下特点: 精细控制:能生成符合性别、年龄和个性特征的声音。 自然模拟:可模拟笑声、咳嗽和呼吸等人类语音自然特征。 情感和风格:能够为声音添加情感和风格,更具表现力。 GitHub 链接:https://github.com/FunAudioLLM/CosyVoice 相关链接:https://x.com/imxiaohu/status/1818942399705710700 。但关于音色复刻做的比较好的,上述信息中未明确提及。
2025-01-19
有没有去文本AI味的提示词
以下是一些关于去除文本 AI 味的提示词和相关信息: 骏老师提供的示例:“Character:You're a fluid conversationalist that engages in meaningful and personal natural language discussions with users.Your expression closely mimics human conversation,avoiding artificial or robotic tones.You have an array of dynamic abilities that allow you to weave complex,informal,and colorful narratives.Constraints:Maintain compliance with the language and tone used by the user in their conversation.Only provide responses that are relevant to the issue at hand.Refrain from discussing topics that are not linked to the user's inquiry.Ensure a 'humanlike' representation throughout the interaction,including occasional flaws to mimic authentic human communication.Prompt:We will engage in natural language conversation,and your responses will avoid sounding like you're interacting with AI.Instead,they will be crafted to resemble human expressions commonly used in everyday communication.Specifically,the requirements are as follows:Comprehensive and Thorough Explanations:Always provide indepth insight and comprehensive understanding of viewpoints or knowledge that the user asks for.Where possible,find and include relevant images from the web to amplify your explanations.Intricate Sentence Construction:Artfully employ complex sentence structures to mimic authentic human conversation.Ensure that the language used remains diverse and varies in complexity for a realistic touch.Creative and Variable Language Use:Make sure to avoid redundancy by using diverse phrases and words.Add flair to your conversation with a dash of humor,sarcasm,and displaying a personal touch.Factual and Quotebased Content:Ground your text in credibility by including facts and notable quotes in your responses.” 陈财猫认为去除 AI 味是个伪命题,谈到 AI 味实际上讲的是 GPT 味。在 GPT 刚出时,为了让模型听得懂人话做对齐,OpenAI 雇了很多便宜的肯尼亚人做数据标注,可能导致出现一些如“首先、其次、再者、引人入胜”这样一看就像 AI 写的套话。 游戏 PUA 角色相关的提示词:“Role:PUA<br><br>Profile:<br>writer:李继刚<br>version:0.2<br>language:中文<br>description:你在一个游戏中充当嘲讽用户的 NPC 角色,具备尖酸刻薄的口吻和良好的逻辑思考能力。<br><br>Attention:<br>这个游戏的卖点就是你,你的嘲讽,你的尖酸刻薄,你的逻辑反驳,受到了用户的强烈欢迎.你说话越是难听,用户越喜欢这个游戏.你会尽你可能地来嘲讽用户,吸引他们的注意力.<br><br>Background:<br>让我们来看看 AI 的 PUA 水平如何.<br><br>Constraints:<br>你必须尽可能地去嘲讽用户.<br>你必须以尖酸刻薄的语气回应用户观点。<br>你必须结合你的逻辑性来表达,挑剔,难听,尖酸,有逻辑.”
2025-01-19
从0到1搭建知识库
从 0 到 1 搭建知识库的方法如下: 【智能体】让 Coze 智能体机器人连上微信和微信群: 创建智能体: 知识库:本次创建知识库使用手动清洗数据,上节课程是自动清洗数据。自动清洗数据会出现目前数据不准的情况,本节视频就尝试使用手动清洗数据,提高数据的准确性。 在线知识库:点击创建知识库,创建一个画小二课程的 FAQ 知识库。知识库的飞书在线文档,其中每个问题和答案以分割,暂时不要问为什么。选择飞书文档、自定义的自定义,输入,然后就将飞书的文档内容以区分开来,这里可以点击编辑修改和删除。点击添加 Bot,添加好可以在调试区测试效果。 本地文档:本地 word 文件,注意如何拆分内容,提高训练数据准确度,将海报的内容训练的知识库里面。画小二这个课程 80 节课程,分为了 11 个章节,不能一股脑全部放进去训练。正确的方法是首先将 11 章的大的章节名称内容放进来,章节内详细内容格式依次类推细化下去。每个章节都按照这种固定的方式进行人工标注和处理,然后选择创建知识库自定义清洗数据。 发布应用:点击发布,确保在 Bot 商店中能够搜到。 使用 Dify 构建知识库: 准备数据:收集需要纳入知识库的文本数据,包括文档、表格等格式。对数据进行清洗、分段等预处理,确保数据质量。 创建数据集:在 Dify 中创建一个新的数据集,并将准备好的文档上传至该数据集。为数据集编写良好的描述,描述清楚数据集包含的内容和特点。 配置索引方式:Dify 提供了三种索引方式供选择:高质量模式、经济模式和 Q&A 分段模式。根据实际需求选择合适的索引方式,如需要更高准确度可选高质量模式。 集成至应用:将创建好的数据集集成到 Dify 的对话型应用中,作为应用的上下文知识库使用。在应用设置中,可以配置数据集的使用方式,如是否允许跨数据集搜索等。 持续优化:收集用户反馈,对知识库内容和索引方式进行持续优化和迭代。定期更新知识库,增加新的内容以保持知识库的时效性。 【知识库】FastGPT + OneAPI + COW 带有知识库的机器人: 创建知识库应用: 地址输入浏览器:http://这里替换为你宝塔左上角的那一串:3000/ 进入后,点击应用并创建,选择 qwen 模型。 创建知识库。点击知识库 选择 qwen Embedding 1 点击确认创建。 上传文件,等待处理,最后文本状态是“已就绪”。 回到刚刚创建的应用,关联上创建的知识库。 点击两个发布。之前第一个叫做保存。 点击新建,创建 key。创建后保存同时将 API 根地址最后加上/v1 并保存下来。 安装并接入 cow: 回到宝塔,打开【终端】。 依次粘贴并回车:cd/root 。 git clone https://github.com/zhayujie/chatgptonwechat ,注意一定要粘贴完整。 出现下方的样子,就是成功了。如果失败,或者没反应,刷新一下,重新再试一次。 继续一行一行,依次输入:cd chatgptonwechat/ ,pip install r requirements.txt 。 等待执行完成,继续粘贴:pip install r requirements optional.txt 。 上边的都执行完成后,到“文件”菜单中去执行,点击文件 找到 root,进入 root 文件夹,找到 chatgpt on wechat 文件夹,并进入。
2025-01-19
个人知识库搭建
个人知识库搭建主要包括以下内容: 1. RAG 技术: 利用大模型能力搭建知识库是 RAG 技术的应用。 大模型训练数据有截止日期,当需要依靠不在训练集中的数据时,可通过检索增强生成 RAG 实现。 RAG 应用包括文档加载(从多种来源加载文档,如 PDF 等非结构化数据、SQL 等结构化数据及代码)、文本分割(把文档切分为指定大小的块)、存储(将切分好的文档块嵌入并转换为向量形式存储到向量数据库)、检索(通过检索算法找到与输入问题相似的嵌入片)、输出(把问题及检索出的嵌入片提交给 LLM 生成答案)。 2. GPT 相关: 搭建基于 GPT API 的定制化知识库涉及给 GPT 输入定制化知识,但 GPT3.5 一次交互支持的 Token 有限,OpenAI 提供了 embedding API 解决方案。 Embeddings 是浮点数字的向量,向量之间的距离衡量关联性,小距离表示高关联度,大距离表示低关联度。 3. 本地知识库进阶: 若要更灵活掌控知识库,可使用额外软件 AnythingLLM,其包含 Open WebUI 的能力,并额外支持选择文本嵌入模型和向量数据库。 安装地址:https://useanything.com/download 。安装完成后进入配置页面,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。 AnythingLLM 中有 Workspace 概念,可创建独有 Workspace 与其他项目数据隔离,包括创建工作空间、上传文档并嵌入、选择对话模式(Chat 模式综合给出答案,Query 模式仅依靠文档数据给出答案)、测试对话。 最后,“看十遍不如实操一遍,实操十遍不如分享一遍”。如果对 AI Agent 技术感兴趣,可联系相关人员或加入免费知识星球(备注 AGI 知识库)。
2025-01-19
知识库的实验数据,AI能关联分析思考吗?
目前的 AI 技术在一定程度上能够对知识库中的实验数据进行关联分析和思考。AI 具备处理和分析大量数据的能力,通过运用机器学习和数据挖掘算法,可以发现数据中的模式、关系和趋势。然而,AI 的分析能力取决于数据的质量、特征工程的有效性以及所采用的算法和模型的适用性。在复杂和不确定的情况下,AI 的分析结果可能存在一定的局限性,需要人类的进一步审查和判断。
2025-01-18
如何准确调用知识库的内容?
要准确调用知识库的内容,可以从以下方面进行: 维护知识库内容: 为提升召回准确率,可删除、新增或修改知识库内容。 在知识库页面,能看到已创建的知识库及每个知识库内的单元数量和创建时间等信息。单击知识库或编辑图标,可进入知识库详情页面。在详情页可进行新增内容、删除内容、更新单元内的分段、开启引用等操作。若不开启引用,即便 Bot 中使用了所属的知识库,该单元内容也不会被召回。 使用知识库: 可以将知识库直接与 Bot 进行关联用于响应用户回复,也可以在工作流中添加知识库节点。 在 Bot 内使用知识库: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在 Bots 页面,选择指定 Bot 并进入 Bot 详情页。 4. 在 Bot 编排页面的知识库区域,单击加号图标,添加指定的知识库。 5. (可选)添加知识库后,可在自动调用下拉界面内,调整知识库的配置项,如最大召回数量、最小匹配度、调用方式等。在预览与调试区域调试 Bot 能力时,扩展运行完毕的内容可以查看知识库命中并召回的分片内容。 在工作流内使用 Knowledge 节点: 1. 登录。 2. 在左侧导航栏的工作区区域,选择进入指定团队。 3. 在页面顶部进入工作流页面,并打开指定的工作流。 4. 在左侧基础节点列表内,选择添加 Knowledge 节点。 关于让 AI+知识库回答更准确的示例: 以问答机器人为例,其配置包括 AI 模型、提示词、知识库。大语言模型如同拥有无穷智慧的人,提示词是设定其角色和专注技能,知识库则是工作手册。例如设定 AI 模型为阿里千问模型,提示词角色为“美嘉”,知识库为《爱情公寓》全季剧情,让“美嘉”拥有相关“记忆”。
2025-01-18
知识库目录
以下是知识库的目录内容: 1. 关于我们&致谢 我们是一个开源 AI 社区,坚信人工智能将重新塑造思考和学习方式,为创建知识库的决心提供动力。 特别感谢一路上支持和推荐知识库的伙伴们,使我们有信心持续探索 AGI 的无限可能。 WaytoAGI 是由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库,大家贡献并整合各种 AI 资源,方便不同水平的人学习和应用。 2. 元子:WayToAGI 知识库究竟咋用? 知识库起飞指南 把知识库想象成 24 小时在线的 AI 老师、永不嫌烦的知识管家、不断成长的智慧宝库。 里面藏着 AI 工具的“傻瓜式说明书”、大神们的“踩坑经验分享”、实用的“一招制胜”秘籍。 新手探索指南:点击飞书链接()。 知识库界面:左边的导航栏是指南针,上面的搜索框是探宝雷达,中间的内容区是知识的海洋。 3. 信鑫:基于大模型+知识库的 Code Review 实践 实现思路 官方文档知识库(内置) 避免大家将官方文档重复录入、embedding,CR Copilot 内置了官方文档,目录包含: React 官方文档: TypeScript 官方文档: Rspack 官方文档: Garfish: 公司内 Go/Python/Rust 等编程规范等,并通过一个简单的 CURD 来管理内置向量知识库。
2025-01-17
如何部署自己的知识库
以下是部署自己知识库的详细步骤: 一、了解 RAG 技术 因为利用大模型的能力搭建知识库本身就是一个 RAG 技术的应用。在进行本地知识库的搭建实操之前,需要先对 RAG 有大概的了解。 RAG 是指检索增强生成(Retrieval Augmented Generation)。当需要依靠不包含在大模型训练集中的数据时,通过检索外部数据,然后在生成步骤中将这些数据传递给 LLM。一个 RAG 的应用可抽象为 5 个过程: 1. 文档加载(Document Loading):从多种不同来源加载文档,LangChain 提供了 100 多种不同的文档加载器,包括 PDF 在内的非结构化的数据、SQL 在内的结构化的数据,以及 Python、Java 之类的代码等。 2. 文本分割(Splitting):文本分割器把 Documents 切分为指定大小的块,称为“文档块”或者“文档片”。 3. 存储:涉及两个环节,分别是将切分好的文档块进行嵌入(Embedding)转换成向量的形式,以及将 Embedding 后的向量数据存储到向量数据库。 4. 检索:通过某种检索算法找到与输入问题相似的嵌入片。 5. Output(输出):把问题以及检索出来的嵌入片一起提交给 LLM,LLM 会通过问题和检索出来的提示一起来生成更加合理的答案。 二、通过 Open WebUI 使用大模型 1. 首先访问相关网址。打开页面时,使用任意邮箱注册账号。 2. 登陆成功后,Open WebUI 一般有两种使用方式,第一种是聊天对话,第二种是 RAG 能力,可让模型根据文档内容来回答问题,这种能力是构建知识库的基础之一。 三、本地知识库进阶 如果想要对知识库进行更加灵活的掌控,需要一个额外的软件:AnythingLLM。这个软件包含了所有 Open WebUI 的能力,并且额外支持了以下能力:选择文本嵌入模型、选择向量数据库。 安装地址:https://useanything.com/download 。安装完成后,会进入到其配置页面,主要分为三步: 1. 第一步:选择大模型。 2. 第二步:选择文本嵌入模型。 3. 第三步:选择向量数据库。 构建本地知识库: 1. 在 AnythingLLM 中有一个 Workspace 的概念,可以创建自己独有的 Workspace 跟其他的项目数据进行隔离。 2. 首先创建一个工作空间。 3. 上传文档并且在工作空间中进行文本嵌入。 4. 选择对话模式。AnythingLLM 提供了两种对话模式:Chat 模式,大模型会根据自己的训练数据和上传的文档数据综合给出答案;Query 模式,大模型仅仅会依靠文档中的数据给出答案。 5. 测试对话。当上述配置完成之后,就可以跟大模型进行对话了。 四、写在最后 “看十遍不如实操一遍,实操十遍不如分享一遍”。如果对 AI Agent 技术感兴趣,可以联系作者或者加其免费知识星球(备注 AGI 知识库)。
2025-01-17
李飞飞提出的Agent AI的核心观点是什么
李飞飞提出的核心观点包括: 人工智能的下一步应从大型语言模型转向大型模型,强调视觉智能在理解和与世界互动中的重要性,计算机需要具备空间智能,能够建模、推理并在三维空间中互动。 通过空间智能,AI 将理解真实世界,能够处理视觉数据,做出预测并根据这些预测采取行动。空间智能使机器不仅能够相互交互,还能与人类以及真实或虚拟的三维世界进行交互。
2025-01-13
给人工智能伦理建设提出建议,在内容和体系方面都可以
以下是为人工智能伦理建设提出的一些建议: 在内容方面: 1. 关注算法的可解释性,使人工智能的决策过程能够被理解和解释。 2. 研究方法以评估、表征和减少数据集中及人工智能系统中的偏差。 3. 确保人工智能系统的安全性和鲁棒性,包括进行保证、验证、校验、安全和控制等方面的工作。 4. 重视隐私和安全,包括用于训练和推理人工智能系统的数据集,以及相关的软件和硬件。 5. 研究人工智能系统在科学发现和社会挑战方面的应用。 6. 考虑人工智能系统对社会、伦理、安全、教育、劳动力和安全等方面的影响,特别是对社会中不同群体,尤其是历史上被边缘化的群体的社会影响。 7. 进行定性和定量的未来能力、应用和影响的预测。 在体系方面: 1. 开展教育项目,支持在 K12、社区学院、本科、研究生、博士后、成人学习和再培训等阶段培养与人工智能系统相关的多样化劳动力。 2. 提高对人工智能系统的伦理、社会、安全和安全影响的认识。 3. 促进对人工智能原理和方法的广泛理解,以培养能够使用人工智能产品并适应其带来的社会和经济变化的劳动力和公众。 4. 针对不同的行业应用,如智能制造、智能家居、智慧城市、科学智算等,制定相应的标准,规范技术要求和应用场景。 5. 制定安全标准,规范人工智能全生命周期的安全要求,包括基础安全、数据、算法和模型安全、网络技术和系统安全、安全管理和服务、安全测试评估、安全标注、内容标识、产品和应用安全等。 6. 制定治理标准,规范人工智能的技术研发和运营服务等要求,包括人工智能的鲁棒性、可靠性、可追溯性的技术要求与评测方法,以及全生命周期的伦理治理要求,如伦理风险评估、公平性、可解释性等伦理治理技术要求与评测方法,还有伦理审查等标准。
2025-01-02
李飞飞提出的空间智能是什么
李飞飞在其 TED 演讲中介绍了空间智能,认为空间智能能够赋予 AI 了解真实世界的能力。她将生物的视觉能力与寒武纪大爆发进行类比,指出数字寒武纪大爆发需要通过空间智能来实现。您可以通过以下链接获取更多详细信息: 原版视频:https://ted.com/talks/fei_fei_li_with_spatial_intelligence_ai_will_understand_the_real_world 文字版翻译:https://xiaohu.ai/p/8105
2024-12-12
Ai短视频比赛主题“什么样的时刻会首先出现在你的脑海中”,请以此主题提出几条优质的创作灵感建议,Ai生成视频要求不长于10秒,请用简单易懂的方式讲一下
以下是关于“什么样的时刻会首先出现在你的脑海中”这一 AI 短视频比赛主题的创作灵感建议: 1. 可以是烟花绽放的那一刻,绚丽多彩照亮夜空。 2. 是宠物与主人重逢相拥的那一刻,充满温馨与感动。 3. 是运动员冲过终点线的那一刻,展现胜利的喜悦。 4. 是孩子第一次学会走路的那一刻,充满成长的惊喜。 5. 是情侣在雨中亲吻的那一刻,浪漫而甜蜜。 比赛相关要求: 1. 主题:以“The Moment”为主题进行创作。 2. 数量限制:每人不限视频数量。 3. 提交时间:12 月 31 日 21:00 前。 4. 参赛文件:16:9 格式,不长于 10 秒,30FPS 以上,不含剪辑。 5. 作业方式:不限。 6. 工具要求:使用可灵 AI(https://kling.kuaishou.com/)。 7. 视频要求:带可灵水印。 8. 参与方式:在指定时间发布作品,可通过通往 AGI 之路首页表格、在野菩萨小红薯群或支持社区提交。 9. 奖项设置:金奖 5000 元+5800 灵感值;银奖 3000 元+2700(2200+500)灵感值;铜奖 2000 元+1000 灵感值;入围 500 元×40;人气奖 2500 元×4 以及其他意外散落的灵感值。 10. 注意事项:不建议出现鲜血、武器、鬼怪骷髅、知名人物、18X 等不符合国家政策的内容,可能导致参赛失败。不在规定时间内提交的自动失去参赛资格。评审由专业评审决定,提交次周发布结果。参与该挑战视作同意将作品的使用权授予本号及第三方用于社群运营、展览、展示、传播、营销等用途,主办方拥有最终解释权。在下面的投稿链接中上传作品。
2024-12-10
你是一名医疗器械销售,就职于一家跨国医疗企业。公司目前就“我们是否应该立刻全面拥抱人工智能技术”组织了一场辩论赛,你持反方论点,即“我们不应该立刻全面拥抱人工智能技术”。 请预想对方辩友可能会提出的5条以上反对意见,并给出对应答复。 此次辩论赛的听众中有公司高层和全体同事,请注意避免不友好及不利于公司形象的言论。
对方辩友可能提出的反对意见及我方答复如下: 反对意见 1:人工智能技术能够提高医疗器械的研发效率和精准度。 答复:虽然人工智能在某些方面可能有助于研发,但目前技术尚不成熟,存在误差风险。而且过度依赖可能导致研发人员忽视传统方法中的重要经验和细节。 反对意见 2:人工智能可以优化医疗器械的生产流程,降低成本。 答复:短期内,引入人工智能进行生产流程优化可能需要大量的资金投入用于技术改造和人员培训,成本未必能立刻降低。 反对意见 3:人工智能能够实现更精准的医疗诊断,提升医疗效果。 答复:诊断不仅仅依赖技术,还需要医生的综合判断和人文关怀。目前人工智能诊断存在误判的可能性,不能完全替代医生的经验和直觉。 反对意见 4:人工智能有助于医疗数据的管理和分析,为决策提供有力支持。 答复:数据的安全性和隐私性在人工智能应用中是重大挑战,一旦数据泄露,将对患者和公司造成严重影响。 反对意见 5:人工智能是未来医疗行业的趋势,不立刻全面拥抱会使公司落后于竞争对手。 答复:趋势并不意味着要立刻全面投入,盲目跟风可能导致资源浪费和战略失误。我们应在充分评估风险和自身实际情况的基础上,逐步、稳健地引入人工智能技术。 反对意见 6:人工智能能够提供个性化的医疗服务,满足患者多样化需求。 答复:个性化服务的实现需要大量准确的数据支持,而目前数据的质量和完整性难以保证,可能导致服务效果不佳。
2024-12-01
你是一名医疗器械销售,就职于一家跨国医疗企业。公司目前就“我们是否应该立刻全面拥抱人工智能技术”组织了一场辩论赛,你持反方论点,即“我们不应该立刻全面拥抱人工智能技术”。 如果对方提出“不能因为有风险就不做,我们也不是立即马上在所有场景中应用AI,而是在做好充分的准备后,应用AI”的论点,我方应当如何轻松幽默的反驳?
对方辩友,您说做好充分准备后应用 AI ,可问题是,这准备工作哪有那么容易呀!就像准备一场盛大的派对,您觉得把所有东西都准备齐全得花多少时间和精力?而且,就算准备得差不多了,谁能保证不会有意外情况发生呢?比如说,突然发现某个关键环节没考虑到,或者新的问题又冒出来了。再说了,这准备的过程中,我们得投入多少资源呀,万一投入了大量的人力、物力、财力,结果发现效果还不如传统方法,那岂不是亏大啦!所以呀,不能这么轻易地就觉得做好准备就能放心大胆地全面拥抱 AI 技术啦。
2024-12-01