直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

我想搜索全面彻底的搜索某方面客观存在的事实信息,有什么工具可以实现

回答

以下是一些可以用于全面彻底搜索某方面客观存在的事实信息的工具和相关信息:

  • Coze 手搓的极简版 Perplexity:它旨在结合搜索引擎和 LLM 的优势,提供更优的信息检索体验。但 LLM 本身作为知识问答工具存在缺陷,如无法实时获取最新信息、有“幻觉”问题、无法给出准确引用来源等,而搜索引擎返回的信息呈现形式原始,需要进一步处理。
  • 基于嵌入的搜索:OpenAI 提出,如果作为输入的一部分提供,模型可以利用外部信息源,例如通过嵌入实现高效的知识检索。文本嵌入是衡量文本字符串相关性的向量,相似或相关的字符串距离更近,利用快速向量搜索算法,可将文本语料库分割成块进行嵌入和存储,给定查询后进行向量搜索找到最相关的文本块。相关示例实现可在OpenAI Cookbook中找到。关于如何使用知识检索来最小化模型编造错误事实的可能性,可参阅策略“指示模型使用检索到的知识来回答查询”。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

艾木: 我用Coze手搓了一个极简版Perplexity(基本可以替代Google搜索)

1.首先,LLM的一个很大的缺陷是它无法实时获取最新的信息。它能获取的信息就是预训练时输入的信息,这些信息有一个截断日期,这个日期之后的信息它一概不知(至少无法从模型内部获取到)。而搜索引擎可以获取到更加实时的信息。2.LLM有“幻觉”问题。在缺少相关事实信息的情况下,它就会编造。更严重的是,它很擅长编造,经常编得跟真的一样。而搜索引擎可以检索出相关的信息,这些信息可以作为LLM“推理”的依据。3.LLM无法给出准确的引用来源。LLM吸收了整个互联网的信息,当它回答问题的时候,你会感觉它的回复好像是参考了互联网上的某个地方的内容,但是它无法告诉你它具体引用或者改编的是哪里的内容,因为LLM已经把整个互联网的信息作了词元(token)级别的融合。LLM无法给出引用来源间接带来一个严重问题是,你无法去到信息源,去自己做验证。而搜索引擎可以给予准确的信息源。以上种种问题,决定了LLM本身作为一个知识问答工具是完全不合格的。而搜索引擎的问题则是体验上不够简便、不够直接。搜索引擎返回的信息是一堆链接和文本片段(很多时候还有广告干扰),这种呈现形式是比较原始的,还需要人去做进一步处理。给搜索引擎加上LLM,或许可以带来更优的信息检索体验。Perplexity[4]就是基于这个思路搞出来的产品,目前其估值已经超过5亿美元了,它的目标是要取代Google搜索。这个思路本身没有什么新鲜的,OpenAI早在21年就研究过了[5],后来也有研究者作了进一步的验证[3]。这个思路的技术实现也不复杂,贾扬清大佬用了不到500行Python代码就实现了一个基础版[6]。

沃尔夫勒姆:人工智能能解决科学问题吗?

Exploring Spaces of Systems“Can one find a system that does X?” Say a Turing machine that runs for a very long time before halting.Or a cellular automaton that grows,but only very slowly.Or,for that matter,a chemical with some particular property.“能找到一个能做某事的系统吗?”假设一台图灵机在停止之前运行了很长时间。或者是一个生长的元胞自动机,但生长速度非常缓慢。或者,就此而言,具有某种特定性质的化学物质。This is a somewhat different type of question than the ones we’ve been discussing so far.It’s not about taking a particular rule and seeing what its consequences are.It’s about identifying what rule might exist that has certain consequences.这是一个与我们迄今为止讨论的问题类型有所不同的问题。这并不是要采取特定的规则并看看其后果是什么。这是关于确定可能存在哪些规则会产生某些后果。And given some space of possible rules,one approach is exhaustive search.And in a sense this is ultimately the only “truly unbiased” approach,that will discover what’s out there to discover,even when one doesn’t expect it.Of course,even with exhaustive search,one still needs a way to determine whether a particular candidate system meets whatever criterion one has set up.But now this is the problem of predicting a computation—where the things we said above apply.考虑到一些可能的规则空间,一种方法是穷举搜索。从某种意义上说,这最终是唯一“真正公正”的方法,即使人们没有预料到,它也会发现有待发现的东西。当然,即使进行了详尽的搜索,人们仍然需要一种方法来确定特定的候选系统是否满足人们所建立的任何标准。但现在这是预测计算的问题——我们上面所说的事情都适用。

目录:OpenAI 官方指南

如果作为输入的一部分提供,模型可以利用外部信息源。这可以帮助模型生成更明智和最新的响应。例如,如果用户询问有关特定电影的问题,将有关电影的高质量信息(例如演员、导演等)添加到模型的输入中可能会很有用。嵌入可用于实现高效的知识检索,以便在运行时将相关信息动态添加到模型输入中。文本嵌入是一个向量,可以衡量文本字符串之间的相关性。相似或相关的字符串将比不相关的字符串靠得更近。这一事实以及快速向量搜索算法的存在意味着嵌入可用于实现高效的知识检索。特别是,一个文本语料库可以被分割成块,每个块都可以被嵌入和存储。然后,给定的查询可以被嵌入,可以进行向量搜索,以找到与查询最相关的语料库的嵌入文本块(即,在嵌入空间中最接近的)。可以在[OpenAI Cookbook](https://github.com/openai/openai-cookbook/blob/main/examples/vector_databases/Using_vector_databases_for_embeddings_search.ipynb)中找到示例实现。[有关如何使用知识检索来最小化模型编造](https://platform.openai.com/docs/guides/gpt-best-practices/tactic-instruct-the-model-to-use-retrieved-knowledge-to-answer-queries)错误事实的可能性的示例,请参阅策略“指示模型使用检索到的知识来回答查询”。

其他人在问
生成式搜索和知识问答的区别
生成式搜索和知识问答存在以下区别: 生成式搜索: 采用大型语言模型技术,能更好地理解用户自然语言查询的语义,不仅仅是匹配关键词。 可以生成通顺的自然语言回答,而非简单返回网页链接和片段,结果更易于理解和使用。 能够根据用户的历史查询和偏好个性化结果,提供更贴合需求的答复。 例如 Perplexity 等 AI 搜索引擎,通过收集各种来源的信息给出答案。 但存在训练成本高、可解释性差、潜在偏差和不当内容等问题。 知识问答: 例如 RAG ,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。 原理是在基础大模型基础上引用外部数据,对搜索到的数据信息进行切片、拆分和语义理解,再根据用户提问进行检索和回答,但比基座模型更耗时。 一些知识问答系统能够支持在本地运行。 此外,为您推荐一些 AI 搜索引擎: 秘塔 AI 搜索:由秘塔科技开发,提供多模式搜索、无广告干扰、结构化展示和信息聚合等功能。 Perplexity:聊天机器人式搜索引擎,允许用户用自然语言提问,使用生成式 AI 技术收集信息并给出答案。 360AI 搜索:360 公司推出,通过 AI 分析问题,生成清晰、有理的答案,并支持增强模式和智能排序。 天工 AI 搜索:昆仑万维推出,采用生成式搜索技术,支持自然语言交互和深度追问,未来将支持多模态搜索。 Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互方式,支持多种 AI 模型和图像生成技术,有插件系统和社区功能。 Devv:面向程序员的 AI 搜索引擎,专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 Phind:专为开发者设计的 AI 搜索引擎,利用大型语言模型提供相关搜索结果和动态答案,擅长处理编程和技术问题。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-14
我没有知识库,如何让AI就某一问题穷尽搜索
要让 AI 就某一问题进行穷尽搜索,一般会涉及以下步骤: 1. 文档向量化:知识库中的文档需要被转换成向量形式,以便在数值级别上与问题向量进行比较。使用知识库工具上传文档时,会完成文档的向量化,这依靠 Embedding Model 实现。 2. 知识库检索: 相似性计算:使用相似性度量方法(如余弦相似性)计算问题向量和各个文档向量之间的相似度,以找出与问题内容最接近的文档。 排序与选择:根据相似性得分对所有文档进行排序,通常会选择得分最高的几个文档,认为这些文档与问题最相关。 信息抽取:从选定的高相关性文档中抽取具体的信息片段或答案,可能涉及进一步的文本处理技术,如命名实体识别、关键短语提取等。 3. 信息整合阶段:将检索到的全部信息连同用户问题和系统预设整合成一个全新的上下文环境,为生成回答提供基础。 此外,像生物进化中通过自然选择的方式,从特定规则开始逐步改变(可能随机),在每一步保留最有效的规则并丢弃其他,这种方法不是我们通常定义的“人工智能”(更像是“遗传算法”),但在高维规则空间中往往比低维规则空间效果更好,因为维度越多,陷入局部最小值的可能性越小。 同时,给 AI 配备随时更新的“活字典”即知识库是一个好方法。知识库就像 AI 随时可查阅的百科全书,当 AI 遇到不确定问题时,可从知识库中检索相关信息给出更准确回答。比如建立包含最新新闻、科技发展、法律法规等内容的知识库,或者利用整个互联网的实时数据作为知识库,通过搜索引擎获取最新信息。
2024-11-13
用20个字概括AI问答和搜索
AI 问答和搜索包括联网检索、多种引擎及检索原理 存在联网检索的 AI 及相关工具。 推荐多种 AI 搜索引擎。 介绍知识库检索的原理和步骤。
2024-11-13
搜索DragGAN
DragGAN 于 2023 年 6 月 25 日开源。喜欢 AI 绘画的对它应该不陌生,期待它带来更大的惊艳。此外,相关论文中增加了微软研究院新发布的多模态 AI 助手;学习路径中增加了适合初学者的深度学习课程 fast.ai ;AI 名词增加到 80 多个,补充了很多技术名词。您可以通过以下链接获取更多详细信息:
2024-11-11
请根据提供的AI工具网址,搜索常用的AI工具,实际操作AI工具,记录使用过程中的感受和发现,提交一份体验报告,描述工具的使用过程和个人感受,并就AI相关的热点话题,AI伦理、AI与就业等简要发表自己的看法。
以下是一份关于常用 AI 工具的体验报告: 一、AI 工具使用过程和感受 1. 超级简历优化助手 使用过程:用户上传简历,工具分析内容并提供优化建议。 个人感受:对于求职者来说,能够针对性地提升简历质量,提高求职成功率,操作简单易懂。 2. 酷家乐等设计软件 使用过程:用户上传户型图,软件通过 AI 生成多种室内设计方案。 个人感受:为室内设计提供了便捷和丰富的创意,节省了设计时间和精力。 3. Amper Music 使用过程:用户提出需求,工具生成旋律和编曲。 个人感受:对音乐创作者有很大的辅助作用,激发创作灵感。 4. 松果倾诉智能助手 使用过程:通过文字或语音与用户交流,提供情感咨询。 个人感受:在情感支持方面提供了及时的帮助和建议。 5. 小佩宠物智能设备 使用过程:实时监测宠物的活动、饮食等状况,提供健康预警。 个人感受:让宠物主人能更方便地关注宠物健康。 6. 马蜂窝智能行程规划 使用过程:根据用户输入的目的地、时间等因素定制旅游路线。 个人感受:为旅行规划提供了个性化的方案,节省了规划时间。 7. 作业帮智能辅导 使用过程:根据学生的学习情况提供针对性的学习方案。 个人感受:有助于学生获得更贴合自身需求的学习辅导。 8. AI 游戏道具推荐系统 使用过程:在游戏中分析玩家风格和进度,推荐合适道具。 个人感受:提升了游戏体验,使玩家能更有效地获取所需道具。 9. AI 天气预报分时服务 使用过程:利用彩云天气提供每小时的天气预报。 个人感受:为出行和活动安排提供了更精准的参考。 10. AI 医疗病历分析平台 使用过程:分析医疗病历中的症状、检查结果等信息,为医生提供辅助诊断建议。 个人感受:有助于提高医疗诊断的准确性和效率。 11. AI 会议发言总结工具 使用过程:在会议中自动总结发言者的主要观点和重点内容。 个人感受:方便会议记录和回顾,提高工作效率。 12. AI 书法作品临摹辅助工具 使用过程:识别书法作品的笔画和结构,为用户提供临摹指导和评价。 个人感受:对书法爱好者的临摹学习有一定的帮助。 二、关于 AI 相关热点话题的看法 1. AI 伦理 随着 AI 技术的广泛应用,数据隐私、算法偏见等伦理问题日益凸显。需要建立健全的法律法规和伦理准则,确保 AI 的发展符合人类的价值观和利益。 2. AI 与就业 AI 的发展可能会导致一些传统岗位的减少,但同时也会创造新的就业机会,如 AI 开发、维护和管理等。重要的是通过教育和培训,提升劳动者的技能,以适应新的就业需求。 三、健身的 AI 产品 1. Keep:中国最大的健身平台,提供全面的健身解决方案,帮助用户实现健身目标。 2. Fiture:沸彻魔镜集硬件、丰富课程内容、明星教练和社区于一体。 3. Fitness AI:利用人工智能进行锻炼,增强力量和速度。 4. Planfit:健身房家庭训练与 AI 健身计划,AI 教练使用大量文本数据和 ChatGPT 实时提供指导。
2024-11-11
如何使用必应的人工智能搜索功能
使用必应的人工智能搜索功能可以参考以下内容: 必应是获取信息和学习东西的一个选择,有免费和付费选项。对于一些特定情况,如技术支持、决定吃饭地点或获取建议,必应可能比谷歌更好。 但使用人工智能作为搜索引擎存在幻觉风险,使用时需谨慎。 对于提升AI搜索引擎的准确度,关键因素包括挂载的上下文信息密度和基座模型的智能程度。 在联网检索前,可先对用户的 query 进行意图识别,判断是否需要联网,以节省搜索成本和提升效率。例如,对于一些有标准答案的数学、编程或生活常识问题,可不联网检索,直接用大模型训练好的知识库进行回答。 可利用如 Perplexity.AI 等工具的强大搜索功能获取信息,启用 Pro 功能能获得更专业和深入的搜索结果。通过微软的 Bing 搜索引擎等具备联网搜索功能的工具,也能快速搜集大量相关资料。
2024-11-08