Chat with Wiki - 多模态搜索

Answer

以下是关于多模态搜索的相关信息：

ThinkAny 搜索引擎：

产品特性：
- 支持多模态检索（Multi-Mode-Search），可检索链接、图片、视频等模态内容。
- 支持多维度输出（Multi-Form-Output），能以对话、大纲、思维导图、时间线等形式输出搜索问答内容。
- 支持多信源检索（Multi-Retrieve-Source），可检索 Google、Wikipedia、Github 等信息源的内容。
开源了 API 项目 rag-search，实现联网检索功能，并对检索结果进行重排和获取详情内容。
长期发展方向是走 AI Search+Anything 的平台化路线，允许用户挂载自定义信息源、创建自定义智能体、实现自定义的流程编排。

其他推荐的 AI 搜索引擎：

秘塔 AI 搜索：提供多模式搜索、无广告干扰、结构化展示和信息聚合等功能。
Perplexity：聊天机器人式搜索引擎，用自然语言提问，从各种来源收集信息并给出答案。
360AI 搜索：通过 AI 分析问题，生成清晰、有理的答案，并支持增强模式和智能排序。
天工 AI 搜索：采用生成式搜索技术，支持自然语言交互和深度追问，未来将支持图像、语音等多模态搜索。
Flowith：创新的 AI 交互式搜索和对话工具，基于节点式交互方式，支持多种 AI 模型和图像生成技术，有插件系统和社区功能。
Devv：面向程序员的 AI 搜索引擎，提供编程、软件开发和人工智能等领域的专业建议和指导。
Phind：专为开发者设计的 AI 搜索引擎，利用大型语言模型提供相关搜索结果和动态答案，擅长处理编程和技术问题。

提升 AI 搜索准确度：

在提示词的设计和调试方面需要下功夫，很多环节都需用到提示词，如请求大模型判断是否需要联网、改写问题、提取关键词、回答问题、标注引用来源、以思维导图形式输出答案、做 Function Calling 判断使用的 Agents 等。
多模态检索是提升信息密度的重要措施，随着 5G 发展，互联网信息多元化，图片、视频、音频比重增大，多模态检索为获取不同形式信息再聚合起来作为引用参考。但多模态检索实现困难，现阶段可在谷歌搜索基础上，先使用其图片/视频检索 API 拿到匹配内容，再通过 OCR 图片识别、音视频转录等方法拿到多模态信息的文本内容。

Content generated by AI large model, please carefully verify (powered by aily)

References

工具：我做了一个 AI 搜索引擎

1.多模态检索Multi-Mode-Search支持检索链接/图片/视频等模态内容1.多维度输出Multi-Form-Output支持以对话/大纲/思维导图/时间线等形式输出搜索问答内容。202406251501281.多信源检索Multi-Retrieve-Source支持检索Google/Wikipedia/Github等信息源的内容，作为搜索问答的挂载上下文。另外，ThinkAny还开源了一个API项目：rag-search，完整实现了联网检索功能，并对检索结果进行重排（Reranking）/获取详情内容（Read Content），最终得到一份准确度还不错的检索结果。20240619163823ThinkAny产品的长期发展方向，会走AI Search+Anything的平台化路线。允许用户挂载自定义信息源（Sources）/创建自定义智能体（Agents）/实现自定义的流程编排（Workflows）ThinkAny要保证基础能力的完备性，结合第三方的创意，实现一个更智能的AI搜索平台，覆盖更多的搜索场景。

问：AI 搜索引擎

以下是一些推荐的AI搜索引擎：1.秘塔AI搜索：由秘塔科技开发，提供多模式搜索、无广告干扰、结构化展示和信息聚合等功能，旨在提升用户的搜索效率和体验。2.Perplexity：一款聊天机器人式的搜索引擎，允许用户用自然语言提问，使用生成式AI技术从各种来源收集信息并给出答案。3.360AI搜索：360公司推出的AI搜索引擎，通过AI分析问题，生成清晰、有理的答案，并支持增强模式和智能排序。4.天工AI搜索：昆仑万维推出的搜索引擎，采用生成式搜索技术，支持自然语言交互和深度追问，未来还将支持图像、语音等多模态搜索。5.Flowith：一款创新的AI交互式搜索和对话工具，基于节点式交互方式，支持多种AI模型和图像生成技术，提供插件系统和社区功能。6.Devv：面向程序员的AI搜索引擎，专注于提供编程、软件开发和人工智能等领域的专业建议和指导。7.Phind：专为开发者设计的AI搜索引擎，利用大型语言模型提供相关的搜索结果和动态答案，特别擅长处理编程和技术问题。这些AI搜索引擎通过不同的技术和功能，为用户提供更加精准、高效和个性化的搜索体验。内容由AI大模型生成，请仔细甄别

工具：我做了一个 AI 搜索引擎

提升AI搜索的准确度，在提示词的设计和调试方面也需要花很大的功夫。上述的很多个环节，都需要用到提示词，比如：通过提示词请求大模型判断是否需要联网通过提示词请求大模型改写问题，提取关键词通过提示词请求大模型回答问题，标注引用来源通过提示词请求大模型以思维导图的形式输出答案通过提示词请求大模型做Function Calling判断使用的Agents提示词工程是一个很系统的学科，有实操指南，有方法论。不能一招通吃，只有经过大量调试，才能设计出一套适合自身业务的提示词。1.多模态检索Multi Mode提升AI搜索的关键步骤是保证检索到的信息密度。只拿信息源检索返回的摘要内容肯定不够，前面我们也提到了要并行获取多个链接的详情内容。多模态检索是提升信息密度的一个重要措施。随着5G的发展，互联网上的信息越来越多元化，图片/视频/音频占了很大的比重。多模态检索就是为了尽可能多的获取不同形式的信息，再聚合起来作为引用参考。多模态检索的实现是非常困难的。涉及到海量信息源的处理和识别。现阶段可以在谷歌搜索的基础上完成多模态检索的需求。第一步我们可以使用谷歌的图片/视频检索API，拿到跟query匹配的图片/视频内容。第二步要做的工作是通过OCR图片识别/音视频转录等方法，拿到多模态信息的文本内容。