Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI搜索的底层逻辑是怎样的

Answer

AI 搜索的底层逻辑主要是“检索增强生成(RAG)”,具体包括以下步骤:

  1. 检索(Retrieve):使用用户的查询(query)调用搜索引擎 API,获取搜索结果。
  2. 增强(Augmented):设置提示词,将检索结果作为挂载的上下文。
  3. 生成(Generation):大模型回答问题,并标注引用来源。

在检索过程中,还涉及以下原理:

  1. 信息筛选与确认:对检索器提供的信息进行评估,筛选出最相关和最可信的内容,并验证信息的来源、时效性和相关性。
  2. 消除冗余:识别和去除多个文档或数据源中的重复信息,避免在生成回答时出现重复或矛盾。
  3. 关系映射:分析不同信息片段之间的逻辑和事实关系,如因果、对比、顺序等,构建结构化的知识框架。
  4. 上下文构建:将筛选和结构化的信息组织成连贯的上下文环境,包括排序、归类和整合。
  5. 语义融合:必要时合并意义相近但表达不同的信息片段,减少语义重复并增强表达力。
  6. 预备生成阶段:将整合好的上下文信息编码成适合生成器处理的格式,如转化为适合输入到生成模型的向量形式。

最后,全新的上下文被传递给大语言模型,大语言模型根据提供的信息生成准确和连贯的答案。影响 AI 搜索的关键因素包括挂载的上下文信息密度和基座模型的智能程度。在响应速度方面,Retrieve 要求联网检索信息的速度快,Generation 要求大模型生成内容的速度快,同时为提高准确度可能存在耗时的重排和获取内容详情步骤。

Content generated by AI large model, please carefully verify (powered by aily)

References

工具:我做了一个 AI 搜索引擎

我选择做什么产品,一般有三个原则:1.是我很感兴趣的方向2.产品有价值,能带来成就感3.在我的能力范围内早在去年11月,就有朋友建议我研究一下AI搜索赛道的产品。当时我的第一想法是,搜索引擎应该是一类有很高技术壁垒的产品,不在我的能力范围,所以一直不敢尝试,也没花时间去研究。直到今年年初,有媒体报道:“贾扬清500行代码写了一个AI搜索引擎”,当时觉得很神奇,写一个AI搜索引擎这么简单吗?花了点时间研究了一下贾扬清老师开源的Lepton Search源码,Python写的,后台逻辑400多行。又看了一个叫float32的AI搜索引擎源码,Go写的,核心逻辑也就几百行。看完两个项目代码之后,开始“技术祛魅”,号称能颠覆谷歌/百度统治的新一代AI搜索引擎,好像也“不过如此”。底层技术概括起来就一个词,叫做“RAG”,也就是所谓的“检索增强生成”。1.检索(Retrieve):拿用户query调搜索引擎API,拿到搜素()结果;2.增强(Augmented):设置提示词,把检索结果作为挂载上下文;3.生成(Generation):大模型回答问题,标注引用来源;弄清楚AI搜索的底层逻辑之后,我决定在这个领域开始新的尝试。我给要做的AI搜索引擎产品取名“ThinkAny”,名字直译于我之前创立的一家公司“任想科技”。

工具:我做了一个 AI 搜索引擎

[title]工具:我做了一个AI搜索引擎[heading1]ThinkAny是如何冷启动的[heading2]ThinkAny的产品特性20240619154427ThinkAny虽然第一个版本实现的比较简单,但在创立之初,就一直聚焦在三个核心问题。也就是我认为的,AI搜索的三个要义:准/快/稳。准确度是AI搜索的第一要义。用户之所以会选择使用AI搜索引擎,是因为传统搜索引擎不能第一时间给到用户想要的答案,往往需要点进去阅读几个链接的内容之后,才能得到足够多的信息。而AI搜索引擎,解决的第一个问题就是搜索效率问题,用AI代替人工,阅读检索内容,总结归纳后给到用户一个直接的答案。而这个答案,一定要有足够高的准确度。这是建立用户信任的基础,如果准确度不达标,用户使用AI搜索的理由就不成立。影响AI搜索的两个关键因素:挂载的上下文信息密度+基座模型的智能程度。ThinkAny在基座模型的选择上,集成了gpt-4-turbo / claude-3-opus等大参数模型,有非常高的智能程度。在上下文信息密度的问题上,采取了并行读取多个链接内容,暴力传输全部内容的策略。ThinkAny也缓存了历史对话,支持对搜索结果进行追问(连续对话)。AI搜索的响应速度要足够快AI搜索的底层原理是RAG,涉及到Retrieve和Generation两个步骤。Retrieve要求联网检索信息的速度足够快,Generation要求大模型生成内容的速度足够快。除了这两个步骤之外,为了提高搜索结果的准确度,需要对检索结果进行重排(Reranking),需要获取检索到的内容详情(Read Content),这两个步骤往往是耗时的。

【AI+知识库】商业化问答场景,让AI回复更准确,一篇专为所有“小白”讲透RAG的实例教程(上篇)

[title]【AI+知识库】商业化问答场景,让AI回复更准确,一篇专为所有“小白”讲透RAG的实例教程(上篇)[heading3]2、检索原理1.信息筛选与确认:2.首先,系统会对检索器提供的信息进行评估,筛选出最相关和最可信的内容。这通常涉及到对信息的来源、时效性和相关性进行验证。3.消除冗余:4.在多个文档或数据源中,可能会有重复的信息。系统需要识别和去除这些冗余内容,以防在生成回答时出现重复或相互矛盾的信息。5.关系映射:6.系统将分析不同信息片段之间的逻辑和事实关系,如因果、对比、顺序等。这有助于构建一个结构化的知识框架,使得信息在语义上更加连贯。7.上下文构建:8.将筛选和结构化的信息组织成一个连贯的上下文环境。这通常包括对信息进行排序、归类和整合,使其形成一个统一的叙述或解答框架。9.语义融合:10.在必要时,系统可能会进行语义融合,即合并意义相近但表达不同的信息片段,以减少语义上的重复并增强信息的表达力。11.预备生成阶段:12.最后,整合好的上下文信息被编码成适合生成器处理的格式,如将文本转化为适合输入到生成模型的向量形式。④、大模型生成回答1、生成器:最终全新的上下文被一起传递给大语言模型。随后,大语言模型(LLM)根据提供的信息来回答问题。因为这个上下文包括了检索到的信息,因此大语言模型相当于同时拿到了问题和参考答案,通过LLM的全文理解,最后生成一个准确和连贯的答案。

Others are asking
怎么用ai写发明专利
以下是关于如何用 AI 写发明专利的相关知识: 在专利法律框架下,人工智能具有以下 3 种存在形式: 1. 专利法所保护的客体,即人工智能“本身”作为专利法保护的发明。在这种情况下发生专利侵权时,关于侵权的认定以及责任的界定与传统的专利侵权并无差别。 2. 发明创造的“辅助工具”,即人工智能作为人类进行发明创造活动所依赖的辅助性技术研发的工具。人工智能作为其本身作为一种技术方案并不侵权,但是其为了完成人类交付的任务或者是程序设定的任务而实施的技术方案则可能构成侵权。在数据收集和算法学习阶段,有可能因未经许可使用他人现有的专利作为其研发工具而构成侵权。在生成阶段,人工智能利用文字处理、同义替换等方式来规避现有的技术权利要求,从而生成大量的与现有技术实质相似的技术方案,但实质上并未改进智力成果,因此也可能存在潜在的专利侵权风险。从理论上讲,在设计人工智能系统时,人类可以提前干预将仍处于保护期内的专利技术信息排除在训练数据库之外,从而防止专利侵权的情形。但是当下的技术水平并不足以支撑此种需求,在对人工智能模型进行训练时仍需要将人类科技应用领域中最具创造力的结果纳入其中,在满足此种需求的前提下要求完全防止专利侵权并不现实。其次是人工智能生成物侵犯专利权从结果上来说具有不可预测性,即便是人类提前介入干预,也并不能保证人工智能是否会从其他专利技术中组合、转换甚至开拓出的技术方案不侵犯专利权。 3. 发明创造活动的主体,即完全脱离人类的干预和控制,自主进行发明创造活动的人工智能。就目前而言,这种情况很难实现,尤其是在实行实质审查制度的我国。2018 年,有研发者就 DABUS,一个模拟人脑运行进行内容输出的 AI 系统向美国、欧洲、英国等多国专利部门提交了 DABUS 为发明人的专利申请。绝大多数专利部门都认为,从文义本身出发进行解释,立法者并不打算允许非人类作为发明人,从而拒绝了其专利申请。有趣的是,澳大利亚联邦法院在审理中推翻了该国知识产权局驳回 DABUS 专利申请的决定,并指出:发明人(inventor)一词是表示动作的代理名词,表示执行“发明”这一动作的实体,并未将非人类发明者排除在外,只有这样才能与专利法“鼓励技术创新、通过创新及技术的传播来促进经济福祉”的目标保持一致。虽然这一判决最终又被上诉法院驳回,但对于我们理解人工智能专利权的问题,仍有一定参考价值。 近年来,人工智能(AI)在专利审查领域得到了广泛应用。以下是一些具体的 AI 应用和平台,它们在专利审查过程中发挥了重要作用: 1. 专利检索与分类:AI 可以帮助进行高效的专利检索和分类,通过自然语言处理(NLP)和机器学习算法,自动识别和分类专利文献。示例平台:Google Patents、IBM Watson for IP。 2. 专利分析和评估:AI 可以分析专利文本,评估专利的新颖性和创造性,预测专利的授权可能性。示例平台:TurboPatent、PatentBot。 3. 自动化专利申请:AI 可以帮助自动生成专利申请文件,减少人工编写和审查时间。示例平台:Specifio、PatentPal。 4. 专利图像和图表分析:AI 可以分析专利申请中的图像和图表,帮助识别和分类技术内容。示例平台:Aulive、AIpowered image recognition tools。
2025-03-04
我是一个AI小白,从事基础建设土木工程行业。请你给我制定一个AI学习计划,特别是相关软件学习,联动。
对于您这样从事基础建设土木工程行业的 AI 小白,以下是为您制定的一个初步的 AI 学习计划: 一、基础知识学习 1. 在线课程:推荐您在 Coursera、EdX 等平台上搜索关于人工智能基础的课程,了解 AI 的基本概念、发展历程和应用领域。 2. 书籍阅读:可以阅读《人工智能:一种现代方法》《机器学习》等入门书籍,建立对 AI 的理论框架认识。 二、相关软件学习 1. Python 编程语言:这是 AI 开发中常用的语言。您可以通过在线教程(如菜鸟教程、廖雪峰的 Python 教程)学习 Python 的基础语法和数据结构。 2. TensorFlow 和 PyTorch:这是两个主流的深度学习框架。您可以从它们的官方文档入手,学习如何搭建和训练简单的神经网络模型。 三、实践项目 1. 尝试使用 Python 实现一些简单的机器学习算法,如线性回归、决策树等。 2. 参与开源项目或者在 Kaggle 等平台上参加竞赛,积累实践经验。 四、与土木工程行业结合 1. 研究如何将 AI 技术应用于土木工程中的结构分析、材料性能预测等方面。 2. 关注土木工程领域中使用 AI 的最新案例和研究成果。 学习 AI 是一个长期的过程,需要您保持耐心和持续的学习热情。祝您学习顺利!
2025-03-04
我是一个传统的B端产品经理,如何入门AI产品呢?
作为传统的 B 端产品经理,入门 AI 产品可以参考以下步骤: 1. 入门级:通过 WaytoAGI 等开源网站或一些课程来了解 AI 的概念,使用 AI 产品并尝试动手实践应用搭建。对应的画像可能是喜欢听小宇宙 APP 的播客或浏览 AI 相关的文章。 2. 研究级:有两个路径,一个是技术研究路径,一个是商业化研究路径。这个阶段对应的画像可能是对某一领域有认知,可以根据需求场景选择解决方案,或利用 Hugging face 等工具手搓出一些 AI 应用来验证想法。 3. 落地应用:这一阶段的画像就是有一些成功落地应用的案例,如产生商业化价值。 总结来说,对 AI 产品经理的要求是懂得技术框架,不一定要了解技术细节,而是对技术边界有认知,最好能知道一些优化手段和新技术的发展。AI 也是工具和手段,产品经理要关注的还是场景、痛点、价值。 此外,还可以了解一些相关的技术原理和框架,比如: 1. 思维链:谷歌在 2022 年一篇论文提到思维链可以显著提升大语言模型在复杂推理的能力(即有推理步骤),即使不用小样本提示,也可以在问题后面加一句【请你分步骤思考】。 2. RAG(检索增强生成):外部知识库切分成段落后转成向量,存在向量数据库。用户提问并查找到向量数据库后,段落信息会和原本的问题一块传给 AI;可搭建企业知识库和个人知识库。 3. PAL(程序辅助语言模型):2022 年一篇论文中提出;比如对于语言模型的计算问题,核心在于不让 AI 直接生成计算结果,而是借助其他工具比如 Python 解释器作为计算工具。 4. ReAct:2022 年一篇《React:在语言模型中协同推理与行动》的论文提出了 ReAct 框架,即 reason 与 action 结合,核心在于让模型动态推理并采取行动与外界环境互动。比如用搜索引擎对关键字进行搜索,观察行动得到的结果。可借助 LangChain 等框架简化构建流程。 个人总结:看很多大佬的发言,都说要关注或直接阅读技术论文,比如产品经理转型 AI 产品经理,也需要懂技术脉络。而小白直接看技术论文还是有难度,虽然现在可以让 AI 辅助阅读,不过还是要完成一定的知识储备。而林粒粒呀的这期视频是一个很好的科普入门。
2025-03-04
AI设计图标
以下是关于 AI 设计图标的相关内容: Midjourney 商业实战案例 UI 设计篇 1. 直播礼物风格图标 关键词:喂图 + (Gift icon),cartoon style,solid color background luminous effect,3d –iw 1 –v 5 –q 2 特点:卡通风格,纯色背景发光效果,3d。您需要在素材网站上找到喜欢的 icons 风格,然后喂图给机器人,并打上关键词。(Gift icon)是可替换的关键词,比如(beer icon)啤酒图标、(Headphone icon)耳机图标等。一般这种图标会用在直播的礼物场景中。 2. 主题应用 icons 关键词:icon design,light texture,glow,Dribbble,3D,frostedglass effect,3d,ui,ux,–upbeta–q 2–v 4 生成的素材可用于参考。 3. B 端图标 关键词:喂图 + A data icon,blue gradient frosted glass,frostedglass building,white transparent technology sensewhite city building scene,data line link,chip,OCrenderer,big data,industrial machinery,high detailight gray background with simple linear details,studio lighting,3d,c4d,pure white background,8k 质感不错,建议多尝试喂不同构图的图片,喂图玩法中参考图影响最大。 4. 音乐软件 UI 设计 关键词:music app ui design,ux design,white,light,bright,data,modern,smooth,behance,dribbble,–upbeta–q 2–v 4 UI 设计不规范,文字乱,MJ 在这块只能作为风格参考。 Bard 的 prompt 使用技巧 Bard 建议使用“给 AI 下具体设计任务”的方式,而不是简单地“要求 AI 直接输出内容”。例如,设计 AI 网站的 logo 时,应遵循以下 tips: 1. 保持简洁易记。即使在小尺寸或不同情境下使用,也应易于记忆和识别。 2. 使用相关的符号或图标。有助于传达品牌意义,使 logo 更具视觉吸引力。 3. 选择与技术和信任相关的颜色。如蓝色、绿色和白色等。 4. 使用一致的字体。应与网站的整体品牌一致。 5. 从他人处获取反馈。设计几个 logo 后,征求他人意见,看他们更喜欢哪个。
2025-03-04
哪个AI仿写试题功能最好?
目前,在仿写试题方面,只要提示词到位、示例清晰,AI 表现出色。例如,GPT 4.0 可以模仿中高考、托福雅思、SAT(美国高考)、GRE(美国研究生入学考)等试题,模仿得有模有样。对于高学段理科试题的仿写可能还有所不足。此外,文心一言或者 Kimi 等国产大模型在英语和语文学科的选词填空出题方面也有不错的表现。总的来说,不同的 AI 模型在仿写试题方面各有特点,具体哪个最好可能取决于您的具体需求和使用场景。
2025-03-04
AI动画
以下是关于 AI 动画的相关内容: Runway 可以生成 AI 动画,使用图片+文字描述功能,将 MJ 生成的图片增加对应的动态描述,输入 Runway,同时增加镜头变换的设置,具体教程可查看 。 大雷在 2 天爆肝 3 分半 AI 动画短片的制作复盘中提到,在时间和金钱的双重压力下,找到了适合自己的制作捷径。AI 目前主要是辅助工具,帮忙搞定图和片,其他部分还得靠人。大雍负责前期的内容构思和脚本编写,大雷主要负责图片、视频生成和视频剪辑。Midjourney 提示词主要围绕皮克斯、迪士尼、3D 风格来写,例如:"a small white Chiense dragon,anthropomorphic,Smile with surprise,wearing a school uniform,looking at a blurry gift box in the foreground,super closeup shot,camera focus on his face,3D render,Unreal Engine,Pixar 3D style,blurry classroom scene,bright sunshinear 16:9niji 6",重点是"a small white Chiense dragon,anthropomorphic,3D render,Unreal Engine,Pixar 3D style",尺寸比例 16:9,模型选择 niji 6,其他根据需求调整。动画主要使用 Runway,因其控制笔刷有优势。悦音可进行 AI 配音,具有旁白质感,如磁性浑厚、大片质感、娓娓道来等特点。
2025-03-04
你的底层大模型用的是哪个?
目前常见的大型语言模型多采用右侧只使用 Decoder 的 Decoderonly 架构,例如我们熟知的 ChatGPT 等。这些架构都是基于谷歌 2017 年发布的论文“attention is all you need”中提出的 Transformer 衍生而来,其中包括 Encoder 和 Decoder 两个结构。 大模型的特点在于: 1. 预训练数据非常大,往往来自互联网上的论文、代码、公开网页等,一般用 TB 级别的数据进行预训练。 2. 参数非常多,如 Open 在 2020 年发布的 GPT3 就已达到 170B 的参数。 大模型之所以能有效生成高质量有意义的回答,关键在于“大”。例如 GPT1 的参数规模是 1.5 亿,GPT2 Medium 的参数规模是 3.5 亿,到 GPT3.5 时,参数规模达到惊人的 1750 亿,参数规模的增加实现了量变到质变的突破,“涌现”出惊人的“智能”。 大模型的预训练机制是指其“脑袋”里存储的知识都是预先学习好的,预训练需要花费相当多的时间和算力资源。在没有其他外部帮助的情况下,大模型所知道的知识信息总是不完备且滞后的。
2025-02-18
不同厂家的AI产品是底层算法不一样吗?比如ChatGPT和豆包
不同厂家的 AI 产品底层算法通常是不一样的。 以常见的 ChatGPT 和豆包为例,ChatGPT 是由 OpenAI 开发的,其底层算法具有独特的特点和优势。而豆包是由字节跳动开发的,也有其自身的算法设计和优化。 在当前的 AI 领域,大多数 AI 应用程序都由大型语言模型(LLMs)驱动,其中只有几个基础模型,由少数几个组织创建。例如 OpenAI 制作了 GPT3.5 和 GPT4,Google 有 Bard 等。 从相关的访问量数据来看,不同的 AI 产品在市场上的表现也有所不同。比如在某些月份,ChatGPT 的访问量较高,而豆包的访问量也在不断变化。但这并不能直接反映其底层算法的差异,只是从侧面反映了它们在用户中的受欢迎程度和使用情况。
2025-01-17
ChatGPT的底层原理是什么
ChatGPT 的底层原理主要包括以下几个方面: 1. 数据获取与训练:从网络、书籍等来源获取大量人类创作的文本样本,然后训练神经网络生成“类似”的文本。 2. 神经网络结构:由非常简单的元素组成,尽管数量庞大。基本操作是为每个新单词(或单词部分)生成“输入”,然后将其“通过其元素”(没有任何循环等)。 3. 生成文本方式:通过自回归生成,即把自己生成的下一个词和之前的上文组合成新的上文,再生成下一个词,不断重复生成任意长的下文。 4. 训练目的:不是记忆,而是学习以单字接龙的方式训练模型,学习提问和回答的通用规律,实现泛化,以便在遇到没记忆过的提问时,能利用所学规律生成用户想要的回答。 5. 与搜索引擎的区别:搜索引擎无法给出没被数据库记忆的信息,而ChatGPT作为生成模型,可以创造不存在的文本。 其结果表明人类语言(以及背后的思维模式)的结构比我们想象的要简单和更具有“法律属性”,ChatGPT已经隐含地发现了它。同时,当人类生成语言时,许多方面的工作与ChatGPT似乎相当相似。此外,GPT的核心是单字接龙,在翻译等场合应用时,先直译再改写能使Transform机制更好地起作用。
2024-12-03
ai的底层逻辑是什么
AI 的底层逻辑包括以下几个方面: 1. 决策方面:AI 在越来越多的场景落地,成为企业管理和决策的重要工具。然而,AI 的决策过程并非真正的“理解”,而是基于复杂计算和模式匹配,其本质存在局限性,是个“黑盒”,输出结果可见但决策过程难以理解,这种不透明性给企业决策带来风险。 2. 大模型方面:大模型依靠概率计算逐字接龙工作,参数规模的增加使其实现量变到质变的突破,从而“涌现”出智能。大模型的知识是通过预训练预先学习和存储的,但在没有外部帮助时,其知识信息可能不完备和滞后。 3. 神经网络方面:计算机科学家以人脑神经元细胞结构为灵感,利用概览模型在计算机上实现对人脑结构的模仿,但大模型内部如同人类大脑一样是混沌系统,即使是开发者也无法解释其微观细节。
2024-11-13
ai的底层逻辑
AI 的底层逻辑主要涉及以下几个方面: 1. 大模型的底层原理: 大语言模型依靠概率计算逐字接龙的方式工作,平时看到的逐字输出并非特效,而是其真实的工作方式。 大模型参数规模的增加,如从 GPT1 的 1.5 亿到 GPT3.5 的 1750 亿,实现了量变到质变的突破,从而“涌现”出智能。这种“涌现”结构在人类的进化和个体学习成长中也存在。 预训练是大模型获取知识的方式,其需要大量时间和算力资源。在没有外部帮助的情况下,大模型的知识信息可能不完备且滞后。 GPT 是生成式预训练转换器模型(Generative Pretrained Transformer),生成式指大模型根据已有输入不断计算生成下一个字词,直至计算出概率最大时结束输出。 2. 必须理解的核心概念: LLM 是 Large language model 的缩写,即大语言模型。 Prompt 是提示词,即输入给大模型的文本内容,其质量会显著影响回答质量。 Token 是大模型语言体系中的最小单元,不同厂商对中文的切分方法不同,通常 1Token≈12 个汉字,大模型的收费和输入输出长度限制以 token 为单位。 上下文指对话聊天内容的前后信息,其长度和窗口会影响大模型回答质量。
2024-11-06
如果想学习ai,作为ai产品经理,需要ai底层的算法掌握到什么程度
作为 AI 产品经理,对 AI 底层算法的掌握程度需要达到以下几个方面: 1. 理解产品核心技术:了解基本的机器学习算法原理,以便做出更合理的产品决策。 2. 与技术团队有效沟通:掌握一定的算法知识,减少信息不对称带来的误解。 3. 评估技术可行性:在产品规划阶段,能够准确判断某些功能的技术可行性。 4. 把握产品发展方向:了解算法前沿,更好地把握产品未来的发展趋势。 5. 提升产品竞争力:发现产品的独特优势,提出创新的产品特性。 6. 数据分析能力:掌握相关算法知识,提升数据分析能力。 同时,如果希望在 AI 领域继续精进,还需要了解以下基础内容: AI 背景知识: 基础理论:清楚人工智能、机器学习、深度学习的定义及其之间的关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等基本概念。 概率论:掌握基础的概率论知识,如条件概率、贝叶斯定理。 算法和模型: 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:了解其基本概念。 评估和调优: 性能评估:知道如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学会使用网格搜索等技术优化模型参数。 神经网络基础: 网络结构:理解包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)等的基本结构。 激活函数:熟悉常用的激活函数,如 ReLU、Sigmoid、Tanh。
2024-11-05
有没有好用的搜索引擎类AI门户
以下是一些好用的搜索引擎类 AI 门户: 1. 秘塔 AI 搜索:由秘塔科技开发,具有多模式搜索、无广告干扰、结构化展示和信息聚合等功能,能提升用户的搜索效率和体验。 2. Perplexity:聊天机器人式的搜索引擎,允许用自然语言提问,通过生成式 AI 技术从各种来源收集信息并给出答案。 3. 360AI 搜索:360 公司推出,通过 AI 分析问题,生成清晰有理的答案,并支持增强模式和智能排序。 4. 天工 AI 搜索:昆仑万维推出,采用生成式搜索技术,支持自然语言交互和深度追问,未来还将支持多模态搜索。 5. Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互方式,支持多种 AI 模型和图像生成技术,有插件系统和社区功能。 6. Devv:面向程序员的 AI 搜索引擎,专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 7. Phind:专为开发者设计,利用大型语言模型提供相关搜索结果和动态答案,擅长处理编程和技术问题。 此外,存在能联网检索的 AI,例如 ChatGPT Plus 用户可开启 web browsing 功能实现联网,Perplexity 结合了 ChatGPT 式的问答和普通搜索引擎功能,允许用户指定希望聊天机器人在制定响应时搜索的源类型,Bing Copilot 可简化在线查询和浏览活动,还有 You.com 和 Neeva AI 等搜索引擎,提供基于人工智能的定制搜索体验并保持用户数据私密性。 近期出现的各类 AI 搜索引擎不断颠覆传统搜索引擎,如 perplexity.ai、metaso、360 搜索、ThinkAny 等,能辅助高效处理信息,智能摘要功能可快速筛选信息,还能通过自然语言生成美观可用的图片,降低创作门槛和周期。每个人应根据自己的日常工作流找到适合的工具,技术迭代会不断推动 AI Agent 向前发展。
2025-03-02
深度搜索
以下是为您提供的关于深度搜索的相关信息: Jina AI 推出了 DeepSearch 功能,专为深入研究复杂问题设计,能够自动进行多轮搜索,阅读、分析搜索到的内容,推理优化答案,确保逻辑性和可靠性,且与 OpenAI Chat API 兼容,可轻松接入现有应用。相关链接: 。 在国内月活榜中,deepseek 作为聊天机器人,网址为 chat.deepseek.com,活跃用户达 7068 万人,环比变化为 24.3616%,所属公司为深度求索。
2025-03-02
生成式 AI 搜索
生成式 AI 搜索具有以下特点和应用: 有可能彻底改变互联网的核心功能之一——搜索。传统搜索中,用户在 Google 输入问题后常被大量链接及不准确信息淹没,而由大型语言模型驱动的搜索引擎可提供自然语言写成的简洁答案,并能在用户感兴趣时提供更多链接阅读。 一些公司为一般搜索查询提供服务,如 You 和 Neeva。还有公司采取更垂直化的方法,如 Consensus 跨越研究论文进行搜索,Perplexity 的 Bird SQL 产品针对 Twitter 进行搜索。 对于产品推荐尤为有价值,能根据特定需求提供策划过的选项列表。 在企业内部搜索应用中具有巨大潜力,如 Glean 允许团队跨应用搜索,Vowel 允许用户查询视频会议记录。 以下是一些推荐的 AI 搜索引擎: 秘塔 AI 搜索:由秘塔科技开发,提供多模式搜索、无广告干扰、结构化展示和信息聚合等功能,旨在提升用户的搜索效率和体验。 Perplexity:聊天机器人式的搜索引擎,允许用户用自然语言提问,使用生成式 AI 技术从各种来源收集信息并给出答案。 360AI 搜索:360 公司推出,通过 AI 分析问题,生成清晰、有理的答案,并支持增强模式和智能排序。 天工 AI 搜索:昆仑万维推出,采用生成式搜索技术,支持自然语言交互和深度追问,未来还将支持图像、语音等多模态搜索。 Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互方式,支持多种 AI 模型和图像生成技术,提供插件系统和社区功能。 Devv:面向程序员的 AI 搜索引擎,专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 Phind:专为开发者设计的 AI 搜索引擎,利用大型语言模型提供相关的搜索结果和动态答案,特别擅长处理编程和技术问题。 在生成式人工智能方面,近年来大型语言模型的飞速进步为信息检索领域带来新机遇和挑战。2022 年 OpenAI 发布 ChatGPT 引发轰动,其在对话中展现出理解复杂问题和生成连贯文本的能力,被视为对传统搜索引擎的颠覆性竞争。ChatGPT 的成功引发搜索引擎巨头的紧迫感,谷歌推出 Bard 并逐步向 180 多个国家开放服务,百度推出文心一言等生成式 AI 搜索功能,微软将 GPT4 集成到必应搜索中推出新版本的 Bing Chat。早期观察指出,聊天机器人式的搜索在提供直接答案的同时,存在回答不准确甚至“幻觉”信息的问题,现阶段许多用户对 AI 答案的准确性和可靠性仍存疑虑。
2025-02-28
请从知识库搜索相关自资料:AI与环境艺术设计:AI帮助生成设计灵感、AI优化空间布局、AI分析环境因素等
以下是关于 AI 生成 CAD 图的相关资料: 1. 学术论文:通过 Google Scholar、IEEE Xplore、ScienceDirect 等学术数据库搜索相关的学术论文,以了解 AI 在 CAD 领域的应用和研究成果。 2. 专业书籍:查找与 AI 在 CAD 领域相关的专业书籍,从中了解 AI 在 CAD 设计中的应用和案例。 3. 在线课程和教程:参加 Coursera、edX、Udacity 等平台上的 AI 和 CAD 相关课程。在 YouTube 等视频平台上查找教程和演示视频,了解 AI 在 CAD 设计中的应用。 4. 技术论坛和社区:加入如 Stack Overflow、Reddit 的 r/AI 和 r/CAD 等相关的技术论坛和社区,与其他专业人士交流和学习。同时关注 AI 和 CAD 相关的博客和新闻网站,了解最新的技术动态和应用案例。 5. 开源项目和代码库:在 GitHub 等开源平台上探索 AI 和 CAD 相关项目,例如 OpenAI 的 GPT3、AutoGPT 等 AI 模型在 CAD 设计中的应用,了解 AI 在 CAD 设计中的应用和实现。 6. 企业案例研究:研究 Autodesk、Siemens 等公司在 AI 在 CAD 设计中的应用案例,了解 AI 技术在实际项目中的应用和效果。 在学习和研究 AI 生成 CAD 图的过程中,了解相关的基础知识和技术细节非常重要。通过阅读学术论文、参加在线课程、观看教程视频和交流学习,您可以逐步掌握 AI 在 CAD 领域的应用和实现。随着 AI 技术的不断发展,AI 在 CAD 设计中的应用将会越来越广泛,为设计师和工程师提供更多的辅助和支持。
2025-02-27
如何高效率的用AI搜索学术文献资料
以下是关于如何高效率用 AI 搜索学术文献资料的方法: 1. 确定课题主题:明确研究兴趣和目标,选择具有研究价值和创新性的主题。 2. 收集背景资料:使用学术搜索引擎和文献管理软件等 AI 工具来搜集相关研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具提取收集资料中的关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成包括引言、文献综述、方法论、结果和讨论等部分的课题大纲。 5. 撰写文献综述:借助 AI 工具撰写文献综述部分,确保内容准确完整。 6. 构建方法论:根据研究需求,采用 AI 建议的方法和技术设计研究方法。 7. 数据分析:若课题涉及数据收集和分析,使用 AI 数据分析工具处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具撰写课题各部分,并进行语法和风格检查。 9. 生成参考文献:使用 AI 文献管理工具生成正确的参考文献格式。 10. 审阅和修改:利用 AI 审阅工具检查课题的逻辑性和一致性,并根据反馈修改。 11. 提交前的检查:使用 AI 抄袭检测工具确保课题的原创性,并进行最后的格式调整。 同时,为您介绍一些相关的 AI 工具和平台: 1. 文献管理和搜索: Zotero:结合 AI 技术自动提取文献信息,帮助管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 2. 内容生成和辅助写作: Grammarly:提供文本校对、语法修正和写作风格建议,提高语言质量。 Quillbot:基于 AI 的重写和摘要工具,精简和优化论文内容。 3. 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化,帮助进行复杂的数据分析和模型构建。 4. 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,提供丰富模板库和协作功能,简化论文编写。 5. 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:检测潜在抄袭问题。 需要注意的是,AI 工具可以作为辅助,但不能完全替代研究者的专业判断和创造性思维。在使用 AI 进行课题写作时,应保持批判性思维,并确保研究的质量和学术诚信。 另外,开搜 AI 搜索是一款免费无广告、直达结果的搜索工具,它可以帮助在校学生快速搜集专业领域的学术资料,智能总结关键信息,助力撰写论文和报告,同时支持查看来源出处,参考价值高。对于教育教师群体,能获取丰富的教学资源,自动生成教案和课题研究报告,提高教学内容的准备效率。职场办公人群可利用其高效查找工作所需信息,简化文案撰写、PPT 制作和工作汇报的准备工作。也能为学术研究人员提供深入的行业分析,通过 AI 技术整合和总结大量数据,形成有深度的研究报告。链接:https://kaisouai.com/
2025-02-27
多模态搜索
以下是关于多模态搜索的相关信息: ThinkAny 搜索引擎: 产品特性: 支持多模态检索(MultiModeSearch),可检索链接、图片、视频等模态内容。 支持多维度输出(MultiFormOutput),能以对话、大纲、思维导图、时间线等形式输出搜索问答内容。 支持多信源检索(MultiRetrieveSource),可检索 Google、Wikipedia、Github 等信息源的内容。 开源了 API 项目 ragsearch,实现联网检索功能,并对检索结果进行重排和获取详情内容。 长期发展方向是走 AI Search+Anything 的平台化路线,允许用户挂载自定义信息源、创建自定义智能体、实现自定义的流程编排。 其他推荐的 AI 搜索引擎: 秘塔 AI 搜索:提供多模式搜索、无广告干扰、结构化展示和信息聚合等功能。 Perplexity:聊天机器人式搜索引擎,用自然语言提问,从各种来源收集信息并给出答案。 360AI 搜索:通过 AI 分析问题,生成清晰、有理的答案,并支持增强模式和智能排序。 天工 AI 搜索:采用生成式搜索技术,支持自然语言交互和深度追问,未来将支持图像、语音等多模态搜索。 Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互方式,支持多种 AI 模型和图像生成技术,有插件系统和社区功能。 Devv:面向程序员的 AI 搜索引擎,提供编程、软件开发和人工智能等领域的专业建议和指导。 Phind:专为开发者设计的 AI 搜索引擎,利用大型语言模型提供相关搜索结果和动态答案,擅长处理编程和技术问题。 提升 AI 搜索准确度: 在提示词的设计和调试方面需要下功夫,很多环节都需用到提示词,如请求大模型判断是否需要联网、改写问题、提取关键词、回答问题、标注引用来源、以思维导图形式输出答案、做 Function Calling 判断使用的 Agents 等。 多模态检索是提升信息密度的重要措施,随着 5G 发展,互联网信息多元化,图片、视频、音频比重增大,多模态检索为获取不同形式信息再聚合起来作为引用参考。但多模态检索实现困难,现阶段可在谷歌搜索基础上,先使用其图片/视频检索 API 拿到匹配内容,再通过 OCR 图片识别、音视频转录等方法拿到多模态信息的文本内容。
2025-02-25
AI大模型本地化部署的逻辑是什么?输入的数据不会外泄吗?
AI 大模型本地化部署的逻辑主要包括以下步骤: 1. 选择合适的部署方式,如本地环境部署、云计算平台部署、分布式部署、模型压缩和量化、公共云服务商部署等,要根据自身的资源、安全和性能需求来决定。 2. 准备训练所需的数据和计算资源,确保有足够的训练数据覆盖目标应用场景,并准备足够的计算资源,如 GPU 服务器或云计算资源。 3. 选择合适的预训练模型作为基础,可以使用开源的预训练模型如 BERT、GPT 等,也可以自行训练一个基础模型。 4. 针对目标任务进行模型微调训练,根据具体应用场景对预训练模型进行微调训练,并优化模型结构和训练过程以提高性能。 5. 部署和调试模型,将训练好的模型部署到生产环境,并对部署的模型进行在线调试和性能优化。 6. 注意安全性和隐私保护,大模型涉及大量数据和隐私信息,需要重视安全性和合规性。 关于输入数据是否会外泄,这取决于本地化部署的安全性措施和配置。如果采取了严格的安全措施,如数据加密、访问控制、网络隔离等,输入的数据外泄的风险可以大大降低。但如果安全措施不到位,就存在数据外泄的可能。例如,赞成把一个训练好就不动的模型部署在端侧(如手机或家庭计算中心),记录所有知识和记忆的相关数据就不会跑到云端,能更好地保障数据安全。
2025-02-28
提示词有哪些逻辑框架
提示词常见的逻辑框架包括以下方面: 1. Vidu Prompt 基本构成: 提示词基础架构:包括主体/场景、场景描述、环境描述、艺术风格/媒介。在描述时需调整句式和语序,避免主体物过多/复杂、分散的句式,避免模糊术语,使用流畅准确的口语化措辞,避免过度文学化叙述,丰富、准确和完整的描述有助于生成特定艺术风格、满足需求的视频。 提示词与画面联想程度:通过单帧图像示例介绍关系,如基础词“玻璃桌上的咖啡杯,杯子外面写着单词 LOVE”,适度联想扩充为“花园里的透明玻璃桌上的咖啡杯,杯子外面写着单词 LOVE,周围满是盛开的鲜花,和煦的阳光洒满整个花园,Claude Monet,印象派风格”。联想关键点包括具体详实的位置描述/环境描述,可帮助构建画面基本呈现效果,以及艺术风格描述,可进一步提升效果和氛围,统一画面风格。 2. Super Prompt: 来源:在 X 上爆火,有相关链接。 原文包括 prompt、flowchart、结合提示词的思考过程解释等。 提示词结构及作用:个人感受是只给方向的逻辑框架很棒,省 Token,可沿用深化和迭代。 逐句解析包括 META_PROMPT1 的多个部分以及二进制编码部分和 META_PROMPT2 等。最后的灵感来源有参考价值,是指导 LLM 思考逻辑的索引,在有具体应用场景时可针对性引入,抽象规则是指路灯。
2025-02-28
文学性强、逻辑性差的文字描述转成图片或图表的AI工具有什么
以下是一些可以将文学性强、逻辑性差的文字描述转成图片或图表的 AI 工具: 1. AI“词生卡”:通过将抽象的文字描述转化为直观的逻辑图表和流程图,改变处理和呈现信息的方式。例如,在商业领域可根据项目描述自动生成流程图,还能用于自定义活动海报、商务名片、简历等,实现文图双输出。 2. 以下工具可用于绘制逻辑视图、功能视图和部署视图: Lucidchart:流行的在线绘图工具,支持多种图表创建,用户可通过拖放界面轻松操作。 Visual Paradigm:全面的 UML 工具,提供多种架构视图创建功能。 ArchiMate:开源建模语言,与 Archi 工具配合使用,支持逻辑视图创建。 Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板。 draw.io(现称为 diagrams.net):免费在线图表软件,支持多种图表类型创建。 PlantUML:文本到 UML 转换工具,通过编写描述生成序列图等。 Gliffy:基于云的绘图工具,提供架构图创建功能。 Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型。 Rational Rose:IBM 的 UML 工具,支持多种视图创建。 如果您想将小说做成视频,可以参考以下工具和流程: 工具与网址: 1. Stable Diffusion(SD):AI 图像生成模型,基于文本描述生成图像。网址: 2. Midjourney(MJ):AI 图像生成工具,适用于创建小说中的场景和角色图像。网址: 3. Adobe Firefly:Adobe 的 AI 创意工具,生成图像和设计模板。网址: 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址: 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址: 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址: 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址: 8. 故事 AI 绘图:小说转视频的 AI 工具。网址: 一般流程包括文本分析、角色与场景生成、视频编辑与合成等。
2025-02-09
哪款AI软件,逻辑性最强,知识点最全面
目前市场上有多种 AI 软件在不同领域展现出较强的逻辑性和全面的知识点。以下为您列举部分示例: 医渡云病历分析系统:使用数据分析和自然语言处理技术,能够分析医疗病历,为医生提供辅助诊断建议,市场规模达数十亿美元。 讯飞听见会议总结功能:运用自然语言处理和机器学习技术,可自动总结会议发言内容,市场规模达数亿美元。 英语流利说纠错功能:借助自然语言处理和机器学习,帮助语言学习者纠正发音、语法等错误,并提供纠正建议和练习,市场规模达数十亿美元。 腾讯文档分类功能:通过数据分析和机器学习,自动分类办公文件,方便管理,市场规模达数亿美元。 美图美妆 APP:利用图像识别和数据分析,根据用户肤质提供美容护肤建议,市场规模达数亿美元。 喜马拉雅儿童版:采用自然语言处理和机器学习,为儿童生成有趣故事,激发想象力,市场规模达数亿美元。 汽车之家 APP:使用数据分析和机器学习,快速诊断汽车故障,提供维修建议,市场规模达数十亿美元。 顺丰速运 APP:凭借数据分析和机器学习,优化物流配送路径,提高物流效率,市场规模达数十亿美元。
2025-02-06
大模型搭建知识库的逻辑是什么
大模型搭建知识库的逻辑主要包括以下几个方面: 1. 理解 RAG 技术:利用大模型搭建知识库本质上是 RAG 技术的应用。在大模型训练数据有截止日期或不包含所需数据时,通过检索增强生成(RAG)来解决。RAG 可抽象为 5 个过程: 文档加载:从多种来源加载包括非结构化、结构化和代码等不同类型的文档。 文本分割:把文档切分为指定大小的块。 存储:包括将切分好的文档块嵌入转换成向量形式,并将向量数据存储到向量数据库。 检索:通过检索算法找到与输入问题相似的嵌入片。 输出:把问题及检索出来的嵌入片一起提交给大模型,生成更合理的答案。 2. 构建知识库各个流程: 从用户提出问题开始,经历用户问题的理解、路由、初步检索、重排序等环节,最终将重排序后的结果和用户的查询意图组合成上下文输入给大模型生成输出结果。需要注意重排序结果的使用限制,如设置阈值进行截断或筛选相关性分数等。 后置处理包括敏感内容检测和移除、格式化输出等。 3. 知识库的需求:大模型并非 100%准确,存在数据日期限制和无法感知公司内部私有数据等问题,知识库的出现就是为解决大模型的数据准确性问题。例如在客服系统中,公司将用户问题及答案记录在文档中以知识库形式投喂给大模型,使其能更准确回答用户自然语言询问的问题。
2025-02-03
Deepseek 使用逻辑
DeepSeek 的使用逻辑如下: 效果对比:用 Coze 做了小测试,可对比查看相关视频。 如何使用: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 DeepSeek。 认真阅读开场白后正式开始对话。 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用,减轻调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力基础上优化输出质量,减轻 AI 味,增加可读性。 设计了阈值系统,可能会根据反馈修改。 用 XML 进行更为规范的设定,而非 Lisp 和 Markdown。 关于 DeepSeek 的其他信息: 1 月 26 日社区动态速览: 提示词框架包含四大模块:任务目的、计划规则、格式规则、输出说明。通过明晰的任务拆分与规则定义,让提示更具可操作性,但不可过度依赖,有示例模板可清晰展现相关内容。 Anthropic 的“计算机使用”模型,Claude 有新能力,如可识别屏幕截图,计算光标像素坐标并执行操作,结合了图像识别、推理和动作能力,能将用户指令转化为具体步骤并执行,少量软件训练后能自我纠正并迅速上手。 OpenAI Operator 工作机制,利用虚拟主机、Chrome 浏览器、CUA 实现网页实时操控,能执行复杂导航任务,结合 GPT4o 的视觉处理与强化学习,可处理屏幕截图、推理操作并发送指令,在感知—推理—动作循环中迭代,遇敏感任务则提示用户确认。 开源项目 Browser Use。 1 月 28 日社区动态速览: 华尔街分析师认为 DeepSeek 以小成本实现媲美领先 AI 产品的性能,并在全球主要市场 App Store 登顶,高盛认为其或改变科技格局,降低 AI 行业进入门槛。 DeepSeek 中文场景表现优秀,日常写作和表达习惯贴近人类,但专业论文总结略弱,数学能力不错,编程能力逊于 GPT,采用 GRPO 算法替代传统 PPO,提升语言评价灵活性与训练速度。 复旦大学 OpenMOSS 发布实时语音交互模型,中文语音体验近似 GPT4o 高级语音,响应时间低于 200 毫秒,支持打断和自然互动,可生成多情感、多风格语音,包含方言、戏剧化台词等,多语言适配,嘈杂环境下仍具备强逻辑推理能力。 阿里巴巴推出 Qwen2.51M 模型。
2025-01-30