直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

AI搜索工程架构

回答

以下是关于 AI 搜索工程架构的相关内容:

一、可插拔架构 在整个搜索回答的全流程,有很多节点可以做 Hook 埋点,每个 Hook 可以挂载零至多个插件,多个插件构成了 AI 搜索的可插拔架构。一些常用的功能,可以由 AI 搜索平台自身或第三方创作者抽离成标准插件,用在 AI 搜索主流程或者智能体/工作流等辅助流程。比如,自定义一个思维导图摘要插件,用户可以在搜索的步骤中选择这个自定义插件,实现用思维导图输出搜索结果。

二、提升可玩性 可以预置一个 after_answer 钩子,在大模型回答完用户 query 之后,把请求大模型的上下文信息和大模型的回答内容一起发给第三方插件,第三方插件可以把内容整理成文章/思维导图等格式,再同步到第三方笔记软件。

三、自定义智能体 Agent 智能体一般是对一些自定义操作的封装,用于解决某个场景的某类问题。以 ChatGPT 的 GPTs 举例,一个智能体应用由以下几部分自定义操作组成:

  1. 提示词:描述智能体的作用,定义智能体的回复格式。
  2. 知识库:上传私有文件作为回答参考。
  3. 外挂 API:请求第三方 API 获取实时数据。
  4. 个性化配置:是否联网/是否使用图片生成/是否使用数据分析等。

四、提升准确度

  1. 为获取足够信息密度,需获取链接详情页内容。通过上一步的 Reranking 选择最匹配的 top_k 条数据,避免获取全部内容导致 context 超限。为保证获取详情内容的效率,可做并行处理,如通过 goroutine 或者 python 的协程并行读取 top_k 条链接。获取链接详情内容有多种方案,如网页爬虫、无头浏览器抓取、第三方 Reader 读取等。
  2. 构建上下文内容池 Context Pool,将历史搜索结果和历史对话消息组成 Context Pool。每次搜索后追问,都带上这个 Context Pool 做意图识别/问题改写,拿到新的检索结果后更新这个 Context Pool,并带上最新的 Context Pool 内容作为上下文请求大模型回答。需要保证 Context Pool 的内容有较高的信息密度,同时控制其内容长度,不要超过大模型的 context 极限。

五、检索增强生成 (RAG) 以 Sana 的企业搜索用例为例,RAG 过程始于应用程序加载和转换无结构文件,转换为 LLM 可查询格式,文件被“分块”成更小的文本块,并作为向量嵌入和存储在数据库中。当用户提出问题时,系统会检索语义上最相关的上下文块,并将其折叠到“元提示”中,与检索到的信息一起馈送给 LLM,然后 LLM 合成答复返回给用户。在生产中,AI 应用程序具有更复杂的应用程序流程,包含多个检索步骤和提示链,不同类型的任务并行执行,然后将结果综合在一起,以生成最终输出。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

工具:我做了一个 AI 搜索引擎

[title]工具:我做了一个AI搜索引擎[heading1]ThinkAny是如何冷启动的[heading2]AI搜索如何提升可玩性比如,可以预置一个after_answer钩子,在大模型回答完用户query之后,把请求大模型的上下文信息和大模型的回答内容一起发给第三方插件,第三方插件可以把内容整理成文章/思维导图等格式,再同步到第三方笔记软件。在整个搜索回答的全流程,有很多节点可以做Hook埋点,每个Hook可以挂载零至多个插件,多个插件构成了AI搜索的可插拔架构,这套架构让AI搜索的全流程变得高度可定制,可玩性更高。一些常用的功能,可以由AI搜索平台自身或第三方创作者抽离成标准插件,用在AI搜索主流程或者智能体/工作流等辅助流程。比如,自定义一个思维导图摘要插件,输入内容是一段文本,输出内容是基于toc(table of contents)构成的思维导图。用户可以在搜索的步骤中选择这个自定义插件,实现用思维导图输出搜索结果。1.自定义智能体Agent智能体是现阶段ChatBot类产品经常用到的一种辅助产品形态。智能体一般是对一些自定义操作的封装,用于解决某个场景的某类问题。以ChatGPT()的GPTs举例,一个智能体应用由以下几部分自定义操作组成:提示词:描述智能体的作用,定义智能体的回复格式知识库:上传私有文件作为回答参考外挂API:请求第三方API获取实时数据个性化配置:是否联网/是否使用图片生成/是否使用数据分析等AI搜索的智能体也大体如此,外挂API的操作实际上就是挂载自定义信息源做检索。

工具:我做了一个 AI 搜索引擎

[title]工具:我做了一个AI搜索引擎[heading1]ThinkAny是如何冷启动的[heading2]AI搜索如何提升准确度很多的信息源(比如谷歌)返回的检索结果,只包含链接+摘要信息。如果要保证足够的信息密度,免不了要获取链接对应的详情页内容(Read Content)。上一步的Reranking让我们可以选择其中最匹配的top_k条数据,而不至于获取全部内容导致context超限。为了保证获取详情内容的效率,我们需要做一定的并行处理。比如通过goroutine或者python的协程并行读取top_k条链接,在一次请求耗时内拿到top_k条链接的全部内容。获取链接详情内容有很多方案,包括网页爬虫/无头浏览器抓取/第三方Reader读取等。ThinkAny目前使用的是jina.ai的Reader方案。做了一个开关,控制是否获取链接详情,为了保证响应速度,线上的版本暂时未开。1.构建上下文内容池Context Pool提高AI搜索的准确度,上下文的控制也是一个非常重要的手段。比如可以构建一个上下文内容池(Context Pool)=历史搜索结果(Search Results)+历史对话消息(Chat Messages)每次搜索后追问,都带上这个Context Pool做意图识别/问题改写,拿到新的检索结果后更新这个Context Pool,并带上最新的Context Pool内容作为上下文请求大模型回答。Context Pool里的Search Results可以根据链接做去重,Chat Messages可以根据相似度匹配做过滤。需要保证Context Pool的内容有较高的信息密度,同时要控制Context Pool的内容长度,不要超过大模型的context极限。对Context Pool的构建和动态更新,是一个非常有挑战性的事情,如果能做好,对搜索结果的准确度提升也能起到非常大的帮助。1.提示词工程Prompt Engineering

AI 智能体:企业自动化的新架构 - Menlo Ventures

设置基线:RAG是当今大多数现代人工智能应用程序的标准架构。让我们以Sana的企业搜索用例为例,了解它在幕后的工作原理。该过程始于应用程序加载和转换无结构文件(如PDF、幻灯片、文本文件)跨越企业数据孤岛,如Google Drive和Notion,转换为LLM可查询格式,通常通过像[Unstructured](https://menlovc.com/portfolio/unstructured/)*这样的数据预处理引擎进行。这些文件现在被"分块"成更小的文本块,以实现更精确的检索,并作为向量嵌入和存储在像[Pinecone](https://menlovc.com/portfolio/pinecone/)*这样的数据库中。当用户向AI应用程序提出问题时(例如,"总结我与公司X会议的所有笔记"),系统会检索语义上最相关的上下文块,并将其折叠到"元提示"中,与检索到的信息一起馈送给LLM。然后,LLM会从检索到的上下文中合成一个整洁的带有项目符号的答复返回给用户。当然,该图仅说明了一个带有一个LLM调用的单一检索步骤。在生产中,AI应用程序具有更复杂的应用程序流程,包含数十甚至数百个检索步骤。这些应用程序通常具有"提示链",其中一个检索步骤的输入馈送到下一步,并且不同类型的任务并行执行多个"提示链"。然后将结果综合在一起,以生成最终输出。[Eve](https://menlovc.com/portfolio/eve/)*法律研究的共同驾驭员,例如,可能会将针对《第七篇》的研究查询分解为专注于预定子主题的独立提示链,如雇主背景、就业历史、《第七篇》、相关案例法和原告案件支持证据。LLMs然后运行每个提示链,为每个生成中间输出,并综合各输出编写最终备忘录。

其他人在问
是AI聪明还是人的大脑聪明
AI 和人的大脑谁更聪明是一个复杂的问题,不能简单地一概而论。 从某些方面来看,AI 具有强大的计算能力和处理大量数据的能力,能够快速准确地完成特定任务。例如,在处理复杂的数学计算、大规模数据的分析和模式识别等方面表现出色。 然而,人的大脑具有独特的智慧和能力。大脑是一个混沌系统,具有创造性、适应性、情感理解、综合判断和复杂情境处理等能力。人类能够进行抽象思维、创新创造、理解情感和道德等方面的思考。 AI 是通过学习人类大脑结构来发展的,但目前仍存在诸多不足和缺陷。例如,大模型内部也是混沌系统,即使是科学家也无法解释其微观细节。 在绘画方面,人类的绘画创作通常是线性发展的过程,先学习线稿表达、色彩搭配、光影表现等,而 AI 是以积累数据、扩散噪声、再降噪收束的路径来生图,经常会在同一张图中呈现出不同绘画级别的细节。 总之,AI 和人的大脑各有优势和局限性,不能简单地判定谁更聪明。
2024-11-22
AI到底是什么
AI 是一门令人兴奋的科学,它是指某种模仿人类思维,可以理解自然语言并输出自然语言的东西。 对于不具备理工科背景的人来说,可以把 AI 当成一个黑箱,只需要知道它是能够理解自然语言的存在即可。其生态位是一种似人而非人的存在,即便技术再进步,这一生态位也不会改变。 从历史角度看,最初计算机是按照明确定义的程序来运算的,但对于像从照片判断人的年龄这类无法明确编程的任务,就需要人工智能来解决。 在应用方面,AI 健身是利用人工智能技术辅助或改善健身训练和健康管理的方法,能根据用户情况提供定制化训练计划和建议。比如 Keep、Fiture、Fitness AI、Planfit 等都是不错的 AI 健身工具。
2024-11-22
AI知识库工具
以下是为您提供的关于 AI 知识库工具的相关信息: WayToAGI(通往 AGI 之路): 这是由一群热爱 AI 的专家和爱好者共同建设的开源 AI 知识库。 大家贡献并整合各种 AI 资源,让人们能轻松学习 AI 知识,应用各类 AI 工具和实战案例。 提供一系列开箱即用的工具,如文生图、文生视频、文生语音等的详尽教程。 追踪 AI 领域最新进展并时刻更新,无论您是初学者还是行业专家,都能在此发掘有价值的内容。 网址:https://waytoagi.com/ 体验链接:https://waytoagi.com/ 知识库在 AI 模型中的作用: 知识库就像 AI 的“活字典”,是一个非常贴切的比喻。 能解决 AI 知识“过期”的问题,AI 可随时从更新的知识库中检索相关信息,给出更准确的回答。 例如可建立包含最新新闻、科技发展、法律法规等内容的知识库,让 AI 回答最新事件的问题。 像热门的 AI 搜索,就是将整个互联网的实时数据作为知识库,通过搜索引擎获取最新信息。 产品经理 AI 工具集: 用户研究、反馈分析:Kraftful(kraftful.com) 脑图:Whimsical(whimsical.com/aimindmaps)、Xmind(https://xmind.ai) 画原型:Uizard(https://uizard.io/autodesigner/) 项目管理:Taskade(taskade.com) 写邮件:Hypertype(https://www.hypertype.co/) 会议信息:AskFred(http://fireflies.ai/apps) 团队知识库:Sense(https://www.senseapp.ai/) 需求文档:WriteMyPRD(writemyprd.com) 敏捷开发助理:Standuply(standuply.com) 数据决策:Ellie AI(https://www.ellie.ai/) 企业自动化:Moveworks(moveworks.com)
2024-11-22
我想做ui设计来模仿微信做一个app,想找各种图标素材 怎么用ai找这些素材
以下是使用 AI 找模仿微信做 App 所需图标素材的方法: 1. 对于直播礼物风格图标:可以在素材网站上找到喜欢的 icons 风格,然后喂图给 Midjourney 机器人,并加上关键词,如“喂图 + 耳机图标等。 2. 对于主题应用 icons:使用关键词“icon design,light texture,glow,Dribbble,3D,frostedglass effect,3d,ui,ux,–upbeta –q 2 –v 4”。 3. 对于 B 端图标:可以喂图加上关键词“A data icon,blue gradient frosted glass,frostedglass building,white transparent technology sensewhite city building scene,data line link,chip,OCrenderer,big data,industrial machinery,high detailight gray background with simple linear details,studio lighting,3d,c4d,pure white background,8k”。 4. 对于音乐软件 UI 设计:使用关键词“music app ui design,ux design,white,light,bright,data,modern,smooth,behance,dribbble,–upbeta –q 2 –v 4”。 需要注意的是,Midjourney 生成的图片可能在某些方面不够规范或完善,只能作为风格参考。
2024-11-22
怎么用ai写脚本
以下是关于如何用 AI 写脚本的一些指导: 首先,明确您要写的故事类型和来源。故事来源可以有两种路径: 1. 原创(直接经验):包括您或您周围人的经历、您做过的梦、您想象的故事等等。 2. 改编(间接经验):比如对经典 IP、名著、新闻进行改编或二创。 在剧本写作方面: 编剧是有一定门槛的手艺,不能单纯依赖剧作理论和模板,而应先大胆地写和实践,再结合看书学习,不断总结经验。对于短片创作,由于篇幅较小、情节和角色相对简单,可以从自己或朋友的经历改编入手,或者对触动您的短篇故事进行改编。多与他人讨论您的故事,有助于修改和进步。 如果您想用 AI 把小说做成视频,大致的制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说,提取关键场景、角色和情节。 2. 生成角色与场景描述:利用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:借助 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,并添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,提升视频质量。 8. 审阅与调整:观看视频,根据需要调整某些场景或音频。 9. 输出与分享:完成编辑后,输出最终视频并在所需平台分享。 需要注意的是,具体操作步骤和所需工具可能因项目需求和个人偏好有所不同,AI 工具的可用性和功能也可能变化,建议访问相关工具网址获取最新信息和使用指南。 另外,对于担心 AI 削弱孩子思考力的问题,如果使用方法正确,AI 反而能助力拓展思维边界。比如将提问方式从封闭性改为开放性,或者让 AI 帮助提出更多拓展思考的问题。在 AI 辅助写作文时,可以让孩子提交与 AI 共同完成作文的聊天记录,重点关注孩子能否说清 AI 作文的优缺点以及如何修改。
2024-11-22
如何起步开始学习ai设计
以下是关于如何起步开始学习 AI 设计的一些建议: 1. 阅读相关文章: 如 ,了解市场动态和生成式 AI 商业模式的相关问题。 ,认识到尽早学习的重要性,避免被其他熟练掌握 AI 动力设计技巧的设计师超越。 ,了解设计的当前状态、常见问题及实用技巧。 ,学习最佳实践和利用 UX 策略使 AI/ML 系统更易于解释和透明。 2. 利用工具: 了解星流一站式 AI 设计工具,在入门模式下,熟悉右侧生成器的图片参考部分,如快速参考、风格迁移、Tile 分块、重新上色等功能。 掌握基础模型,包括星流通用大模型及基础模型 F.1、基础模型 XL、基础模型 1.5 等,了解它们在效果和生成速度上的差异。 了解增强模型,可通过收藏、查看例图和选择风格等方式进行使用。
2024-11-22
请问有ai生成架构图的工具么
以下是一些可以生成架构图(包括逻辑视图、功能视图、部署视图)的工具: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,用户可通过拖放轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能。 3. ArchiMate:开源建模语言,与 Archi 工具配合使用可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板。 6. draw.io(现称 diagrams.net):免费在线图表软件,支持创建多种类型图表。 7. PlantUML:文本到 UML 转换工具,通过编写描述生成序列图等,辅助创建逻辑视图。 8. Gliffy:基于云的绘图工具,提供创建架构图功能。 9. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图。 请注意,这些工具并非都是基于 AI 的。AI 在绘图工具中的应用通常涉及智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,应考虑具体需求,如是否支持特定建模语言、是否与特定开发工具集成、偏好在线工具或桌面应用程序等。 此外,以下是一些可以辅助或自动生成 CAD 图的 AI 工具: 1. CADtools 12:Adobe Illustrator 插件,为 AI 添加 92 个绘图和编辑工具。 2. Autodesk Fusion 360:集成 AI 功能的云端 3D CAD/CAM 软件。 3. nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据输入自动生成 3D 模型。 5. 主流 CAD 软件(如 Autodesk 系列、SolidWorks 等)的生成设计工具,可根据设计目标和约束条件自动产生多种设计方案。 这些工具通常需要一定的 CAD 知识和技能才能有效使用。对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。 以上内容由 AI 大模型生成,请仔细甄别。
2024-11-09
请帮我总结AI AGENT的总体架构,帮助我更快学习相关的知识,尽快进行具体场景的商业落地
AI Agent 是一个融合了多学科精髓的综合实体,不仅有实体形态,还有丰富的概念形态,并具备许多人类特有的属性。其总体架构包括以下方面: 1. 大模型 LLM 扮演“大脑”。 2. 规划:包括子目标分解、反思与改进。子目标分解将大型任务分解为较小可管理的子目标以处理复杂任务;反思和改进可对过去的行动进行自我批评和反思,从错误中学习并改进未来步骤,提高最终结果质量。 3. 记忆。 此外,AI Agent 还具有以下特点和应用: 1. 能够自行规划任务执行的工作流路径,面向简单或线性流程的运行。 2. 可以实现多 Agent 协作,例如让大语言模型扮演不同角色,相互协作共同开发应用或复杂程序。
2024-11-04
AI生成系统架构图 用什么
以下是一些可以用于绘制逻辑视图、功能视图和部署视图的工具: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,包括上述视图,用户可通过拖放轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能。 3. ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,有丰富模板用于创建相关视图。 6. draw.io(现 diagrams.net):免费在线图表软件,支持创建逻辑和部署视图等。 7. PlantUML:文本到 UML 转换工具,可通过描述文本自动生成相关视图。 8. Gliffy:基于云的绘图工具,提供创建架构图功能。 9. Archi:免费开源工具,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建逻辑和部署视图。 请注意,虽然这些工具可以辅助创建架构视图,但它们不都是基于 AI 的。AI 在绘图工具中的应用通常涉及智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,您应该考虑您的具体需求,比如是否需要支持特定的建模语言、是否需要与特定的开发工具集成、是否偏好在线工具或桌面应用程序等。
2024-10-30
有没有RAG 基本架构的中文图示
以下是关于 RAG 基本架构的介绍: RAG 是当今大多数现代人工智能应用程序的标准架构。以 Sana 的企业搜索用例为例,其工作原理如下: 1. 应用程序加载和转换无结构文件(如 PDF、幻灯片、文本文件),跨越企业数据孤岛(如 Google Drive 和 Notion),通过数据预处理引擎(如 Unstructured)转换为 LLM 可查询格式。 2. 这些文件被“分块”成更小的文本块,作为向量嵌入并存储在数据库(如 Pinecone)中,以实现更精确的检索。 3. 当用户提出问题时,系统检索语义上最相关的上下文块,并将其折叠到“元提示”中,与检索到的信息一起馈送给 LLM。 4. LLM 从检索到的上下文中合成答复返回给用户。 RAG 的基本概念: RAG 是一种结合了检索和生成的技术,能让大模型在生成文本时利用额外的数据源,提高生成的质量和准确性。其基本流程为: 首先,给定用户输入(如问题或话题),RAG 从数据源中检索出相关文本片段(称为上下文)。 然后,将用户输入和检索到的上下文拼接成完整输入传递给大模型(如 GPT),输入通常包含提示,指导模型生成期望输出(如答案或摘要)。 最后,从大模型的输出中提取或格式化所需信息返回给用户。
2024-10-17
怎们架构专属自己企业的AI系统
要架构专属自己企业的 AI 系统,可以参考以下步骤: 一、逐步搭建 AI 智能体 1. 搭建整理入库工作流 新建工作流「url2table」,根据弹窗要求自定义工作流信息。 工作流全局流程设置需根据实际需求进行。 2. 在外层 bot 中封装工作流,完成整体配置 创建 Bot。 填写 Bot 介绍。 切换模型为“通义千问”,测试下来通义对提示词理解和执行效果较好。 把配置好的工作流添加到 Bot 中。 新增变量{{app_token}}。 添加外层 bot 提示词(可按需求和实际效果优化调整)。 二、相关术语 以下是一些在 AI 系统架构中可能涉及的术语: 1. AI 或 AI 系统或 AI 技术:具有“适应性”和“自主性”的产品和服务,如在定义的第 3.2.1 节中所述。 2. AI 供应商:在 AI 系统的研究、开发、培训、实施、部署、维护、提供或销售中发挥作用的任何组织或个人。 3. AI 用户:使用 AI 产品的任何个人或组织。 4. AI 生命周期:与 AI 系统的寿命相关的所有事件和过程,从开始到退役,包括其设计、研究、培训、开发、部署、集成、操作、维护、销售、使用和治理。 5. AI 生态系统:在 AI 生命周期中实现 AI 使用和供应的复杂网络,包括供应链、市场和治理机制。 6. 基础模型:在大量数据上训练的一种 AI 模型,可适用于广泛的任务,可作为构建更具体 AI 模型的基础。 经过上述配置,您可以在「预览与调试」窗口与 AI 智能体对话并使用全部功能。
2024-09-11
输入文字,生成组织架构图
以下是一些可以用于生成组织架构图的工具: 1. PlantUML:这是一个文本到 UML 的转换工具,通过编写描述性文本可自动生成序列图、用例图、类图等,能帮助创建逻辑视图。 2. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 3. Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 4. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包含逻辑视图和部署视图。 需要注意的是,这些工具并非都基于 AI。AI 在绘图工具中的应用通常涉及智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,应考虑具体需求,如是否需要支持特定建模语言、与特定开发工具集成、偏好在线工具或桌面应用程序等。 另外,增强版 Bot 是基于 AI 驱动的智能创作平台,可实现一站式内容生成(包括图片、PPT、PDF)。在图片理解与生成场景中,在对话框输入诉求即可测试效果,比如生成常见的系统架构风格架构设计图,给出一张图片。通过简短的文本就能让 Bot 生成相应的图片,这背后是文本到图片或视频等其他格式内容的映射关系,在日常工作中使用便捷。当然,也可以根据图片提取里面的关键知识内容。
2024-09-03
请介绍图片搜索最好用的AI工具
以下为您介绍一些在图片搜索相关方面表现出色的 AI 工具: 图片去水印工具: 1. AVAide Watermark Remover:在线工具,支持多种图片格式,操作简单,可去除水印、文本、对象等。 2. Vmake:可上传最多 10 张图片,自动检测并移除水印,适合快速处理。 3. AI 改图神器:能一键去除图片中的多余物体、人物或水印,支持粘贴或上传手机图像。 图生图产品: 1. Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感。 2. Retrato:将图片转换为非凡肖像,有 500 多种风格选择。 3. Stable Diffusion Reimagine:通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:将上传照片转换为芭比风格。 图片生成 3D 建模工具: 1. Tripo AI:在线 3D 建模平台,能利用文本或图像快速生成高质量 3D 模型。 2. Meshy:支持文本、图片生成 3D 及 AI 材质生成。 3. CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 可通过手绘草图实时设计 3D 形象。 4. Sudo AI:通过文本和图像生成 3D 模型,适用于游戏领域。 5. VoxCraft:免费工具,能将图像或文本快速转换成 3D 模型,提供多种功能。 请注意,以上内容由 AI 大模型生成,请仔细甄别。这些工具各有特点,您可以根据具体需求选择最适合您的工具。
2024-11-21
360AI搜索
以下是关于 360AI 搜索的相关信息: 360AI 搜索是 360 公司推出的 AI 搜索引擎,通过 AI 分析问题,生成清晰、有理的答案,并支持增强模式和智能排序。 其定位是新一代答案引擎,在传统搜索的网页检索能力基础上,结合大型语言模型意图识别、信息提炼、归纳整理、生成文案等一系列技术能力,学习人类的思维和语言组织模式,生成有理有据、逻辑清晰的优质答案。 具有以下特点: 针对模糊问题,可通过反问和几轮交互理解问题,给出答案。 搜索全网上万条相关内容,深度阅读 20+网页,生成的答案非常丰富。 对比大模型产品特别是聊天机器人,回答更具时效性。 通过主动追问帮助用户延展学习,了解更多周边信息。 功能包括阅读提炼全网内容,并归纳总结,相当于替用户读了几十个精选网页,并进行归纳总结。其工作流程为:分析问题语义→提炼搜索关键词→查询全网相关内容→精选出参考价值较高的网页→进行结构化总结,重点突出,详略得当。 在国内总榜中排名第 3,4 月访问量为 1134 万次,相对 3 月变化为 13。 Web 端和 H5 端的网址为: ,手机端可扫码下载 360 AI 搜索 APP。
2024-11-21
生成式搜索和知识问答的区别
生成式搜索和知识问答存在以下区别: 生成式搜索: 采用大型语言模型技术,能更好地理解用户自然语言查询的语义,不仅仅是匹配关键词。 可以生成通顺的自然语言回答,而非简单返回网页链接和片段,结果更易于理解和使用。 能够根据用户的历史查询和偏好个性化结果,提供更贴合需求的答复。 例如 Perplexity 等 AI 搜索引擎,通过收集各种来源的信息给出答案。 但存在训练成本高、可解释性差、潜在偏差和不当内容等问题。 知识问答: 例如 RAG ,通过引用外部数据源为模型做数据补充,适用于动态知识更新需求高的任务。 原理是在基础大模型基础上引用外部数据,对搜索到的数据信息进行切片、拆分和语义理解,再根据用户提问进行检索和回答,但比基座模型更耗时。 一些知识问答系统能够支持在本地运行。 此外,为您推荐一些 AI 搜索引擎: 秘塔 AI 搜索:由秘塔科技开发,提供多模式搜索、无广告干扰、结构化展示和信息聚合等功能。 Perplexity:聊天机器人式搜索引擎,允许用户用自然语言提问,使用生成式 AI 技术收集信息并给出答案。 360AI 搜索:360 公司推出,通过 AI 分析问题,生成清晰、有理的答案,并支持增强模式和智能排序。 天工 AI 搜索:昆仑万维推出,采用生成式搜索技术,支持自然语言交互和深度追问,未来将支持多模态搜索。 Flowith:创新的 AI 交互式搜索和对话工具,基于节点式交互方式,支持多种 AI 模型和图像生成技术,有插件系统和社区功能。 Devv:面向程序员的 AI 搜索引擎,专注于提供编程、软件开发和人工智能等领域的专业建议和指导。 Phind:专为开发者设计的 AI 搜索引擎,利用大型语言模型提供相关搜索结果和动态答案,擅长处理编程和技术问题。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-14
我没有知识库,如何让AI就某一问题穷尽搜索
要让 AI 就某一问题进行穷尽搜索,一般会涉及以下步骤: 1. 文档向量化:知识库中的文档需要被转换成向量形式,以便在数值级别上与问题向量进行比较。使用知识库工具上传文档时,会完成文档的向量化,这依靠 Embedding Model 实现。 2. 知识库检索: 相似性计算:使用相似性度量方法(如余弦相似性)计算问题向量和各个文档向量之间的相似度,以找出与问题内容最接近的文档。 排序与选择:根据相似性得分对所有文档进行排序,通常会选择得分最高的几个文档,认为这些文档与问题最相关。 信息抽取:从选定的高相关性文档中抽取具体的信息片段或答案,可能涉及进一步的文本处理技术,如命名实体识别、关键短语提取等。 3. 信息整合阶段:将检索到的全部信息连同用户问题和系统预设整合成一个全新的上下文环境,为生成回答提供基础。 此外,像生物进化中通过自然选择的方式,从特定规则开始逐步改变(可能随机),在每一步保留最有效的规则并丢弃其他,这种方法不是我们通常定义的“人工智能”(更像是“遗传算法”),但在高维规则空间中往往比低维规则空间效果更好,因为维度越多,陷入局部最小值的可能性越小。 同时,给 AI 配备随时更新的“活字典”即知识库是一个好方法。知识库就像 AI 随时可查阅的百科全书,当 AI 遇到不确定问题时,可从知识库中检索相关信息给出更准确回答。比如建立包含最新新闻、科技发展、法律法规等内容的知识库,或者利用整个互联网的实时数据作为知识库,通过搜索引擎获取最新信息。
2024-11-13
我想搜索全面彻底的搜索某方面客观存在的事实信息,有什么工具可以实现
以下是一些可以用于全面彻底搜索某方面客观存在的事实信息的工具和相关信息: Coze 手搓的极简版 Perplexity:它旨在结合搜索引擎和 LLM 的优势,提供更优的信息检索体验。但 LLM 本身作为知识问答工具存在缺陷,如无法实时获取最新信息、有“幻觉”问题、无法给出准确引用来源等,而搜索引擎返回的信息呈现形式原始,需要进一步处理。 基于嵌入的搜索:OpenAI 提出,如果作为输入的一部分提供,模型可以利用外部信息源,例如通过嵌入实现高效的知识检索。文本嵌入是衡量文本字符串相关性的向量,相似或相关的字符串距离更近,利用快速向量搜索算法,可将文本语料库分割成块进行嵌入和存储,给定查询后进行向量搜索找到最相关的文本块。相关示例实现可在中找到。关于如何使用知识检索来最小化模型编造错误事实的可能性,可参阅策略“指示模型使用检索到的知识来回答查询”。
2024-11-13
用20个字概括AI问答和搜索
AI 问答和搜索包括联网检索、多种引擎及检索原理 存在联网检索的 AI 及相关工具。 推荐多种 AI 搜索引擎。 介绍知识库检索的原理和步骤。
2024-11-13
提示词工程
提示词工程师(Prompt Engineer)是在与人工智能模型交互时,负责设计和优化提示的专业人员。他们的目标是通过精心构造的提示,引导模型产生准确、有用和相关的回答。 主要职责包括: 设计提示:根据用户需求和模型能力设计有效的提示,考虑提示的长度、结构、措辞和信息量等因素,确保清晰传达用户意图并引导模型生成满意结果。 优化提示:通过收集用户反馈、分析模型结果和实验不同的提示策略等方式不断优化提示,以提高模型性能。 评估提示:使用各种指标如模型的准确率、流畅度和相关性等来评估提示的有效性。 提示词工程师需要具备以下技能和知识: 领域知识:对所工作的领域有深入了解,以便设计出有效的提示。 自然语言处理(NLP):了解 NLP 的基本原理和技术,能够理解和生成自然语言文本。 人工智能(AI):了解 AI 的基本原理和技术,能够理解和使用 AI 模型。 沟通能力:具备良好的沟通能力,与用户、团队成员和其他利益相关者有效沟通。 以下是一些提示词工程师工作的实际案例: 无需微调,仅用提示词工程就能让 LLM 获得 tool calling 的功能。其实现原理主要有两部分代码组成:提示词注入和工具结果回传。提示词注入用于将工具信息以及使用工具的提示词添加到系统提示中。工具结果回传则是解析 tool calling 的输出,并将工具返回的内容再次嵌入 LLM。 在生成式 AI 模型中,提示词工程是一门新兴的学科,它塑造了模型的交互和输出。提示词是用户与模型沟通愿望的文本界面,可从简单问题到复杂任务,包括指令、问题、输入数据和示例等。提示词工程的核心在于制作出能实现特定目标的最佳提示词,这不仅要指导模型,还需深刻理解模型能力和局限性及所处上下文。此外,提示词工程是一个迭代和探索的过程,类似于传统软件工程实践,且需要适应新范式。本文旨在深入探讨这个新兴领域,重点关注其在 LLM 中的应用,且多数技术也适用于多模态生成式 AI 模型。
2024-11-13
请总结本知识库,并提炼出11节面向十岁儿童关于AIGC的课程,三节是提示词工程,2节文生文,2节文生图/图生图,2节文生音频,2节文生视频/图生视频,不需要涉及智能体及文生代码
以下是对本知识库的总结: 包含了不同时间段的 AIGC 周刊内容,如 Open AI 发布 ChatGPT 的 iOS 应用、Google 宣布多项 AI 新功能、AI 歌手相关教程等。 有关于提示词工程的课程及相关技巧介绍。 涉及一些特定的 AIGC 技术和方法,如 Donut 文档理解方法。 提到了谷歌的生成式 AI 学习课程。 以下是为十岁儿童设计的 11 节关于 AIGC 的课程: 1. 提示词工程基础 什么是提示词 提示词的作用 简单的提示词示例 2. 提示词工程进阶 复杂提示词的构建 如何优化提示词 提示词的实际应用 3. 提示词工程实践 设计自己的提示词任务 分享与讨论提示词成果 总结提示词的使用技巧 4. 文生文入门 了解文生文的概念 简单的文生文工具介绍 尝试生成一段文字 5. 文生文提高 优化文生文的输入 让生成的文字更有趣 比较不同文生文的效果 6. 文生图/图生图基础 认识文生图和图生图 常见的文生图工具 用简单描述生成一张图片 7. 文生图/图生图进阶 更复杂的描述生成精美图片 对生成的图片进行修改 分享自己生成的图片 8. 文生音频入门 什么是文生音频 简单的文生音频工具 生成一段简单的音频 9. 文生音频提高 让生成的音频更动听 给音频添加特效 欣赏优秀的文生音频作品 10. 文生视频/图生视频基础 文生视频和图生视频的概念 基本的文生视频工具 制作一个简单的视频 11. 文生视频/图生视频进阶 让视频更精彩 视频的后期处理 展示自己制作的视频
2024-10-31
aigc提示工程师应该学习哪些课程
以下是 AIGC 提示工程师应该学习的一些课程: 1. 针对开发者的 AIGPT 提示工程课程:由 OpenAI 技术团队成员授课,涵盖软件开发最佳实践的提示,常见用例如总结、推理、转换和扩展,以及使用 LLM 构建聊天机器人等内容。 2. 范德堡大学的提示工程课程:教您成为生成 AI 工具的专家用户,展示利用生成式人工智能工具的示例,提高日常工作效率,并深入了解其工作原理。 3. 了解大型语言模型背后的理论:深入探讨自然语言处理中基本模型的细节,学习创新技术,涉及基于 Transformer 的模型,以及少量学习和知识蒸馏等转移学习技术,聚焦新的 LLM 发展方向。 4. 提示词培训课——Part4:包括提词工程的基础概念和实用技巧,如利用地规构建思考链条、探讨提示词的敏感性问题、解释'token'概念及相关操作,深入讲解提示词的进阶技术,如增强推理能力、运用元提示和任务分解技巧,探讨 AIAgent 和 AIAgentic 的概念和差别,学习多智能体设计模式,梳理提词落地流程。
2024-10-31
提词工程
提示词工程是一门在 AI 领域中新兴且重要的学科,主要包括以下方面: 实现原理:主要由提示词注入和工具结果回传两部分代码组成。提示词注入用于将工具信息及使用工具的提示词添加到系统提示中,包含 TOOL_EAXMPLE、tools_instructions、REUTRN_FORMAT 三个部分。工具结果回传则是解析 tool calling 的输出,并将工具返回的内容再次嵌入 LLM。 提示词注入阶段:INSTRUCTION 包含 TOOL_EAXMPLE、tools_instructions、REUTRN_FORMAT 三个部分。TOOL_EAXMPLE 用于提示 LLM 理解和使用工具,编写时应注意用无关紧要的工具作示例避免混淆。tools_instructions 可通过输入不同工具动态调整,让 LLM 得知可用工具及使用方法。REUTRN_FORMAT 定义调用 API 的格式。 工具结果回传阶段:利用正则表达式抓取输出中的“tool”和“parameters”参数,对于 interpreter 工具使用另一种正则表达式提取 LLM 输出的代码。通过识别 LLM 返回的调用工具的字典提取对应值,传入工具函数,将结果以 observation 或 user 角色返回给 LLM。 是用户与模型沟通愿望的文本界面,涵盖简单问题到复杂任务,包括指令、问题、输入数据和示例等,以指导 AI 的响应。其核心在于制作出能实现特定目标的最佳提示词,需结合领域知识、对 AI 模型的理解及系统化方法为不同情境定制提示词,还可能包括创建可根据给定数据集或上下文进行程序化修改的模板,是一个迭代和探索的过程。 在人工智能迅速发展的当下,已成为企业领导者必须掌握的关键技能,是设计和优化输入到 AI 系统指令(即提示词)的艺术和科学。但简单提示词存在局限性,无法满足复杂需求,推动了更先进提示技巧如思维链、思维树和思维图等的发展。
2024-10-23
无人驾驶开发工程师
以下是为您提供的关于无人驾驶开发工程师的相关信息: 在生成式人工智能的行动方面,目前出现的趋势是首先将 AI 作为辅助驾驶(humanintheloop)部署,并通过使用机会积累经验,最终实现全自动化部署。例如 Sierra 就是一个例子,它在无法解决问题时能优雅地转交给人工处理。同时,新一代自主型应用随着生成式 AI 推理能力的提升而涌现,如 L4 智能驾驶可能是第一个具身智能最大的应用场景,目前其安全性比人类高 10 倍。 在 2024 北京智源大会的主题讨论中,张亚勤认为目前真正赚钱的是 2B 领域,如芯片、服务器等,应用是先 2C 再 2B。他把智能分成信息智能、具身智能、生物智能 3 个阶段,预测 05 年是信息智能,510 年是物理智能(具身智能),1520 年是生物智能。李开复认为无人驾驶面临巨大机会,FSD 会为无人驾驶带来新机遇,大模型适合虚拟世界,而接入物理世界会面临很多现实问题,创业者更适合从虚拟世界的 AI 创业开始。
2024-10-21
我是一定装饰工程造价从业人员,如何通过学习AI来提升自己
对于装饰工程造价从业人员来说,通过以下方式学习 AI 可以提升自己: 了解相关基础知识和技术细节:阅读关于 AI 生成 CAD 图的学术论文,深入研究其原理和应用。 参加在线课程:系统学习 AI 在 CAD 领域的知识和技能。 观看教程视频:直观地了解操作和实践方法。 交流学习:与同行或专家交流经验,分享心得。 需要注意的是,随着 AI 技术的不断发展,其在 CAD 设计中的应用会越来越广泛,为设计师和工程师提供更多辅助和支持。但以上内容由 AI 大模型生成,请您仔细甄别。
2024-09-24