Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI infra是什么意思?

Answer

AI Infra 通常指的是人工智能基础设施。随着越来越多的 AI 模型和产品的出现,AI Infra 所涵盖的工具变得愈发重要,这些工具能够帮助构建、改进和监控 AI 模型及产品。

例如,硅基流动致力于打造大模型时代的 AI 基础设施平台,通过算法、系统与硬件的协同创新,跨数量级降低 AI 应用的开发和使用门槛,加速 AGI 普惠人类。

在一些相关的产品和服务中,如 EdenAI 帮助 AI 创作者为其产品选择合适的 AI API 并在它们之间切换,Langdoc 能快速创建和部署 LLM 插件或应用程序,Langfuse 可追踪和调试复杂的 LLM 应用程序,这些都属于 AI Infra 的范畴。

Content generated by AI large model, please carefully verify (powered by aily)

References

ProductHunt 2023 年度最佳产品榜单

随着越来越多的AI模型和产品的出现,帮助构建、改进和监控它们的工具变得比以往任何时候都更加重要,因此几年的奖项又出现了一个新的类别。这个类别的入围者帮助AI创作,者为他们的产品选择合适的AI API并在它们之间切换(如EdenAI)、快速创建和部署LLM插件(如Langdoc)或LLM应用程序(如LLM Spark),以及追踪和调试复杂的LLM应用程序(如Langfuse)。Langfuse(免费可用)——大模型应用的开源追踪和分析工具:Langfuse为大模型应用提供开源可观测性和分析功能。可观测性:在可视化界面中探索和调试复杂的日志和追踪。分析:使用直观的仪表板改善成本、降低成本、减少延迟,提高响应质量。Eden AI(免费可用)——将顶尖AI API融合为一:将Eden AI集成到产品中,实现以下目标:通过为每项AI任务选择正确的AI API来提高准确性和降低成本通过集中管理使用限制和成本监测,让你更加放心不断探索市场上新兴的AI能力。Langdock(免费可用)——在几分钟内创建、部署、测试和监控ChatGPT插件:将你的API连接到Langdock,并将其作为插件部署到所有大模型应用中,如ChatGPT和LangChain(Bing和Bard即将推出)。然后使用Langdock内置的测试功能来确保一切按预期工作,并在插件扩展时进行监控。LLM Spark(免费可用):用于构建生产就绪大模型应用的开发平台。

赛博月刊@25年1月:AI行业大事记

生成大模型3.0专注于高质量图像和视频的生成,不仅显著提升了生成内容的质量和可控性,还降低了计算成本。理解大模型1.0则强化了对图像和视频的时空建模与解析能力,实现了对图像视频和内容更精细、更准确的理解。使用入口:前往官网(hidreamai.com)体验。锐评(by Jomy)→可灵的竞品[🔍官方介绍](https://mp.weixin.qq.com/s/vw_rl8QdhG78VG8QC-UukA)[heading4]【3D】影眸科技●Rodin Gen-1.5 3D生成工具[content]Rodin Gen-1.5能够生成高质量、高精度的3D模型,尤其在CAD类工业模型和硬表面模型方面表现出色,有效解决了行业内长期存在的薄面和边缘锐度问题。使用入口:前往官网(Hyper3D.ai)体验。实测效果中规中矩。https://x.com/DeemosTech/status/1873752612832788546[heading4]【融资】硅基流动●完成亿元人民币Pre-A轮融资[content]硅基流动(SiliconFlow)已于2024年底完成亿元人民币Pre-A轮融资,由华创资本领投,普华资本跟投,老股东耀途资本继续超额跟投,华兴资本担任独家财务顾问。此次融资将加速硅基流动的AI云基础设施升级与商业化拓展。硅基流动成立于2023年8月,致力于打造大模型时代的AI基础设施(AI Infra)平台,通过算法、系统与硬件的协同创新,跨数量级降低AI应用的开发和使用门槛,加速AGI普惠人类。[🔍官方介绍](https://mp.weixin.qq.com/s/NyStkbw_JgTulQ-RiA2V4A)

【法律法规】《人工智能法案》2023.06.pdf

Text proposed by the CommissionAmendment(44h)‘critical infrastructure’means an asset,a facility,equipment,a network or a system,or a part of an asset,a facility,equipment,a network or a system,which is necessary for the provision of an essential service within the meaning of Article 2(4)of Directive(EU)2022/2557;Amendment(44k)‘social scoring’means evaluating or classifying natural persons based on their social behaviour,socio-economic status or known or predicted personal or personality characteristics;Amendment(44l)‘social behaviour’means the way a natural person interacts with and influences other natural persons or society;Amendment(44m)‘state of the art’means the developed stage of technical capability at a given time as regards products,processes and services,based on the[heading2]Amendment 211[heading2]Proposal for a regulation Article 3–paragraph 1[content]Text proposed by the Commission[heading2]Amendment 212[heading2]Proposal for a regulation Article 4[content]Text proposed by the Commission[heading3]Article 4[heading3]Amendments to Annex I[content]The Commission is empowered to adopt delegated acts in accordance with Article 73 to amend the list of techniques and approaches listed in Annex I,in order to update that list to market and technological developments on the basis of characteristics that are similar to the techniques and approaches listed therein.[heading2]Amendment 213

Others are asking
有什么免费生成视频的AI
以下是一些免费生成视频的 AI 工具: 海外: Haiper(有免费额度):https://haiper.ai/ 。能生成 HD 超高清的视频,包括文生视频、图生视频、素描生视频、扩展视频。文生视频支持选择风格、秒数(2s 和 4s)、种子值。图生视频只能写提示词、秒数(2s 和 4s)、种子值。还能进行视频重绘,轻松修改颜色、纹理和元素以改变原视频的视觉内容,但局部重绘时如果是大量背景的重绘,效果一般,视频容易崩。 DynamiCrafter(免费):https://huggingface.co/spaces/Doubiiu/DynamiCrafter ,https://github.com/Doubiiu/DynamiCrafter?tab=readmeovfile 。可以做 2 秒图生视频和短视频拼长视频。 Morph studio(内测):https://app.morphstudio.com/ 。暂未对外开放,可在官网提交内测申请,discord 上可以免费体验。支持文生视频、图生视频,英文提示词,支持运镜、运动强度、尺寸、秒数设置,默认生成 3s 视频。 国内: Hidreamai(有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以。文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 ETNA:https://etna.7volcanoes.com/ 。可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8~15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps。 Dreamina(国内内测,有免费额度):https://jimeng.jianying.com/aitool/video/generate 。支持文生视频、图生视频,视频生视频,支持图生视频首尾帧功能,提示词使用中文、英文都可以。文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择,支持多种尺寸,默认生成 3s 的视频。 可灵(免费):https://klingai.kuaishou.com/ 。支持文生视频、图生视频,支持图生视频首尾帧功能,提示词可使用中文。文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持多种尺寸,默认生成 5s 的视频。
2025-03-30
基于人气对AI工具进行排面的网址
以下是为您提供的基于人气对 AI 工具进行排名的网址及相关信息: 10 月流量榜 |排名|产品|市场|分类|网址|访问量(万)|环比变化| |||||||| |A35+1|文心一言|国内|聊天机器人|yiyan.baidu.com|2111|0.0286| |A36+1|Beacons AI|海外|营销工具|beacons.ai|2073|0.0297| |A37+1|Hugging Face|海外|模型训练与部署|huggingface.co|1908|0.0724| |A38+1|ZeroGPT|海外|内容检测|zerogpt.com|1800|0.239| |A39+1|Gamma|海外|PPT 生成|gamma.app|1799|0.2561| |A40+1|Gauth|出海|教育|gauthmath.com|1786|0.222| |A41+1|Feedly|海外|研究工具|feedly.com|1721|0.0049| |A42+1|豆包|国内|聊天机器人|doubao.com|1688|0.2501| |A43+1|Loom|海外|视频生成|loom.com|1662|0.0412| |A44+1|mailchimp|海外|营销工具|mailchimp.com|1614|0.0379| |A45+1|prezi|海外|PPT 生成|prezi.com|1612|0.0458| 12 月全球总榜 Top100 部分数据 |排名|产品|分类|访问量|环比变化| |||||| |27|Gamma AI|PPT|980|0.52| |28||GPU|940|0.01| |29|LanguageTool|General Writing|900|0.01| |30|Zapier|Productivity|870|0.1| |31|CF Spark|Design Assistant|870|0.04| |32|Playground AI|Image Generation|850|0.02| |33|Picsart Al|Image Generation|850|0.03| |34|Systeme|Marketing|840|0.05| |35|vocalremover|Audio Editing|839|0| |36|Replicate|Developer Community|830|0.12| |37|Semantic Scholar|Research|800|0.08| |38|Runwayml|Video Generation|762|0.17| |39|ProductGPT|Ecommerce|740|0.12| |40|Photoroom|Image Editing|740|0.02| |排名|产品|分类|访问量|环比变化| |||||| |55|Casetext|Law|600|0| |56|DeepSwap|Image Editing|580|0.17| |57|ZeroGPT|Research|570|0.13| |58|Smodin|General Writing|560|0.19| |59|WatermarkRemover.io|Image Editing|540|0.06| |60|DID|Video Generation|540|0.04| |61|GPTZero|AI Detection|530|0.88| |62|GetResponse Email Generator|Marketing|530|0.1| |63|Wordtune|General Writing|520|0.05| |64|Moka Eva|Human Resources|510|1.03| |65|forefront|General Chatbot|510|0.05| |66|Chat GPT Demo||510|0.14| |67|Obsidian|Productivity|500|0.11| |68|Kapwing AI|Video Editing|500|0.05|
2025-03-30
免费AI换脸工具
以下为您介绍免费的 AI 换脸工具: 开源免费的解决方案 facefusion: 本机解决方案:需要 Python 环境及安装多个依赖软件,对编程知识有一定要求,且运行推理计算速度依赖 GPU,本地计算机若无 GPU 或显存较小,执行速度缓慢,不推荐本地化安装。 云服务解决方案:可利用云厂商如阿里云的 PAI 和 AutoDL 提供的大模型运行环境和计算能力,但会产生一定费用。以 AutoDL 为例,注册后在算力市场选择可接受价格的算力服务器,建议选取 GPU 配置更高的设备。然后通过模型镜像启动 GPU 服务器,在算法社区查找 facefusion 镜像,点击右下角创建实例按钮,启动实例,通过 JupyterLab 工具中的终端输入相关命令启动 facefusion,注意要加上“executionproviders cuda cpu”参数以使用 GPU 能力。最后打开 facefusion 软件,在软件界面上传准备好的图片、视频进行换脸处理。 星流一站式 AI 设计工具中的换脸功能:选中图像进入扩展功能界面,自动提取面部信息,上传想要替换到图像的图片,重绘风格选择与放大图像相对应的风格可提升换脸效果,其余参数默认即可。
2025-03-30
论文降低ai率的提示词
以下是为您整理的关于降低论文 AI 率的相关提示词信息: 给 Claude 一个评分标准,并让 Claude 根据评分标准重写其答案(让 Claude 对自己的输出进行双重检查)。 掌握提示词四要素:指令、上下文、输出格式、角色设定。 结构化内容组织:使用编号、子标题和列表来组织文章,使内容条理清晰,易于读者理解。 规定概述 内容解读 结语结构:围绕主题展开讨论,首先概述规定内容,然后逐条解读具体内容,并以结语结束。 案例和挑战的结合:通过引入实际案例和潜在挑战,增强论点的说服力,并提供实用的解决方案。 结合法规和实际操作:通过引入法规内容和实际操作案例,提供详细的解释和建议。 商业术语的使用:在写作中融入行业特定的术语和概念,确保内容的专业性和针对性。 输出的文章结构: 标题:开门见山、切中要害,用疑问句引起目标群体悬念。 第一部分:说清楚本文要解决的问题是什么,问题的背景是什么,这个问题可能导致哪些损失。 第二部分:以一个案例引入,这个案例改写自【基础材料】的【类案参考】部分,需要写清楚案号、案件事实经过、法院裁判结果、法院作出这一裁判结果的关键依据和其他与文章有关的要点。 第三部分:对案例进行进一步的分析,写明需要注意的关键点,分析可以改写自【基础材料】的【问答结果及分析】部分,这部分不要给建议。 第四部分:给出具体的操作建议,应分为:事前应注意事项;事中需要注意留存的证据;事后可以采取的补救措施,三个部分;每个部分分别给出三条清晰具体的建议。
2025-03-30
哪些 ai 可以读取视频内容
以下是一些可以读取视频内容的 AI: 1. 视频内容分析模型:上传视频后可以生成视频内容的文本描述。来源: 2. XiaoHu.AI:支持多场景,从图像识别到视频理解,可解析超过 1 小时视频内容并秒级定位事件。广泛识别常见物体、文档结构化解析(发票、表单等),适用于金融与商业领域。支持不同尺寸图像处理,保留高分辨率;精准物体定位与属性分析。多模态 AI 代理具备手机、电脑执行复杂任务的能力。详细介绍:
2025-03-30
怎么用Ai作ppt
以下是使用 AI 制作 PPT 的一些方法和步骤: 1. 工具选择: 可以使用 Claude 和 Gamma.app 组合。Claude 能帮助快速寻找符合条件的论文、提取精炼论文信息、找到适合的 PPT 制作工具并教会使用。 WPS AI 也可用于制作 PPT,能快速生成并进行主题配色、字体修改和添加动画等操作。 2. 使用 Claude 的方法: 不会使用学术网站条件搜索时,可与 Claude 对话解决。 可通过 POE 调用 Claude,也可使用官方 web,但 pro 用户可能会遇到 token 限制。 3. 与 AI 交互流程(以 Claude 3.7 Sonnet 为例): 阶段 1 主观描述:向 AI 清晰阐述需求。 目前 AI 生成的并非真正的 PPT 格式,而是基于模型的 HTML 输出能力,无法在 PPT 里进行二次深度编辑。 4. 信息的 AI 可视化: 给 AI 一段数据,让其直接可视化展示 PPT。 让其描述信息媒介的进化史。 直接复制文章给它,让其自动把核心数据进行可视化。 需要注意的是,使用 AI 制作 PPT 是一个与 AI 互动的过程,需要保持耐心,反复尝试,不能指望复制一段提示词就得到满意结果。
2025-03-30
AI Infra 有哪些
AI Infra 主要包括以下方面: 1. 入围的相关工具和服务: Langfuse:大模型应用的开源追踪和分析工具,提供开源可观测性和分析功能,包括在可视化界面中探索和调试复杂的日志和追踪,以及使用直观的仪表板改善成本、降低成本、减少延迟,提高响应质量。 Eden AI:将顶尖 AI API 融合为一,通过为每项 AI 任务选择正确的 AI API 来提高准确性和降低成本,通过集中管理使用限制和成本监测让用户更加放心,并不断探索市场上新兴的 AI 能力。 Langdock:在几分钟内创建、部署、测试和监控 ChatGPT 插件,将 API 连接到 Langdock,并将其作为插件部署到所有大模型应用中,然后使用内置的测试功能来确保一切按预期工作,并在插件扩展时进行监控。 LLM Spark:用于构建生产就绪大模型应用的开发平台。 2. 基础设施成本的演变:目前模型参数和 GPU 计算能力呈指数级增长,但这种趋势是否持续尚不清楚。 3. 基础设施的考虑因素: 外部与内部基础设施的选择:许多创业公司,尤其是应用公司,在成立初期无需建立自己的 AI 基础设施,可采用托管模型服务,如 OpenAI、Hugging Face(针对语言)和 Replicate(针对图像生成)等,这些服务定价基于消费量,通常比运行单独的基础设施更便宜。而一些训练新的基础模型或构建垂直集成 AI 应用程序的公司,则可能需要直接在 GPU 上运行自己的模型,管理基础设施可成为竞争优势的来源。
2025-02-06
AI Infra 市场未来的想象空间
在生成式 AI 革命进入第二个年头时,研究从迅速生成预训练结果的“快速思考(System 1)”转向推理过程中深度思考的“慢速思考(System 2)”,为全新自主型应用程序开启大门。自《生成式 AI:一个创意新世界》发表的两年间,AI 生态系统变化巨大,也有了新预测。生成式 AI 市场基础层趋于稳定,由 Microsoft/OpenAI、AWS/Anthropic、Meta 和 Google/DeepMind 等重要玩家和联盟主导,形成平衡态,只有具备经济实力和巨额资本的玩家仍在竞争,市场结构逐渐明朗,未来生成下一个 token 的成本会降低,数量会增多。随着大规模语言模型(LLM)市场稳定,竞争前沿转向以“系统 2”思维主导的推理层开发和扩展,受 AlphaGo 等模型启发,旨在让 AI 系统进行深思熟虑的推理和问题解决,新的认知架构和用户界面也在改变推理能力与用户的互动方式。 综上所述,对于 AI Infra 市场未来的想象空间,其可能在推理层的开发和扩展方面有更多的发展和创新,市场结构会进一步优化,成本降低和数量增加的趋势也将持续。
2024-11-01
AI infra
以下是关于“AI infra”的相关信息: AI 模型的计算成本: GPT3 约有 1750 亿个参数,对于 1024 个令牌的输入和输出,计算成本约为 350 万亿次浮点运算。训练像 GPT3 这样的模型需要约 3.14×10^23 次浮点运算,其他模型如 Meta 的 LLaMA 有更高的计算要求。训练此类模型是人类迄今计算量最大的任务之一。AI 基础设施昂贵的原因在于底层算法问题计算难度极大,相比之下,对一百万个条目的数据库表进行排序的算法复杂性微不足道。因此,应选择最小的模型来解决具体用例。同时,根据变换器的经验法则,可轻松估计特定大小模型的算力和内存消耗,进而选择合适的硬件。 Generative AI 的开发工具和基础设施的趋势: 有一张图描绘了其趋势,代表了在 AI 开发领域中,为满足不同需求,工具和基础设施正逐渐模块化和专业化。图中的公司被分为四个主要类别: 1. Orchestration(编排):如 DUST、FIAVIE、LangChain 等公司提供的工具帮助开发人员管理和协调各部分和任务,确保系统流畅运行。 2. Deployment, Scalability, & PreTraining(部署,可扩展性和预训练):如 UWA mosaicm、NMAREL、anyscale 等公司提供工具,帮助开发人员部署模型,保证模型的可扩展性,以及进行预训练。 3. Context & Embeddings(上下文和嵌入):如 TRUDO,Llamalndex,BerriAI 等公司提供工具,帮助模型处理和理解语言上下文,以及将词语和句子转化为计算机可理解的形式。 4. QA & Observability(质量保证和可观察性):如 Pinecone,drant,Vald 等公司提供工具,确保模型表现,并能监控模型的性能和状态。 AI 基础设施的考虑因素: 一些创业公司,尤其是训练新的基础模型或构建垂直集成 AI 应用程序的公司,不可避免直接在 GPU 上运行自己的模型。这要么是因为模型本身就是产品,团队正在寻找“模型市场契合度”,要么是因为需要对训练和/或推理进行细粒度的控制,以实现某些功能或大规模降低边际成本。无论哪种方式,管理基础设施都可以成为竞争优势的来源。
2024-08-22
API是什么意思有什么用
API 是应用程序编程接口(Application Programming Interface)的缩写。它是软件之间进行交互和数据交换的接口,使得开发者能够访问和使用另一个程序或服务的功能,而无需了解其内部实现的详细信息。 API 就像是一个信差,接受一端的请求,告诉那边的系统您想要做的事情,然后把返回的信息发回给您。 APIKey 是一种实现对 API 访问控制的方法,通常是一串字符串,用于身份验证和访问控制。当开发者或应用程序尝试通过 API 与另一个程序或服务交互时,APIKey 作为请求的一部分被发送,以证明请求者具有调用该 API 的权限。APIKey 帮助服务提供商识别调用者身份,监控和控制 API 的使用情况,以及防止未经授权的访问。 要使用 API,通常需要去官网寻找 API 文档,API 的规则一般会写在网站的开发者相关页面或 API 文档里。例如,TMDB 的搜索电影 API 文档的网址是:https://developer.themoviedb.org/reference/searchmovie 。在 API 文档中,会详细告知如何使用相应的 API,包括请求方法、所需的查询参数等。您可以在文档中进行相关配置和操作。 登录网站寻找 Apikeys 创建新的密钥(记得保存好、不要泄露)。使用 APIKEY 可能需要单独充值,一共有两种模式可以使用: 1. 使用官方的 key 网站:https://platform.openai.com/apikeys 创建好您的 key 后记得复制保存。 2. 如果觉得充值比较麻烦可以考虑用第三方的网站:https://www.gptapi.us/register?aff=WLkA ,这个充值起来方便一些,模型选择也可以多一些。
2025-03-29
agi 是什么意思
AGI 指通用人工智能(Artificial General Intelligence),是一种能够像人类一样思考、学习和执行多种任务的人工智能系统。 部分人认为大语言模型(LLM)具有 AGI 潜力,例如 ChatGPT 背后的技术,而 LeCun 反对这一观点。 OpenAI 曾有关于实现 AGI 的计划,如原计划在 2026 年发布的 Q下一阶段(最初被称为 GPT6,后重新命名为 GPT7)因埃隆·马斯克的诉讼而被暂停。 在公众传播层面,AIGC 指用 Stable Diffusion 或 Midjourney 生成图像内容,后来泛指用 AI 生成音乐、图像、视频等内容;LLM 指 NLP 领域的大语言模型;GenAI 是生成式人工智能模型,国内官方政策文件使用这个词相对科学,涵盖了 LLM 和 AIGC。
2025-03-26
agi是什么意思
AGI 即通用人工智能(Artificial General Intelligence),指的是一种能够完成任何聪明人类所能完成的智力任务的人工智能系统。能够像人类一样思考、学习和执行多种任务,在许多领域内以人类水平应对日益复杂的问题。例如,OpenAI 致力于实现 AGI,其研发的 GPT 系列模型在某种程度上是朝着 AGI 迈出的巨大一步。像 ChatGPT 这样的产品就是由致力于 AGI 的 OpenAI 研发的。同时,Sam Altman 也认为确保 AGI 造福全人类是重要使命,AGI 可以被看作是人类进步脚手架上的另一个工具,可能带来治愈所有疾病、有更多时间与家人共享、充分发挥创造潜力等美好前景。
2025-03-22
Stable Diffusion 是 Diffusion Model 的优化版本,引入了潜在空间(Latent Space)技术,这个潜在空间(Latent Space)是什么意思,它的实现原理是什么?
在 Stable Diffusion 模型中,潜在空间(Latent Space)指的是图像的潜在分布,它包含了与图像相关的所有信息。 图像被映射到潜在空间后,扩散过程在这个空间中进行。ComfyUI 中的许多操作都在潜在空间中进行,如 KSampler 节点就是在这个空间中执行采样过程。在潜在空间中,通过节点调整对潜在空间的操作,如噪声添加、去噪步数等,这部分通常由潜在空间操作模块来实现。 在 Stable Diffusion 模型中,图像的潜在分布是通过一个编码器解码器结构来学习的。编码器将图像映射到潜在空间,而解码器则将潜在空间中的向量映射回图像空间。通过这种方式,模型可以学习到图像的潜在分布,从而实现图像生成、编辑和操作。 在采样过程中,Stable Diffusion 模型通过逐步降低噪声水平来生成图像。在这个过程中,模型根据当前的噪声水平预测图像的潜在分布,然后根据这个分布生成一个新的图像。这个过程重复进行,直到生成一个高质量的图像。 与之对应的是像素空间(Pixel Space),像素空间指的是图像中每个像素的原始颜色或强度值所组成的空间。图像可以看作是一个二维或三维的矩阵,其中每个元素代表一个像素。在像素空间中,图像的表示是密集的,且包含了大量的细节信息。
2025-03-21
AGI什么意思?
AGI 指通用人工智能(Artificial General Intelligence),是一种能够像人类一样思考、学习和执行多种任务的人工智能系统。能够在许多领域内以人类水平应对日益复杂的问题。例如,OpenAI 致力于实现 AGI,其研发的 ChatGPT 被认为是朝着 AGI 迈出的巨大一步。同时,Sam Altman 也指出呈现人工通用智能特征的系统正浮现,认为 AGI 是人类进步脚手架上的另一个工具,可能带来治愈所有疾病、有更多时间与家人共享、充分发挥创造潜力等美好愿景。
2025-03-18
MCP是什么意思
模型上下文协议(Model Context Protocol,简称 MCP)是一种全新的开放协议,用于标准化地为大语言模型(LLMs)提供应用场景和数据背景。 MCP 就像 AI 领域的“USBC 接口”,能让不同的 AI 模型与外部工具和数据源轻松连接。其好处包括: 简化开发:一次整合,多次复用,不再重复开发。 灵活性强:轻松切换 AI 模型或工具,无需复杂的重新配置。 实时互动:长连接保证数据实时更新。 安全可靠:内置标准化安全和权限控制。 扩展性强:AI 系统扩展时,只需连接新的 MCP 服务器。 与传统 API 相比,通常 AI 系统连接外部工具时,需要单独整合多个不同的 API,每个 API 都有独立的代码、文档、认证方式、错误处理和后续维护,极大地增加了开发复杂度。传统 API 就像每扇门都有一把不同的钥匙,而 MCP 让 AI 模型更简单地获取数据、工具与服务。 MCP 最早由 Anthropic 公司开发,现在已成为一个开放协议,越来越多的企业和开发者开始采用它,逐渐成为 AI 与工具互动的新标准。 在某些情况下,传统 API 可能更适合,比如应用场景需要精准且严格受控的交互方式,包括需要细粒度控制、功能严格限制,更偏好紧耦合以提升性能,希望最大化交互的可预测性。 快速集成 MCP 的步骤包括: 1. 定义能力:明确 MCP 服务器提供的功能。 2. 实现 MCP 层:按照协议标准进行开发。 3. 选择通信方式:本地连接(标准输入输出)或远程连接(如 WebSockets)。 4. 创建资源/工具:开发或连接数据源和服务。 5. 建立客户端连接:与 MCP 服务器建立安全稳定的连接。 例如,Claude 可以通过简单的 MCP 集成直接连接到 GitHub、创建新存储库并创建 PR。
2025-03-15