Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

MCP是什么?未来的发展趋势如何?

Answer

MCP(模型上下文协议)是一种于 2024 年 11 月推出的开放协议,允许系统以跨集成的泛化方式为 AI 模型提供上下文。该协议定义了 AI 模型如何调用外部工具、获取数据和与服务交互。

MCP 已经在重塑 AI 智能体和代理的生态系统。其未来的发展趋势取决于如何应对基础性挑战,如果处理得当,可能成为 AI 与工具交互的默认接口,并开启新一代自主、多模态、深度集成的 AI 体验。如果被广泛采用,它可能代表工具构建、消费和货币化方式的转变。

今年将是关键的一年,可能会面临一些关键问题,比如是否会看到一个统一的 MCP 市场崛起,AI 代理的认证是否会变得无缝,多步执行能否被正式纳入协议等。

MCP 从 LSP(语言服务器协议)中获取灵感,超越 LSP 的地方在于其以智能体为中心的执行模型,LSP 主要是被动响应,而 MCP 专门为支持自主的 AI 工作流而设计,根据上下文,AI 智能体可以决定使用哪些工具、按什么顺序以及如何将它们串在一起来完成任务。MCP 还引入了人工参与的功能,允许人类提供额外的数据并批准执行。

Content generated by AI large model, please carefully verify (powered by aily)

References

A16z:深入探讨 MCP 与 AI 工具的未来

MCP已经在重塑AI代理生态系统,但下一波进展将取决于我们如何应对基础性挑战。如果处理得当,MCP可能成为AI与工具交互的默认接口,并开启新一代自主、多模态、深度集成的AI体验。如果MCP被广泛采用,它可能代表工具构建、消费和货币化方式的转变。我们期待看到市场将它们带向何方。今年将是关键的一年:我们会看到一个统一的MCP市场崛起吗?AI代理的认证会变得无缝吗?多步执行能否被正式纳入协议?本文链接:https://a16z.com/a-deep-dive-into-mcp-and-the-future-of-ai-tooling/-完-

深入探讨 MCP 和 AI 工具的未来

MCP已经在重塑AI智能体生态系统,但下一波进展将取决于我们如何解决基础性挑战。如果做得好,MCP可能成为AI与工具互动的默认接口,释放出新一代的自主、多模态和深度集成的AI体验。如果被广泛采用,MCP可能代表着工具构建、使用和货币化的转变。我们很期待看到市场将它带向何方。今年将是关键:我们是否会看到统一的MCP市场的兴起?认证是否会为AI智能体变得无缝?多步执行是否能被正式纳入协议?

深入探讨 MCP 和 AI 工具的未来

自从OpenAI在2023年发布函数调用以来,我一直在思考解锁智能体和工具使用生态系统所需的条件。随着基础模型变得越来越智能,智能体与外部工具、数据和API的交互能力变得越来越分散:开发人员需要为智能体实现特殊的业务逻辑,以适应智能体操作和集成的每一个系统。很明显,需要有一个标准的执行、数据获取和工具调用接口。API是互联网最早的统一语言——为软件通信创造了共同语言,但人工智能模型缺乏同等的东西。模型上下文协议(MCP),于2024年11月推出,在开发者和AI社区中已经获得了广泛关注,被视为一种潜在的解决方案。在本文中,我们将探讨什么是MCP,它如何改变AI与工具的交互方式,开发人员已经使用它构建了什么,以及仍需解决的挑战。让我们开始吧。[heading2]什么是MCP?[content]MCP是一种开放协议,允许系统以跨集成的泛化方式为AI模型提供上下文。该协议定义了AI模型如何调用外部工具、获取数据和与服务交互。作为一个具体的例子,下面是Resend MCP服务器如何与多个MCP客户端协作。这个想法并不新鲜;MCP从LSP(语言服务器协议)中获取灵感。在LSP中,当用户在编辑器中输入时,客户端查询语言服务器以自动完成建议或诊断。在MCP超越LSP的地方在于其以智能体为中心的执行模型:LSP主要是被动的(响应来自IDE的请求,基于用户输入),而MCP是专门为支持自主的AI工作流而设计的。根据上下文,AI智能体可以决定使用哪些工具、按什么顺序以及如何将它们串在一起来完成任务。MCP还引入了人工参与的功能,允许人类提供额外的数据并批准执行。

Others are asking
Mcp教程
以下是关于 MCP 教程的相关内容: 资源链接: 什么是 MCP 以及为什么要用它: Model Context Protocol(模型上下文协议),简称 MCP,是由 Anthropic 公司提出的一个开放标准,旨在解决 AI 模型与外部数据源和工具之间的连接问题。 MCP 就像是 AI 世界的“USBC 接口”,它提供了一种标准化的方式,让 AI 应用能够轻松连接到各种数据源和工具,不需要为每个新连接重新开发接口。 MCP 解决的主要问题包括: 碎片化集成:以前每个 AI 应用都需要单独开发与各种数据源的连接。 重复工作:不同团队重复构建相似的集成方案。 “N 乘 M 问题”:当有 N 个 AI 客户端需要连接 M 个数据源时,可能需要 N×M 个自定义集成。 希望这篇教程能帮助您了解 MCP 的基础知识,并开始构建自己的 MCP 服务器!随着实践的深入,您会发现 MCP 为 AI 应用与数据源及工具的集成提供了简单而强大的解决方案。 本篇内容由 Genspark 制作 https://www.genspark.ai/autopilotagent_viewer?id=c10e49b3228d4f65be347ab34777aaf8
2025-04-15
MCP是什么
模型上下文协议(Model Context Protocol,简称 MCP)是一种全新的开放协议,专门用于标准化地为大语言模型(LLMs)提供应用场景和数据背景。 它就像为 AI 模型量身定制的“USBC 接口”,能让不同的 AI 模型与外部工具和数据源轻松连接。 MCP 的好处包括: 简化开发:一次整合,多次复用,不再重复开发。 灵活性强:轻松切换 AI 模型或工具,无需复杂的重新配置。 实时互动:长连接保证数据实时更新。 安全可靠:内置标准化安全和权限控制。 扩展性强:AI 系统扩展时,只需连接新的 MCP 服务器。 MCP 最早由 Anthropic 公司开发,现在已成为一个开放协议,越来越多的企业和开发者开始采用。 MCP 是一个典型的客户端服务端架构,对于有编程基础的同学来说容易理解,就像开发中常见的 MySQL 一样。 与传统 API 相比,通常 AI 系统连接外部工具时,需要单独整合多个不同的 API,每个 API 都有独立的代码、文档、认证方式、错误处理和后续维护,极大地增加了开发复杂度。而 MCP 能简化这一过程。 在某些情况下,传统 API 更适合,比如应用场景需要精准且严格受控的交互方式,如需要细粒度控制、功能严格限制;更偏好紧耦合以提升性能;希望最大化交互的可预测性。 要开始使用 MCP,可按以下步骤: 1. 定义能力:明确 MCP 服务器提供的功能。 2. 实现 MCP 层:按照协议标准进行开发。 3. 选择通信方式:本地连接(标准输入输出)或远程连接(如 WebSockets)。 4. 创建资源/工具:开发或连接数据源和服务。 5. 建立客户端连接:与 MCP 服务器建立安全稳定的连接。 总之,MCP 让 AI 与外部数据、工具的连接变得更加标准化和高效。
2025-04-14
mcp 的内容
MCP(模型上下文协议)是一种创新的开放协议,由 Anthropic 公司在 2024 年 11 月推出并开源。 其主要特点和功能包括: 统一了交互标准,是链接所有 AI 应用与工具的桥梁,兼容所有 AI 应用。 具有三大功能:工具(Tools),底层使用 Function call 实现,与 OpenAI 格式兼容;资源(Resources),为 AI 提供参考信息;提示词(Prompts),预设对话模板。 主要接口路径包括获取工具列表、调用工具、获取资源列表、读取资源内容、获取提示词列表、获取提示词内容等。 转换步骤包括客户端向 MCP 服务器请求工具列表,将 MCP 工具定义转换为 Function call 格式,发送 Function Call 定义给 LLM,接收 LLM 生成的 Function call,将 Function call 转为 MCP 工具调用,发送工具调用结果给 LLM。 MCP 就像一个“转接头”或“通用插座”,其核心作用是统一不同外部服务,通过标准化接口与 AI 模型对接。它与传统 API 的关键区别在于: 单一协议:MCP 像一个统一接口,只要一次整合,就能连接多个服务。 动态发现:AI 模型能自动识别并使用可用的工具,不用提前写死每个接口。 双向通信:MCP 支持类似 WebSockets 的实时双向通信,模型不仅能查询数据,还能主动触发操作。 MCP 最早由 Anthropic 公司开发,目的是帮助 AI 模型(如 Claude)更容易地连接工具和数据源,现在已成为一个开放协议,被越来越多的企业和开发者采用,逐渐成为 AI 与工具互动的新标准。 官方文档:https://modelcontextprotocol.io/
2025-04-13
如何使用MCP?提供教程
以下是关于如何使用 MCP 的详细教程: 前置准备工作: 任选一个客户端软件进行配置,大致分为四步: 1. 填入大模型 API 密钥。 2. 找到 MCP 配置界面。 3. 填入 MCP Server 对应的 json 脚本。 4. 使用 MCP。 不同客户端软件的配置方法: 1. Cherry Studio(推荐): 版本:2025 年 4 月发布的 1.1.17。 配置大模型 API:填入之前准备好的 AiHubMix 的 API 密钥。 配置 MCP:例如,图中填写的就是 Playwright 的 MCP Server 和百度地图的 MCP Server。 使用 MCP。 2. Cursor(推荐): 配置大模型 API:如果 Cursor Pro 在免费试用期,这一步可以不做;如果不在免费试用期,最好的办法是氪金,也可以试试填入之前准备好的 AiHubMix 的 API 密钥。 配置 MCP Server:填入 MCP Server 的 json,保存。 回到 Cursor 的 MCP 配置页面,等待几秒钟,多点几次蓝色框里的按钮,直到绿灯亮起,并显示出所有 MCP 工具。 使用 MCP:Ctrl+Shift+L 新建对话,将模式设置为 Agent。 3. Claude Desktop: 配置 MCP Server:用文本编辑器(VSCode、Sublime Text 等)打开 claude_desktop_config.json 文件,填入 MCP Server 对应的 json 文件,保存。 重启 Claude Desktop。 查看 MCP Server 连接状态。 使用 MCP。 MCP 的好处: 1. 简化开发:一次整合,多次复用,不再重复开发。 2. 灵活性强:轻松切换 AI 模型或工具,无需复杂的重新配置。 3. 实时互动:长连接保证数据实时更新。 4. 安全可靠:内置标准化安全和权限控制。 5. 扩展性强:AI 系统扩展时,只需连接新的 MCP 服务器。 传统 API 更适合的场景: 1. 需要细粒度控制、功能严格限制。 2. 更偏好紧耦合以提升性能。 3. 希望最大化交互的可预测性。 快速集成 MCP 的步骤: 1. 定义能力:明确您的 MCP 服务器提供哪些功能。 2. 实现 MCP 层:按照协议标准进行开发。 3. 选择通信方式:本地连接(标准输入输出)或远程连接(如 WebSockets)。 4. 创建资源/工具:开发或连接您的数据源和服务。 5. 建立客户端连接:与 MCP 服务器建立安全稳定的连接。 MCP 与 API 的比较: MCP 与传统 API 之间的主要区别在于: 1. 单一协议:MCP 充当标准化的“连接器”,因此集成一个 MCP 意味着可能访问多个工具和服务,而不仅仅是一个。 2. 动态发现:MCP 允许 AI 模型动态发现可用工具并与之交互,而无需对每个集成进行硬编码知识。 3. 双向通信:MCP 支持持久的实时双向通信 类似于 WebSockets。AI 模型既可以检索信息,也可以动态触发操作。 以 Cursor 驱动 blender 自动化建模的 MCP 项目为例: 首先,在 github 上找到项目说明(https://github.com/ahujasid/blendermcp)。以 Mac 安装为例,首先要安装一个 uv 包(如果不懂,就直接新建一个项目文件夹后,将相关需求丢给 AI)。显示 uv 安装完毕后(初次使用可能需要安装一系列的环境,只要一路让 AI 安装就可以了),还是找到点击界面右上角的小齿轮图标。找到 MCP 模块 Add new global MCP server,将相关内容粘贴进去。退回 MCP 界面时,就会发现已经连接上了这个 blender 服务器,并且增加了很多具体功能。
2025-04-13
如何开发MCP
MCP(模型上下文协议)是由 Anthropic 在 2024 年 11 月推出并开源的一项创新标准。它就像一个“转接头”或“通用插座”,其核心作用是统一不同的外部服务(如 Google Drive、GitHub、Slack、本地文件系统等),通过标准化接口与 AI 模型对接。 MCP 的好处包括: 简化开发:一次整合,多次复用,不再重复开发。 灵活性强:轻松切换 AI 模型或工具,无需复杂的重新配置。 实时互动:长连接保证数据实时更新。 安全可靠:内置标准化安全和权限控制。 扩展性强:AI 系统扩展时,只需连接新的 MCP 服务器。 与传统 API 相比,MCP 更适合需要上下文理解的场景,而传统 API 更适合需要精准且严格受控的交互方式,如需要细粒度控制、功能严格限制,更偏好紧耦合以提升性能,希望最大化交互的可预测性的场景。 开发 MCP 的步骤如下: 1. 定义能力:明确 MCP 服务器提供的功能。 2. 实现 MCP 层:按照协议标准进行开发。 3. 选择通信方式:本地连接(标准输入输出)或远程连接(如 WebSockets)。 4. 创建资源/工具:开发或连接数据源和服务。 5. 建立客户端连接:与 MCP 服务器建立安全稳定的连接。 MCP 是一个典型的 CS 架构,对于有编程基础的同学来说容易理解。开发 MCP 前需要进行环境安装,包括下载并安装 Python(官网:https://www.python.org/),安装 uv(借助 uv 进行虚拟环境创建和依赖管理,它是一个 Python 依赖管理工具,采用 Rust 编写,兼有创建虚拟环境和包管理工具的功能,可以平替 pip,venv)。
2025-04-12
我想找与高德地图MCP相关的教程
以下是为您整理的与高德地图 MCP 相关的教程内容: 1. 在 2025 年 4 月 3 日的智能纪要中,演示了通过 Figma 样式生成网页及整合新闻信息的操作过程,包括读取 Figma 样式、存储为公共样式、自动完成任务大闭环等,还计划打通多点连贯性,新建 news RSS 以整合信息。 2. 演示了 MCP 服务下的网页渲染生成及配置应用,提到模型 API 配置一次可反复调用,选择合适供应商和工具并填入密钥,展示了生成火星新闻页面的效果,探讨了交互问题,如添加网址跳转,还介绍了按需求文档开发页面的方式,最后打算尝试小程序开发,提及接入高德地图 API。 3. 新起项目相关安排及高德地图 API key 获取步骤,银海提议新建项目,创建新编辑页,建一个名为 PRD 点 MD 的需求文档,告知相关页面。还提到需要高德地图的 MCP 服务,因当前无高德,打算从豆哥市场获取。讨论了调用需 API key,介绍了获取 API key 的步骤,包括登录高德控制台,创建新应用并添加 key 等。 4. 银海关于获取 API key、连接高德 MCP 及后续开发需求说明,先是拿到高德 API key 并尝试在豆哥的高的 MCP 连接、测试,运行输入杭州未返回信息,先不管运行结果进行配置添加,添加成功后默认高德服务可行。之后要求阅读 PRD、NT 文档,按需求实现所有页面,如需用高德地图直接调用工具,部分文档内容可写进 PRD。 5. 观察其获取页面数据及实现 iOS 地图应用过程,先是等待程序读取页面信息,期间发现勾选后仍需重复 approve疑似有小 bug。之后程序获取到 5 个页面数据,准备实现 iOS 地图应用。提到实现 iOS 应用可用 switch 等编程语言,但希望写成 html 结构,不想用需 x code 运行的 switch,只需等待其实现即可。 6. 应用自动写页面与代码的过程及相关讨论,银海介绍应用开发进度,称可解放双手等待页面生成,目前 5 个页面框架已做好,样式在编写。还提到高德地图密钥未给,探讨地图渲染方式。指出代码无 rules 易截断,分享 cursor decore 网站,其中有诸多代码规范,建议配置 rules 提升代码可读性。 7. 黄叔用 AI 解决约会地点选择难题,使用 Windsurf+高德 MCP+32kw.com,只花了 20 分钟就完成了需求验证,并做出了相关网页,您可以通过 https://www.32kw.com/view/b109136 查看。
2025-04-11
,AI agent 发展趋势,技术状态,商业模式
以下是关于 AI Agent 的发展趋势、技术状态和商业模式的相关信息: 发展趋势: 2024 年内,办公场景“AI 助手”开始有良好使用体验,实时生成的内容开始在社交媒体内容、广告中出现。 2025 2027 年,接近 AGI 的技术出现,人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行。 技术状态: 目标实现基于 ReAct、SFT、RAG、强化学习等实现自主规划能力的 AI Agent,构建具备认知、决策智能的 Agent 智能体框架。 专注文本/多模态大模型、AI Agent 技术创新与应用。 商业模式: 依据不同类型销售市场的特点,结合一站式 AI 搭建平台将销售部署的产品化和模版化,让企业更容易落地和应用 AI 能力。 销售智能体 Blurr.AI 占位交易环节,解决 2B 销售获客的痛点,且具有向前后端环节延展的势能。
2025-04-13
准确的讲述垂直大模型的概念,国内外的应用现状、场景,发展趋势,最好能附带图片。内容尽量详细、逻辑通顺。
垂直大模型是专注于特定领域的大模型,例如小语种交流、临床医学、AI 蛋白质结构预测等。 在国内,大模型分为通用模型如文心一言、讯飞星火等,处理自然语言;也有垂直模型专注特定领域。 大模型因其强大的语言理解和生成能力,在多个领域和应用场景中表现出色。比较火的应用场景包括: 1. 文本生成和内容创作:撰写文章、生成新闻报道、创作诗歌和故事等。 2. 聊天机器人和虚拟助手:提供客户服务、日常任务提醒和信息咨询等服务。 3. 编程和代码辅助:代码自动补全、bug 修复和代码解释。 4. 翻译和跨语言通信:促进不同语言背景的用户之间的沟通和信息共享。 5. 情感分析和意见挖掘:为市场研究和产品改进提供数据支持。 6. 教育和学习辅助:创建个性化的学习材料、自动回答学生问题和提供语言学习支持。 7. 图像和视频生成:如 DALLE 等模型可以根据文本描述生成相应的图像,甚至在未来可能扩展到视频内容的生成。 8. 游戏开发和互动体验:创建游戏中的角色对话、故事情节生成和增强玩家的沉浸式体验。 9. 医疗和健康咨询:理解和回答医疗相关的问题,提供初步的健康建议和医疗信息查询服务。 10. 法律和合规咨询:帮助解读法律文件,提供合规建议,降低法律服务的门槛。 关于发展趋势,尽管当前市场以基础大模型为主,但将大模型与行业专业知识结合,以满足不同行业的需求,成为未来发展的关键。例如腾讯研究院的《行业大模型调研报告》指出,如何将大模型与行业专业知识结合是重点。同时,在发展过程中也需要注意其在隐私、安全和伦理方面的挑战。 很抱歉,暂时无法为您提供相关图片。
2025-04-11
罗列具体的AI模型产品和具体的AI技术创新点,并总结AI技术的发展趋势,并说明这些发展趋势为用户的交互体验带来了什么样的改变?按照时间线将以上内容梳理出来
以下是按照您的需求梳理的内容: 时间线 早期: 从图灵测试、早期的图灵机器人和 ELISA 开始,到 IBM 的语音控制打印机、完全由人工智能创作的小说、微软的同声传译系统。 近年来: OpenAI 发布 ChatGPT 模型,引发用户习惯从简单触控操作转向更复杂的长文本输入,未来可能延伸至长语音交互。 大模型创新方面,架构优化加速涌现,融合迭代成为趋势。Scaling Law 泛化,推理能力成为关键,倒逼计算和数据变革。AGI 探索中,视频生成点燃世界模型,空间智能统一虚拟和现实。 在应用方面,AI 在文科白领的个人助理、呼叫中心、文本处理和教育等领域表现出色,能完成 80%到 90%的工作;对于工科白领,特别是程序员,能简化代码检索和调整;在蓝领领域,自动驾驶取得显著进展。但在复杂任务方面仍有改进空间。 第一轮洗牌结束,聚焦 20 赛道 5 大场景,多领域竞速中运营大于技术,AI 助手成为竞争重点。AI+X 赋能类产品发展迅速,原生 AI 爆款难求。多模态上马,Agent 席卷一切,高度个性化呼之欲出。 人工智能发展经历了萌芽、积累沉淀到如今大模型和多模态模型百花齐放的阶段。大模型由数据、算法、算力构成,算法有技术架构的迭代,如英伟达的显卡辅助模型训练,数据质量对生成理想的大模型至关重要。 未来: 李沐预测技术发展可能催生出革命性的应用形态,但 AI 离真正变革世界还有一段距离。 预计 AI 在蓝领工作的初步应用至少需要 5 年时间。 AI 技术创新点: 大模型创新:架构优化加速涌现,融合迭代大势所趋。 Scaling Law 泛化:推理能力成皇冠明珠,倒逼计算和数据变革。 AGI 探索:视频生成点燃世界模型,空间智能统⼀虚拟和现实。 AI 技术的发展趋势: 模型架构不断优化和融合。 更加注重推理能力的提升。 探索 AGI 领域,实现虚拟和现实的统一。 应用格局不断洗牌,聚焦特定赛道和场景。 多模态和 Agent 技术的广泛应用。 对用户交互体验的改变: 用户习惯从简单触控操作转向更复杂的长文本输入,未来可能延伸至长语音交互。 AI 应用为用户提供辅助,在多个领域帮助完成任务。
2025-03-31
AI技术发展时间线,罗列具体的AI模型产品和具体的AI技术创新点,并总结AI技术的发展趋势,并说明这些发展趋势为用户的交互体验带来了什么样的改变?
以下是关于 AI 技术发展的相关内容: AI 技术发展时间线: 从图灵测试、早期的图灵机器人和 ELISA,到 IBM 的语音控制打印机、完全由人工智能创作的小说、微软的同声传译系统,再到 OpenAI 发布 ChatGPT 模型,经历了萌芽、积累沉淀到如今大模型和多模态模型百花齐放的阶段。 具体的 AI 模型产品: ChatGPT 改变了用户习惯,从简单触控操作转向更复杂的长文本输入,未来可能延伸至长语音交互。 具体的 AI 技术创新点: 大模型创新方面,架构优化加速涌现,融合迭代成为趋势。 Scaling Law 泛化,推理能力成为皇冠明珠,倒逼计算和数据变革。 AGI 探索中,视频生成点燃世界模型,空间智能统一虚拟和现实。 AI 技术的发展趋势: 大模型创新:架构优化加速涌现,融合迭代大势所趋。 应用格局:第一轮洗牌结束,聚焦 20 赛道 5 大场景。 应用竞争:多领域竞速运营大于技术,AI 助手兵家必争。 应用增长:AI+X 赋能类产品大干快上,原生 AI 爆款难求。 产品趋势:多模态上马,Agent 席卷一切,高度个性化呼之欲出。 智变千行百业:左手变革生产力,右手重塑行业生态。 行业渗透率:数据基础决定初速度,用户需求成为加速度。 创投:投融资马太效应明显,国家队出手频率提升。 对用户交互体验的改变: ChatGPT 使用户从简单触控操作转向更复杂的长文本输入,未来可能延伸至长语音交互。 在文科白领方面,AI 能完成 80%到 90%的工作,如个人助理、呼叫中心、文本处理和教育等领域。 对于工科白领,特别是程序员,AI 能简化代码检索和调整。 在蓝领领域,AI 在自动驾驶方面取得显著进展。
2025-03-31
最新的大模型发展趋势
以下是关于最新的大模型发展趋势的相关内容: 决策模块方面:决策模块是具身智能系统的核心,早期依赖人工编程和专用算法,如今基于近端策略优化算法和 Qlearning 算法的强化学习方法在具身智能自主导航等任务中展现出更好的决策灵活性,但在复杂环境适应能力等方面仍有局限。大模型的出现极大增强了具身智能体的智能程度,提高了环境感知等能力。具身智能体的大模型发展方向是视觉语言动作模型(VLA)和视觉语言导航模型(VLN)。VLA 输入语言、图像或视频流,输出语言和动作;VLN 输入语言、图像或视频流,输出语言和移动轨迹。 应用场景方面:大模型因其强大能力在多个领域有出色表现,成为热点。包括文本生成和内容创作、聊天机器人和虚拟助手、编程和代码辅助、翻译和跨语言通信、情感分析和意见挖掘、教育和学习辅助、图像和视频生成、游戏开发和互动体验、医疗和健康咨询、法律和合规咨询等。随着技术进步和模型优化,未来可能拓展到更多领域,同时需注意隐私、安全和伦理挑战。 OpenAI 方面:OpenAI 推出新模型为行业注入强心剂,带来新活力和希望。结合其提出的通往 AGI 的分级,正在从第一级向第二级迈进,未来可能见证 AI 从生成工具向智能体转变。
2025-03-23
我想找最新的关于大模型发展趋势的材料
以下是为您找到的关于大模型发展趋势的最新材料: 基础通识课中提到了 AI 模型及相关进展,包括视频生成模型、相关论文,以及 AI 在诺奖和蛋白质研究领域的应用等。还介绍了人工智能的发展历程,从早期到如今大模型和多模态模型百花齐放的阶段。同时提到大模型由数据、算法、算力构成,算法有技术架构的迭代,数据质量对生成理想的大模型至关重要,以及针对弱智 8 的问题对大模型进行测试等相关内容。 2023 年度中文大模型基准测评报告.pdf 中包含 2023 年国内大模型发展趋势、测评体系、方法说明、综合测评结果、SuperCLUE2.0 升级、四大维度测评分析及示例介绍、优秀模型案例介绍等内容。 2024 年历史更新(归档)中,有《探讨大模型未来:从 Scaling Law 到数据红利再到终极 Token 工厂》,探讨了大模型的未来,包括规模化法则、数据红利和 Token 工厂概念。还有《【AI 学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)》《智变时代/全面理解机器智能与生成式 AI 加速的新工业革命》《文生图大模型基准测评首期榜单公布,DALLE 3 取得最高 76.94 分》等相关文章。
2025-03-23
我想要自学AI相关的知识,但不知道从哪里开始,需要一个行动方案,我未来想做一个ai产品经理
以下是为您提供的自学 AI 知识并成为 AI 产品经理的行动方案: 1. 应用方面: 深入了解 Prompt,选择适合自己的 AI 对话、绘画和语音产品,每天使用并用于解决实际问题或提升效率。 2. 分析方面: 大量阅读各类文章、视频以及行业报告,理解各知识之间的关系。 3. 掌握相关技能: 了解目前 AI 提示词工程师岗位的招聘技能要求,例如: 本科及以上学历,计算机科学、人工智能、机器学习相关专业背景。 熟悉 ChatGPT、Llama、Claude 等 AI 工具的使用及原理,并具有实际应用经验。 熟练掌握 ChatGPT、Midjourney 等 AI 工具的使用及原理。 负责制定和执行 AI 项目,如 Prompt 设计平台化方法和模板化方法。 了解并熟悉 Prompt Engineering,包括常见的 Prompt 优化策略(例如 CoT、Fewshot 等)。 对数据驱动的决策有深入的理解,能够基于数据分析做出决策。 具有创新思维,能够基于业务需求提出并实践 AI first 的解决方案。 对 AI 技术与算法领域抱有强烈的好奇心,并能付诸实践。 对 AIGC 领域有深入的理解与实际工作经验,保持对 AI 技术前沿的关注。 具备一定的编程和算法研究能力,能应用新的 AI 技术和算法于对话模型生成。 具有一定的编程基础,熟练使用 Python、Git 等工具。 4. 了解产品经理工作: 调研市场、思考需求、转化需求、思考解决方案、设计解决方案、分配任务、进行测试、实现解决方案。 像善用提示词工程的人一样,将需求抽象再具象成产品。 总之,要成为 AI 产品经理,需要不断学习和实践,适应行业的发展和变化。
2025-04-12
未来ai发展有什么方向性的可能,尤其对于产品运营的启发
未来 AI 发展具有以下方向性的可能,对产品运营有如下启发: 1. 从通用能力到专业化细分: 早期通用型 AI 产品如 ChatGPT 吸引大量用户,但难以满足多样化需求。 如今越来越多 AI 产品专注特定领域或功能,如图像生成(Midjourney、Stable Diffusion 等)、视频制作(Pika、Runway 等)、音频处理(各种 AI 配音、音乐生成工具),每个细分领域的产品不断提升核心能力,为用户提供更精准和高质量服务。 2. 商业模式的探索与创新: ToB 市场深耕,如针对内容创作者的 ReadPo,为专业用户提供高效工具。 新型广告模式,如天宫搜索的“宝典彩页”,允许用户认领主题词实现变现。 AI 产品从技术展示向解决用户痛点和创造商业价值转变。 3. 公司未来的样貌: AI 是生产力革命,将通过 AI 网络协同工作,推动对新型基础设施的需求。 未来公司建设可能成为 AI Agent 的工作,公司可能像神经网络一样工作。 下一代公司规模可能更小,但数量会增加,具有新的组建方式、所有权和管理结构。 未来公司将需要解决知识管理、内容生成、信任、安全和身份验证等难题的企业产品,软件数量将不断扩张和变化,代码生成和软件代理业务将更定制化和快速迭代。 4. 具体应用场景: 企业应用:提示词工程重要性凸显,带来超级个性化服务、预测性决策能力、自动创新设计能力、自动识别和优化内部流程。 交通领域:自动驾驶汽车提高安全性和效率,优化信号灯和流量。 物流配送:优化路线和计划,降低成本,包括无人机送货。 教育:提供个性化学习体验。 农业:分析农田数据提高产量和质量。 人工智能时代下最重要的三个基石是数据、算法和算力,相关资源如: 算力: 数据:
2025-04-10
未来ai发展尤其对于腾讯的发展有什么方向性的可能
以下是关于腾讯在未来 AI 发展方向的一些可能: 1. 2024 年数字科技趋势:从连接、交互、计算和智能四个维度,对 100 多项未来技术和重点方向给出趋势性判断。包括星地直连的卫星互联网、垂直起降飞机的未来交通网、能源、信息和交通的多网协同,使未来网络连接的广度和深度都迎来无限可能。报告下载地址:(发布时间:2024/01/23) 2. 金融业大模型应用:强调大模型技术对金融业带来的革命性影响,包括提高效率、降低成本、创新服务和优化风险管理等方面。通过深入分析多个案例,展示大模型在金融服务、风险管理、客户服务和营销策略等领域的应用,同时指出实施大模型技术面临的挑战,如数据隐私、算法偏见和监管合规等。报告下载地址:(发布时间:2023/11/30) 3. 在基础模型和开源生态方面: 合成数据方面:量变不能直接产生质变,质量和结构至关重要;需要从扩充数据转向创造知识,通过系统化方法提升训练数据质量。 游戏开发、影视制作、工业设计、VR 构建等领域:面临数据积累和模型优化以实现产业赋能的挑战,当前瓶颈包括训练数据稀缺和泛化能力有限,未来方向可能是 GANs 数据生成和迁移学习优化。 材质还原方面:基于几何模型的空间结构特征生成真实感材质与纹理映射,纹理生成方法多元化,核心技术不断突破,AI 赋能加速发展,应用场景持续扩展。
2025-04-10
我想在未来从事ai事业,现在该如何学习ai,
如果您想在未来从事 AI 事业,以下是一些学习建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始学习,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 可以参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 AI 的技术历史和发展方向,目前最前沿的技术点包括: 1. 偏向技术研究方向: 数学基础:线性代数、概率论、优化理论等。 机器学习基础:监督学习、无监督学习、强化学习等。 深度学习:神经网络、卷积网络、递归网络、注意力机制等。 自然语言处理:语言模型、文本分类、机器翻译等。 计算机视觉:图像分类、目标检测、语义分割等。 前沿领域:大模型、多模态 AI、自监督学习、小样本学习等。 科研实践:论文阅读、模型实现、实验设计等。 2. 偏向应用方向: 编程基础:Python、C++等。 机器学习基础:监督学习、无监督学习等。 深度学习框架:TensorFlow、PyTorch 等。 应用领域:自然语言处理、计算机视觉、推荐系统等。 数据处理:数据采集、清洗、特征工程等。 模型部署:模型优化、模型服务等。 行业实践:项目实战、案例分析等。 无论是技术研究还是应用实践,数学和编程基础都是必不可少的。同时需要紧跟前沿技术发展动态,并结合实际问题进行实践锻炼。
2025-03-26
未来AGI新职业有哪些
未来 AGI 可能催生以下新职业: 1. 与 AGI 技术安全和伦理相关的工作,如负责确保 AGI 可控性和与人类价值对齐的专业人员。 2. 参与公共政策制定和全球合作的“政策顾问”和“外交官”,协助制定 AGI 相关的规则和标准。 3. 由于 AGI 对劳动力市场的冲击,可能会出现帮助劳动者快速适应职业转换、学习新技能的职业培训师和指导顾问。 同时,AGI 的广泛应用将对劳动力市场产生巨大冲击,许多传统职业可能被取代,但历史经验表明,每次技术革命虽淘汰旧岗位,但也会创造全新岗位。例如汽车取代马车夫催生了汽车产业的新工作,AGI 时代也有望出现我们今日难以想象的新职业,整体上有望维持就业的动态平衡。不过在调整过渡期,许多劳动者将面临前所未有的职业转换压力,需要快速适应并学习新技能,转向机器不能完全胜任的任务。
2025-03-17
AI应用赛道中top应用介绍,实现的功能和应用场景,产品Launch时间:AIGC功能 Launch时间、当前月活用户数、营收利润、一年成本投入、市场占有率、目前融资金额及估值、创始团队介绍、公司员工规模、所属国家、用户来源、用户来自于哪些国家、用户profile、转化率、ROI等等, 盈利模式,优劣势与未来发展趋势。
以下是关于 AI 应用赛道的相关介绍: 应用场景:涵盖医疗、制造业、金融风控、消费端个性化服务、办公、农业、能源优化、娱乐等领域。 关键技术: 1. 包括大语言模型作为中枢神经系统,记忆模块实现长期和短期记忆,以及规划能力中的目标设定、任务拆解、生成策略、执行与反馈、资源管理和多智能体协同。 2. 强化学习用于环境感知和决策调整,多模态融合涉及多种数据类型,低成本训练是考虑成本的重要因素。 智能体特征:包括自主性、交互性和适应性,如通过自我对弈和博弈不断进化,在金融风控领域利用大量数据提升准确率。 AI 技术路线:从有语言能力的 AI 到有推理能力,再到能使用工具、发明创新以及形成组织,共五级。 智能体框架类型:分为任务驱动型、多智能体协作、强化学习型、具身智能体、应用型智能体,每种类型都有代表性框架。 智能体与大模型的关系:大模型是中枢和基石,智能体是行动引擎,两者协同演进,智能体产生的数据可反哺大模型。 未来趋势:智能体可能在中小企业中更具效益,人机协作中人类成为监督角色,但存在算力成本、伦理风险、技术瓶颈等挑战。 B 端变现与创业方向: 1. B 端变现细分包括高频率和大规模的内容生产细分,如文字、视频、3D 模型、AI 智能体等,底层是需求和数据收集及训练模型,算力和能源是关键。 2. 自媒体创业:视频号等平台尚有蓝海空间,需具备内容创新和差异化,内容成本低且更新迭代快。 3. 游戏创业:个人或团队可做轻量化游戏,结合 AI 技术,满足放松和社交需求,专注垂类赛道,避免与大厂竞争。 4. 影视创业:25 年将是拐点,更多内容会采用 AI 技术,如哪吒 2 因前期规划未用 AI 技术。 5. 广告营销创业:重点是 AI 虚拟人,数字插画可走治愈类型,要明确平台用户画像和产品定位,做好次留存和引入私域。 AI 虚拟人的发展与创业机遇: 1. 创业难点:创业对创业者综合能力要求极高,找到志同道合且能力互补的战友是创业前期最难的事。 2. AI 虚拟人发展:从早期以首位为核心的宅文化虚拟偶像,到以 CG 技术和动捕语音合成技术为核心的角色,再到如今以动捕和人工智能技术为核心的服务型虚拟人,其发展历程不断演进。 3. 虚拟人产业链:包括基础层的硬件和软件研发,平台层如商汤、百度等提供工具和系统,应用层涉及影视、传媒、游戏、金融、文旅等内容变现。 4. 未来创业机遇:AI 虚拟人是未来 310 年 Web 3.0 的风口,提前布局未来有潜力的赛道,准备好迎接机遇。 相关案例和产品信息: 1. 10 月 26 日,AI 翻译和口型匹配技术在视频制作中的应用逐渐流行,公司如 Captions、HeyGen 和 Verbalate 通过 AI 生成字幕、配音和口型匹配等功能,帮助用户轻松实现视频翻译本地化。 2. 10 月 25 日,Perplexity 最新估值约为 5 亿美元,较 3 月宣布的 1.5 亿美元估值上涨 300%以上,当前的付费用户数量达到了 1.5 万人,截止本月,Perplexity 的 ARR 达到 300 万美元,最新估值约为 ARR 的 150 倍。 3. 《100 个有意思的 AI 应用》由国盛证券出品,分为基于 LLM 自然语言能力的对话、写作、阅读、分析等应用;多模态技术持续发展,图像、视频、音频、3D 等 AIGC 应用;企业级应用等。
2025-03-14