直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

主流大厂目前的agi 进展

回答

目前主流大厂在 AGI 方面的进展情况如下:

  • 2023 年之前,国内 AI 行业自认为与美国差距不大,但 ChatGPT 和 GPT4 的出现打破了这种认知,OpenAI 直接拉开了 2 年的技术差距。
  • 2023 年上半年,国内大厂纷纷囤卡招人,研究类 GPT 架构,或成立创业公司,试图创造国产 AGI。但下半年发现不容易后,纷纷转向“垂直应用”“商业化”,不再提 AGI。
  • 国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 还有不小差距。
  • 百度和阿里在大厂中比较高调,百度的“文心 4.0”是当前国内能力较好的模型之一,即将发布的阿里的“通义千问”也备受关注。
  • 大厂们在人才、GPU、数据和资金储备方面具备冲击 AGI 的条件,但实际效果尚无明确亮点,且受内部短期考核压力影响,多数力量用于卷新产品和向上汇报工作,同时还背负其他业务和政治考量。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AGI万字长文(上)| 2023回顾与反思

从业内人的角度,ChatGPT和GPT4的出现时最令人惊讶的,不是它的能力,而是保密工作做的太好。2023之前国内AI行业还处在沾沾自喜,自认为和美国只有个把月差距,而且还有人口数据优势;这种论调一下子被GPT4打回了原形。OpenAI在国内完全没有预警的情况下,直接拉开2年技术差距。具体原因,可能是国内的骄傲自大,可能是被之前Google主推的T5技术路线带偏,也可能是因为AGI实在是影响过于巨大,FBI、美国国防部这些国家机关不可能没和OpenAI打过招呼。OpenAI的成功是大力出奇迹,所以23年上半年国内也笃信只要有卡有钱就可以“大炼钢铁”。那时不论是纷纷囤卡招人,研究类GPT架构的大厂们,还是讲着中国OpenAI的故事,拿着巨额融资的创业公司们,都想要第一个创造国产AGI。而到了下半年,在试验了一番发现不容易之后,又纷纷转向要做“垂直应用”、“商业化”;反而不提AGI了。这个转向是短视的,甚至是致命的。2023年,中美在AGI技术的差距并没有缩小。现在,国内最领先的模型水平大概在准ChatGPT3.5的水平,和GPT4还有不小差距;甚至还不如临时拼凑的Mistral团队的水平。大厂。大厂们无论是人才、GPU、数据,还是资金储备都是可以冲击AGI的,不过从实际效果上来看还并没有明确亮点。但与此同时,受内部短期考核压力的裹挟,大多数力量应该都放在卷新产品圈地盘和向上汇报工作上了。从另一个角度,这些模型虽然能力一般,但和业务的结合都是比较充分的。最后,大厂们同时背负了太多其他业务和政治考量:对于是否做大模型的出头鸟,很多公司都是要三思的。具体来讲,百度和阿里是大厂里比较高调:百度的“文心4.0”是当前国内能力最好的模型之一,即将发布的阿里的“通义千问

红杉|AI 50 未来公司

原文链接:https://www.sequoiacap.com/article/ai-50-2024/发表时间:2024-4-11作者:Konstantine Buhler编译:Z Potentials去年,生成式AI从不引人注意的地方走到了AI 50强榜单的前列。今年,随着我们看到企业用户和消费者的AI生产力开始大幅提高,它成为前沿和中心。尽管2023年美国的大部分AI风投都流向了基础设施领域——其中60%流向了最大的大语言模型(LLM)提供商,但应用公司仍在AI 50强榜单中占据主导地位。与此同时,我们开始看到AI如何为公司赋能。如今,许多公司正将AI融入其工作流程,以此来快速达成KPI。我们看到大公司正通过将AI融入其产品的方式而获益。工作流程自动化平台ServiceNow通过AI驱动的Now Assist,实现了近20%的事件避免率。Palo Alto Networks利用AI降低了处理费用的成本。Hubspot利用AI扩大了能够支持的用户规模。瑞典金融科技公司Klarna最近宣布,通过将AI融入用户支持,他们在运行率方面节省了4000多万美元。现在,成千上万的公司正在将AI整合到他们的工作流程中,以扩张规模和降低成本。AI 50强企业正在快速进化。不远的将来,我们有望看到UX和UI围绕AI的功能进行重新设计。在更好、更廉价地复制现有功能之后,我们将开发全新的用户界面,以提供有价值的新体验。

AGI 万字长文(下)| 2024,分叉与洪流

在AI上发力的还有手机和PC厂商:华为、荣耀、小米、OPPO、VIVO、三星、联想等都已宣布会在手机/PC端侧搭载大模型。这个可能性来自于:2023年下半年“模型小型化”的众多进展(详情见“上篇”)。不过,仔细看来,除了很弱的Nvidia Chat with RTX,目前并没有真正全离线版的大模型产品,端上智能暂时还是噱头。手机和电脑厂商们的打法基本都是大模型还是放在线上,手机和电脑来调用,然后搭配一个小AI做总结等服务。“端”确实“智能”了,但"大脑"还在线上,手机上顶多有个"脑干"。纯粹的端上智能有几个问题:1)离线小模型永远都会和在线大模型有一个代际的能力差距,于是为什么消费者要用一个更傻的模型而不是用线上的模型服务?2)即使是小模型,它目前的耗能和生热仍然难以达到手机要求。3)目前的AI还不是刚需,猎奇成分比较多。4)技术上还不能确认小型化的模型是“真AGI”还是“聊天机器”。所以说,短期内的端上智能仍然会停留在一些个别小市场里。

其他人在问
AGI是什么意思?
AGI 即通用人工智能(Artificial General Intelligence),指能够像人类一样思考、学习和执行多种任务的人工智能系统。它可以做任何人类可以做的事。 Deepmind 的研究团队在去年十一月发表的论文《Levels of AGI》中,给 AGI 的定义提出了六个原则,其中最重要的一点是“关注能力,而非过程”,即应关注 AGI 能完成什么,而非它如何完成任务。AGI 的定义应包括多个级别,每个级别都有明确的度量标准和基准。 还有一个常见且较合理和可验证的定义:AGI 是一种自主系统,在大多数具有经济价值的工作中超越了人类的能力。例如 Sam Altman 常说的,用自动化来贡献 GDP。Andrej Karpathy 今年初在其博客上发表的《Selfdriving as a case study for AGI》(虽很快删除),全文用自动化的交通服务来类比 AGI 和它的经济价值。
2024-11-13
如何可以快速的学习Agi
以下是关于快速学习 AGI 的一些建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定的模块进行深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 鉴于人工智能依赖的神经网络基础,专家 AI 可能通过元学习(或学会学习)比我们预期的更快地获得知识,并带着我们人类一同进步。AI 的性质让我们可以做一些我们无法对人做的事情,即将他们一部分一部分地拆解,并研究每一个小部分。通过构建系统以深入探索专家 AI 的内部工作机制,我们将创造一个学习的飞轮。最终,专家 AI 可能超越领域专家的角色,成为下一代专家——无论是人类还是 AI——的教师。
2024-11-13
什么是AGI
AGI 即通用人工智能(Artificial General Intelligence),是指具有人类水平的智能和理解能力的 AI 系统。它有能力完成任何人类可以完成的智力任务,适用于不同的领域,同时拥有某种形式的意识或自我意识。目前还只是一个理论概念,还没有任何 AI 系统能达到这种通用智能水平。 AGI 的发展有五个等级: 1. 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 2. 推理者(Reasoners):具备人类推理水平,能够解决复杂问题,如 ChatGPT,能根据上下文和文件提供详细分析和意见。 3. 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多产品在执行任务后仍需人类参与,尚未达到完全智能体的水平。 4. 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 5. 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 更多信息请见(AGI)。OpenAI 原计划在 2026 年发布的 Q 的下一阶段(最初被称为 GPT6,后重新命名为 GPT7),由于埃隆·马斯克最近的诉讼而被暂停。计划在 2027 年发布的 Q 2025(GPT8)将实现完全的 AGI。
2024-11-12
如何加入 WaytoAGI 社区群
如果您想加入 WaytoAGI 社区群,可以通过以下方式: 1. 填写问卷进群,群内会分享最新 AI 信息和社区活动。 2. 搜索微信号 Andywuwu07 或扫描二维码加微信,备注 AI 共学,以便被拉进免费的 AI Agent 共学群。 3. 飞书群内置 AI 智能机器人,可以回复任何与 AI 相关的问题。 4. 新手可以使用 Kimi 智能助手入门学习和体验 AI,PC 端可通过下载。 5. 如需下载研究报告,诚邀您加入知识星球:了解。
2024-11-11
如何建立自己AGI?
建立自己的 AGI 是一个具有挑战性且长期的过程,以下是一些建议和参考: 首先,在学习前可能处于对 AI 和提示词工程不理解,不懂代码、英语差,注册尝试各种 AI 工具走弯路的状态。 学习后,可能能够搓多 Agent 的智能体,进行营销文案创作、SQL 代码进阶学习应用,创建图像流智能体和 Agent 智能体玩具,在公司中实践智能客服等。 在学习路径方面,关键词包括“少就是多”“先有个初识”“目录索引推荐”“兴趣最重要”“先动手”。学习路径类似于游戏通关的主线加支线,要学以致用,通过学习、分享和不断填补知识的缝隙来成长。 同时,新手学习 AI 需记住这是一个长期过程,要有耐心和持续努力,不要害怕犯错。完整的学习路径建议参考「通往 AGI 之路」知识库首页(https://waytoagi.feishu.cn/wiki/QPe5w5g7UisbEkkow8XcDmOpn8e)的布鲁姆分类法,设计自己的学习路径。 另外,关于 AGI 的未来发展,2024 年内有诸多机会点,如图片超短视频的精细操控、有一定操控能力的生成式短视频、AI 音频能力进展、“全真 AI 颜值网红”出现、游戏 AI NPC 进展、AI 男/女朋友聊天成熟、实时生成内容在社交媒体和广告中出现、AI Agent 进展、AI 的商业模式用例、可穿戴全天候 AI 硬件、中国 AI 发展、AI 造成的问题等。2025 2027 年,AI 3D 技术、全真 AI 虚拟人、AR/VR 技术、接近 AGI 的技术、具身智能等方面将有新的发展,同时也会带来一些社会问题。
2024-11-10
使用AGI类工具时,用户应该注意些什么
使用 AGI 类工具时,用户应注意以下几点: 1. 理解工具:全面了解工具的应用场景和调用方法是有效使用的前提。利用 LLM 的 zeroshot learning 和 fewshot learning 能力,可通过描述工具功能和参数的 zeroshot demonstration 或特定工具使用场景和相应方法演示的少量提示来获取工具知识。面对复杂任务,应先将其分解为子任务,再组织和协调,这依赖于 LLM 的推理和规划能力以及对工具的理解。 2. 使用工具:学习使用工具的方法主要包括从 demonstration 中学习和从 reward 中学习。包括模仿人类专家行为,了解行为后果,并根据环境和人类的反馈做出调整。环境反馈包括任务完成结果和环境状态变化,人类反馈包括显性评价和隐性行为。 3. 关注工具选择:对于 Tools 类工具,开发者需选到合适的工具,并填写准确优秀的参数。可将业务上的 knowhow 转化为 Agent 的知识,提升工具使用的准确率,把精力放在这方面而非工程化上。
2024-11-10
目前国外主流的图像类AICG应用有哪些
目前国外主流的图像类 AICG 应用包括 DALL·E2、StableDiffusion 等。DALL·E2 能够根据输入的文本描述生成逼真且富有创意的图像;StableDiffusion 则以其强大的生成能力和广泛的自定义选项受到众多用户的青睐。
2024-11-13
目前国外主流的十大图像类AICG应用有哪些
目前关于国外主流的十大图像类 AICG 应用,暂时没有确切和权威的统一排名。不同的评估标准和应用场景可能会导致结果有所差异。一些常见且受到广泛关注的图像类 AICG 应用包括 DALL·E2、StableDiffusion、Midjourney 等,但要确切指出十大应用会因各种因素而难以确定。
2024-11-13
目前国外主流的图像类AICG应用有哪些
目前国外主流的图像类 AICG 应用包括 DALL·E2、StableDiffusion 等。DALL·E2 能够根据输入的文本描述生成逼真的图像;StableDiffusion 则具有强大的图像生成能力和丰富的自定义选项。
2024-11-13
现在业内比较主流的 RAG 方案 开源/商业的都有哪些啊
目前业内比较主流的 RAG 方案包括开源和商业的,以下为您介绍: 1. Dify:这是一个开源的大模型应用开发平台。它结合后端即服务和 LLMOps 的理念,为用户提供直观界面来快速构建和部署生产级别的生成式 AI 应用。具备强大工作流构建工具、广泛的模型集成、功能丰富的提示词 IDE 以及全面的 RAG Pipeline 用于文档处理和检索。还允许定义 Agent 智能体,并通过 LLMOps 功能对应用程序性能进行持续监控和优化。提供云服务和本地部署选项,满足不同用户需求。其设计理念注重简单性、克制和快速迭代,适合个人研究和企业级落地项目。 官方手册:https://docs.dify.ai/v/zhhans 一般来说,如果是个人研究,推荐单独使用;如果是企业级落地项目,推荐多种框架结合使用。 2. LangChain:这是一个为简化大模型应用开发而设计的开源框架。通过提供模块化的工具和库,允许开发者轻松集成和操作多种大模型,将更多精力投入到创造应用的核心价值上。设计注重简化开发流程,支持广泛模型,具备良好可扩展性,适应不断变化的业务需求。作为社区广泛支持的开源项目,拥有活跃贡献者和持续更新,提供全面文档和示例代码,充分考虑应用安全性和用户数据隐私保护,是多语言支持的灵活框架,适用于各种规模项目和不同背景开发者。 官方手册:https://python.langchain.com/docs/get_started/introduction/
2024-09-24
对于辅助代码编写的AI工具有什么推荐,哪些是主流使用人数较多的工具
以下是一些主流的辅助代码编写的 AI 工具: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议,帮助更快、更少地编写代码。 2. 通义灵码:阿里巴巴团队推出,基于通义大模型,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力。 3. CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,可为开发人员实时提供代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型,可快速生成代码,提升开发效率。 5. Cody:代码搜索平台 Sourcegraph 推出,借助 Sourcegraph 强大的代码语义索引和分析能力,了解开发者的整个代码库,不止是代码片段。 6. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供智能研发服务的免费 AI 代码助手,基于蚂蚁集团自研的基础大模型进行微调的代码大模型。 7. Codeium:一个由 AI 驱动的编程助手工具,通过提供代码建议、重构提示和代码解释来帮助软件开发人员,提高编程效率和准确性。 更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。 每个工具的功能和适用场景可能会有所不同,您可以根据自己的需求来选择最适合您的工具。
2024-09-09
24年9月,当下主流好用ai的大模型有哪些
当下主流好用的 AI 大模型主要包括: 1. OpenAI 系统:包括 3.5 和 4.0 版本。3.5 模型于 11 月启动了当前的 AI 热潮,4.0 模型在春季首次发布,功能更强大。此外,还有新的变种使用插件连接到互联网和其他应用程序,如 Code Interpreter 是一个非常强大的 ChatGPT 版本,可以运行 Python 程序。如果未为 OpenAI 付费,只能使用 3.5 版本。 2. 微软的 Bing:使用 4 和 3.5 的混合,通常是 GPT4 家族中首个推出新功能的模型。例如,它既可以创建也可以查看图像,而且可以在网页浏览器中阅读文档,并连接到互联网。
2024-09-05
AI加教育的最新进展
以下是 AI 加教育的最新进展: 案例方面: “AI 赋能教师全场景”,来自 MQ 老师的投稿贡献。 “未来教育的裂缝:如果教育跟不上 AI”,揭示了人工智能在教育领域从理论走向实际应用带来的颠覆性改变。 “化学:使用大型语言模型进行自主化学研究”。 “翻译:怎么把一份英文 PDF 完整地翻译成中文?”,介绍了 8 种方法。 对未来的预判: 个性化学习时代已到来,AI 将作为教育生态系统的一部分与人类教师协作,为孩子提供不同的学习体验,如混合式教学、定制学习路径等。 教育工作者将成为学习的引导者和伙伴,更多关注孩子的全人发展,如创造力和社交智慧。 未来 3 年,提升人机协作效率的领域,如 AI 作业批改、备课、定制教育规划、学前启蒙等,对教育从业者蕴藏着巨大机遇。 探索实践: 过去半年多,梳理教学和育儿工作流,每个环节与 AI 协作可大幅提升效率,但也加剧了知识获取的不平等。从家长的“育”、老师的“教”和学生的“学”进行了落地实践的拆解。
2024-11-05
近几个月,中国AI行业有什么重要进展?
以下是近几个月中国 AI 行业的一些重要进展: 过去 12 个月,人工智能行业流量增长显著。2022 年 9 月研究起始时,分析的工具产生 2.418 亿次访问,到 2023 年 8 月达到 28 亿次访问量。 从去年 11 月 ChatGPT 成为最快达到 100 万用户的平台后,行业热度持续攀升,2023 年 5 月访问量达到约 41 亿的峰值。 2023 年上半年国内笃信靠资金和卡能发展类 GPT 架构,但下半年纷纷转向“垂直应用”“商业化”,不提 AGI。目前国内最领先的模型水平大概在准 ChatGPT3.5 水平,和 GPT4 有差距。 百度的“文心 4.0”是当前国内能力较好的模型之一,即将发布的阿里的“通义千问”。 中国开源项目在今年赢得全球粉丝,成为积极开源贡献者。DeepSeek 在编码任务中表现出色,阿里巴巴发布的 Qwen2 系列视觉能力令人印象深刻,清华大学的自然语言处理实验室资助的 OpenBMB 项目催生了 MiniCPM 项目。
2024-11-04
最新AI进展
以下是关于最新 AI 进展的相关内容: AI 技术的发展历程: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现机器学习算法如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到发展。 当前 AI 前沿技术点: 1. 大模型(Large Language Models):如 GPT、PaLM 等。 2. 多模态 AI:包括视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习:如自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:例如元学习、一次学习、提示学习等。 5. 可解释 AI:涉及模型可解释性、因果推理、符号推理等。 6. 机器人学:涵盖强化学习、运动规划、人机交互等。 7. 量子 AI:包括量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 10 月 14 日的 AI 相关进展: 1. ChatGPT 命令工具上线,提供搜索、图像、O1 推理三种命令,使普通模型也具备高级推理能力,测试表明所有模型均支持命令调用,显著提升了 ChatGPT 的整体能力。 2. Anthropic CEO 展望未来,认为 AI 将在 5 10 年内助力扫除几乎所有疾病,寿命翻倍至 150 岁,包括在医学进展方面实现 50 100 年的突破,如大规模预防自然传染病与开发“万能疫苗”,降低癌症死亡率,治愈遗传疾病,开发抗衰老疗法,帮助治疗抑郁症、精神分裂症等疾病,同时自动化劳动解放人类创造力,推动全球经济增长,但也需平衡风险与潜力。 3. ChatGPT 4.0 Canvas 功能助力写作,提供思路、润色语言、内容扩展,支持快速修改与撤回版本,极大提升写作效率,未来或将支持多人协作、数据图表生成、甚至直接生成 PPT。 对于新手学习 AI,要持续学习和跟进,关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。
2024-10-31
中国上市公司在ai应用方面的进展
目前,中国上市公司在 AI 应用方面取得了一定进展。 一方面,许多公司正将 AI 融入其工作流程,以快速达成 KPI、扩张规模和降低成本。例如,工作流程自动化平台 ServiceNow 通过 AI 驱动的 Now Assist,实现了近 20%的事件避免率;Palo Alto Networks 利用 AI 降低了处理费用的成本;Hubspot 利用 AI 扩大了能够支持的用户规模。瑞典金融科技公司 Klarna 最近宣布,通过将 AI 融入用户支持,他们在运行率方面节省了 4000 多万美元。 另一方面,对于 AI 应用层的创业者来说,存在一些问题和探索。中国企业软件的发展曾受人均 GDP 不够高、人力成本等因素限制,但如果 AI 能极大降低软件成本并提高效率,可能带来价值突破。我们期待中国 2B 的 AI 软件应用实现跨越式发展。 此外,还有一些相关的资源可供参考,如 2022 2024 年融资 2000 万美金以上的公司列表和详细公司分析、AI Grant 公司列表和详细公司分析、AIGC 行业与商业观察等。同时,也有关于 AI 变革公司/产业实践探索的相关内容,如 2023 年年报中中国上市公司对生成式 AI 的使用,以及安克创新的 AI 实践分析等。
2024-10-28
近期的大模型进展
近期大模型的进展主要包括以下方面: 多模态大模型: 现状:随着数据集和模型规模扩大,传统多模态模型计算量大,研究重点在于各模态的连接,利用现成训练好的单模态基础模型可减少训练费用和提升效率。通过多模态预训练和指令微调实现模态对齐及模型输出与人类意图对齐是核心挑战。 发展历程:最初集中在多模态内容理解和文本生成,如 Flamingo、BLIP2 等;同时实现多模态输入和输出工作,如 MMLMM;将 LLM 和外部工具继承进来,实现“anytoany”的多模态理解和生成,如 visualchatgpt 等;还有为减少级联过程中传播误差的工作。 大型视觉模型 Sora:符合视觉模型的规模化定律,展示了新兴能力,包括遵循指令、视觉提示工程和视频理解等,是第一个展示确认新兴能力的视觉模型,标志着计算机视觉领域的重要里程碑。 OpenAI 的新模型 o1preview/mini:复杂问题思考过程长,相对简单问题也需 5 10 秒,使用条数少,冷却时间长,但推理模型准确率不断攀升,为行业注入了强心剂。
2024-10-23
9月份AI技术有哪些进展
以下是 9 月份 AI 技术的一些进展: 1. 9 月 AI 圈内发生了多起趣事和事件,包括 Cursor 编程软件的爆红、Runway 删除开源的 Stable Diffusion v1.5、国产 AI Bot 类产品留存率不足 1%等。 2. 众多新模型和功能接连发布,如 DeepSeek、OpenAI 和 Meta 有新的进展,以及 AI 编程工具不断竞争。 3. 行业关注度持续上升,尤其是 Cursor 的成功引发广泛讨论,显示 AI 编程工具仍在快速发展。 4. 吴恩达深入探讨了 AI 技术的最新发展和未来方向,重点关注 Agentic Workflow、模型架构、推理速度和基础设施。他介绍了 Agentic Workflow 的优势,强调 AI 能够自主回顾和修复错误,提高系统稳定性。以斯坦福大学的演示为例,AI Agent 在网络搜索失败时自动切换到维基百科,展示了其适应性。 5. 关于模型架构,吴恩达认为现有的 Transformer 模型已经表现良好,虽然新架构值得研究,但不是必需的。他强调提高快速推理和生成控制能力更为关键。 6. 推理速度被视为当前 AI 应用的主要瓶颈。吴恩达指出,显著提高推理速度(如从 25 分钟缩短到 2 分钟)将极大改善用户体验,推动 AI 应用发展。 7. 在讨论 AI 基础设施时,吴恩达认同增加训练投资可能提高模型效率的观点。他提到一些公司正在开发高效的 token 生成技术,并提出了训练和推理基础设施是否应分离的问题,暗示这可能需要新的架构支持。
2024-10-04