目前在 AI 领域,很难简单地确定哪家是最强的。Llama 3.1 是迄今为止最大版本,在推理、数学、多语言和长上下文任务中能与 GPT-4 相抗衡,标志着开放模型缩小了与专有前沿的差距。
谷歌 DeepMind 与纽约大学团队开发的 AlphaGeometry 在奥林匹克级几何问题基准测试中表现出色,解决了 30 题中的 25 题,接近人类国际数学奥林匹克金牌得主的表现。
在国内,由 DeepSeek、零一万物、知谱 AI 和阿里巴巴开发的模型在 LMSYS 排行榜上取得了优异成绩,尤其在数学和编程方面表现突出。智谱一年间推出了 4 代 GLM,一直是国内能力较好的模型之一。MiniMax 推出了 MoE 架构的新模型,还有“星野”这个目前国内较成功的 AI 陪聊 APP。月之暗面专注长 Token 能力,在记忆力和长 Token 能力上有一定优势。
需要注意的是,AI 领域发展迅速,各模型的优势和表现也会随时间变化。
Llama 3.1是迄今为止最大版本,其在推理、数学、多语言和长上下文任务中能够与GPT-4相抗衡。这标志首次开放模型缩小与专有前沿的差距。上图为人们关于Llama 3.1 405B与GPT,Claude的评估,win:胜Tie:平Loss:输借助AlphaGeometry,符号推理引擎得以拯救谷歌DeepMind与纽约大学团队使用符号引擎生成了数百万条合成定理和证明,利用这些数据从零开始训练了一个语言模型。AlphaGeometry在语言模型提出新构造,与符号引擎执行推理交替进行,直至找到解决方案。令人印象深刻的是,AlphaGeometry在奥林匹克级几何问题基准测试中解决了30题中的25题,接近人类国际数学奥林匹克金牌得主的表现。第二好的AI表现仅得10分。它还展示了泛化能力——例如,发现2004年国际数学奥林匹克问题中的一个具体细节对于证明并非必要“尽管受到制裁,中国LLMs在排行榜上风头正劲”由DeepSeek、零一万物、知谱AI和阿里巴巴开发的模型在LMSYS排行榜上取得了优异的成绩,尤其在数学和编程方面表现尤为出色。中国的最强模型与美国生产的第二强前沿模型竞争,同时在某些子任务上挑战了SOTA。中国模型更能优先考虑计算效率,以弥补GPU访问的限制,并学会比美国同行更有效地利用资源。中国模型各有优势。例如,DeepSeek在推理过程中通过多头隐式注意力减少内存需求,并且改进了MoE架构。同时,零一万物更加关注数据集的建设而不是建筑创新。由于在像Common Crawl这样的流行存储库中相对缺乏数据,因此它更加关注建立强大的中文数据集来弥补不足。
智谱:一年间推出了4代GLM,一直是国内能力最好的模型之一MiniMax:推出了MoE架构的新模型,和”星野“这个目前国内最成功的AI陪聊APP月之暗面:专注长Token能力,在记忆力和长Token能力上可圈可点其他的我暂时不列了,在2023年官宣AI大模型的公司非常多,其中免不了很多是蹭流量的。以及,大模型确实有门槛,融了资的公司还有些钱花,我们可以多给一些时间看2024年的结果。(判断的方式并不客观,欢迎讨论)从产品层面上,2C端唯一真正出圈的是“妙鸭相机”,不过也只是昙花一现。大多数消费者对于AI产品的态度是“猎奇”,而非刚需。在2B行业中,大模型目前还是“纯技术投入”,对于收入撬动非常有限;而卖AI的大厂们实际上的目的是为了卖云……最后,硬件层上的卡脖子并没有缓解。目前国内仍然没有芯片可以胜任大模型训练。不过在推理上已经开始有Nvidia的替代产品逐渐出现。备受瞩目的华为昇腾在单卡指标上距离不远,但因为稳定性不足和缺乏Cuda(硬件编译库)生态,仍然需要时间打磨。美国对于国内的芯片禁运在未来还会进一步加深;因此,除了卷模型之外,基于昇腾生态的软-硬件创业是一个机会,而且是更确定的机会。
原文链接:https://www.sequoiacap.com/article/ai-50-2024/发表时间:2024-4-11作者:Konstantine Buhler编译:Z Potentials去年,生成式AI从不引人注意的地方走到了AI 50强榜单的前列。今年,随着我们看到企业用户和消费者的AI生产力开始大幅提高,它成为前沿和中心。尽管2023年美国的大部分AI风投都流向了基础设施领域——其中60%流向了最大的大语言模型(LLM)提供商,但应用公司仍在AI 50强榜单中占据主导地位。与此同时,我们开始看到AI如何为公司赋能。如今,许多公司正将AI融入其工作流程,以此来快速达成KPI。我们看到大公司正通过将AI融入其产品的方式而获益。工作流程自动化平台ServiceNow通过AI驱动的Now Assist,实现了近20%的事件避免率。Palo Alto Networks利用AI降低了处理费用的成本。Hubspot利用AI扩大了能够支持的用户规模。瑞典金融科技公司Klarna最近宣布,通过将AI融入用户支持,他们在运行率方面节省了4000多万美元。现在,成千上万的公司正在将AI整合到他们的工作流程中,以扩张规模和降低成本。AI 50强企业正在快速进化。不远的将来,我们有望看到UX和UI围绕AI的功能进行重新设计。在更好、更廉价地复制现有功能之后,我们将开发全新的用户界面,以提供有价值的新体验。