Chat with Wiki - 目前最强的AI是哪家？

Answer

目前在 AI 领域，很难简单地确定哪家是最强的。Llama 3.1 是迄今为止最大版本，在推理、数学、多语言和长上下文任务中能与 GPT-4 相抗衡，标志着开放模型缩小了与专有前沿的差距。

谷歌 DeepMind 与纽约大学团队开发的 AlphaGeometry 在奥林匹克级几何问题基准测试中表现出色，解决了 30 题中的 25 题，接近人类国际数学奥林匹克金牌得主的表现。

在国内，由 DeepSeek、零一万物、知谱 AI 和阿里巴巴开发的模型在 LMSYS 排行榜上取得了优异成绩，尤其在数学和编程方面表现突出。智谱一年间推出了 4 代 GLM，一直是国内能力较好的模型之一。MiniMax 推出了 MoE 架构的新模型，还有“星野”这个目前国内较成功的 AI 陪聊 APP。月之暗面专注长 Token 能力，在记忆力和长 Token 能力上有一定优势。

需要注意的是，AI 领域发展迅速，各模型的优势和表现也会随时间变化。

Content generated by AI large model, please carefully verify (powered by aily)

References

2024人工智能报告｜一文迅速了解今年的AI界都发生了什么？

Llama 3.1是迄今为止最大版本，其在推理、数学、多语言和长上下文任务中能够与GPT-4相抗衡。这标志首次开放模型缩小与专有前沿的差距。上图为人们关于Llama 3.1 405B与GPT,Claude的评估，win:胜Tie:平Loss：输借助AlphaGeometry，符号推理引擎得以拯救谷歌DeepMind与纽约大学团队使用符号引擎生成了数百万条合成定理和证明，利用这些数据从零开始训练了一个语言模型。AlphaGeometry在语言模型提出新构造，与符号引擎执行推理交替进行，直至找到解决方案。令人印象深刻的是，AlphaGeometry在奥林匹克级几何问题基准测试中解决了30题中的25题，接近人类国际数学奥林匹克金牌得主的表现。第二好的AI表现仅得10分。它还展示了泛化能力——例如，发现2004年国际数学奥林匹克问题中的一个具体细节对于证明并非必要“尽管受到制裁，中国LLMs在排行榜上风头正劲”由DeepSeek、零一万物、知谱AI和阿里巴巴开发的模型在LMSYS排行榜上取得了优异的成绩，尤其在数学和编程方面表现尤为出色。中国的最强模型与美国生产的第二强前沿模型竞争，同时在某些子任务上挑战了SOTA。中国模型更能优先考虑计算效率，以弥补GPU访问的限制，并学会比美国同行更有效地利用资源。中国模型各有优势。例如，DeepSeek在推理过程中通过多头隐式注意力减少内存需求，并且改进了MoE架构。同时，零一万物更加关注数据集的建设而不是建筑创新。由于在像Common Crawl这样的流行存储库中相对缺乏数据，因此它更加关注建立强大的中文数据集来弥补不足。

AGI万字长文（上）| 2023回顾与反思

智谱：一年间推出了4代GLM，一直是国内能力最好的模型之一MiniMax：推出了MoE架构的新模型，和”星野“这个目前国内最成功的AI陪聊APP月之暗面：专注长Token能力，在记忆力和长Token能力上可圈可点其他的我暂时不列了，在2023年官宣AI大模型的公司非常多，其中免不了很多是蹭流量的。以及，大模型确实有门槛，融了资的公司还有些钱花，我们可以多给一些时间看2024年的结果。（判断的方式并不客观，欢迎讨论）从产品层面上，2C端唯一真正出圈的是“妙鸭相机”，不过也只是昙花一现。大多数消费者对于AI产品的态度是“猎奇”，而非刚需。在2B行业中，大模型目前还是“纯技术投入”，对于收入撬动非常有限；而卖AI的大厂们实际上的目的是为了卖云……最后，硬件层上的卡脖子并没有缓解。目前国内仍然没有芯片可以胜任大模型训练。不过在推理上已经开始有Nvidia的替代产品逐渐出现。备受瞩目的华为昇腾在单卡指标上距离不远，但因为稳定性不足和缺乏Cuda（硬件编译库）生态，仍然需要时间打磨。美国对于国内的芯片禁运在未来还会进一步加深；因此，除了卷模型之外，基于昇腾生态的软-硬件创业是一个机会，而且是更确定的机会。

红杉｜AI 50 未来公司

原文链接：https://www.sequoiacap.com/article/ai-50-2024/发表时间：2024-4-11作者：Konstantine Buhler编译：Z Potentials去年，生成式AI从不引人注意的地方走到了AI 50强榜单的前列。今年，随着我们看到企业用户和消费者的AI生产力开始大幅提高，它成为前沿和中心。尽管2023年美国的大部分AI风投都流向了基础设施领域——其中60%流向了最大的大语言模型（LLM）提供商，但应用公司仍在AI 50强榜单中占据主导地位。与此同时，我们开始看到AI如何为公司赋能。如今，许多公司正将AI融入其工作流程，以此来快速达成KPI。我们看到大公司正通过将AI融入其产品的方式而获益。工作流程自动化平台ServiceNow通过AI驱动的Now Assist，实现了近20%的事件避免率。Palo Alto Networks利用AI降低了处理费用的成本。Hubspot利用AI扩大了能够支持的用户规模。瑞典金融科技公司Klarna最近宣布，通过将AI融入用户支持，他们在运行率方面节省了4000多万美元。现在，成千上万的公司正在将AI整合到他们的工作流程中，以扩张规模和降低成本。AI 50强企业正在快速进化。不远的将来，我们有望看到UX和UI围绕AI的功能进行重新设计。在更好、更廉价地复制现有功能之后，我们将开发全新的用户界面，以提供有价值的新体验。