与知识库对话 - 国产AI与国外AI的实际差距

回答

国产 AI 与国外 AI 存在一定的差距，但情况较为复杂，且在不同方面表现有所不同。

在 2023 年之前，国内 AI 行业曾自认为与美国差距不大，但 ChatGPT 和 GPT4 的出现打破了这种认知，OpenAI 直接拉开了 2 年的技术差距。当时国内出现了从追求创造国产 AGI 到转向做“垂直应用”“商业化”的转变。国内最领先的模型水平大概在准 ChatGPT3.5 的水平，和 GPT4 仍有差距。大厂在人才、GPU、数据和资金储备上有冲击 AGI 的能力，但实际效果尚不明确，且受内部短期考核压力等因素影响。

然而到了 2024 年，竞争达到白热化阶段。在文本到视频扩散模型方面，Google DeepMind 和 OpenAI 展示了强大的成果，但中国的相关情况在报告中未详细说明，不过国内也涌现出了一系列表现出色的 AI 生成视频工具，生成结果甚至远超国外。Llama 3.1 在某些任务中能与 GPT-4 相抗衡，而中国的一些模型如由 DeepSeek、零一万物、知谱 AI 和阿里巴巴开发的模型在 LMSYS 排行榜上取得优异成绩，尤其在数学和编程方面表现出色，且在某些子任务上挑战了前沿水平。中国模型在计算效率、数据集建设等方面各有优势，能弥补 GPU 访问的限制等不足。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

AGI万字长文（上）| 2023回顾与反思

[title]AGI万字长文（上）| 2023回顾与反思[heading1]上篇：2023，风暴的前奏[heading2]<7>国内进展与卡脖子从业内人的角度,ChatGPT和GPT4的出现时最令人惊讶的,不是它的能力,而是保密工作做的太好。2023之前国内AI行业还处在沾沾自喜,自认为和美国只有个把月差距,而且还有人口数据优势;这种论调一下子被GPT4打回了原形。OpenAI在国内完全没有预警的情况下,直接拉开2年技术差距。具体原因,可能是国内的骄傲自大,可能是被之前Google主推的T5技术路线带偏,也可能是因为AGI实在是影响过于巨大,FBI、美国国防部这些国家机关不可能没和OpenAI打过招呼。OpenAI的成功是大力出奇迹,所以23年上半年国内也笃信只要有卡有钱就可以“大炼钢铁”。那时不论是纷纷囤卡招人,研究类GPT架构的大厂们,还是讲着中国OpenAI的故事,拿着巨额融资的创业公司们,都想要第一个创造国产AGI。而到了下半年,在试验了一番发现不容易之后,又纷纷转向要做“垂直应用”、“商业化”;反而不提AGI了。这个转向是短视的,甚至是致命的。2023年,中美在AGI技术的差距并没有缩小。现在,国内最领先的模型水平大概在准ChatGPT3.5的水平,和GPT4还有不小差距;甚至还不如临时拼凑的Mistral团队的水平。大厂。大厂们无论是人才、GPU、数据,还是资金储备都是可以冲击AGI的,不过从实际效果上来看还并没有明确亮点。但与此同时,受内部短期考核压力的裹挟,大多数力量应该都放在卷新产品圈地盘和向上汇报工作上了。从另一个角度,这些模型虽然能力一般,但和业务的结合都是比较充分的。最后,大厂们同时背负了太多其他业务和政治考量:对于是否做大模型的出头鸟,很多公司都是要三思的。具体来讲,百度和阿里是大厂里比较高调:百度的“文心4.0”是当前国内能力最好的模型之一,即将发布的阿里的“通义千问

2024人工智能报告｜一文迅速了解今年的AI界都发生了什么？

[title]2024人工智能报告｜一文迅速了解今年的AI界都发生了什么？[heading2]二、2024国内VS国外AI企业，竞争达到白热化阶段Google DeepMind和OpenAI都给我们展示了强大的文本到视频扩散模型的预览。但访问仍然受到严格限制，而且他们也没有提供很多技术细节。Meta更进一步，将音频加入其中，Movie Gen的核心是一个30亿视频生成和一个13亿音频生成模型，可以分别以每秒16帧的速度生成16秒的视频，并以每秒45秒的速度生成音频片段。这些模型利用了文本到图像和文本到视频任务的联合优化技术，以及为任意长度的视频生成连贯音频的新颖扩展方法。**小编说明：**在这份报告中，原作者并没有对中国的AI生成图，生成视频的工具展开详细说明，只说明中国可灵与国外AI生成工具在竞争中。但着这并不代表中国有关该功能AI工具落后于国外。在2024年，国内涌现类似可灵、即梦、智谱清影等等一系列AI生成视频工具，其生成结果甚至远超国外，详情大家可以查看小编之前实测的[8款国内外免费AI生成视频工具对比实测！我们真的可以做到“一人搞定一部影视作品“吗？](https://link.juejin.cn/?target=https%3A%2F%2Flink.zhihu.com%2F%3Ftarget%3Dhttp%253A%2F%2Fmp.weixin.qq.com%2Fs%253F__biz%253DMzkyNTI3NTY1Ng%253D%253D%2526mid%253D2247510194%2526idx%253D1%2526sn%253D5c00bae4b0830b35881ff977d1575714%2526chksm%253Dc1cbebd5f6bc62c3607525e1e6c78384bbfde23bcaea339121db6004414ee1fe0439c9530cea%2526scene%253D21%2523wechat_redirect)

2024人工智能报告｜一文迅速了解今年的AI界都发生了什么？

[title]2024人工智能报告｜一文迅速了解今年的AI界都发生了什么？[heading2]二、2024国内VS国外AI企业，竞争达到白热化阶段Llama 3.1是迄今为止最大版本，其在推理、数学、多语言和长上下文任务中能够与GPT-4相抗衡。这标志首次开放模型缩小与专有前沿的差距。上图为人们关于Llama 3.1 405B与GPT,Claude的评估，win:胜Tie:平Loss：输借助AlphaGeometry，符号推理引擎得以拯救谷歌DeepMind与纽约大学团队使用符号引擎生成了数百万条合成定理和证明，利用这些数据从零开始训练了一个语言模型。AlphaGeometry在语言模型提出新构造，与符号引擎执行推理交替进行，直至找到解决方案。令人印象深刻的是，AlphaGeometry在奥林匹克级几何问题基准测试中解决了30题中的25题，接近人类国际数学奥林匹克金牌得主的表现。第二好的AI表现仅得10分。它还展示了泛化能力——例如，发现2004年国际数学奥林匹克问题中的一个具体细节对于证明并非必要“尽管受到制裁，中国LLMs在排行榜上风头正劲”由DeepSeek、零一万物、知谱AI和阿里巴巴开发的模型在LMSYS排行榜上取得了优异的成绩，尤其在数学和编程方面表现尤为出色。中国的最强模型与美国生产的第二强前沿模型竞争，同时在某些子任务上挑战了SOTA。中国模型更能优先考虑计算效率，以弥补GPU访问的限制，并学会比美国同行更有效地利用资源。中国模型各有优势。例如，DeepSeek在推理过程中通过多头隐式注意力减少内存需求，并且改进了MoE架构。同时，零一万物更加关注数据集的建设而不是建筑创新。由于在像Common Crawl这样的流行存储库中相对缺乏数据，因此它更加关注建立强大的中文数据集来弥补不足。