与知识库对话 - GPT-4与GPT-4o能力对比雷达图

回答

GPT-4o 具有以下能力：

音频方面：
- 比 Whisper large v3 更好地转录音频。
- 可以将音频整理成会议记录。
- 能够将音频从一种语言翻译成另一种语言。
- 可以总结音频。
- 从语音合成角度：
  - 通过提示创建语音角色，包括说话的速度、情感等。
  - 跨语音类型合成（语音克隆）。
  - 进行长格式和短格式语音合成。
  - 实现跨语言合成。
- 使用的标记数量减少了 2 - 3 倍，词汇量更大。
视觉方面：
- 生成更符合提示的图像。
- 总结视频。
- 创建 3D 资产。
- 进行光学字符识别等。
API 方面：与 GPT4-turbo 对比，速度快 2 倍，价格减半，访问限制提高 5 倍。

在实际使用中，与 GPT 4.0 相比，GPT 4o 输出的长度有所提升，输出速度更快。在同样自然语言的情况下，之前用 GPT 4.0 要求写 5000 字的文章，只能做到 866 个字，中间还断了一次，而使用 GPT 4o 输出了 1182 个字，一气呵成。在国际数学奥林匹克竞赛（IMO）的资格考试中，GPT-4o 仅正确解决了 13%的问题，而推理模型得分为 83%。其编码能力在比赛中达到了 Codeforces 比赛的第 89 个百分位。但作为早期模型，它还不具备使 ChatGPT 实用的许多功能，如浏览网页获取信息以及上传文件和图像。在许多常见情况下，GPT-4o 在短期内更有能力。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

OpenAI 春季发布会：GPT-4o

官方介绍：https://openai.com/index/hello-gpt-4o/如何访问GPT-4、GPT-4 Turbo和GPT-4o？https://help.openai.com/en/articles/7102672-how-can-i-access-gpt-4-gpt-4-turbo-and-gpt-4oSam的博文：https://blog.samaltman.com/gpt-4o音频主管Alexis Conneau：https://twitter.com/alex_conneau[GPT4o的一些文本生成任务测试（连夜）](https://waytoagi.feishu.cn/wiki/Y3Aawxm4Piynr2kNjXOcJpnDnld?fromScene=spaceOverview)GPT-4o完全能力1.比Whisper large v3更好地转录音频2.它可以将音频整理成会议记录3.可以将音频从一种语言翻译成另一种语言4.总结音频5.所有这些都是零样本/少样本学习5.1.从语音合成的角度来看，它可以：5.1.1.通过提示创建语音角色-它说话的速度、情感等5.1.2.跨语音类型合成（语音克隆）5.1.3.长格式和短格式语音合成5.1.4.跨语言合成所有这些都只需要文本/音频指导。它使用的标记数量减少了2-3倍，即更好的标记器，但当然词汇量更大。从视觉方面来看，它可以：1.生成更符合提示的图像2.总结视频3.创建3D资产4.光学字符识别等等5.GPT-4o API—2倍快，半价，5倍访问限制（与GPT4-turbo对比）

GPTs 实战：大家来找茬

嘿，大家好呀，我是景淮，一个加拿大的程序员，沉迷AI不能自拔中。今天OpenAI的发布会更新了新的GPT-4o,看了直播的视频，还有官方发布出来的效果，确实惊艳。感觉又是搞死一大堆公司的节奏。然后坐等更新，终于在所有人都差不多更新完之际。我的号更新了，上手试了试，其他功能玩起来没有视频上那么惊艳。输出的长度有所提升。在同样自然语言的情况下，之前用GPT 4.0要求写5000字的文章，只能做到866个字，中间还断了一次（点了“继续”）然后，使用GPT 4o输出了1182个字，一气呵成。下图左边为GPT 4.0，右边为GPT 4o，大家可以对比感受下。然后是输出的速度，这边是4.0[20240513183818.webm](https://bytedance.feishu.cn/space/api/box/stream/download/all/VbOvbD4hMoKhLvxI57dcNtQhnhb?allow_redirect=1)下面是4o[20240513183934.webm](https://bytedance.feishu.cn/space/api/box/stream/download/all/XDe2bqY5eookYdxh3YPcp7UNnTg?allow_redirect=1)但这个输出速度，真的是不便秘了，甚至可以说是一泻千里！快，真的快。上面的视频没有做过任何加速处理，大家可以比较下生成速度。真的惊艳到我了。可能对不常用GPT的人来说，不就是输出长点，快点嘛？算什么提升。但对于熟悉GPT经常被其烦恼的人来说。这个改变是翻天覆地的。

OpenAI 新模型9.12发布：OpenAI o1-WaytoAGI整理

We trained these models to spend more time thinking through problems before they respond,much like a person would.Through training,they learn to refine their thinking process,try different strategies,and recognize their mistakes.我们训练这些模型在问题做出响应之前花更多时间思考问题，就像一个人一样。通过培训，他们学会完善自己的思维过程，尝试不同的策略，并认识到自己的错误。In our tests,the next model update performs similarly to PhD students on challenging benchmark tasks in physics,chemistry,and biology.We also found that it excels in math and coding.In a qualifying exam for the International Mathematics Olympiad(IMO),GPT-4o correctly solved only 13% of problems,while the reasoning model scored 83%.Their coding abilities were evaluated in contests and reached the 89th percentile in Codeforces competitions.You can read more about this in our[technical research post](https://openai.com/index/learning-to-reason-with-llms/).在我们的测试中，下一次模型更新的性能类似于博士生在物理、化学和生物学中具有挑战性的基准任务。我们还发现它在数学和编码方面表现出色。在国际数学奥林匹克竞赛（IMO）的资格考试中，GPT-4o仅正确解决了13%的问题，而推理模型得分为83%。他们的编码能力在比赛中得到了评估，并在Codeforces比赛中达到了第89个百分位。您可以在我们的[技术研究帖子](https://openai.com/index/learning-to-reason-with-llms/)中阅读更多相关信息。As an early model,it doesn't yet have many of the features that make ChatGPT useful,like browsing the web for information and uploading files and images.For many common cases GPT-4o will be more capable in the near term.