GPT-4o 具有以下能力:
在实际使用中,与 GPT 4.0 相比,GPT 4o 输出的长度有所提升,输出速度更快。在同样自然语言的情况下,之前用 GPT 4.0 要求写 5000 字的文章,只能做到 866 个字,中间还断了一次,而使用 GPT 4o 输出了 1182 个字,一气呵成。在国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4o 仅正确解决了 13%的问题,而推理模型得分为 83%。其编码能力在比赛中达到了 Codeforces 比赛的第 89 个百分位。但作为早期模型,它还不具备使 ChatGPT 实用的许多功能,如浏览网页获取信息以及上传文件和图像。在许多常见情况下,GPT-4o 在短期内更有能力。
官方介绍:https://openai.com/index/hello-gpt-4o/如何访问GPT-4、GPT-4 Turbo和GPT-4o?https://help.openai.com/en/articles/7102672-how-can-i-access-gpt-4-gpt-4-turbo-and-gpt-4oSam的博文:https://blog.samaltman.com/gpt-4o音频主管Alexis Conneau:https://twitter.com/alex_conneau[GPT4o的一些文本生成任务测试(连夜)](https://waytoagi.feishu.cn/wiki/Y3Aawxm4Piynr2kNjXOcJpnDnld?fromScene=spaceOverview)GPT-4o完全能力1.比Whisper large v3更好地转录音频2.它可以将音频整理成会议记录3.可以将音频从一种语言翻译成另一种语言4.总结音频5.所有这些都是零样本/少样本学习5.1.从语音合成的角度来看,它可以:5.1.1.通过提示创建语音角色-它说话的速度、情感等5.1.2.跨语音类型合成(语音克隆)5.1.3.长格式和短格式语音合成5.1.4.跨语言合成所有这些都只需要文本/音频指导。它使用的标记数量减少了2-3倍,即更好的标记器,但当然词汇量更大。从视觉方面来看,它可以:1.生成更符合提示的图像2.总结视频3.创建3D资产4.光学字符识别等等5.GPT-4o API—2倍快,半价,5倍访问限制(与GPT4-turbo对比)
嘿,大家好呀,我是景淮,一个加拿大的程序员,沉迷AI不能自拔中。今天OpenAI的发布会更新了新的GPT-4o,看了直播的视频,还有官方发布出来的效果,确实惊艳。感觉又是搞死一大堆公司的节奏。然后坐等更新,终于在所有人都差不多更新完之际。我的号更新了,上手试了试,其他功能玩起来没有视频上那么惊艳。输出的长度有所提升。在同样自然语言的情况下,之前用GPT 4.0要求写5000字的文章,只能做到866个字,中间还断了一次(点了“继续”)然后,使用GPT 4o输出了1182个字,一气呵成。下图左边为GPT 4.0,右边为GPT 4o,大家可以对比感受下。然后是输出的速度,这边是4.0[20240513183818.webm](https://bytedance.feishu.cn/space/api/box/stream/download/all/VbOvbD4hMoKhLvxI57dcNtQhnhb?allow_redirect=1)下面是4o[20240513183934.webm](https://bytedance.feishu.cn/space/api/box/stream/download/all/XDe2bqY5eookYdxh3YPcp7UNnTg?allow_redirect=1)但这个输出速度,真的是不便秘了,甚至可以说是一泻千里!快,真的快。上面的视频没有做过任何加速处理,大家可以比较下生成速度。真的惊艳到我了。可能对不常用GPT的人来说,不就是输出长点,快点嘛?算什么提升。但对于熟悉GPT经常被其烦恼的人来说。这个改变是翻天覆地的。
We trained these models to spend more time thinking through problems before they respond,much like a person would.Through training,they learn to refine their thinking process,try different strategies,and recognize their mistakes.我们训练这些模型在问题做出响应之前花更多时间思考问题,就像一个人一样。通过培训,他们学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。In our tests,the next model update performs similarly to PhD students on challenging benchmark tasks in physics,chemistry,and biology.We also found that it excels in math and coding.In a qualifying exam for the International Mathematics Olympiad(IMO),GPT-4o correctly solved only 13% of problems,while the reasoning model scored 83%.Their coding abilities were evaluated in contests and reached the 89th percentile in Codeforces competitions.You can read more about this in our[technical research post](https://openai.com/index/learning-to-reason-with-llms/).在我们的测试中,下一次模型更新的性能类似于博士生在物理、化学和生物学中具有挑战性的基准任务。我们还发现它在数学和编码方面表现出色。在国际数学奥林匹克竞赛(IMO)的资格考试中,GPT-4o仅正确解决了13%的问题,而推理模型得分为83%。他们的编码能力在比赛中得到了评估,并在Codeforces比赛中达到了第89个百分位。您可以在我们的[技术研究帖子](https://openai.com/index/learning-to-reason-with-llms/)中阅读更多相关信息。As an early model,it doesn't yet have many of the features that make ChatGPT useful,like browsing the web for information and uploading files and images.For many common cases GPT-4o will be more capable in the near term.