直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

gpt4o发布会

回答

OpenAI 春季发布会:GPT-4o 模型

OpenAI 在春季发布会上推出了 GPT-4o 模型,这是迈向更自然的人机交互的一步。GPT-4o 可以接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出的任意组合。它在英语文本和代码上的性能与 GPT-4 Turbo 相匹配,在非英语语言的文本上也有显著改进,同时在 API 中也更快且便宜 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。

GPT-4o 具有内置安全性,通过过滤训练数据和通过训练后改进模型行为等技术,在设计上具有跨模态的安全性。OpenAI 还创建了新的安全系统,为语音输出提供护栏。OpenAI 对网络安全、CBRN、说服力和模型自主性的评估表明,GPT-4o 在这些类别中的任何一个类别中的得分都不超过中等风险。

演讲者强调了将微调和 RAG 相结合以获得最佳性能的好处。他们将该理论应用于 Spider 1.0 基准测试,使用 RAG 和微调实现了高精度。演讲最后总结了优化流程,并强调了使用所讨论的技术迭代提高 LLM 性能的重要性。演讲者还邀请观众提问,并进行了进一步讨论。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

OpenAI 春季发布会:GPT-4o

GPT-4o has safety built-in by design across modalities,through techniques such as filtering training data and refining the model’s behavior through post-training.We have also created new safety systems to provide guardrails on voice outputs.GPT-4o通过过滤训练数据和通过训练后改进模型行为等技术,在设计上具有跨模态的内置安全性。我们还创建了新的安全系统,为语音输出提供护栏。We’ve evaluated GPT-4o according to our我们根据GPT-4o评估了[Preparedness Framework](https://openai.com/preparedness)and in line with our[voluntary commitments](https://openai.com/index/moving-ai-governance-forward/)。Our evaluations of cybersecurity,CBRN,persuasion,and model autonomy show that GPT-4o does not score above Medium risk in any of these categories.This assessment involved running a suite of automated and human evaluations throughout the model training process.We tested both pre-safety-mitigation and post-safety-mitigation versions of the model,using custom fine-tuning and prompts,to better elicit model capabilities.准备框架,并符合我们的自愿承诺。我们对网络安全、CBRN、说服力和模型自主性的评估表明,GPT-4o在这些类别中的任何一个类别中的得分都不超过中等风险。该评估涉及在整个模型训练过程中运行一套自动化和人工评估。我们使用自定义微调和提示测试了模型的安全缓解前和安全缓解后版本,以更好地激发模型功能。

OpenAI 春季发布会:GPT-4o

GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出的任意组合。它可以在短短232毫秒内响应音频输入,平均为320毫秒,这与对话中的人类响应时间相似。它在英语文本和代码上的GPT-4 Turbo性能相匹配,在非英语语言的文本上也有显著改进,同时在API中也更快且便宜50%。与现有模型相比,GPT-4o在视觉和音频理解方面尤其出色。

OpenAI 春季发布会:GPT-4o

The presenters highlighted the benefits of combining fine-tuning and RAG for optimal performance.演讲者强调了将微调和RAG相结合以获得最佳性能的好处。Application of Theory理论应用The presenters applied the theory to a practical challenge,the Spider 1.0 benchmark,achieving high accuracy using both RAG and fine-tuning.演讲者将该理论应用于实际挑战,即Spider 1.0基准测试,使用RAG和微调实现了高精度。Conclusion结论The presentation concluded with a summary of the optimization flow and emphasized the importance of iteratively improving LLM performance using the discussed techniques.演讲最后总结了优化流程,并强调了使用所讨论的技术迭代提高LLM性能的重要性。Q&AThe presenters invited questions from the audience and were available for further discussion.演讲者邀请观众提问,并可以进行进一步讨论。

其他人在问
免费试用chatgpt4o
ChatGPT 4o 于 5 月 13 日发布后引起热潮,目前 ChatGPT 官网有 3 个版本,分别是 GPT3.5、GPT4 和 ChatGPT 4o。发布会上称 ChatGPT 4o 可以免费体验,但次数有限。 GPT3.5 为免费版本,拥有 GPT 账号即可使用,但其智能程度不如 GPT4o,且无法使用 DALL.E3 等插件。ChatGPT 3.5 的知识更新到 2022 年 1 月,ChatGPT 4o 的知识更新到 2023 年 10 月,ChatGPT 4 则更新到 2023 年 12 月。 想要更多功能更智能的 GPT4o 需升级到 PLUS 套餐,收费标准为 20 美金一个月,GPT4 还有团队版和企业版,费用更贵,一般推荐使用 PLUS 套餐。 以下是安卓系统安装、订阅 GPT4 的教程: 1. 安装 Google Play:到小米自带的应用商店搜索 Google Play 进行安装,安装好后打开,按提示登录。 2. 下载安装 ChatGPT:在谷歌商店搜索“ChatGPT”进行下载安装,开发者是 OpenAI。可能会遇到“google play 未在您所在的地区提供此应用”的问题,可通过在 Google Play 点按右上角的个人资料图标,依次点按:设置>常规>帐号和设备偏好设置>国家/地区和个人资料,添加国内双币信用卡,地区选美。若仍搜不到,可卸载重装 Google Play 并保持梯子的 IP 一直是美。 3. 体验 ChatGPT:若只想体验 ChatGPT 3.5 版本,不升级 GPT4,直接登录第二部注册好的 ChatGPT 账号即可。 4. 订阅 GPT4 Plus 版本:先在 Google play 中的【支付和订阅】【支付方式】中绑定好银行卡,然后在 ChatGPT 里订阅 Plus。
2024-11-19
gpt4o视觉模型
GPT4o 是 OpenAI 推出的模型。开发人员现在可在 API 中将其作为文本和视觉模型进行访问。与 GPT4 Turbo 相比,具有速度快 2 倍、价格减半、速率限制高出 5 倍的优势。未来几周计划向 API 中的一小群受信任的合作伙伴推出对其新音频和视频功能的支持。 GPT4o(“o”代表“omni”)是迈向更自然人机交互的一步,能接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出的任意组合。它在 232 毫秒内可响应音频输入,平均为 320 毫秒,与人类响应时间相似。在英语文本和代码上的 GPT4 Turbo 性能相匹配,在非英语语言的文本上有显著改进,在 API 中更快且便宜 50%,在视觉和音频理解方面表现出色。 在 GPT4o 之前,语音模式由三个独立模型组成的管道实现,存在信息丢失等问题。而 GPT4o 是在文本、视觉和音频上端到端训练的新模型,所有输入和输出都由同一个神经网络处理,但对其能做什么及局限性仍在探索。
2024-11-14
GPT4o能免费用几次
ChatGPT 4o 可以免费体验,但免费体验次数很有限。截至 2024 年 5 月 13 日,Plus 用户在 GPT4o 上每 3 小时最多发送 80 条消息。免费套餐的用户将默认使用 GPT4o,且使用 GPT4o 发送的消息数量受到限制,具体数量会根据当前的使用情况和需求而有所不同。当不可用时,免费层用户将切换回 GPT3.5。
2024-10-26
chatgpt4o免费的模型和付费的模型有什么区别
ChatGPT 免费的模型(如 GPT3.5)和付费的模型(如 GPT4o 的 PLUS 套餐)主要有以下区别: 1. 知识更新时间:ChatGPT 3.5 的知识更新到 2022 年 1 月,ChatGPT 4o 的知识更新到 2023 年 10 月,而 ChatGPT 4 更新到 2023 年 12 月。 2. 智能程度:GPT3.5 的智能程度明显低于 GPT4o。 3. 功能:GPT3.5 无法使用 DALL.E3(AI 画图功能)、GPTs 商店和高级数据分析等插件。 4. 费用:想要使用更多功能更智能的 GPT4o 需要升级到 PLUS 套餐,收费标准是 20 美金一个月。GPT4 还有团队版企业版,费用更贵,一般推荐使用 PLUS 套餐即可。 此外,ChatGPT 4o 发布后,虽称可免费体验,但免费体验次数很有限。
2024-10-26
如何连接GPT4o
以下是连接 GPT4o 的方法: 1. 对于 ChatGPT Mac 客户端: 下载地址:persistent.oaistatic.com/sidekick/public/ChatGPT_Desktop_public_latest.dmg 使用 Proxyman、Charles 或您喜欢的网络代理来进行以下操作(需要有 ChatGPT 付费账号,以及网络技术基础):以 ProxyMan 为例 登录一次以触发 API 调用 对 ChatGPT 的 App 启用 SSL 代理(需要配置好 ProxyMan 证书) 再登录一次以触发 API 调用 然后右键点击 ab.chatgpt.com/v1/initialize 选择本地映射,并将所有的 false 替换为 true 再尝试一次,您就应该能顺利登录了。 详细版图文教程: 2. 对于安卓系统: 先在 Google play 中的【支付和订阅】【支付方式】中绑定好银行卡 然后在区 chatgpt 里订阅 Plus,操作如下截图 完成后即可开始使用 ChatGPT 4o
2024-08-18
gpt4o mini有关的文档
以下是关于 GPT4o mini 的相关文档信息: Open AI 发布了 GPT4o mini 模型。其 MMLU 得分为 82%,碾压其他同级别小模型。价格较低,为 0.15 美元/100 万 token 输入和 0.6 美元/100 万 token 输出,比 GPT3.5 Turbo 便宜超过 60%。具有 128k 的大上下文窗口,非常适合 RAG。GPT4o mini 在 API 中支持文本和图片,未来将支持文本、图像、视频和音频输入和输出。GPT4o mini 接替 3.5 成为 ChatGPT 中的免费模型,目前还不支持多模态,而且 4o mini 的 API 一旦涉及到图片 Token 数量也会大增。
2024-08-17
openai发布会内容
以下是关于 OpenAI 发布会的相关内容: 1. 12 月 20 日,OpenAI 发布 AI 大模型风险防范框架文件,OpenAI 董事会有权决定发布新 AI 模型,框架文件提出防范 AI 大模型灾难性风险的路线图,董事会可推翻领导团队关于 AI 模型发布的决策。相关链接:https://openai.com/safety/preparedness 2. 12 月 12 日,OpenAI 连续 12 天 AI 发布会的第五天完整视频(中英文双语字幕),亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作,多平台无缝衔接,涵盖多种应用场景,实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接: 3. OpenAI 将在 11 月 6 日举办首次开发者大会,会上将发布重要更新,目标是让开发者能够更快捷和廉价地开发基于大模型的应用。此次更新最让人期待的部分是将推出 Stateful API,理论上可将大模型应用的开销削减为原来的二十分之一。相关链接:https://mp.weixin.qq.com/s/NPqAeSl3NQ0_wbHzsJSw
2024-12-19
OpenAI前六场发布会的内容提炼
以下是 OpenAI 前六场发布会的部分内容提炼: OpenAI 第六天发布会:ChatGPT 的高级语音模式获得公开访问权限,能通过自然语音与用户对话并理解屏幕内容,降低使用门槛,展示多模态能力和个性化发展潜力。 相关报告:甲子光年发布的《2024 人工智能产业 30 条判断——万千流变,一如既往》涵盖 AI 技术历史发展、当前趋势和未来预测,提到 Transformer 模型和 GPT 系列发展及在多行业应用,探讨了 AI 芯片进步、在科学研究中的角色和对社会的广泛影响,还预测了 AI 产业增长。中信建投证券的海外 AI 应用行业专题《旧金山草根调研与海外 AI 应用进展》长达 100 多页,聚焦旧金山草根调研及海外 AI 应用进展,显示旧金山及硅谷地区 AI 企业众多,AI 应用在 To B 场景如广告、助手、数据分析等领域受关注,长期看好,尤其是 C 端应用潜力,列举了多家公司及其业务领域、功能进展,并提供相关上市公司数据。 OpenAI 首届开发者大会:短短 45 分钟发布会,Sam Altman 表示团队对开发者关注的问题做了六大升级,包括更长的上下文长度、更强的控制、模型的知识升级、多模态、模型微调定制和更高的速率限制,前四条主要关于新模型性能提升,后两点针对企业开发者痛点,同时宣布 API 价格下调。
2024-12-17
OPenAI最近的产品发布会
OpenAI 近期举行了多次产品发布会: 去年 11 月晚些时候发布了基于 GPT3.5 最新版本的消费级产品 ChatGPT。公司内部对是否发布这样强大的工具存在争论,但 Altman 表示支持,认为这是让公众适应 AI 改变日常生活现实的战略一部分。ChatGPT 功能强大,能在 SAT 考试中获大学水平分数、写作文、总结书籍等,还能按各种要求改写。 近期举行了 12 场发布会,推出多个新产品,包括推理模型 o1、文字转视频工具 Sora 等。o1 正式版在复杂推理和数学能力上显著提升,推出的强化微调技术使模型更具专业性。 在 5 月份的 GPT4o 模型发布会上,邀请了可汗学院的创始人 Salman Khan 和他儿子一起使用 GPT4o 辅导孩子在可汗学院上做数学题,这是 OpenAI 第一次将多模态模型能力在教育场景上落地应用的尝试。
2024-12-17
openai发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,称其为世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示多模态推理。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等更多功能。 此外,在 12 月 12 日和 12 月 15 日的宝玉日报中,提到 OpenAI 连续 12 天 AI 发布会的第五天亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作;多平台无缝衔接,支持 iPhone、iPad 和 Mac,涵盖多种应用场景;实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接:https://x.com/dotey/status/1866974269051113543
2024-12-17
open发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,是目前世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示模型的多模态推理能力。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等功能。 新模型 9.12 发布的要点: 1. 发布两个模型:o1 mini,o1 preview。Plus 全量可用 o1 mini 一周 50 条,o1 preview 一周 30 条。 2. 更聪明的思考方式:像人一样花更多时间思考问题,尝试不同策略,能意识到自己的错误。 3. 在复杂任务上表现出色:在物理、化学、生物、数学和编程等领域的挑战性任务上表现得像博士生,在 IMO 和 Codeforces 竞赛中取得高分。 4. 暂时缺少一些功能:目前没有 ChatGPT 那样的网络浏览和文件上传功能,但在复杂推理任务上非常强大。 O1 Pro 版本的要点: 1. 面向专业用户,强大精确。 2. 独有功能包括深度推理能力,可处理复杂数学和科学问题,支持多步推理和专业计算,思考时间约 1 3 分钟;在科学、数学、编程等领域表现出色,提供专业准确解答;支持长文本处理,轻松应对长文档处理与内容生成;提供更多微调选项,用户可根据自身需求进行个性化定制。 3. 对比优势:错误率大幅降低,推理能力显著增强,基准测试表现惊人。 ChatGPT Pro 订阅计划的要点: 1. 费用为每月 200 美元。 2. 目标用户是解决复杂问题的研究人员、工程师和专业人士。 3. 核心功能是使用 o1 Pro 模式,专为数学竞赛、科学研究、代码开发等高要求场景优化,提供更高的准确性和可靠性,适用于严格的技术基准测试任务。 4. 特别支持:OpenAI 为美国医学研究人员提供资助,重点支持罕见病基因发现、痴呆症研究、癌症免疫治疗。 发布会吐槽:直播仅用 30 分钟讲完,像是把一个大更新硬切成了 12 段。总结:o1 基础版主打日常体验,速度快且功能全面;o1 Pro 版深度推理与专业能力爆表,适合更复杂的任务。ChatGPT Pro 订阅计划开启了高性能 AI 工具的新篇章,推动科研与工程领域的新突破!
2024-12-17
openAI 最近的发布会都有哪些主要内容?
OpenAI 最近的发布会主要内容包括: 2023 年 11 月的开发者大会,开放了 GPTs 和 GPT4 Turbo 等一系列内容,不过由于 DDoS 攻击和负载问题,其所有服务断断续续挂了接近一天。 之前还悄咪咪开放了两个新功能,包括可以上传 PDF 等文档进行分析和提问,以及在 GPT4 加持下,代码解释器、图片交谈、图片生成和联网能力可自行选择完成任务。 发布了图像生成模型 sCM 等。
2024-12-16