Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

OpenAI过去12天的发布会总结

Answer

以下是 OpenAI 过去 12 天发布会的总结:

  • 自媒体记录方面:
    • 夕小瑶科技说:o3 发布,可能影响码农工作。
    • 孔某人的低维认知:OpenAI 圣诞 12 天总评,感谢大佬赏饭。
    • MAX 01Founder:一文详解 o3,虽接近 AGI 但使用成本高。
    • 南瓜博士:使用 o3 钱包和脑子可能不够。
    • 数字生命卡兹克:OpenAI 正式发布 o3,通往 AGI 路上已无障碍。
  • 具体发布内容:
    • Day12:o3 与 o3 mini 正式亮相。
    • Day11:ChatGPT 桌面应用,Option+空格快速唤起。
    • Day10:OpenAI 发布电话倾诉功能 1-800-242-8478。
    • Day9:o1 满血版 API 和 4o 实时语音 API 更新。
    • Day8:AI 搜索功能免费开放,并支持实时语音搜索。
    • Day7:ChatGPT 全新“项目”功能发布。
    • Day6:实时视频通话&圣诞老人模式正式上线。
    • Day5:ChatGPT 与 Apple 的深度合作。
    • Day4:直播“翻车”的 Canvas。
    • Day3:Sora 终于上线,有案例和功能详解。
    • Day2:微调 O1 模型,低成本高效率。
    • Day1:强化学习微调的实操案例。
  • 宝玉日报 12 月 18 日:
    • AI 架构与技术选型的 4 条原则:选主流框架、确保测试覆盖率、避免私有框架、采用模块化设计。
    • OpenAI 12 天发布会第 9 天:o1 API 正式版速度更快成本降低,支持多种新功能;语音交互升级,引入 WebRTC 支持,处理费用降低;新增偏好微调功能和工具包,简化 API 密钥申请流程。
  • 易观分析报告预测了 AI 技术未来的关键发展方向,德邦证券报告对 OpenAI 十二日发布会进行深度总结,认为随着大模型能力提升和应用场景扩展,AI 应用商业价值有望实现,建议关注相关领域。
Content generated by AI large model, please carefully verify (powered by aily)

References

OpenAI12场发布会每日记录完整版包含视频翻译-Day1-12

自媒体记录:夕小瑶科技说:o3发布了,摔碎了码农的饭碗https://mp.weixin.qq.com/s/BeHaO1c3RN-5HFYhJ8B1mQ孔某人的低维认知:OpenAI圣诞12天总评:要感谢大佬赏饭https://mp.weixin.qq.com/s/yL2EoP-uE4Q50tTHnX5qRwMAX 01Founder:一文详解o3:无限接近AGI,但你用不起https://mp.weixin.qq.com/s/fa6Znp4qphcyiuZ-mGal4g南瓜博士:使用o3?我的钱包和脑子都不够https://mp.weixin.qq.com/s/UBSz2A_FjLXZJnRA5u9YiQ数字生命卡兹克:OpenAI正式发布o3-通往AGI的路上,已经没有了任何阻碍。https://mp.weixin.qq.com/s/fzUXLrWY7pLU5uEtrtOouQDay12 o3与o3 mini正式亮相Day11 ChatGPT桌面应用,Option+空格快速唤起Day10 OpenAI发布电话倾诉功能1-800-242-8478Day9 o1满血版API和4o实时语音API更新Day8 AI搜索功能免费开放,并支持实时语音搜索Day7 ChatGPT全新“项目”功能发布Day6实时视频通话&圣诞老人模式正式上线Day5 ChatGPT与Apple的深度合作Day4直播“翻车”的CanvasDay3 Sora终于上线,案例和功能详解Day2微调O1模型,低成本高效率Day1强化学习微调的实操案例!

宝玉 日报

🫧宝玉日报「12月18日」✨✨✨✨✨✨✨✨1⃣️🧠AI架构与技术选型的4条原则选主流框架:优先选择语料多、生成质量好的语言和框架。测试覆盖率:用AI辅助生成测试代码,确保代码质量。避免私有框架:尽量使用流行框架生成独立模块代码。模块化设计:降低耦合度,方便AI快速开发和维护。🔗[https://x.com/dotey/status/1869209113726529989](https://x.com/dotey/status/1869209113726529989)2⃣️💻OpenAI 12天发布会第9天:开发者主题日o1 API正式版:速度更快,成本降低60%,支持视觉识别、函数调用、结构化输出等功能。语音交互升级:引入WebRTC支持,12行代码即可实现实时语音交互,音频处理费用降低60%。偏好微调功能:让AI回答更具个性化,企业AI准确率提升显著。新增Go和Java工具包,简化API密钥申请流程。🔗[https://x.com/dotey/status/1869166100367151452](https://x.com/dotey/status/1869166100367151452)3⃣️🎭Sora眼中的西施:穿越古代的浪漫邂逅Prompt描述了在繁华古代集市遇见西施的唯美场景。镜头化叙事,展现了主角与西施的心动瞬间及互动细节。🔗[https://x.com/dotey/status/1869087190447280303](https://x.com/dotey/status/1869087190447280303)

通往 AGI 之路

易观分析发布的《[2025年AI产业发展十大趋势报告](https://waytoagi.feishu.cn/record/ROgmrSNMxerHcUc9iuQczrY1n7B)》预测了AI技术未来的关键发展方向。报告指出,大模型技术将进入复杂推理阶段,多模态模型能力将升级,Agent将进化为超级智能体,AI原生应用将形成服务闭环,现存应用将加速拥抱AI,AIGC将赋能IP全生态,硬件将全面AI化,AI将赋能千行百业,企业需利用专有数据形成深度洞察,AI应用的深化将对企业组织能力提出新要求。德邦证券:《[AI应用产业化的开端:OpenAI十二日发布会深度总结](https://waytoagi.feishu.cn/record/GWH9rWHI4es7v5cvBcbctVuNnkG)》OpenAI发布了多个新旧产品,如Sora、高级语音、o1、Canvas等,以及全新产品如强化微调、Project、o1 API等,旨在提升AI的推理性能和多模态交互能力,朝人工通用智能(AGI)目标迈进。报告认为,随着大模型能力的提升和应用场景的扩展,AI应用的商业价值有望实现,建议关注to B/C Agent、多模态AI和推理算力等领域。

Others are asking
12种prompt框架
以下是 12 种 Prompt 框架: 1. Instruction(指令):说明希望 AI 执行的具体任务,例如翻译或写一段文字。 2. Context(背景信息):提供更多背景信息,引导模型做出更贴合需求的回复。 3. Input Data(输入数据):告知模型需要处理的数据。 4. Output Indicator(输出引导):告知模型输出的类型或风格。 5. Capacity and Role(能力和角色):明确 ChatGPT 应扮演的角色。 6. Insight(见解):提供请求背后的见解、背景和上下文。 7. Statement(声明):明确要求 ChatGPT 做什么。 8. Personality(个性):指定希望 ChatGPT 以何种风格、个性或方式回应。 9. Experiment(实验):请求 ChatGPT 回复多个示例。 10. Background(背景):说明背景,为 ChatGPT 提供充足信息。 11. Role(角色):指定希望 ChatGPT 扮演的角色。 12. Objectives(目标):说明希望实现的目标。 此外,还有一些其他相关的框架概念,如: 1. Key Result(关键结果):明确想要的具体效果,并试验和调整。 2. Evolve(试验并改进):包括改进输入、改进答案和重新生成等方法。 3. CONTEXT 上下文背景:为对话设定舞台。 4. OBJECTIVE 目的:描述目标。 5. ACTION 行动:解释所需的动作。 6. SCENARIO 方案:描述场景。 7. TASK 任务:描述任务。 8. ICIO 框架:相关链接 9. CRISPE 框架:相关链接 10. BROKE 框架:作者陈财猫,相关链接 11. PATFU 泡芙提示词框架:作者口袋君,包括 Problem(问题)、Aera(领域)、Task(任务)等。
2025-01-06
openai 12天都有哪些内容
以下是 OpenAI 12 天相关的内容: 12 月 18 日: API 正式版:速度更快,成本降低 60%,支持视觉识别、函数调用、结构化输出等功能。 语音交互升级:引入 WebRTC 支持,12 行代码即可实现实时语音交互,音频处理费用降低 60%。 偏好微调功能:让 AI 回答更具个性化,企业 AI 准确率提升显著。 新增 Go 和 Java 工具包,简化 API 密钥申请流程。 12 月 12 日: 苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作。 多平台无缝衔接:支持 iPhone、iPad 和 Mac,涵盖 Siri 集成、写作工具增强、视觉智能分析等多种应用场景。 实用场景:圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。 12 月 5 日: OpenAI 近日宣布将举行为期 12 天的活动,期间每天直播展示新功能或工具。 DeepMind 发布了基础世界模型 Genie 2,可以通过一张图片生成可操作的 3D 环境,实现智能体的实时交互与行为预测。 真格基金投资副总裁 Monica 在其播客「OnBoard!」发布的最新一期对谈中,与在一线大模型机构有实际训练大语言模型(LLM)经验的研究员针对 OpenAI o1 模型进行了三个多小时的拆解与解读。强化学习如何给大语言模型带来新的逻辑推理能力?这种能力的来源、实现方式和未来潜力又是怎样的?o1 带来的「新范式」会对行业有怎样的影响?
2024-12-20
输出12个精选prompt框架
以下是 12 种精选的 Prompt 框架: 1. Key Result(关键结果):明确想要的具体效果,通过试验并调整。包括改进输入、改进答案和重新生成等方法。 2. Evolve(试验并改进):三种改进方法自由组合,如从答案不足之处改进背景、目标与关键结果,在后续对话中指正 ChatGPT 答案缺点,或在 Prompt 不变情况下多次生成结果优中选优。 3. CONTEXT(上下文背景):为对话设定舞台。 4. OBJECTIVE(目的):描述目标。 5. ACTION(行动):解释所需的动作。 6. SCENARIO(方案):描述场景。 7. TASK(任务):描述任务。 8. ICIO 框架:相关链接 9. CRISPE 框架:相关链接 10. BROKE 框架:作者陈财猫,相关链接 11. PATFU 泡芙提示词框架:作者口袋君,包括清晰表述需要解决的问题、问题所在领域及需要扮演的角色、解决问题需要执行的具体任务。 12. Format(格式):详细定义输出的格式和限制条件,以及记录提示词版本并根据输出结果对提示词迭代。
2024-12-16
11月到12月AI领域的发展情况
在过去的 11 月到 12 月期间,AI 领域呈现出以下发展情况: 流量增长:在过去 12 个月里,人工智能行业是重要的技术发展之一。从 2022 年 9 月到 2023 年 8 月,研究的工具总流量增长了 10.7 倍,从起始的 2.418 亿次访问增长到 28 亿次访问。其中,流量的飞跃从去年 11 月开始,ChatGPT 成为最快达到 100 万用户的平台。2023 年 5 月达到峰值约 41 亿,之后有所回落,但人们的兴趣仍巨大。 创新机会: 整合组件使 AI 系统全面理解物理世界环境,做出更智能决策和行动,对开发先进机器人和自动化系统有益。 算力成为核心竞争力关键指标,科技巨头投入巨资建设超大规模 GPU 集群。如 xAI 公司建成超级计算机,Meta 训练新一代模型。 行业竞争格局转向“建设为王”的新时代,数据中心扩展成为重点,建设效率可能决定在 AI 下一阶段的表现。 高质量数据稀缺。 行业动态:2024 年 11 月,AI 行业呈现快速发展态势,大厂纷纷推出新功能,加速产品进化,AI 技术开始渗透到多个领域。如 Claude 上线桌面端和语音输入、Blendbox 推出图层式 AI 生成工具、阿里发布 EcomlD 支持生成真实人像、Suno 上线 Personas 功能等。
2024-12-06
NVIDIA Graphics Device with CUDA capability sm_120 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_61 sm_70 sm_75 sm_80 sm_86 sm_90 compute_37. If you want to use th
您好,出现“NVIDIA Graphics Device with CUDA capability sm_120 is not compatible with the current PyTorch installation. The current PyTorch install supports CUDA capabilities sm_37 sm_50 sm_60 sm_61 sm_70 sm_75 sm_80 sm_86 sm_90 compute_37.”这种情况,意味着您所使用的 NVIDIA 显卡的 CUDA 计算能力(sm_120)与当前安装的 PyTorch 版本不兼容。当前安装的 PyTorch 支持的 CUDA 计算能力为 sm_37 至 sm_90 以及 compute_37 。您可能需要重新安装与您显卡 CUDA 计算能力相匹配的 PyTorch 版本,或者升级您的显卡驱动程序来解决此兼容性问题。
2024-11-30
帮我写一段120字的英文短文,回答这个问题:讨论终身学习的重要性
Lifelong learning is of great significance. It enables us to keep up with the everchanging world and acquire new skills and knowledge. It broadens our horizons, enhances our adaptability, and enriches our lives. It also helps us stay mentally active and engaged, promoting personal growth and development throughout our lives.
2024-11-04
openai
以下是关于 OpenAI 的相关信息: AGI 的 5 个等级: 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 推理者(Reasoners):具备人类推理水平,能解决复杂问题,如 ChatGPT,可根据上下文和文件提供详细分析和意见。 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品执行任务后仍需人类参与,尚未达到完全智能体水平。 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 模型: GPT4(Beta):一组改进 GPT3.5 的模型,可理解和生成自然语言或代码。 GPT3.5:一组改进 GPT3 的模型,可理解并生成自然语言或代码。 DALL·E(Beta):可以在给定自然语言提示的情况下生成和编辑图像的模型。 Whisper(Beta):可以将音频转换为文本的模型。 Embeddings:一组可以将文本转换为数字形式的模型。 Codex(Limited Beta):一组可以理解和生成代码的模型,包括将自然语言转换为代码。 Moderation:可以检测文本是否敏感或不安全的微调模型。 GPT3:一组可以理解和生成自然语言的模型。 GPT、DALL·E、Sora 相关:Sora 的出现证明了 OpenAI 试图让计算机模拟真实物理世界的野心及对自身技术路线的坚持。从 OpenAI 发布的 Sora 的技术报告中可看到对过往大语言模型训练成功经验的复用。加州大学伯克利分校计算机科学 PHD、知乎作者 SIY.Z 从技术实现上分析了 Sora 成功的部分原因,以及从商业和技术趋势上分析了 OpenAI 能跑通全部技术栈的原因,并尝试预测了 OpenAI 下一步的进展。
2024-12-27
openai 发布的sora最新模型中,生成视频的提示词与一般问答提示词有什么区别或者注意事项?
Sora 是 OpenAI 于 2024 年 2 月发布的文本到视频的生成式 AI 模型。 生成视频的提示词与一般问答提示词的区别和注意事项如下: 1. 对于视频生成,神经网络是单射函数,拟合的是文本到视频的映射。由于视频的动态性高,值域大,因此需要丰富且复杂的提示词来扩大定义域,以学好这个函数。 2. 详细的文本提示能迫使神经网络学习文本到视频内容的映射,加强对提示词的理解和服从。 3. 和 DALL·E 3 一样,OpenAI 用内部工具(很可能基于 GPT4v)给视频详尽的描述,提升了模型服从提示词的能力以及视频的质量(包括视频中正确显示文本的能力)。但这会导致在使用时的偏差,即用户的描述相对较短。OpenAI 用 GPT 来扩充用户的描述以改善这个问题,并提高使用体验和视频生成的多样性。 4. 除了文本,Sora 也支持图像或者视频作为提示词,支持 SDEdit,并且可以向前或者向后生成视频,因此可以进行多样的视频编辑和继续创作,比如生成首尾相连重复循环的视频,甚至连接两个截然不同的视频。 以下是一些 Sora 的案例提示词,如:“小土豆国王戴着雄伟的王冠,坐在王座上,监督着他们广阔的土豆王国,里面充满了土豆臣民和土豆城堡。”“咖啡馆的小地图立体模型,装饰着室内植物。木梁在上方纵横交错,冷萃咖啡站里摆满了小瓶子和玻璃杯。”“一张写有‘SORA’的写实云朵图像。”“一群萨摩耶小狗学习成为厨师的电影预告片‘cinematic trailer for a group of samoyed puppies learning to become chefs’”
2024-12-27
openai
OpenAI 的相关信息如下: 模型: OpenAI API 由多种具有不同功能和价位的模型提供支持,还可通过微调针对特定用例对原始基本模型进行有限定制。 具体模型包括:GPT4(Beta),是一组改进 GPT3.5 的模型,能理解和生成自然语言或代码;GPT3.5,是一组改进 GPT3 的模型,能理解并生成自然语言或代码;DALL·E(Beta),能在给定自然语言提示的情况下生成和编辑图像;Whisper(Beta),能将音频转换为文本;Embeddings,能将文本转换为数字形式;Codex(Limited Beta),能理解和生成代码,包括将自然语言转换为代码;Moderation,能检测文本是否敏感或不安全的微调模型;GPT3,能理解和生成自然语言。 为何能跑通所有 AGI 技术栈: 方法论明确:通用模型能用到更多数据,减少技术栈,OpenAI 未来可能会继续走通用模型的道路,降低微调等特化的需求,继续增加模型的上下文长度。 用一个模型为另一个模型提供标注:OpenAI 的 Dall E 和 Sora 都用到了大量可能来自于 GPT vision 的数据标注,未来可能会继续加强各个模型的连接。 Transformer 架构:其在各个模态和技术栈具有优势,能复用模型参数和使用一套基础设施框架训练不同模型,新模型若要取代,需通过缩放定律的检验。 稀疏模型。
2024-12-25
openai发布会内容
以下是关于 OpenAI 发布会的相关内容: 1. 12 月 20 日,OpenAI 发布 AI 大模型风险防范框架文件,OpenAI 董事会有权决定发布新 AI 模型,框架文件提出防范 AI 大模型灾难性风险的路线图,董事会可推翻领导团队关于 AI 模型发布的决策。相关链接:https://openai.com/safety/preparedness 2. 12 月 12 日,OpenAI 连续 12 天 AI 发布会的第五天完整视频(中英文双语字幕),亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作,多平台无缝衔接,涵盖多种应用场景,实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接: 3. OpenAI 将在 11 月 6 日举办首次开发者大会,会上将发布重要更新,目标是让开发者能够更快捷和廉价地开发基于大模型的应用。此次更新最让人期待的部分是将推出 Stateful API,理论上可将大模型应用的开销削减为原来的二十分之一。相关链接:https://mp.weixin.qq.com/s/NPqAeSl3NQ0_wbHzsJSw
2024-12-19
openai 的偏好微调
偏好微调(Direct Preference Optimization)是 OpenAI 的一种新的微调方式。其操作方式是通过向模型展示两个不同的输出结果并指出哪个更好,模型将倾向于生成类似更“好”的结果。这种微调方式可以调整模型输出的风格,增加某种类型输出的权重,减少其他类型的权重。
2024-12-18
OpenAI前六场发布会的内容提炼
以下是 OpenAI 前六场发布会的部分内容提炼: OpenAI 第六天发布会:ChatGPT 的高级语音模式获得公开访问权限,能通过自然语音与用户对话并理解屏幕内容,降低使用门槛,展示多模态能力和个性化发展潜力。 相关报告:甲子光年发布的《2024 人工智能产业 30 条判断——万千流变,一如既往》涵盖 AI 技术历史发展、当前趋势和未来预测,提到 Transformer 模型和 GPT 系列发展及在多行业应用,探讨了 AI 芯片进步、在科学研究中的角色和对社会的广泛影响,还预测了 AI 产业增长。中信建投证券的海外 AI 应用行业专题《旧金山草根调研与海外 AI 应用进展》长达 100 多页,聚焦旧金山草根调研及海外 AI 应用进展,显示旧金山及硅谷地区 AI 企业众多,AI 应用在 To B 场景如广告、助手、数据分析等领域受关注,长期看好,尤其是 C 端应用潜力,列举了多家公司及其业务领域、功能进展,并提供相关上市公司数据。 OpenAI 首届开发者大会:短短 45 分钟发布会,Sam Altman 表示团队对开发者关注的问题做了六大升级,包括更长的上下文长度、更强的控制、模型的知识升级、多模态、模型微调定制和更高的速率限制,前四条主要关于新模型性能提升,后两点针对企业开发者痛点,同时宣布 API 价格下调。
2024-12-17
OPenAI最近的产品发布会
OpenAI 近期举行了多次产品发布会: 去年 11 月晚些时候发布了基于 GPT3.5 最新版本的消费级产品 ChatGPT。公司内部对是否发布这样强大的工具存在争论,但 Altman 表示支持,认为这是让公众适应 AI 改变日常生活现实的战略一部分。ChatGPT 功能强大,能在 SAT 考试中获大学水平分数、写作文、总结书籍等,还能按各种要求改写。 近期举行了 12 场发布会,推出多个新产品,包括推理模型 o1、文字转视频工具 Sora 等。o1 正式版在复杂推理和数学能力上显著提升,推出的强化微调技术使模型更具专业性。 在 5 月份的 GPT4o 模型发布会上,邀请了可汗学院的创始人 Salman Khan 和他儿子一起使用 GPT4o 辅导孩子在可汗学院上做数学题,这是 OpenAI 第一次将多模态模型能力在教育场景上落地应用的尝试。
2024-12-17
openai发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,称其为世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示多模态推理。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等更多功能。 此外,在 12 月 12 日和 12 月 15 日的宝玉日报中,提到 OpenAI 连续 12 天 AI 发布会的第五天亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作;多平台无缝衔接,支持 iPhone、iPad 和 Mac,涵盖多种应用场景;实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接:https://x.com/dotey/status/1866974269051113543
2024-12-17
open发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,是目前世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示模型的多模态推理能力。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等功能。 新模型 9.12 发布的要点: 1. 发布两个模型:o1 mini,o1 preview。Plus 全量可用 o1 mini 一周 50 条,o1 preview 一周 30 条。 2. 更聪明的思考方式:像人一样花更多时间思考问题,尝试不同策略,能意识到自己的错误。 3. 在复杂任务上表现出色:在物理、化学、生物、数学和编程等领域的挑战性任务上表现得像博士生,在 IMO 和 Codeforces 竞赛中取得高分。 4. 暂时缺少一些功能:目前没有 ChatGPT 那样的网络浏览和文件上传功能,但在复杂推理任务上非常强大。 O1 Pro 版本的要点: 1. 面向专业用户,强大精确。 2. 独有功能包括深度推理能力,可处理复杂数学和科学问题,支持多步推理和专业计算,思考时间约 1 3 分钟;在科学、数学、编程等领域表现出色,提供专业准确解答;支持长文本处理,轻松应对长文档处理与内容生成;提供更多微调选项,用户可根据自身需求进行个性化定制。 3. 对比优势:错误率大幅降低,推理能力显著增强,基准测试表现惊人。 ChatGPT Pro 订阅计划的要点: 1. 费用为每月 200 美元。 2. 目标用户是解决复杂问题的研究人员、工程师和专业人士。 3. 核心功能是使用 o1 Pro 模式,专为数学竞赛、科学研究、代码开发等高要求场景优化,提供更高的准确性和可靠性,适用于严格的技术基准测试任务。 4. 特别支持:OpenAI 为美国医学研究人员提供资助,重点支持罕见病基因发现、痴呆症研究、癌症免疫治疗。 发布会吐槽:直播仅用 30 分钟讲完,像是把一个大更新硬切成了 12 段。总结:o1 基础版主打日常体验,速度快且功能全面;o1 Pro 版深度推理与专业能力爆表,适合更复杂的任务。ChatGPT Pro 订阅计划开启了高性能 AI 工具的新篇章,推动科研与工程领域的新突破!
2024-12-17
openAI 最近的发布会都有哪些主要内容?
OpenAI 最近的发布会主要内容包括: 2023 年 11 月的开发者大会,开放了 GPTs 和 GPT4 Turbo 等一系列内容,不过由于 DDoS 攻击和负载问题,其所有服务断断续续挂了接近一天。 之前还悄咪咪开放了两个新功能,包括可以上传 PDF 等文档进行分析和提问,以及在 GPT4 加持下,代码解释器、图片交谈、图片生成和联网能力可自行选择完成任务。 发布了图像生成模型 sCM 等。
2024-12-16
在中国能使用的,可以总结一本书精华的AI软件
目前在中国可以使用的能够总结一本书精华的 AI 软件相对较少。一些常见的具有文本处理和分析能力的 AI 工具,如百度的文心一言、字节跳动的云雀等,可能在一定程度上辅助您进行书籍内容的理解和总结,但专门用于精准总结一本书精华的成熟软件还比较有限。
2025-01-05
在中国可以总结一本书精华的AI 软件
目前在中国,尚未有一款被广泛认可且专门用于总结一本书精华的 AI 软件。但一些通用的 AI 语言模型,如百度的文心一言、阿里的通义千问等,在一定程度上可以辅助您进行书籍内容的总结和理解。您可以通过输入书籍的相关内容,让它们为您生成概括性的文字。不过,其总结效果可能因输入内容的质量和复杂性而有所不同。
2025-01-05
能够总结一本书精华的AI 软件
以下是一些能够总结一本书精华的 AI 软件: 1. 讯飞听见会议总结功能:利用自然语言处理和机器学习,自动总结会议发言内容,市场规模达数亿美元。 2. 彩云天气分时预报:通过数据分析和机器学习,提供精准的分时天气预报,市场规模达数亿美元。 3. 医渡云病历分析系统:借助数据分析和自然语言处理,分析医疗病历以辅助诊断,市场规模达数十亿美元。 4. 书法临摹软件:使用图像识别和数据分析,帮助书法爱好者进行临摹,市场规模达数亿美元。 5. 游戏内商城推荐功能:基于数据分析和机器学习,根据玩家需求推荐游戏道具,市场规模达数亿美元。 OpenAI 对于总结长文档,如一本书的方法研究表明,由于 GPT 的上下文长度固定,不能在单次对话中总结超过特定长度的文本。对于很长的文档,如一本书,可以通过一系列的提示来分别总结每个章节,将章节摘要拼接并再次总结,形成“摘要的摘要”,这个过程可递归执行,直到完整总结整个文档。若需要依赖前面章节信息理解后面章节,在总结时可包含前情提要。OpenAI 之前用 GPT3 做过类似研究,探讨了这种逐步摘要方法的有效性。
2025-01-05
YouTube视频总结工具
以下是关于 YouTube 视频总结工具的相关信息: 从科学家和开发者的视角来看,ChatGPT 本身无法直接总结 YouTube 视频,但有些免费服务可以帮助转录或下载视频的自动生成字幕。将得到的文字保存为文档上传,让 ChatGPT 帮忙转化为简洁要点。例如对于技术性内容的视频,如操控 wavetable 的技巧,使用这种方法能节省时间。对于故意拖长的视频也可采用同样方法,同时可以通过其他方式支持优秀的内容创作者。 以下是一些相关的资源和工具: 此外,还有一些与 GPT 相关的项目,如:
2025-01-05
最近有什么 AI 资讯,给我总结出来
以下是为您总结的近期 AI 资讯: 简报: TLDR AI: The Sequence: Deep Learning Weekly: Ben’s Bites: Last week in ai: Your guide to AI: 播客: No Priors podcast hosted by Sarah Guo and Elad Gil Robot Brains Podcast hosted by Pieter Abbeel Lex Fridman Podcast hosted by Lex Fridman The Gradient podcast hosted by Daniel Bashir Generally Intelligent hosted by Kanjun Qiu Last Week in AI 会议: 工业界:World AI Cannes Festival 其他资讯: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器: 12 月 26 日资讯: Meta:AI 建模技术 PartGen,一种从各种模态(包括文本、图像、3D 模型)进行组合/零件级 3D 生成和重建的新方法。地址: Threejs ai:生成极简 3D 场景工具,由网友@vidythatte 开发的根据文字/图片提示生成极简 3D 场景工具,输入提示文字即可迭代构建这样的场景,可以用它制作简单的故事交互应用。地址:
2025-01-03
推荐一个写体制内比较靠谱的年终总结人工智能软件
以下是为您推荐的一些可能有助于写体制内年终总结的工具和资源: 《》:涵盖了生成式 AI 相关数据。 总结类 AI 工具:
2024-12-30