Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

OpenAI过去12天的发布会总结

Answer

以下是 OpenAI 过去 12 天发布会的总结:

  • 自媒体记录方面:
    • 夕小瑶科技说:o3 发布,可能影响码农工作。
    • 孔某人的低维认知:OpenAI 圣诞 12 天总评,感谢大佬赏饭。
    • MAX 01Founder:一文详解 o3,虽接近 AGI 但使用成本高。
    • 南瓜博士:使用 o3 钱包和脑子可能不够。
    • 数字生命卡兹克:OpenAI 正式发布 o3,通往 AGI 路上已无障碍。
  • 具体发布内容:
    • Day12:o3 与 o3 mini 正式亮相。
    • Day11:ChatGPT 桌面应用,Option+空格快速唤起。
    • Day10:OpenAI 发布电话倾诉功能 1-800-242-8478。
    • Day9:o1 满血版 API 和 4o 实时语音 API 更新。
    • Day8:AI 搜索功能免费开放,并支持实时语音搜索。
    • Day7:ChatGPT 全新“项目”功能发布。
    • Day6:实时视频通话&圣诞老人模式正式上线。
    • Day5:ChatGPT 与 Apple 的深度合作。
    • Day4:直播“翻车”的 Canvas。
    • Day3:Sora 终于上线,有案例和功能详解。
    • Day2:微调 O1 模型,低成本高效率。
    • Day1:强化学习微调的实操案例。
  • 宝玉日报 12 月 18 日:
    • AI 架构与技术选型的 4 条原则:选主流框架、确保测试覆盖率、避免私有框架、采用模块化设计。
    • OpenAI 12 天发布会第 9 天:o1 API 正式版速度更快成本降低,支持多种新功能;语音交互升级,引入 WebRTC 支持,处理费用降低;新增偏好微调功能和工具包,简化 API 密钥申请流程。
  • 易观分析报告预测了 AI 技术未来的关键发展方向,德邦证券报告对 OpenAI 十二日发布会进行深度总结,认为随着大模型能力提升和应用场景扩展,AI 应用商业价值有望实现,建议关注相关领域。
Content generated by AI large model, please carefully verify (powered by aily)

References

OpenAI12场发布会每日记录完整版包含视频翻译-Day1-12

自媒体记录:夕小瑶科技说:o3发布了,摔碎了码农的饭碗https://mp.weixin.qq.com/s/BeHaO1c3RN-5HFYhJ8B1mQ孔某人的低维认知:OpenAI圣诞12天总评:要感谢大佬赏饭https://mp.weixin.qq.com/s/yL2EoP-uE4Q50tTHnX5qRwMAX 01Founder:一文详解o3:无限接近AGI,但你用不起https://mp.weixin.qq.com/s/fa6Znp4qphcyiuZ-mGal4g南瓜博士:使用o3?我的钱包和脑子都不够https://mp.weixin.qq.com/s/UBSz2A_FjLXZJnRA5u9YiQ数字生命卡兹克:OpenAI正式发布o3-通往AGI的路上,已经没有了任何阻碍。https://mp.weixin.qq.com/s/fzUXLrWY7pLU5uEtrtOouQDay12 o3与o3 mini正式亮相Day11 ChatGPT桌面应用,Option+空格快速唤起Day10 OpenAI发布电话倾诉功能1-800-242-8478Day9 o1满血版API和4o实时语音API更新Day8 AI搜索功能免费开放,并支持实时语音搜索Day7 ChatGPT全新“项目”功能发布Day6实时视频通话&圣诞老人模式正式上线Day5 ChatGPT与Apple的深度合作Day4直播“翻车”的CanvasDay3 Sora终于上线,案例和功能详解Day2微调O1模型,低成本高效率Day1强化学习微调的实操案例!

宝玉 日报

🫧宝玉日报「12月18日」✨✨✨✨✨✨✨✨1⃣️🧠AI架构与技术选型的4条原则选主流框架:优先选择语料多、生成质量好的语言和框架。测试覆盖率:用AI辅助生成测试代码,确保代码质量。避免私有框架:尽量使用流行框架生成独立模块代码。模块化设计:降低耦合度,方便AI快速开发和维护。🔗[https://x.com/dotey/status/1869209113726529989](https://x.com/dotey/status/1869209113726529989)2⃣️💻OpenAI 12天发布会第9天:开发者主题日o1 API正式版:速度更快,成本降低60%,支持视觉识别、函数调用、结构化输出等功能。语音交互升级:引入WebRTC支持,12行代码即可实现实时语音交互,音频处理费用降低60%。偏好微调功能:让AI回答更具个性化,企业AI准确率提升显著。新增Go和Java工具包,简化API密钥申请流程。🔗[https://x.com/dotey/status/1869166100367151452](https://x.com/dotey/status/1869166100367151452)3⃣️🎭Sora眼中的西施:穿越古代的浪漫邂逅Prompt描述了在繁华古代集市遇见西施的唯美场景。镜头化叙事,展现了主角与西施的心动瞬间及互动细节。🔗[https://x.com/dotey/status/1869087190447280303](https://x.com/dotey/status/1869087190447280303)

通往 AGI 之路

易观分析发布的《[2025年AI产业发展十大趋势报告](https://waytoagi.feishu.cn/record/ROgmrSNMxerHcUc9iuQczrY1n7B)》预测了AI技术未来的关键发展方向。报告指出,大模型技术将进入复杂推理阶段,多模态模型能力将升级,Agent将进化为超级智能体,AI原生应用将形成服务闭环,现存应用将加速拥抱AI,AIGC将赋能IP全生态,硬件将全面AI化,AI将赋能千行百业,企业需利用专有数据形成深度洞察,AI应用的深化将对企业组织能力提出新要求。德邦证券:《[AI应用产业化的开端:OpenAI十二日发布会深度总结](https://waytoagi.feishu.cn/record/GWH9rWHI4es7v5cvBcbctVuNnkG)》OpenAI发布了多个新旧产品,如Sora、高级语音、o1、Canvas等,以及全新产品如强化微调、Project、o1 API等,旨在提升AI的推理性能和多模态交互能力,朝人工通用智能(AGI)目标迈进。报告认为,随着大模型能力的提升和应用场景的扩展,AI应用的商业价值有望实现,建议关注to B/C Agent、多模态AI和推理算力等领域。

Others are asking
12 个精选 prompt 框架
以下是 12 个精选的 prompt 框架: 1. ICIO 框架: 指令:执行的具体任务。 背景信息:提供执行任务的背景信息、上下文内容,以便大模型更好地回答。 输入信息:大模型需要用到的一些信息。 输出信息:明确输出的具体信息的要求,比如字数、风格、格式。 2. BROKE 框架:通过 GPT 的设计提示,提升整体反馈的效率。 背景:提供足够背景信息,让大模型理解问题的上下文。 角色设定:特定的角色,让 GPT 根据特定的角色能力和特点来形成响应。 目标:明确任务的目标,让大模型知道您想让它做什么。 结果定义:明确可以衡量的结果,让大模型清楚自己做的情况。 调整:根据具体的情况,调整具体的结果。 3. CRISPIE 框架: 能力和角色:您期望大模型扮演的角色洞察,提供幕后洞察力、背景信息和上下文。 声明:简洁明了地说明希望完成的任务。 个性:回应的风格、个性或者方式。 实验:提供多个回答的示例。 4. 课件中的 Prompt 之术“三板斧”: 分配角色。 给出示例(fewshots)。 思维链(ChainofThought)。
2025-02-06
12个prompt 框架
以下是 12 种 Prompt 框架: 1. Instruction(指令):即希望 AI 执行的具体任务,如翻译或写一段文字。 2. Context(背景信息):给 AI 更多背景信息,引导模型做出更贴合需求的回复。 3. Input Data(输入数据):告知模型需要处理的数据。 4. Output Indicator(输出引导):告知模型输出的类型或风格。 5. Capacity and Role(能力和角色):ChatGPT 应扮演的角色。 6. Insight(见解):提供请求背后的见解、背景和上下文。 7. Statement(声明):说明要求 ChatGPT 做什么。 8. Personality(个性):希望 ChatGPT 以何种风格、个性或方式回应。 9. Experiment(实验):请求 ChatGPT 回复多个示例。 10. Background(背景):说明背景,为 ChatGPT 提供充足信息。 11. Role(角色):希望 ChatGPT 扮演的角色。 12. Objectives(目标):希望实现的目标。 此外,还有以下框架: 1. TASK(任务):定义特定任务。 2. ACTION(行动):描述需要做的事情。 3. GOAL(目标):解释最终目标。 4. INPUT(输入):描述信息或资源。 5. STEPS(步骤):询问详细的步骤。 6. EXPECTATION(期望):描述所需的结果。 7. REQUEST(请求):描述您的要求。 8. Key Result(关键结果):要什么具体效果,试验并调整。 9. Evolve(试验并改进):三种改进方法自由组合,包括改进输入、改进答案、重新生成。 10. CONTEXT(上下文背景):为对话设定舞台。 11. OBJECTIVE(目的):描述目标。 12. SCENARIO(方案):描述场景。 同时,还有一些特定的框架,如 ICIO 框架、CRISPE 框架、BROKE 框架等。
2025-01-23
12种prompt框架
以下是 12 种 Prompt 框架: 1. Instruction(指令):说明希望 AI 执行的具体任务,例如翻译或写一段文字。 2. Context(背景信息):提供更多背景信息,引导模型做出更贴合需求的回复。 3. Input Data(输入数据):告知模型需要处理的数据。 4. Output Indicator(输出引导):告知模型输出的类型或风格。 5. Capacity and Role(能力和角色):明确 ChatGPT 应扮演的角色。 6. Insight(见解):提供请求背后的见解、背景和上下文。 7. Statement(声明):明确要求 ChatGPT 做什么。 8. Personality(个性):指定希望 ChatGPT 以何种风格、个性或方式回应。 9. Experiment(实验):请求 ChatGPT 回复多个示例。 10. Background(背景):说明背景,为 ChatGPT 提供充足信息。 11. Role(角色):指定希望 ChatGPT 扮演的角色。 12. Objectives(目标):说明希望实现的目标。 此外,还有一些其他相关的框架概念,如: 1. Key Result(关键结果):明确想要的具体效果,并试验和调整。 2. Evolve(试验并改进):包括改进输入、改进答案和重新生成等方法。 3. CONTEXT 上下文背景:为对话设定舞台。 4. OBJECTIVE 目的:描述目标。 5. ACTION 行动:解释所需的动作。 6. SCENARIO 方案:描述场景。 7. TASK 任务:描述任务。 8. ICIO 框架:相关链接 9. CRISPE 框架:相关链接 10. BROKE 框架:作者陈财猫,相关链接 11. PATFU 泡芙提示词框架:作者口袋君,包括 Problem(问题)、Aera(领域)、Task(任务)等。
2025-01-06
openai 12天都有哪些内容
以下是 OpenAI 12 天相关的内容: 12 月 18 日: API 正式版:速度更快,成本降低 60%,支持视觉识别、函数调用、结构化输出等功能。 语音交互升级:引入 WebRTC 支持,12 行代码即可实现实时语音交互,音频处理费用降低 60%。 偏好微调功能:让 AI 回答更具个性化,企业 AI 准确率提升显著。 新增 Go 和 Java 工具包,简化 API 密钥申请流程。 12 月 12 日: 苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作。 多平台无缝衔接:支持 iPhone、iPad 和 Mac,涵盖 Siri 集成、写作工具增强、视觉智能分析等多种应用场景。 实用场景:圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。 12 月 5 日: OpenAI 近日宣布将举行为期 12 天的活动,期间每天直播展示新功能或工具。 DeepMind 发布了基础世界模型 Genie 2,可以通过一张图片生成可操作的 3D 环境,实现智能体的实时交互与行为预测。 真格基金投资副总裁 Monica 在其播客「OnBoard!」发布的最新一期对谈中,与在一线大模型机构有实际训练大语言模型(LLM)经验的研究员针对 OpenAI o1 模型进行了三个多小时的拆解与解读。强化学习如何给大语言模型带来新的逻辑推理能力?这种能力的来源、实现方式和未来潜力又是怎样的?o1 带来的「新范式」会对行业有怎样的影响?
2024-12-20
输出12个精选prompt框架
以下是 12 种精选的 Prompt 框架: 1. Key Result(关键结果):明确想要的具体效果,通过试验并调整。包括改进输入、改进答案和重新生成等方法。 2. Evolve(试验并改进):三种改进方法自由组合,如从答案不足之处改进背景、目标与关键结果,在后续对话中指正 ChatGPT 答案缺点,或在 Prompt 不变情况下多次生成结果优中选优。 3. CONTEXT(上下文背景):为对话设定舞台。 4. OBJECTIVE(目的):描述目标。 5. ACTION(行动):解释所需的动作。 6. SCENARIO(方案):描述场景。 7. TASK(任务):描述任务。 8. ICIO 框架:相关链接 9. CRISPE 框架:相关链接 10. BROKE 框架:作者陈财猫,相关链接 11. PATFU 泡芙提示词框架:作者口袋君,包括清晰表述需要解决的问题、问题所在领域及需要扮演的角色、解决问题需要执行的具体任务。 12. Format(格式):详细定义输出的格式和限制条件,以及记录提示词版本并根据输出结果对提示词迭代。
2024-12-16
11月到12月AI领域的发展情况
在过去的 11 月到 12 月期间,AI 领域呈现出以下发展情况: 流量增长:在过去 12 个月里,人工智能行业是重要的技术发展之一。从 2022 年 9 月到 2023 年 8 月,研究的工具总流量增长了 10.7 倍,从起始的 2.418 亿次访问增长到 28 亿次访问。其中,流量的飞跃从去年 11 月开始,ChatGPT 成为最快达到 100 万用户的平台。2023 年 5 月达到峰值约 41 亿,之后有所回落,但人们的兴趣仍巨大。 创新机会: 整合组件使 AI 系统全面理解物理世界环境,做出更智能决策和行动,对开发先进机器人和自动化系统有益。 算力成为核心竞争力关键指标,科技巨头投入巨资建设超大规模 GPU 集群。如 xAI 公司建成超级计算机,Meta 训练新一代模型。 行业竞争格局转向“建设为王”的新时代,数据中心扩展成为重点,建设效率可能决定在 AI 下一阶段的表现。 高质量数据稀缺。 行业动态:2024 年 11 月,AI 行业呈现快速发展态势,大厂纷纷推出新功能,加速产品进化,AI 技术开始渗透到多个领域。如 Claude 上线桌面端和语音输入、Blendbox 推出图层式 AI 生成工具、阿里发布 EcomlD 支持生成真实人像、Suno 上线 Personas 功能等。
2024-12-06
OpenAI总融资额是多少
OpenAI 的总融资额有所不同。根据相关报道,OpenAI 完成了 66 亿美元的融资,总筹资已达 130 亿美元,公司估值达 1570 亿美元。本轮融资由 Thrive Capital 领投,Tiger Global 和软银等参与。
2025-02-03
openai发展史
OpenAI 的发展历程如下: 2015 年成立,一直将 AGI 作为战略目标之一。 2022 年 11 月 30 日,发布基于 GPT 3.5 的 ChatGPT,引发全球 AI 浪潮。 在其内部会议上分享了关于通用人工智能(AGI)的五个发展等级,分别为: 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 推理者(Reasoners):具备人类推理水平,如 ChatGPT,能够根据上下文和文件提供详细分析和意见。 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多产品执行任务后仍需人类参与。 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可加速科学研究和新药发现。 组织(Organizations):最高级别,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 AI 的起源最早可追溯到上世纪: 1943 年,心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为后续的神经网络奠定基础。 1950 年,图灵最早提出图灵测试,作为判别机器是否具备智能的标准。 1956 年,在美国达特茅斯学院,马文·明斯基和约翰·麦凯西等人共同发起召开著名的达特茅斯会议,人工智能(Artificial Intelligence)一词被正式提出,并作为一门学科确立下来。此后接近 70 年,AI 的发展起起落落。 Sam Altman 于 2025 年 1 月 6 日发表反思,回首创业历程,包括经历解雇等事件,也提到 2025 年首批 AI Agent 将融入劳动力市场,ChatGPT 两周岁时已迈入能进行复杂推理的全新模型时代,强调随着 AGI 临近,要回顾公司发展历程,继续探索。
2025-01-26
openai 的产品分析
OpenAI 的产品具有以下特点和发展情况: 去年 11 月发布了基于 GPT3.5 最新版本的消费级产品 ChatGPT,其具有强大的功能,能提供各种回答和完成多种任务,但也存在捏造事实的问题。ChatGPT 被视为 GPT4 的台标。 OpenAI 内部对于是否发布功能强大的工具存在争论,发布被视为让公众适应 AI 改变日常生活现实的战略一部分。 OpenAI 目前严重受限于 GPU,这影响了其多项计划,包括 API 的可靠性和速度、更长上下文窗口的推广、微调 API 以及专用容量的提供。 Sam Altman 分享了 OpenAI 近期路线,如 2023 年的首要任务是更便宜、更快的 GPT4,以及实现更长的上下文窗口、扩展微调 API 和推出有状态的 API。 2024 年 10 月有相关的视频和文章对 OpenAI 进行分析和介绍新产品,如剖析其从理想主义走向商业化的历程,以及介绍了四款创新 AI 产品。
2025-01-11
openai中学生写作的建议
以下是 OpenAI 针对中学生写作的一些建议: 1. 写作过程分为五个阶段:前期调研、框架构建、论证深化、反馈改进和调整格式。 2. 包含 12 条具体建议,如快速了解主题、创建反向大纲、寻求反馈和规范引用等技巧。 3. 强调将 AI 作为思维的催化剂,而非替代品。 4. 获得更好结果的六种策略: 写清楚说明:包括在问题中包含细节以获取更相关的答案、要求模型采用一个角色、使用分隔符清晰地表示输入的不同部分、指定完成任务所需的步骤、提供示例、指定期望的输出长度。 提供参考文本:指示模型使用参考文本回答、指示模型使用参考文本中的引用来回答。 将复杂任务拆分成更简单的子任务。 给 GPT 时间「思考」。 使用外部工具。 系统地测试更改。
2025-01-10
openai
以下是关于 OpenAI 的相关信息: AGI 的 5 个等级: 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 推理者(Reasoners):具备人类推理水平,能解决复杂问题,如 ChatGPT,可根据上下文和文件提供详细分析和意见。 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品执行任务后仍需人类参与,尚未达到完全智能体水平。 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 模型: GPT4(Beta):一组改进 GPT3.5 的模型,可理解和生成自然语言或代码。 GPT3.5:一组改进 GPT3 的模型,可理解并生成自然语言或代码。 DALL·E(Beta):可以在给定自然语言提示的情况下生成和编辑图像的模型。 Whisper(Beta):可以将音频转换为文本的模型。 Embeddings:一组可以将文本转换为数字形式的模型。 Codex(Limited Beta):一组可以理解和生成代码的模型,包括将自然语言转换为代码。 Moderation:可以检测文本是否敏感或不安全的微调模型。 GPT3:一组可以理解和生成自然语言的模型。 GPT、DALL·E、Sora 相关:Sora 的出现证明了 OpenAI 试图让计算机模拟真实物理世界的野心及对自身技术路线的坚持。从 OpenAI 发布的 Sora 的技术报告中可看到对过往大语言模型训练成功经验的复用。加州大学伯克利分校计算机科学 PHD、知乎作者 SIY.Z 从技术实现上分析了 Sora 成功的部分原因,以及从商业和技术趋势上分析了 OpenAI 能跑通全部技术栈的原因,并尝试预测了 OpenAI 下一步的进展。
2024-12-27
openai 发布的sora最新模型中,生成视频的提示词与一般问答提示词有什么区别或者注意事项?
Sora 是 OpenAI 于 2024 年 2 月发布的文本到视频的生成式 AI 模型。 生成视频的提示词与一般问答提示词的区别和注意事项如下: 1. 对于视频生成,神经网络是单射函数,拟合的是文本到视频的映射。由于视频的动态性高,值域大,因此需要丰富且复杂的提示词来扩大定义域,以学好这个函数。 2. 详细的文本提示能迫使神经网络学习文本到视频内容的映射,加强对提示词的理解和服从。 3. 和 DALL·E 3 一样,OpenAI 用内部工具(很可能基于 GPT4v)给视频详尽的描述,提升了模型服从提示词的能力以及视频的质量(包括视频中正确显示文本的能力)。但这会导致在使用时的偏差,即用户的描述相对较短。OpenAI 用 GPT 来扩充用户的描述以改善这个问题,并提高使用体验和视频生成的多样性。 4. 除了文本,Sora 也支持图像或者视频作为提示词,支持 SDEdit,并且可以向前或者向后生成视频,因此可以进行多样的视频编辑和继续创作,比如生成首尾相连重复循环的视频,甚至连接两个截然不同的视频。 以下是一些 Sora 的案例提示词,如:“小土豆国王戴着雄伟的王冠,坐在王座上,监督着他们广阔的土豆王国,里面充满了土豆臣民和土豆城堡。”“咖啡馆的小地图立体模型,装饰着室内植物。木梁在上方纵横交错,冷萃咖啡站里摆满了小瓶子和玻璃杯。”“一张写有‘SORA’的写实云朵图像。”“一群萨摩耶小狗学习成为厨师的电影预告片‘cinematic trailer for a group of samoyed puppies learning to become chefs’”
2024-12-27
openai发布会内容
以下是关于 OpenAI 发布会的相关内容: 1. 12 月 20 日,OpenAI 发布 AI 大模型风险防范框架文件,OpenAI 董事会有权决定发布新 AI 模型,框架文件提出防范 AI 大模型灾难性风险的路线图,董事会可推翻领导团队关于 AI 模型发布的决策。相关链接:https://openai.com/safety/preparedness 2. 12 月 12 日,OpenAI 连续 12 天 AI 发布会的第五天完整视频(中英文双语字幕),亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作,多平台无缝衔接,涵盖多种应用场景,实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接: 3. OpenAI 将在 11 月 6 日举办首次开发者大会,会上将发布重要更新,目标是让开发者能够更快捷和廉价地开发基于大模型的应用。此次更新最让人期待的部分是将推出 Stateful API,理论上可将大模型应用的开销削减为原来的二十分之一。相关链接:https://mp.weixin.qq.com/s/NPqAeSl3NQ0_wbHzsJSw
2024-12-19
OpenAI前六场发布会的内容提炼
以下是 OpenAI 前六场发布会的部分内容提炼: OpenAI 第六天发布会:ChatGPT 的高级语音模式获得公开访问权限,能通过自然语音与用户对话并理解屏幕内容,降低使用门槛,展示多模态能力和个性化发展潜力。 相关报告:甲子光年发布的《2024 人工智能产业 30 条判断——万千流变,一如既往》涵盖 AI 技术历史发展、当前趋势和未来预测,提到 Transformer 模型和 GPT 系列发展及在多行业应用,探讨了 AI 芯片进步、在科学研究中的角色和对社会的广泛影响,还预测了 AI 产业增长。中信建投证券的海外 AI 应用行业专题《旧金山草根调研与海外 AI 应用进展》长达 100 多页,聚焦旧金山草根调研及海外 AI 应用进展,显示旧金山及硅谷地区 AI 企业众多,AI 应用在 To B 场景如广告、助手、数据分析等领域受关注,长期看好,尤其是 C 端应用潜力,列举了多家公司及其业务领域、功能进展,并提供相关上市公司数据。 OpenAI 首届开发者大会:短短 45 分钟发布会,Sam Altman 表示团队对开发者关注的问题做了六大升级,包括更长的上下文长度、更强的控制、模型的知识升级、多模态、模型微调定制和更高的速率限制,前四条主要关于新模型性能提升,后两点针对企业开发者痛点,同时宣布 API 价格下调。
2024-12-17
OPenAI最近的产品发布会
OpenAI 近期举行了多次产品发布会: 去年 11 月晚些时候发布了基于 GPT3.5 最新版本的消费级产品 ChatGPT。公司内部对是否发布这样强大的工具存在争论,但 Altman 表示支持,认为这是让公众适应 AI 改变日常生活现实的战略一部分。ChatGPT 功能强大,能在 SAT 考试中获大学水平分数、写作文、总结书籍等,还能按各种要求改写。 近期举行了 12 场发布会,推出多个新产品,包括推理模型 o1、文字转视频工具 Sora 等。o1 正式版在复杂推理和数学能力上显著提升,推出的强化微调技术使模型更具专业性。 在 5 月份的 GPT4o 模型发布会上,邀请了可汗学院的创始人 Salman Khan 和他儿子一起使用 GPT4o 辅导孩子在可汗学院上做数学题,这是 OpenAI 第一次将多模态模型能力在教育场景上落地应用的尝试。
2024-12-17
openai发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,称其为世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示多模态推理。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等更多功能。 此外,在 12 月 12 日和 12 月 15 日的宝玉日报中,提到 OpenAI 连续 12 天 AI 发布会的第五天亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作;多平台无缝衔接,支持 iPhone、iPad 和 Mac,涵盖多种应用场景;实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接:https://x.com/dotey/status/1866974269051113543
2024-12-17
open发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,是目前世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示模型的多模态推理能力。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等功能。 新模型 9.12 发布的要点: 1. 发布两个模型:o1 mini,o1 preview。Plus 全量可用 o1 mini 一周 50 条,o1 preview 一周 30 条。 2. 更聪明的思考方式:像人一样花更多时间思考问题,尝试不同策略,能意识到自己的错误。 3. 在复杂任务上表现出色:在物理、化学、生物、数学和编程等领域的挑战性任务上表现得像博士生,在 IMO 和 Codeforces 竞赛中取得高分。 4. 暂时缺少一些功能:目前没有 ChatGPT 那样的网络浏览和文件上传功能,但在复杂推理任务上非常强大。 O1 Pro 版本的要点: 1. 面向专业用户,强大精确。 2. 独有功能包括深度推理能力,可处理复杂数学和科学问题,支持多步推理和专业计算,思考时间约 1 3 分钟;在科学、数学、编程等领域表现出色,提供专业准确解答;支持长文本处理,轻松应对长文档处理与内容生成;提供更多微调选项,用户可根据自身需求进行个性化定制。 3. 对比优势:错误率大幅降低,推理能力显著增强,基准测试表现惊人。 ChatGPT Pro 订阅计划的要点: 1. 费用为每月 200 美元。 2. 目标用户是解决复杂问题的研究人员、工程师和专业人士。 3. 核心功能是使用 o1 Pro 模式,专为数学竞赛、科学研究、代码开发等高要求场景优化,提供更高的准确性和可靠性,适用于严格的技术基准测试任务。 4. 特别支持:OpenAI 为美国医学研究人员提供资助,重点支持罕见病基因发现、痴呆症研究、癌症免疫治疗。 发布会吐槽:直播仅用 30 分钟讲完,像是把一个大更新硬切成了 12 段。总结:o1 基础版主打日常体验,速度快且功能全面;o1 Pro 版深度推理与专业能力爆表,适合更复杂的任务。ChatGPT Pro 订阅计划开启了高性能 AI 工具的新篇章,推动科研与工程领域的新突破!
2024-12-17
openAI 最近的发布会都有哪些主要内容?
OpenAI 最近的发布会主要内容包括: 2023 年 11 月的开发者大会,开放了 GPTs 和 GPT4 Turbo 等一系列内容,不过由于 DDoS 攻击和负载问题,其所有服务断断续续挂了接近一天。 之前还悄咪咪开放了两个新功能,包括可以上传 PDF 等文档进行分析和提问,以及在 GPT4 加持下,代码解释器、图片交谈、图片生成和联网能力可自行选择完成任务。 发布了图像生成模型 sCM 等。
2024-12-16
AI播客总结软件
以下是一些关于 AI 播客总结软件的信息: 1. 即刻用户拐子狼分享的工作流: 用飞书妙计将音频转换为文字。 找不到合适的封面图时,使用 Midjourney 制作。 Raycast AI 初步检索关键词。 Notion AI 总结全文内容。 将整篇笔记分为四个部分,包括 AI 总结、ShowNotes、节目文字版和笔记。笔记部分对节目提及的关键词做拓展阅读,若解读品牌会放上该品牌在节目所讨论年份的财报。 2. 危柯宇分享的案例: 点开小宇宙播客分享链接。 打开微信通义听悟小程序。 可以直接在通义听悟看概括总结(2 小时播客可在 4 分钟左右分析完),也可一键转录解析导出 txt 文字版,丢到 kimi 自定义分析。 3. 产品推荐: Podwise:是一款面向播客听众的知识管理应用程序,提供人工智能驱动的摘要、思维导图、大纲、值得引用、转录等功能,帮助用户快速提取和理解播客剧集的主要内容。 Decode:提供分析报税表并提供降低税费建议的服务。 Deasie:为 LLM 应用提供数据治理服务,包括检测敏感信息、确定数据的上下文和含义、为文档分配质量分数以及创建认证数据目录。 Relay:工作流程自动化工具,结合了一键式人工智能辅助、人机交互协作和强大的多人游戏体验,支持在协作中加入人工介入的环节。
2025-02-06
视频生成文字或者视频总结成文字的工具有哪些
以下是一些视频生成文字或者视频总结成文字的工具: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,这是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 另外,更多相关网站可以查看: 如果想用 AI 把小说做成视频,可参考以下制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 如果要创建视频内容,可参考以下步骤: 1. 准备内容:先准备一段视频中播放的内容文字。内容可以是产品介绍、课程讲解、游戏攻略等任何您希望推广,让大家了解的文字。当然,也可以利用 AI 来生成这段文字。 2. 制作视频:使用剪映 App 来对视频进行简单的处理。电脑端打开剪映 App,点击“开始创作”。进入创作页面后,选择顶部工具栏中的“文本”,并点击默认文本右下角的“+”号,为视频添加一个文字内容的轨道。添加完成后,在界面的右侧将准备好的文字内容替换默认文本内容。这样视频内容就准备好了,这将为数字人提供语音播放的内容,以及生成与文字内容相对应的口型。
2025-02-05
总结一下当前AI发展现状以及指导非开发者一类的普通用户如何使用及进阶使相关工具
当前 AI 发展现状: 涵盖了不同领域的应用和发展,如电子小说行业等。 包括了智能体的 API 调用、bot 串联和网页内容推送等方面。 对于非开发者一类的普通用户使用及进阶相关工具的指导: 可以先从国内模型工具入手,这些工具不花钱。 学习从提示词开始,与模型对话时要把话说清,强调提示词在与各类模型对话中的重要性及结构化提示词的优势。 对于技术爱好者:从小项目开始,如搭建简单博客或自动化脚本;探索 AI 编程工具,如 GitHub Copilot 或 Cursor;参与 AI 社区交流经验;构建 AI 驱动的项目。 对于内容创作者:利用 AI 辅助头脑风暴;建立 AI 写作流程,从生成大纲开始;进行多语言内容探索;利用 AI 工具优化 SEO。 若想深入学习美学概念和操作可报野菩萨课程。国内模型指令遵循能力较弱时,可使用 launch BD 尝试解决。
2025-01-31
文献阅读总结有推荐的工具吗
以下是为您推荐的文献阅读总结工具: 1. 浏览器插件“沉浸式翻译”: 地址:https://immersivetranslate.com/ 支持阅读本地 PDF 等,是实用的英文资料和网页翻译插件。 2. 浏览器插件莫妮卡(Monica): 地址:https://monica.im/ 集成了 GPT 的功能,可对网页文字进行翻译。 3. 利用 GPT 辅助阅读:能从英译中到中译中,帮助理解文档内容。 4. Afforai: 是为研究人员设计的 AI 驱动的研究助手和聊天机器人。 提供上传和管理研究论文、注释和笔记、管理引用和元数据等工具。 支持多种文档格式和三种搜索模式。 5. Recall: 提供新型知识管理方法,能自动总结多种在线内容并保存到知识库。 知识库自动组织和分类内容,通过知识图谱技术发现信息联系,还提供间隔重复学习功能。 此外,在学术场景中,GLM4Plus 结合良好的提示词可帮助快速总结、翻译和润色论文内容。例如: 论文总结提示词:结合良好提示词能迅速总结概括文档。 论文内容翻译提示词:结合良好提示词能快速翻译论文内容。 论文内容扩写润色提示词:精心设计的提示词可根据特定场景调整,生成多样化润色结果,如针对小红书的口语化、轻松愉快风格。
2025-01-25
用AI总结长文的prompt怎么写比较好
以下是关于用 AI 总结长文的一些提示词编写建议: 1. 单人发言版:基于李继刚老师的“通知消息整理助手”修改“文字排版大师”的 Prompt,重点 Prompt 语句需标出。 2. 多人发言版: 明确跟 GPT 说明需要其帮忙总结文字内容。 将提示词和文字原文发送给 GPT,等待其输出完毕后复制粘贴到文本编辑器中,整理并删掉无关内容,替换掉不美观的符号。 3. 法律相关: 格式:【设定角色+任务目标+上下文和背景信息+(正面要求)详细需求和细节性信息+(负面要求)限制和不需要的内容+回答的语言风格和形式】 讲清楚背景和目的,例如律师处理交通事故案件时应清晰描述案件事实、法规等。 学会提问,使用清晰、具体的语言,避免模糊表述,了解 AI 工作原理和限制。 拆解工作流程,将复杂任务分解成更小、更具体的环节。 4. 通用写作方面: 第一部分:说清楚要解决的问题及背景,可能导致的损失。 第二部分:以案例引入,写明案号、案件事实经过、裁判结果、关键依据等要点。 第三部分:对案例进一步分析,写明注意关键点,不给建议。 第四部分:给出具体操作建议,包括事前、事中、事后的注意事项和补救措施。 第五部分:结语及作者宣传。 文章结构需有结构化理解,所有结论应有案例基础,不能违反法律规定,文字简练精准,信息密度足够,建议具体细致且易于操作。
2025-01-24
哪个AI对PDF文件的提炼总结能力最强
目前在对 PDF 文件的提炼总结能力方面,Claude 2 表现出色。将整本书粘贴到 Claude 的前一版本中能取得令人印象深刻的结果,新模型更强大。可以通过查看相关经验和提示。此外,myaidrive.com 网站上的 AI PDF 也能处理较大的 PDF 文件,并为冗长的文档提供上级摘要。同时,近期出现的各类 AI 搜索引擎,如 perplexity.ai、metaso、360 搜索、ThinkAny 等,其智能摘要功能能够辅助快速筛选信息。但需要注意的是,这些系统仍可能产生幻觉,若要确保准确性,需检查其结果。
2025-01-23