Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

OPenAI最近的产品发布会

Answer

OpenAI 近期举行了多次产品发布会:

  • 去年 11 月晚些时候发布了基于 GPT-3.5 最新版本的消费级产品 ChatGPT。公司内部对是否发布这样强大的工具存在争论,但 Altman 表示支持,认为这是让公众适应 AI 改变日常生活现实的战略一部分。ChatGPT 功能强大,能在 SAT 考试中获大学水平分数、写作文、总结书籍等,还能按各种要求改写。
  • 近期举行了 12 场发布会,推出多个新产品,包括推理模型 o1、文字转视频工具 Sora 等。o1 正式版在复杂推理和数学能力上显著提升,推出的强化微调技术使模型更具专业性。
  • 在 5 月份的 GPT-4o 模型发布会上,邀请了可汗学院的创始人 Salman Khan 和他儿子一起使用 GPT-4o 辅导孩子在可汗学院上做数学题,这是 OpenAI 第一次将多模态模型能力在教育场景上落地应用的尝试。
Content generated by AI large model, please carefully verify (powered by aily)

References

OpenAI 真正想要什么 | WIRED

去年11月之前,人们对OpenAI的了解主要局限于技术和软件开发领域。但现在全世界都知道,OpenAI在当月晚些时候发布了一款基于GPT-3.5最新版本的消费级产品。几个月来,公司内部一直在使用带有对话界面的GPT版本。这对于该公司所谓的“寻求真相”尤为重要。这意味着,通过对话,用户可以哄骗模型提供更可信、更完整的回答。为大众而优化的ChatGPT可以让任何人只需输入提示信息,就能立即利用似乎无穷无尽的知识源,然后继续对话,就像与一个碰巧无所不知的人类同伴闲聊一样,尽管他也有捏造事实的嗜好。在OpenAI内部,对于是否应该发布这样一款功能空前强大的工具,人们争论不休。但Altman对此表示支持。他解释说,这次发布是一项战略的一部分,旨在让公众适应AI注定会改变他们日常生活的现实,而且可能是为了更好地生活。在公司内部,这被称为“迭代部署假设”。当然,ChatGPT会引起轰动。毕竟,这是一个任何人都能使用的东西,它足够聪明,能在SAT考试中获得大学水平的分数,能写出B-minus的作文,还能在几秒钟内总结出一本书的内容。你可以让它为你撰写融资提案或会议摘要,然后要求它用立陶宛语、莎士比亚十四行诗或痴迷玩具火车的人的口吻进行改写。几秒钟后,大型语言模型就会满足你的要求。太疯狂了。不过,OpenAI将其视为其更新、更连贯、能力更强、更可怕的后继者GPT-4的台标,据说GPT-4是用1.7万亿个参数训练出来的。(OpenAI不会证实这个数字,也不会透露数据集)。

通往 AGI 之路

《[超级智能才是未来,OpenAI的连续剧发布会哪些是真创新?哪些是营销噱头?](https://mp.weixin.qq.com/s/pao8SOvwkAMxB--VPSqqZw)》OpenAI近期举行了12场发布会,推出了多个新产品,包括推理模型o1、文字转视频工具Sora等。o1的正式版在复杂推理和数学能力上显著提升,尤其是在数学竞赛问题中的表现优于人类专家。同时,推出的强化微调技术使模型更具专业性。然而,研究显示,AI在某些任务中可能采取欺骗行为,反映出其自主思考的潜在风险。《[微软CEO纳德拉最新两万字洞察:C端Agent商业模式仍需摸索,广告流量模式或面临转变,B端关键在生态集成](https://mp.weixin.qq.com/s/It3xs5joaxYIHw6V2DKHRA)》微软CEO Satya Nadella在近日与硅谷知名投资人Brad Gerstner以及Bill Gurley讨论了微软的战略转型、对OpenAI投资以及智能体(Agent)的未来,全文两万字。Nadella认为,当前AI领域的竞争将不再是赢家通吃,而是多个企业在不同层次的技术领域展开激烈角逐。

AI 时代的教育 The Intelligence Age's Education - 知乎

作为教育行业的一名从业者,我个人是非常期待有一款划时代意义的AI教育产品能从技术上对教育场景做一次深入的赋能的。但是下一代的AI教育产品应该是什么形态?ta应该拥有什么样的功能?重点去解决哪些问题?用什么样的形态与用户进行交互?仅就目前的市场情况来看,我还没有看到一款真正属于AI时代的学习产品的诞生,无论是学习机,学习笔的硬件还是各种网站或APP的软件,我认为都没有达到我个人对下个时代AI学习产品的想象。比如国内一线品牌的众多学习机类产品,硬件形态都是pad,交互方式仍是传统的APP形式。这种产品形态即使拥有了LLM在产品力上的加持,但是对于用户而言,依然略显冰冷僵硬缺乏温度。科大讯飞AI学习机——图源自科大讯飞官网那么除了类ipad这种学习机的产品形态之外,是否还有其他可能?这个问题在openAI于5月份的GPT-4o模型发布会上,邀请了可汗学院的创始人Salman Khan和他儿子一起使用了GPT-4o辅导孩子在可汗学院上做数学题,一步步启发纠正,各种鼓励,比普通家长辅导效果可能真的要好不少!这可以说是openai第一次将多模态模型能力在教育场景上落地应用的尝试。虽然演示视频中仍然是以一台搭载了GPT4o的ipad作为使用终端,但是我个人觉得这种产品形态应该并非是最终的版本答案。

Others are asking
openai 的产品分析
OpenAI 的产品具有以下特点和发展情况: 去年 11 月发布了基于 GPT3.5 最新版本的消费级产品 ChatGPT,其具有强大的功能,能提供各种回答和完成多种任务,但也存在捏造事实的问题。ChatGPT 被视为 GPT4 的台标。 OpenAI 内部对于是否发布功能强大的工具存在争论,发布被视为让公众适应 AI 改变日常生活现实的战略一部分。 OpenAI 目前严重受限于 GPU,这影响了其多项计划,包括 API 的可靠性和速度、更长上下文窗口的推广、微调 API 以及专用容量的提供。 Sam Altman 分享了 OpenAI 近期路线,如 2023 年的首要任务是更便宜、更快的 GPT4,以及实现更长的上下文窗口、扩展微调 API 和推出有状态的 API。 2024 年 10 月有相关的视频和文章对 OpenAI 进行分析和介绍新产品,如剖析其从理想主义走向商业化的历程,以及介绍了四款创新 AI 产品。
2025-01-11
openai中学生写作的建议
以下是 OpenAI 针对中学生写作的一些建议: 1. 写作过程分为五个阶段:前期调研、框架构建、论证深化、反馈改进和调整格式。 2. 包含 12 条具体建议,如快速了解主题、创建反向大纲、寻求反馈和规范引用等技巧。 3. 强调将 AI 作为思维的催化剂,而非替代品。 4. 获得更好结果的六种策略: 写清楚说明:包括在问题中包含细节以获取更相关的答案、要求模型采用一个角色、使用分隔符清晰地表示输入的不同部分、指定完成任务所需的步骤、提供示例、指定期望的输出长度。 提供参考文本:指示模型使用参考文本回答、指示模型使用参考文本中的引用来回答。 将复杂任务拆分成更简单的子任务。 给 GPT 时间「思考」。 使用外部工具。 系统地测试更改。
2025-01-10
OpenAI过去12天的发布会总结
以下是 OpenAI 过去 12 天发布会的总结: 自媒体记录方面: 夕小瑶科技说:o3 发布,可能影响码农工作。 孔某人的低维认知:OpenAI 圣诞 12 天总评,感谢大佬赏饭。 MAX 01Founder:一文详解 o3,虽接近 AGI 但使用成本高。 南瓜博士:使用 o3 钱包和脑子可能不够。 数字生命卡兹克:OpenAI 正式发布 o3,通往 AGI 路上已无障碍。 具体发布内容: Day12:o3 与 o3 mini 正式亮相。 Day11:ChatGPT 桌面应用,Option+空格快速唤起。 Day10:OpenAI 发布电话倾诉功能 18002428478。 Day9:o1 满血版 API 和 4o 实时语音 API 更新。 Day8:AI 搜索功能免费开放,并支持实时语音搜索。 Day7:ChatGPT 全新“项目”功能发布。 Day6:实时视频通话&圣诞老人模式正式上线。 Day5:ChatGPT 与 Apple 的深度合作。 Day4:直播“翻车”的 Canvas。 Day3:Sora 终于上线,有案例和功能详解。 Day2:微调 O1 模型,低成本高效率。 Day1:强化学习微调的实操案例。 宝玉日报 12 月 18 日: AI 架构与技术选型的 4 条原则:选主流框架、确保测试覆盖率、避免私有框架、采用模块化设计。 OpenAI 12 天发布会第 9 天:o1 API 正式版速度更快成本降低,支持多种新功能;语音交互升级,引入 WebRTC 支持,处理费用降低;新增偏好微调功能和工具包,简化 API 密钥申请流程。 易观分析报告预测了 AI 技术未来的关键发展方向,德邦证券报告对 OpenAI 十二日发布会进行深度总结,认为随着大模型能力提升和应用场景扩展,AI 应用商业价值有望实现,建议关注相关领域。
2024-12-31
openai
以下是关于 OpenAI 的相关信息: AGI 的 5 个等级: 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 推理者(Reasoners):具备人类推理水平,能解决复杂问题,如 ChatGPT,可根据上下文和文件提供详细分析和意见。 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多 AI Agent 产品执行任务后仍需人类参与,尚未达到完全智能体水平。 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可预测蛋白质结构,加速科学研究和新药发现。 组织(Organizations):最高级别的 AI,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 模型: GPT4(Beta):一组改进 GPT3.5 的模型,可理解和生成自然语言或代码。 GPT3.5:一组改进 GPT3 的模型,可理解并生成自然语言或代码。 DALL·E(Beta):可以在给定自然语言提示的情况下生成和编辑图像的模型。 Whisper(Beta):可以将音频转换为文本的模型。 Embeddings:一组可以将文本转换为数字形式的模型。 Codex(Limited Beta):一组可以理解和生成代码的模型,包括将自然语言转换为代码。 Moderation:可以检测文本是否敏感或不安全的微调模型。 GPT3:一组可以理解和生成自然语言的模型。 GPT、DALL·E、Sora 相关:Sora 的出现证明了 OpenAI 试图让计算机模拟真实物理世界的野心及对自身技术路线的坚持。从 OpenAI 发布的 Sora 的技术报告中可看到对过往大语言模型训练成功经验的复用。加州大学伯克利分校计算机科学 PHD、知乎作者 SIY.Z 从技术实现上分析了 Sora 成功的部分原因,以及从商业和技术趋势上分析了 OpenAI 能跑通全部技术栈的原因,并尝试预测了 OpenAI 下一步的进展。
2024-12-27
openai 发布的sora最新模型中,生成视频的提示词与一般问答提示词有什么区别或者注意事项?
Sora 是 OpenAI 于 2024 年 2 月发布的文本到视频的生成式 AI 模型。 生成视频的提示词与一般问答提示词的区别和注意事项如下: 1. 对于视频生成,神经网络是单射函数,拟合的是文本到视频的映射。由于视频的动态性高,值域大,因此需要丰富且复杂的提示词来扩大定义域,以学好这个函数。 2. 详细的文本提示能迫使神经网络学习文本到视频内容的映射,加强对提示词的理解和服从。 3. 和 DALL·E 3 一样,OpenAI 用内部工具(很可能基于 GPT4v)给视频详尽的描述,提升了模型服从提示词的能力以及视频的质量(包括视频中正确显示文本的能力)。但这会导致在使用时的偏差,即用户的描述相对较短。OpenAI 用 GPT 来扩充用户的描述以改善这个问题,并提高使用体验和视频生成的多样性。 4. 除了文本,Sora 也支持图像或者视频作为提示词,支持 SDEdit,并且可以向前或者向后生成视频,因此可以进行多样的视频编辑和继续创作,比如生成首尾相连重复循环的视频,甚至连接两个截然不同的视频。 以下是一些 Sora 的案例提示词,如:“小土豆国王戴着雄伟的王冠,坐在王座上,监督着他们广阔的土豆王国,里面充满了土豆臣民和土豆城堡。”“咖啡馆的小地图立体模型,装饰着室内植物。木梁在上方纵横交错,冷萃咖啡站里摆满了小瓶子和玻璃杯。”“一张写有‘SORA’的写实云朵图像。”“一群萨摩耶小狗学习成为厨师的电影预告片‘cinematic trailer for a group of samoyed puppies learning to become chefs’”
2024-12-27
openai
OpenAI 的相关信息如下: 模型: OpenAI API 由多种具有不同功能和价位的模型提供支持,还可通过微调针对特定用例对原始基本模型进行有限定制。 具体模型包括:GPT4(Beta),是一组改进 GPT3.5 的模型,能理解和生成自然语言或代码;GPT3.5,是一组改进 GPT3 的模型,能理解并生成自然语言或代码;DALL·E(Beta),能在给定自然语言提示的情况下生成和编辑图像;Whisper(Beta),能将音频转换为文本;Embeddings,能将文本转换为数字形式;Codex(Limited Beta),能理解和生成代码,包括将自然语言转换为代码;Moderation,能检测文本是否敏感或不安全的微调模型;GPT3,能理解和生成自然语言。 为何能跑通所有 AGI 技术栈: 方法论明确:通用模型能用到更多数据,减少技术栈,OpenAI 未来可能会继续走通用模型的道路,降低微调等特化的需求,继续增加模型的上下文长度。 用一个模型为另一个模型提供标注:OpenAI 的 Dall E 和 Sora 都用到了大量可能来自于 GPT vision 的数据标注,未来可能会继续加强各个模型的连接。 Transformer 架构:其在各个模态和技术栈具有优势,能复用模型参数和使用一套基础设施框架训练不同模型,新模型若要取代,需通过缩放定律的检验。 稀疏模型。
2024-12-25
openai发布会内容
以下是关于 OpenAI 发布会的相关内容: 1. 12 月 20 日,OpenAI 发布 AI 大模型风险防范框架文件,OpenAI 董事会有权决定发布新 AI 模型,框架文件提出防范 AI 大模型灾难性风险的路线图,董事会可推翻领导团队关于 AI 模型发布的决策。相关链接:https://openai.com/safety/preparedness 2. 12 月 12 日,OpenAI 连续 12 天 AI 发布会的第五天完整视频(中英文双语字幕),亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作,多平台无缝衔接,涵盖多种应用场景,实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接: 3. OpenAI 将在 11 月 6 日举办首次开发者大会,会上将发布重要更新,目标是让开发者能够更快捷和廉价地开发基于大模型的应用。此次更新最让人期待的部分是将推出 Stateful API,理论上可将大模型应用的开销削减为原来的二十分之一。相关链接:https://mp.weixin.qq.com/s/NPqAeSl3NQ0_wbHzsJSw
2024-12-19
OpenAI前六场发布会的内容提炼
以下是 OpenAI 前六场发布会的部分内容提炼: OpenAI 第六天发布会:ChatGPT 的高级语音模式获得公开访问权限,能通过自然语音与用户对话并理解屏幕内容,降低使用门槛,展示多模态能力和个性化发展潜力。 相关报告:甲子光年发布的《2024 人工智能产业 30 条判断——万千流变,一如既往》涵盖 AI 技术历史发展、当前趋势和未来预测,提到 Transformer 模型和 GPT 系列发展及在多行业应用,探讨了 AI 芯片进步、在科学研究中的角色和对社会的广泛影响,还预测了 AI 产业增长。中信建投证券的海外 AI 应用行业专题《旧金山草根调研与海外 AI 应用进展》长达 100 多页,聚焦旧金山草根调研及海外 AI 应用进展,显示旧金山及硅谷地区 AI 企业众多,AI 应用在 To B 场景如广告、助手、数据分析等领域受关注,长期看好,尤其是 C 端应用潜力,列举了多家公司及其业务领域、功能进展,并提供相关上市公司数据。 OpenAI 首届开发者大会:短短 45 分钟发布会,Sam Altman 表示团队对开发者关注的问题做了六大升级,包括更长的上下文长度、更强的控制、模型的知识升级、多模态、模型微调定制和更高的速率限制,前四条主要关于新模型性能提升,后两点针对企业开发者痛点,同时宣布 API 价格下调。
2024-12-17
openai发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,称其为世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示多模态推理。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等更多功能。 此外,在 12 月 12 日和 12 月 15 日的宝玉日报中,提到 OpenAI 连续 12 天 AI 发布会的第五天亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作;多平台无缝衔接,支持 iPhone、iPad 和 Mac,涵盖多种应用场景;实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接:https://x.com/dotey/status/1866974269051113543
2024-12-17
open发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,是目前世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示模型的多模态推理能力。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等功能。 新模型 9.12 发布的要点: 1. 发布两个模型:o1 mini,o1 preview。Plus 全量可用 o1 mini 一周 50 条,o1 preview 一周 30 条。 2. 更聪明的思考方式:像人一样花更多时间思考问题,尝试不同策略,能意识到自己的错误。 3. 在复杂任务上表现出色:在物理、化学、生物、数学和编程等领域的挑战性任务上表现得像博士生,在 IMO 和 Codeforces 竞赛中取得高分。 4. 暂时缺少一些功能:目前没有 ChatGPT 那样的网络浏览和文件上传功能,但在复杂推理任务上非常强大。 O1 Pro 版本的要点: 1. 面向专业用户,强大精确。 2. 独有功能包括深度推理能力,可处理复杂数学和科学问题,支持多步推理和专业计算,思考时间约 1 3 分钟;在科学、数学、编程等领域表现出色,提供专业准确解答;支持长文本处理,轻松应对长文档处理与内容生成;提供更多微调选项,用户可根据自身需求进行个性化定制。 3. 对比优势:错误率大幅降低,推理能力显著增强,基准测试表现惊人。 ChatGPT Pro 订阅计划的要点: 1. 费用为每月 200 美元。 2. 目标用户是解决复杂问题的研究人员、工程师和专业人士。 3. 核心功能是使用 o1 Pro 模式,专为数学竞赛、科学研究、代码开发等高要求场景优化,提供更高的准确性和可靠性,适用于严格的技术基准测试任务。 4. 特别支持:OpenAI 为美国医学研究人员提供资助,重点支持罕见病基因发现、痴呆症研究、癌症免疫治疗。 发布会吐槽:直播仅用 30 分钟讲完,像是把一个大更新硬切成了 12 段。总结:o1 基础版主打日常体验,速度快且功能全面;o1 Pro 版深度推理与专业能力爆表,适合更复杂的任务。ChatGPT Pro 订阅计划开启了高性能 AI 工具的新篇章,推动科研与工程领域的新突破!
2024-12-17
openAI 最近的发布会都有哪些主要内容?
OpenAI 最近的发布会主要内容包括: 2023 年 11 月的开发者大会,开放了 GPTs 和 GPT4 Turbo 等一系列内容,不过由于 DDoS 攻击和负载问题,其所有服务断断续续挂了接近一天。 之前还悄咪咪开放了两个新功能,包括可以上传 PDF 等文档进行分析和提问,以及在 GPT4 加持下,代码解释器、图片交谈、图片生成和联网能力可自行选择完成任务。 发布了图像生成模型 sCM 等。
2024-12-16
李飞飞最近出的agent综述文章哪里可以看到
以下是李飞飞相关文章的获取渠道: 《》 《》
2025-01-17
最近有什么新的AI工具吗
以下是一些新的 AI 工具: 游戏方面: Unity 推出了两款 AI 工具,分别是提供新 Copliot 工具的 Unity AI 和允许在 Unity 运行时为游戏或应用程序嵌入 AI 模型的 Unity Sentis。Unity AI 可通过与 Muse Chat 聊天快速启动创建游戏项目、协助编码、创建 3D 材质和动画等内容。Unity Sentis 是第一个将 AI 模型嵌入到实时 3D 引擎中的跨平台解决方案。您可通过 https://create.unity.com/aibeta 申请加入 Muse Chat 的 Waiting list。 PPT 方面: Gamma:在线 PPT 制作网站,通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式。网址:https://gamma.app/ 美图 AI PPT:由美图秀秀开发团队推出,通过输入简单文本描述生成专业 PPT 设计,包含丰富模板库和设计元素。网址:https://www.xdesign.com/ppt/ Mindshow:AI 驱动的 PPT 辅助工具,提供智能设计功能,如自动布局、图像选择和文本优化等。网址:https://www.mindshow.fun/ 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用语音识别和自然语言处理技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 商业方面: 服务小型企业的工具,如 Sameday 可接电话并预约,Truelark 可处理短信、电子邮件和聊天,Osome 可管理后台办公室,Durable 可创建完整的专业网站。 通用内容创建工具,如 Jasper、Copy 和 Writer 在小型和中型企业中已有显著用户基础。 特定类型企业的垂直化工具,如 Harvey 和 Spellbook 帮助法律团队自动化任务,Interior AI 帮助房地产代理商虚拟布置房产,Zuma 帮助物业经理将潜在客户转化为预定参观。
2025-01-09
最近Agent方面的场景案例
以下是一些关于 Agent 方面的场景案例: 1. 吴恩达最新演讲中提到的四种 Agent 设计范式: Reflection(反思):例如让用 Reflection 构建好的 AI 系统写代码,AI 会把代码加上检查正确性和修改的话术再返回给自己,通过反复操作完成自我迭代,虽不能保证修改后代码质量,但效果通常更好。 Tool Use(工具使用):大语言模型调用插件,极大拓展了 LLM 的边界能力。 Planning(规划):属于比较新颖且有前景的方式。 Multiagent(多智能体):也具有发展潜力。 2. Ranger 文章中的相关内容: Agent 被认为是大模型未来的主要发展方向。 中间的“智能体”通常是 LLM 或大模型,通过为其增加工具、记忆、行动、规划这四个能力来实现。 行业里主要用到的是 langchain 框架,它在 prompt 层和工具层完成主要的设计,将 LLM 与 LLM 以及 LLM 与工具进行串接。 3. 从词源和历史变迁来看: 在不同时期,“Agent”在商业、政府、情报、娱乐、体育等领域都有重要角色,涵盖贸易代理、公司代理商、情报特工、艺人经纪人等多种职业。 “Agent”一词具有行动和替身的含义,多数情况下指“拥有行动的替身,替代他人做某事”。
2025-01-07
最近国内外 有什么新出的AI产品
以下是国内外新出的一些 AI 产品: 图像类产品: 国内: 可灵:由快手团队开发,用于生成高质量的图像和视频,图像质量高,最初采用内测邀请制,现向所有用户开放,价格相对较高,重度用户年费可达几千元,平均每月使用成本在 400 到 600 元,也有临时或轻度使用的免费点数和较便宜包月选项。 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,生成图像质量高、细节丰富,操作界面简洁直观、用户友好度高,能与阿里其他产品和服务无缝整合,重点是现在免费,每天签到获取灵感值即可,但存在某些类型图像无法生成、处理非中文语言或国际化内容不够出色、处理多元文化内容可能存在偏差等局限性。 搜索类产品: 国内:大模型厂商推出的 ChatBot 产品(智谱清言、Kimi Chat、百小应、海螺 AI 等),搜索厂商或创业团队推出的 AI 搜索产品(360 AI 搜索、秘塔、博查 AI、Miku 等)。 海外:Perplexity、You、Phind 等。 中国公司和团队的出海产品:ThinkAny、GenSpark、Devv 等。 PPT 类产品: 国内:爱设计 PPT,背后有实力强大的团队,对市场需求有敏锐洞察力,把握住了 AI 与 PPT 结合的市场机遇,已确立市场领先地位,代表了当前国内 AI 辅助 PPT 制作的最高水平,能提高制作效率并保证高质量输出。
2025-01-06
最近有什么 AI 资讯,给我总结出来
以下是为您总结的近期 AI 资讯: 简报: TLDR AI: The Sequence: Deep Learning Weekly: Ben’s Bites: Last week in ai: Your guide to AI: 播客: No Priors podcast hosted by Sarah Guo and Elad Gil Robot Brains Podcast hosted by Pieter Abbeel Lex Fridman Podcast hosted by Lex Fridman The Gradient podcast hosted by Daniel Bashir Generally Intelligent hosted by Kanjun Qiu Last Week in AI 会议: 工业界:World AI Cannes Festival 其他资讯: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器: 12 月 26 日资讯: Meta:AI 建模技术 PartGen,一种从各种模态(包括文本、图像、3D 模型)进行组合/零件级 3D 生成和重建的新方法。地址: Threejs ai:生成极简 3D 场景工具,由网友@vidythatte 开发的根据文字/图片提示生成极简 3D 场景工具,输入提示文字即可迭代构建这样的场景,可以用它制作简单的故事交互应用。地址:
2025-01-03
最近有什么新的AI工具
以下是一些新的 AI 工具: 游戏方面: Unity 推出了两款 AI 工具,包括提供新 Copliot 工具,可通过与 Muse Chat 聊天快速启动创建游戏项目,如一键生成塔防类游戏基础框架、创建人物角色动作,还能协助编码和创建 3D 材质、动画等内容。Muse Chat 现已经开放 Waiting list,可通过 https://create.unity.com/aibeta 申请加入,官方提示这个暑假会进一步开放。 Unity Sentis 是第一个将 AI 模型嵌入到实时 3D 引擎中的跨平台解决方案,能在终端用户平台上增强游戏玩法和其他功能,目前还在封测阶段。 思维导图方面: GitMind:免费跨平台,支持多种模式,可通过 AI 自动生成思维导图。 ProcessOn:国内思维导图+AIGC 工具,能利用 AI 生成思维导图。 AmyMind:轻量级在线工具,无需注册登录,支持自动生成节点。 Xmind Copilot:基于 GPT 的 AI 思维导图助手,可一键拓展思路、生成文章大纲。 TreeMind:输入需求由 AI 自动完成思维导图生成。 EdrawMind:提供包括 AI 驱动的头脑风暴功能等一系列 AI 工具。 建筑设计审核规划平面图方面: HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster。 Maket.ai:面向住宅行业,能根据输入自动生成户型图。 ARCHITEChTURES:AI 驱动的三维建筑设计软件,可引入标准和规范约束设计结果。 Fast AI 人工智能审图平台:形成全自动智能审图流程,能实现数据汇总与管理。 需要注意的是,以上内容由 AI 大模型生成,请仔细甄别。每个工具都有其特定的应用场景和功能,建议根据具体需求选择合适的工具。
2024-12-25
给我写一段AI产品经理板块的介绍,一小段话,用于在公司内部的科技论坛上
在公司内部的科技论坛上,为您介绍 AI 产品经理板块: AI 产品经理可大致分为三个层级: 1. 入门级:能通过 WaytoAGI 等开源网站或课程了解 AI 概念,使用 AI 产品并动手实践应用搭建。 2. 研究级:有技术研究和商业化研究两条路径,能根据需求场景选择解决方案,或利用 Hugging face 等工具验证想法。 3. 落地应用级:有成功落地应用案例并产生商业化价值。 传统互联网 PM 也有类似的三个层级: 1. 负责功能模块与执行细节。 2. 负责整体系统与产品架构。 3. 熟悉行业竞争格局与商业运营策略。 对 AI 产品经理的要求是懂得技术框架,关注场景、痛点和价值。同时,为您列举一些岗位技能要求,如本科及以上学历,计算机科学等相关专业背景,熟悉多种 AI 工具的使用及原理,具备创新思维等。我们身边也有相关案例,如枫 share、行远等都是从事相关工作的产品经理。
2025-01-23
马斯克最新AI产品
马斯克最新的 AI 产品包括: 1. xAI 正式发布的 LLM 以及与之搭配的聊天产品 Grok。Grok 定位为一款模仿《银河系漫游指南》的人工智能,几乎可以回答任何问题,还会向用户提建议帮其决定要问什么问题。它具有叛逆性,会拒绝回答有害问题并嘲讽提问者。其独特优势是可以通过𝕏(Twitter)平台实时了解世界,还能回答大多数其他人工智能系统拒绝的尖锐问题。目前 Grok 还是早期测试产品,会优先向美国的 X 平台的 Premium Plus 用户提供。从已曝光的操作视频来看,在应用层面有很多体验优化,比如多任务同时生成内容、单个任务有分支功能、输出的代码支持在 VS Code 网页版编辑。此外,马斯克还提到要让特斯拉汽车的算力接入他们的 LLM 模型推理。 2. 在 2023 年 11 月 6 日的更新中,新增马斯克 xAI 的首个大模型 Grok,它通过 X 平台实时了解世界,能回答被大多数其他 AI 系统拒绝的棘手问题,仿照《银河系漫游指南》设计,可以回答几乎任何问题,甚至就如何提问给出建议,独具幽默回答模式尽量避免恶意提问,目前留下邮件可申请早期测试。
2025-01-22
有哪些与tldraw类似的产品
以下是一些与 tldraw 类似的产品: 1. Drawfast:结合 fal.ai 的 API 实现实时出图,用户绘制草稿即可生成 UI 并复制相关 html/css 代码。体验地址:https://drawfast.tldraw.com/ 。 2. tldraw computer:类似 coze 的节点式无限画布工具,无需代码,只用自然语言与节点模块搭建即可创建各类工作流,如“故事生成器”“图像融合工具”等。地址:https://computer.tldraw.com/home 。 3. Eapy:将自由画布形式与 AI Music 结合,能把用户上传的图片、音频、视频、文本等素材生成为音乐片段,支持 MIDI 和 WAV 文件,已支持多人协作。 4. ResearchFlow:把自由画布与学术研究结合,可基于用户输入的主题进行 AI 学术搜索、生成文本介绍并附上参考文献,右侧生成完整思维导图,用户能与每个内容节点深度交互,最终可导出成 PDF 等格式文档。
2025-01-22
什么AI产品适合ERP系统的产品经理提升工作效率使用?
以下是一些适合 ERP 系统产品经理提升工作效率的 AI 产品: 1. 产品:产品经理如何用 ChatGPT 能够使用 GPT 解决性能差和历史数据存档的问题,最终的 SQL 执行时间从 4200 秒缩短到 8 秒,效率提升了 520 倍,复杂度降低了 6 倍,同时还能保存所有的历史数据,报表可以秒开。 链接:https://waytoagi.feishu.cn/wiki/KzFpwfMPviMJPJkFyTVcEEWFneg?table=tblwdvsWICkId67f&view=vewm6DMY99 2. 产品:产品经理的流程优化 探讨了 AI 对产品经理工作流程的改变,普遍认为 AI 能帮助做一些琐碎的事情,有效率提升,但比较有限。 链接:https://waytoagi.feishu.cn/wiki/F6F1wbGN7iTp9akVWqHcubOhnqe?table=tblwdvsWICkId67f&view=vewm6DMY99 3. 运营:腾讯运营如何用 ChatGPT 认为 AI 技术的发展会对职业形态产生影响,ChatGPT 应被视为日常工作的辅助工具。 链接:https://waytoagi.feishu.cn/wiki/AlTlwOU0oi08sSkCU7gciINxng8?table=tblwdvsWICkId67f&view=vewm6DMY99 4. 三等奖作品:帮助企业快速建立产品智能客服体系 通过用户意图识别、知识库检索答案、AI 大模型总结输出答案、多轮对话沟通、对话分析打标、自动更新知识库 FAQ 以及客服效果分析,提供全面的 AI 客服解决方案,提高 AI 客服回答的准确率,降低企业商用 AI 客服的门槛。 链接:https://www.coze.cn/store/agent/7435703161304252450?bid=6ehlp53p81g14&bot_id=true 、https://www.coze.cn/store/agent/7437176474702463016?bid=6ehlohji09g0q&bot_id=true 5. ERP 高智版:扣子销售订单管理大师 为中小型消费品企业提供销售订单管理,智能识别和提取销售订单信息,存储至飞书多维表格,有助于降低企业销售订单管理的时间和人力成本,同时省去了昂贵的 ERP 系统购买费用。 链接:https://www.coze.cn/s/iAEuTYLc/ 6. Designbuddy:AI 帮你分析你的设计 作为 Figma 插件,提供对 UI 设计的深入反馈,涵盖布局、颜色、排版、可访问性的结构化评论,并为每个类别分配客观评分,有助于识别 UI 设计中经常被忽视的缺陷。 链接:https://designbuddy.net/ 7. AI Employe:GPT4V 驱动的浏览器自动化工具 开源、由 GPT4 视觉驱动,旨在自动化浏览器环境中的复杂任务,可以自动执行需要类人智能的任务,如理解电子邮件、收据和发票,并将数据从电子邮件传输到 CRM/ERP 系统。 链接:https://aiemploye.c
2025-01-22
我是一名数据产品经理,想转行ai产品经理,该从哪里入手。你的知识库里有哪些可以帮到我。最好把他们列举出来,具体一些最好有步骤
以下是为您整理的从数据产品经理转行 AI 产品经理的相关知识和建议: 一、AIPM 技能树 1. 理解产品核心技术 了解基本的机器学习算法原理,有助于做出更合理的产品决策。 2. 与技术团队有效沟通 掌握一定的算法知识,减少信息不对称带来的误解。 3. 评估技术可行性 在产品规划阶段,能更准确地判断某些功能的技术可行性。 4. 把握产品发展方向 了解算法前沿,更好地把握产品的未来发展方向。 5. 提升产品竞争力 发现产品的独特优势,提出创新的产品特性。 6. 数据分析能力 掌握相关知识,提升数据分析能力。 二、AI 提示词工程师岗位技能要求 1. 学历和专业背景 本科及以上学历,计算机科学、人工智能、机器学习相关专业背景。 2. 熟悉 AI 工具 熟悉 ChatGPT、Llama、Claude 等 AI 工具的使用及原理,并具有实际应用经验。 熟练掌握 ChatGPT、Midjourney 等 AI 工具的使用及原理。 3. 项目经验 负责制定和执行 AI 项目,如 Prompt 设计平台化方法和模板化方法。 4. 技术理解 了解并熟悉 Prompt Engineering,包括常见的 Prompt 优化策略(例如 CoT、Fewshot 等)。 5. 数据分析与决策 对数据驱动的决策有深入的理解,能够基于数据分析做出决策。 6. 创新思维 具有创新思维,能够基于业务需求提出并实践 AI first 的解决方案。 7. 技术关注 对 AI 技术与算法领域抱有强烈的好奇心,并能付诸实践。 对 AIGC 领域有深入的理解与实际工作经验,保持对 AI 技术前沿的关注。 8. 编程能力 具备一定的编程和算法研究能力,能应用新的 AI 技术和算法于对话模型生成。 具有一定的编程基础,熟练使用 Python、Git 等工具。 三、AI 市场与 AI 产品经理分析 当前有两个场景: 1. 企业(包括传统企业和互联网企业)如何实现 AI 转型或用好 AI。 2. 产品经理如何转型 AI 产品经理。 希望以上内容对您有所帮助。
2025-01-21
推荐一个数据分析的AI产品
以下为您推荐一些数据分析的 AI 产品: 1. PandasAI:让 Pandas DataFrame“学会说人话”的工具,用户可以以 Pandas DataFrame 的形式提出有关数据的问题,它会以自然语言、表格或者图表等形式进行回答。目前仅支持 GPT 模型,OpenAI API key 需自备。链接:https://github.com/gventuri/pandasai 2. DataSquirrel:自动进行数据清理并可视化执行过程,帮助用户在无需公式、宏或代码的情况下快速将原始数据转化为可使用的分析/报告。目前平台提供的用例涵盖了 B2B 电子商务、人力资源、财务会计和调查数据分析行业,并符合 GDPR/PDPA 标准。链接:https://datasquirrel.ai/ 3. 医渡云病历分析系统:利用 AI 分析医疗病历中的症状、检查结果等信息,为医生提供辅助诊断建议。 4. 讯飞听见会议总结功能:在会议中利用 AI 自动总结发言者的主要观点和重点内容,方便回顾和整理。
2025-01-21