Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

openAI 最近的发布会都有哪些主要内容?

Answer

OpenAI 最近的发布会主要内容包括:

  • 2023 年 11 月的开发者大会,开放了 GPTs 和 GPT-4 Turbo 等一系列内容,不过由于 DDoS 攻击和负载问题,其所有服务断断续续挂了接近一天。
  • 之前还悄咪咪开放了两个新功能,包括可以上传 PDF 等文档进行分析和提问,以及在 GPT-4 加持下,代码解释器、图片交谈、图片生成和联网能力可自行选择完成任务。
  • 发布了图像生成模型 sCM 等。
Content generated by AI large model, please carefully verify (powered by aily)

References

AIGC 周刊 by 歸藏

|标题|概要|图片|链接|日期||-|-|-|-|-||2023年11月第二周|上周最重要的事情就是Open AI的开发者大会了,之前泄露的内容基本属实,不过还是低估了Open AI的实力。他们一共开放了GPTs和GPT-4 Turbo等一系列内容。同时由于DDos攻击和负载问题Open AI的所有服务断断续续挂了接近一天的时间,每次发版本都炸,太离谱了。||[AIGC Weekly#46](https://waytoagi.feishu.cn/wiki/R30twJA65iSSbPkwQ8ecXwySn9c)|2023/11/13||2023年11月第一周|为了狙击Open AI开发者大会的大招,马斯克的xAI提前发布了他们的LLM以及与之搭配的聊天产品Grok。||[AIGC Weekly#45](https://waytoagi.feishu.cn/wiki/LoS0wAXLHiHzq8kh0l7cLLgMnzd)|2023/11/06||2023年10月第四周|Open AI今天给一些人悄咪咪开放了两个新功能,现在他可以上传PDF等文档进行分析和提问了,GPT-4加持下想必能有更好的结果。另一个是现在代码解释器,图片交谈和图片生成还有联网能力不需要你自己选择了,你发出要求后他可以自行选择需要的能力完成任务。||[AIGC Weekly#44](https://waytoagi.feishu.cn/wiki/DDLHwCPdNijuuRkKSbrcr41ZnIb)|2023/10/30||2023年10月第三周|Midjourney终于发布了他们的图像放大功能,你现在最多可以将生成的图像放大4倍,重点是可以连续放大,效果太好了,买了Topaz照片放大的要亏了。||[AIGC Weekly#43](https://waytoagi.feishu.cn/wiki/B1vqwE30xi14q2klmrsc1WLwneg)|2023/10/23|

10月盘点:AI 行业大事记

Gartner发布2025年十大战略技术趋势DeepSeek●👑开源多模态LLM框架Janus司南●👑开源大模型能力评估模型CompassJudgerAnthropic●发布新功能computer useAnthropic●发布Claude 3.5 Haiku,更新Claude 3.5 SonnetStability AI●发布Stable Diffusion 3.5x.AI●正式推出APIComfyUI V1官方桌面版开放内测华为发布纯血操作系统鸿蒙OS NEXT10月23日Jina AI●推出高性能分类器Classifier APIOpenAI●发布图像生成模型sCMMidjourney●上线外部图片编辑器Runway●发布动画视频功能Act-OneIdeogram●推出AI画板工具CanvasGenmo●👑开源视频生成模型Mochi 1荣耀发布操作系统MagicOS 9.0美国14岁少年与C.AI聊天后离世新华社发文表示警惕「AI污染」乱象10月24日港中文&趣丸●推出TTS模型MaskGCT科大讯飞●发布讯飞星火4.0 Turbo阿里●通义代码模式开始内测Anthropic Claude●新增数据分析功能北京市大中小学推广AI学伴和AI导学应用稚晖君👑开源「灵犀X1」全套资料OpenAI●高管Miles Brundage离职10月25日

10月盘点:AI 行业大事记

9月27日Reecho睿声●三只羊录音事件涉及AI公司出面回应9月28日TeleAI●正式开源TeleChat2-115B10月1日快手●可灵AI全面开放APIOpenAI DevDay10月2日Black Forest Labs●发布FLUX1.1[pro]苹果●推出多模态大模型MM1.510月3日OpenAI●发布ChatGPT Canvas10月8日2024年诺贝尔物理学奖10月9日2024年诺贝尔化学奖10月10日字节●发布首款AI智能体耳机Ola FriendVivo●增加蓝心端侧大模型3B谷歌●图像生成模型Imagen 3开放使用智源●BGE登顶Hugging Face月榜State of AI 2024报告发布10月11日智谱●GLM-4-Flash与「沉浸式翻译」合作北大&北邮&快手●👑开源高清视频生成模型Pyramid Flow10月12日OpenAI●👑开源多智能体协作框架Swarm深势科技●完成数亿元人民币新一轮融资苹果●质疑当前LLM缺乏真正的逻辑推理能力10月14日

Others are asking
openAI关于道德规范的调整是什么
OpenAI 在道德规范方面的调整包括以下内容: 1. OpenAI 认为通过分析 ChatGPT 和 GPT4 用户对数百万条提示的反应,能获得知识以使未来的产品符合道德规范。 2. 随着公司承担更多任务并投入更多商业活动,有人质疑其在多大程度上能集中精力完成降低灭绝风险等任务。 3. OpenAI 与数以百计的内容审核员签订合同,对模型进行教育,使其了解对用户提示做出的不恰当或有害回答。 4. 山姆·奥特曼曾强调 AI 可能带来的潜在灾难,如大规模虚假信息传播、网络攻击以及威权政府滥用等,并对 OpenAI 最初的开放性承诺进行重新考虑。 5. 公司领导层认为董事会作为非营利性控制实体的一部分,将确保营收和利润的驱动力不会压倒最初的想法。但目前 OpenAI 还不清楚 AGI 到底是什么,其定义将由董事会决定。
2025-02-18
openai最近有什么新闻
以下是 OpenAI 最近的一些新闻: 1. 12 天连续直播相关结果,昨天 OpenAI 把 o1 模型在 API 中正式发布,之前发布的是 o1 Preview 历史版本,正式版思考花费的 token 少了 60%。 2. 北京时间 9 月 13 号凌晨 1 点多,OpenAI 宣布推出模型 o1preview 与 o1mini,拥有 Plus 版本的用户会陆续收到新模型权限,可在 Web 客户端中尝鲜体验。 3. OpenAI 更新风控与账号共享识别力度,可能会偷偷降低 ChatGPT 模型的调用规格,如 o1pro 降级为 o1。 4. 奥特曼谈 AI 推理能力进展,o1(2024 年 9 月)排名全球第 9800 名,o3(2024 年 12 月)提升至第 175 名,现内部模型已达全球第 50 名,预计今年内登顶第一。
2025-02-17
openAI过去几年的发展历程
OpenAI 在过去几年的发展历程如下: 在整个团队的努力下,迎来了技术高速发展的“黄金三年”,在自然语言处理领域取得突破性进展,推出了 GPT1、GPT2 和 GPT3 系列模型,每次模型迭代都使模型复杂度成指数级别上升,模型效果也越来越好。 2022 年 11 月 30 日,发布基于 GPT 3.5 的 ChatGPT,引发全球 AI 浪潮。 大约九年前创立,怀揣着对 AGI 潜力的坚定信念,渴望探索如何构建并使其惠及全人类。 创始人山姆·奥特曼回首创业历程,认为虽然有挑战和不愉快,但收获和成长巨大,也暴露出团队在管理上的不足。 展望 2025 年,坚信首批 AI Agent 将融入劳动力市场,目标已瞄准真正意义上的超级智能。新的一年充满反思,随着 AGI 脚步临近,是回顾公司发展历程的重要时刻。
2025-02-11
OpenAI总融资额是多少
OpenAI 的总融资额有所不同。根据相关报道,OpenAI 完成了 66 亿美元的融资,总筹资已达 130 亿美元,公司估值达 1570 亿美元。本轮融资由 Thrive Capital 领投,Tiger Global 和软银等参与。
2025-02-03
openai发展史
OpenAI 的发展历程如下: 2015 年成立,一直将 AGI 作为战略目标之一。 2022 年 11 月 30 日,发布基于 GPT 3.5 的 ChatGPT,引发全球 AI 浪潮。 在其内部会议上分享了关于通用人工智能(AGI)的五个发展等级,分别为: 聊天机器人(Chatbots):具备基本对话能力,主要依赖预设脚本和关键词匹配,用于客户服务和简单查询响应。 推理者(Reasoners):具备人类推理水平,如 ChatGPT,能够根据上下文和文件提供详细分析和意见。 智能体(Agents):不仅具备推理能力,还能执行全自动化业务,但目前许多产品执行任务后仍需人类参与。 创新者(Innovators):能够协助人类完成新发明,如谷歌 DeepMind 的 AlphaFold 模型,可加速科学研究和新药发现。 组织(Organizations):最高级别,能够自动执行组织的全部业务流程,如规划、执行、反馈、迭代、资源分配和管理等。 AI 的起源最早可追溯到上世纪: 1943 年,心理学家麦卡洛克和数学家皮特斯提出机器的神经元模型,为后续的神经网络奠定基础。 1950 年,图灵最早提出图灵测试,作为判别机器是否具备智能的标准。 1956 年,在美国达特茅斯学院,马文·明斯基和约翰·麦凯西等人共同发起召开著名的达特茅斯会议,人工智能(Artificial Intelligence)一词被正式提出,并作为一门学科确立下来。此后接近 70 年,AI 的发展起起落落。 Sam Altman 于 2025 年 1 月 6 日发表反思,回首创业历程,包括经历解雇等事件,也提到 2025 年首批 AI Agent 将融入劳动力市场,ChatGPT 两周岁时已迈入能进行复杂推理的全新模型时代,强调随着 AGI 临近,要回顾公司发展历程,继续探索。
2025-01-26
openai 的产品分析
OpenAI 的产品具有以下特点和发展情况: 去年 11 月发布了基于 GPT3.5 最新版本的消费级产品 ChatGPT,其具有强大的功能,能提供各种回答和完成多种任务,但也存在捏造事实的问题。ChatGPT 被视为 GPT4 的台标。 OpenAI 内部对于是否发布功能强大的工具存在争论,发布被视为让公众适应 AI 改变日常生活现实的战略一部分。 OpenAI 目前严重受限于 GPU,这影响了其多项计划,包括 API 的可靠性和速度、更长上下文窗口的推广、微调 API 以及专用容量的提供。 Sam Altman 分享了 OpenAI 近期路线,如 2023 年的首要任务是更便宜、更快的 GPT4,以及实现更长的上下文窗口、扩展微调 API 和推出有状态的 API。 2024 年 10 月有相关的视频和文章对 OpenAI 进行分析和介绍新产品,如剖析其从理想主义走向商业化的历程,以及介绍了四款创新 AI 产品。
2025-01-11
grok3 发布会亮点内容
Grok 3 发布会的亮点内容包括: 1. 包含两个模型版本:Grok 3 和 Grok 3mini。 2. 在 AIME 和 GPQA 在内的基准测试中显著优于其他模型,在数学推理、代码处理、科学问题方面表现优秀。 3. 具备推理能力,在提供更多测试计算时间的情况下,优于 o1 和 R1。 4. 今天向所有 Premium+订阅者推出(IOS、网页版都有),完整版在网页版,APP 上的 Grok 3 有一定削弱。 5. 新增“Deep Search”能力,能深入了解用户目的,访问并交叉验证多个信息源,确保研究内容准确,并公开执行搜索步骤。 6. 可以调用 Big Brain 功能加强计算来解决问题。 7. 现场演示中,Grok 3 可以生成游戏设计方案。 8. Grok 3 语音模式在大约一周内推出。 9. Grok 3 API 几周后推出。 10. Grok 2 将在 Grok 3 正式可用后开源,xAI 计划也会开源 Grok 3。
2025-02-19
OpenAI过去12天的发布会总结
以下是 OpenAI 过去 12 天发布会的总结: 自媒体记录方面: 夕小瑶科技说:o3 发布,可能影响码农工作。 孔某人的低维认知:OpenAI 圣诞 12 天总评,感谢大佬赏饭。 MAX 01Founder:一文详解 o3,虽接近 AGI 但使用成本高。 南瓜博士:使用 o3 钱包和脑子可能不够。 数字生命卡兹克:OpenAI 正式发布 o3,通往 AGI 路上已无障碍。 具体发布内容: Day12:o3 与 o3 mini 正式亮相。 Day11:ChatGPT 桌面应用,Option+空格快速唤起。 Day10:OpenAI 发布电话倾诉功能 18002428478。 Day9:o1 满血版 API 和 4o 实时语音 API 更新。 Day8:AI 搜索功能免费开放,并支持实时语音搜索。 Day7:ChatGPT 全新“项目”功能发布。 Day6:实时视频通话&圣诞老人模式正式上线。 Day5:ChatGPT 与 Apple 的深度合作。 Day4:直播“翻车”的 Canvas。 Day3:Sora 终于上线,有案例和功能详解。 Day2:微调 O1 模型,低成本高效率。 Day1:强化学习微调的实操案例。 宝玉日报 12 月 18 日: AI 架构与技术选型的 4 条原则:选主流框架、确保测试覆盖率、避免私有框架、采用模块化设计。 OpenAI 12 天发布会第 9 天:o1 API 正式版速度更快成本降低,支持多种新功能;语音交互升级,引入 WebRTC 支持,处理费用降低;新增偏好微调功能和工具包,简化 API 密钥申请流程。 易观分析报告预测了 AI 技术未来的关键发展方向,德邦证券报告对 OpenAI 十二日发布会进行深度总结,认为随着大模型能力提升和应用场景扩展,AI 应用商业价值有望实现,建议关注相关领域。
2024-12-31
openai发布会内容
以下是关于 OpenAI 发布会的相关内容: 1. 12 月 20 日,OpenAI 发布 AI 大模型风险防范框架文件,OpenAI 董事会有权决定发布新 AI 模型,框架文件提出防范 AI 大模型灾难性风险的路线图,董事会可推翻领导团队关于 AI 模型发布的决策。相关链接:https://openai.com/safety/preparedness 2. 12 月 12 日,OpenAI 连续 12 天 AI 发布会的第五天完整视频(中英文双语字幕),亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作,多平台无缝衔接,涵盖多种应用场景,实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接: 3. OpenAI 将在 11 月 6 日举办首次开发者大会,会上将发布重要更新,目标是让开发者能够更快捷和廉价地开发基于大模型的应用。此次更新最让人期待的部分是将推出 Stateful API,理论上可将大模型应用的开销削减为原来的二十分之一。相关链接:https://mp.weixin.qq.com/s/NPqAeSl3NQ0_wbHzsJSw
2024-12-19
OpenAI前六场发布会的内容提炼
以下是 OpenAI 前六场发布会的部分内容提炼: OpenAI 第六天发布会:ChatGPT 的高级语音模式获得公开访问权限,能通过自然语音与用户对话并理解屏幕内容,降低使用门槛,展示多模态能力和个性化发展潜力。 相关报告:甲子光年发布的《2024 人工智能产业 30 条判断——万千流变,一如既往》涵盖 AI 技术历史发展、当前趋势和未来预测,提到 Transformer 模型和 GPT 系列发展及在多行业应用,探讨了 AI 芯片进步、在科学研究中的角色和对社会的广泛影响,还预测了 AI 产业增长。中信建投证券的海外 AI 应用行业专题《旧金山草根调研与海外 AI 应用进展》长达 100 多页,聚焦旧金山草根调研及海外 AI 应用进展,显示旧金山及硅谷地区 AI 企业众多,AI 应用在 To B 场景如广告、助手、数据分析等领域受关注,长期看好,尤其是 C 端应用潜力,列举了多家公司及其业务领域、功能进展,并提供相关上市公司数据。 OpenAI 首届开发者大会:短短 45 分钟发布会,Sam Altman 表示团队对开发者关注的问题做了六大升级,包括更长的上下文长度、更强的控制、模型的知识升级、多模态、模型微调定制和更高的速率限制,前四条主要关于新模型性能提升,后两点针对企业开发者痛点,同时宣布 API 价格下调。
2024-12-17
OPenAI最近的产品发布会
OpenAI 近期举行了多次产品发布会: 去年 11 月晚些时候发布了基于 GPT3.5 最新版本的消费级产品 ChatGPT。公司内部对是否发布这样强大的工具存在争论,但 Altman 表示支持,认为这是让公众适应 AI 改变日常生活现实的战略一部分。ChatGPT 功能强大,能在 SAT 考试中获大学水平分数、写作文、总结书籍等,还能按各种要求改写。 近期举行了 12 场发布会,推出多个新产品,包括推理模型 o1、文字转视频工具 Sora 等。o1 正式版在复杂推理和数学能力上显著提升,推出的强化微调技术使模型更具专业性。 在 5 月份的 GPT4o 模型发布会上,邀请了可汗学院的创始人 Salman Khan 和他儿子一起使用 GPT4o 辅导孩子在可汗学院上做数学题,这是 OpenAI 第一次将多模态模型能力在教育场景上落地应用的尝试。
2024-12-17
openai发布会要点
以下是 OpenAI 发布会的要点: 1. 技术进步展示:从 GPT 4o 到 11 的技术跳跃,在数学竞赛 GPQA 中有出色表现。 2. 原始智能与编码性能:强调原始智能在编码性能方面的重要性,这是用户使用模型的主要领域。 3. 多模态处理能力:展示了模型处理困难问题和多模态输入的能力。 4. 新产品发布:推出聊天 GBT 专业版,提供无限制模型访问和高级语音模式;介绍 O one 亲模式,称其为世界上最智能的机型之一。 5. 性能提升:通过比较专业模式和普通模式,展示了在可靠性和性能上的提升。 6. 用户反馈与改进:根据用户反馈改进 O one 预览版,使其更快更智能,增加多模态输入功能,允许通过图像和文字进行联合推理。 7. Chat BT Pro 和 O one Pro 模式:Chat BT Pro 允许无限制访问最佳模型,如 O14,并提供 O one Pro 模式处理最困难的问题。 8. 错误率和速度提升:新模型的错误率比 O one 预览版少 34%,思考速度提高 50%。 9. 多模态推理演示:通过太空数据中心的案例展示多模态推理。 10. Chat BT Pro 的扩展功能:正在为其添加网页浏览、文件上传等更多功能。 此外,在 12 月 12 日和 12 月 15 日的宝玉日报中,提到 OpenAI 连续 12 天 AI 发布会的第五天亮点功能包括苹果设备深度集成 ChatGPT,可通过 Siri 实现文档总结、任务分配、节日创意等操作;多平台无缝衔接,支持 iPhone、iPad 和 Mac,涵盖多种应用场景;实用场景包括圣诞派对策划、PDF 总结、歌单生成、视觉智能评选毛衣创意等功能演示,体现全新交互体验。相关链接:https://x.com/dotey/status/1866974269051113543
2024-12-17
最近很火的AI工具
以下是一些最近很火的 AI 工具: 1. Unity 推出的两款 AI 工具: Copliot 工具:可通过与 Muse Chat 聊天快速启动创建游戏项目,如一键生成塔防类游戏基础框架、让人物角色做动作,还能协助编码和创建 3D 材质、动画等内容。现可申请加入等待列表:https://create.unity.com/aibeta ,官方提示暑假会进一步开放。 Unity Sentis:是第一个将 AI 模型嵌入到实时 3D 引擎中的跨平台解决方案,能在 Unity 运行时为游戏或应用程序嵌入 AI 模型,增强游戏玩法和其他功能,目前还在封测阶段。 2. NotebookLM:2024 年热门 AI 产品,12 月更新了新功能“加入”,用户可成为播客节目一环。但该功能存在一些限制,如很早之前就在 Google 开发者大会上展示过,最近才有 BETA 版;对部分地区用户有强限制,注意检查网络设置;“加入”功能使用不稳定,需多点耐心;目前只支持英语发言,上传文本语言不受限;目前只支持网页版,没有移动端。使用地址: 3. Writerbuddy AI 分析了 3000 多种 AI 工具,选出访问量最大的 50 个工具,ChatGPT 独占 60%流量。 4. MotionGPT 是多模态运动语言模型,可通过文字聊天生成逼真人体运动,并发布了演示视频。 5. Radishes 是开源无版权音乐平台,支持 Windows、macOS、Linux 和 Web,功能包括音乐搜索、下载、每日歌单推荐等。
2025-02-20
最近一个月有哪些产品更新了ai能力
以下是近一个月 AI 能力更新的相关产品情况: 1. 在 AI 视频应用场景方面: 服务头部创作者方面,未来产品会增强编辑器能力,智能化后期制作任务。 影视后期方向,可将动捕演员表演转化为虚拟角色提高特效制作效率。 专业领域,创作者能通过草图分镜快速验证效果,如动画制作产品 Fable 于今年 4 月试水 Prism Beta 功能。 C 端大众消费侧,AI 视频在小说、网文阅读、短情景剧等内容消费方向有潜力,人物识别和替换可衍生电商平台虚拟试衣间能力。 Viggle、DomoAI 的产品中的模板套用能力若以更低成本开放在短视频产品中,可能带来新的爆发周期。 2. Luma AI 产品: Dream Machine 目前支持 txt2vid 文生视频和 img2vid 图生视频两种能力,8 月底发布的 Dream Machine 1.5 增强了提示词理解能力和视频生成能力,对视频内文字的表现很强。 在 img2vid 图生视频方面,生成效果在多方面远超其他产品,如生成时长较长、运动幅度大、能产生相机多角度位移、提示词中可增加无人机控制的视角变化、运动过程中一致性保持较好、分辨率高且改善了运动幅度大带来的模糊感。 3. 头部产品能力测评: 9 月初针对 Runway(Gen3)、Luma AI(Dream Machine1.5)、可灵 1.0 进行了 txt2vid 和 img2vid 不同场景的测试。 9 月末可灵 1.5 与 Luma、Runway Gen3 的差距在缩小。
2025-02-19
deepseek最近有什么新进展
DeepSeek 近期有以下新进展: 深夜发布大一统模型 JanusPro,将图像理解和生成统一在一个模型中。 模型(7B):https://huggingface.co/deepseekai/JanusPro7B 模型(1B):https://huggingface.co/deepseekai/JanusPro1B JanusPro 是一种新型的自回归框架,通过将视觉编码解耦为独立的路径解决先前方法的局限性,同时利用单一的统一变压器架构进行处理。解耦缓解了视觉编码器在理解和生成中的角色冲突,增强了框架的灵活性,超越了之前的统一模型,并匹配或超过了特定任务模型的性能,成为下一代统一多模态模型的有力候选者。 在编码任务中已成为社区的最爱,其组合了速度、轻便性和准确性而推出的 deepseekcoderv2。
2025-02-19
列出最近很火的10个AI应用
以下是最近很火的 10 个 AI 应用: 1. AI 游戏道具推荐系统:使用数据分析、机器学习技术,已有产品如游戏内商城推荐功能,市场规模达数亿美元,能根据玩家需求推荐游戏道具。 2. AI 天气预报分时服务:运用数据分析、机器学习技术,如彩云天气分时预报,市场规模数亿美元,提供精准的分时天气预报。 3. AI 医疗病历分析平台:采用数据分析、自然语言处理技术,像医渡云病历分析系统,市场规模数十亿美元,可分析医疗病历辅助诊断。 4. AI 会议发言总结工具:借助自然语言处理、机器学习技术,例如讯飞听见会议总结功能,市场规模数亿美元,能自动总结会议发言内容。 5. AI 书法作品临摹辅助工具:通过图像识别、数据分析技术,有书法临摹软件,市场规模数亿美元,帮助书法爱好者进行临摹。 6. AI 摄影参数调整助手:利用图像识别、数据分析技术,一些摄影 APP 有参数调整功能,市场规模数亿美元,可根据场景自动调整摄影参数。 7. AI 音乐情感分析平台:使用机器学习、音频处理技术,如音乐情感分析软件,市场规模数亿美元,能分析音乐的情感表达。 8. AI 家居智能照明系统:基于物联网技术、机器学习技术,像小米智能照明系统,市场规模数十亿美元,实现家居照明的智能化控制。 9. AI 金融风险预警平台:运用数据分析、机器学习技术,如金融风险预警软件,市场规模数十亿美元,可提前预警金融风险。 10. AI 旅游路线优化平台:借助数据分析、自然语言处理技术,如马蜂窝路线优化功能,市场规模数亿美元,能根据用户需求优化旅游路线。
2025-02-17
最近有什么ai的大新闻吗
以下是 2024 年 3 月至 10 月 AI 领域的一些大新闻: 3 月:潞晨科技发布 OpenSora,Suno 发布 V3 版本。 4 月:英伟达发布硬件,股价飙升。 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 7 月:快手开源 LivePortrait 模型,实现表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 9 月:阿里云发布模型,海螺 AI 参战;商汤 Vimi 相机开放微博小程序,元象开源中国最大 MoE 大模型 XVERSEMoEA36B,OpenAI 发布 o1 模型,人工智能生成合成内容标识办法(征求意见稿),Jina AI 发布 ReaderLM 和 Jina Embeddings V3,DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,云栖大会,通义万相 AI 生视频上线,快手可灵 1.5 模型新增运动笔刷能力,腾讯元器智能体对外发布,秘塔科技产品经理 JD 走红 AI 圈,阶跃跃问接入 Step2 万亿参数 MoE 语言大模型,大模型测试基准研究组正式成立,钉钉 365 会员上线,讯飞星火 API 全新升级,豆包大模型全系列发布&更新,Vidu API 正式开放,加速企业级视频创作,OpenAI 发布高级语音功能。 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。
2025-02-15
我是一名教师,是一个AI小白,现在想系统学习相关内容,请帮我规划好
以下是为您规划的系统学习 AI 的方案: 第一阶段:迈出第一步,打好基础 1. 学习指南 系统性学习:避免碎片化输入,系统地阅读相关书籍、听取优质课程,了解 AI 的底层原理和发展历程。 2. 初步探索 避免弯路:不要仅依赖刷短视频学习,对于 B 站等平台上的内容要有选择性,注重质量高的系统性内容。 3. 加入 AI 社区 例如“通往 AGI 之路”开源知识库,参考新手指引入门。 第二阶段:深入学习 1. 了解 AI 基本概念 阅读「」,熟悉术语和基础概念,包括主要分支及相互联系。 浏览入门文章,了解历史、应用和发展趋势。 2. 开始学习之旅 参考「」,学习生成式 AI 等基础知识,推荐李宏毅老师的课程。 利用在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习,并争取获得证书。 第三阶段:选择感兴趣的模块深入 1. 领域选择 AI 领域广泛,如图像、音乐、视频等,根据兴趣选择特定模块深入学习。 掌握提示词技巧,因其上手容易且实用。 第四阶段:实践和尝试 1. 巩固知识 理论学习后通过实践巩固,尝试使用各种产品创作作品。 分享实践成果。 第五阶段:体验 AI 产品 1. 互动学习 尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解工作原理和交互方式,获取实际应用体验,激发对 AI 潜力的认识。
2025-02-22
偏推理型的内容,怎么提升模型的推理深度及准确度?
提升模型推理深度及准确度的方法包括以下几个方面: 1. 扩大模型规模:随着模型规模的扩大,其推理能力会得到提升,类似于 AlphaGo 或 AlphaZero 的工作方式,通过蒙特卡罗推演来修改评估函数,从而提高推理精度。 2. 引入多模态学习:引入图像、视频和声音等多种模式将极大地改变模型的理解和推理能力,特别是在空间理解方面。多模态模型可以通过更多的数据和更少的语言来进行学习。 3. 优化训练方法: RLHF(Reinforcement Learning from Human Feedback):模型在这个过程中的目标是最大程度地获得人类的认可,通过奖励模型来衡量。 结合不同的推理能力提高途径:将生成不同的思维链(CoT)并选择有效路径的方法,与在部署时用大量计算进行推理的方法结合起来。 4. 改进模型结构和算法: 规模和算法是科技进步的关键因素,数据和计算规模具有决定性作用。 在模型之上添加启发式方法或增加模型本身的规模。 此外,Hinton 还提到了一些相关观点,如最合理的模型是将符号转换成大向量并保留符号的表面结构,大型语言模型通过寻找共同的结构来提高编码效率,以及即使训练数据中有错误,大型神经网络也具有超越训练数据的能力等。
2025-02-21
有java scala hadoop spark flink开发经验员工入门AI 学习提纲以及对应学习内容
以下是为有 Java、Scala、Hadoop、Spark、Flink 开发经验的员工提供的 AI 入门学习提纲及对应学习内容: 1. 学习资源推荐: 系统化学习:观看李弘毅老师的生成式 AI 导论、吴达的生成式 AI 入门视频等,并整理学习笔记与大家交流互动。 社区共创学习:参与社区共创活动,通过做小项目反向推动学习。 参考资料:A16Z 推荐的 AI 相关原理内容,包括 GPT 相关知识、Transformer 模型运作原理、大语言模型词语接龙原理等基础知识。 官方 cookbook:open AI 的官方 cookbook,小琪姐做了中文精读翻译。 历史脉络资料:整理 open AI 的发展时间线、万字长文回顾等。 2. 学习路径: 从提示词开始学习与各类模型的对话,了解其重要性和结构化提示词的优势。 学习过程中可以先从国内模型工具入手,不花钱,若想进阶再考虑高阶方向。 3. 其他学习方式: 创作者将内容做成可视化形式,后续会发到群里。 上传相关 PPT 用作参考。 从温达、李弘毅老师课程等学习入门。 了解时代杂志评选的百位领军人物。 学习 AI 相关名词解释,如 AGI、AIGC、agent、prompt 等,可通过与 AI 对话或李继刚老师的课程来理解。 订阅赛博蝉星公众号、国外优质博主的 blog 或 Twitter 等获取最新信息并投稿。 参与社区活动,如 AIPU、CONFIUI 生态大会、每月的切磋大会、新活动 AIPO 等。
2025-02-21
我想学习关于ai生成装修方案的内容
以下是关于学习 AI 生成装修方案的一些建议和资源: 1. 学术方面: 搜索相关学术论文,了解 AI 在装修设计领域的应用和研究成果。可通过 Google Scholar、IEEE Xplore、ScienceDirect 等学术数据库进行搜索。 2. 书籍方面: 查找与 AI 在装修设计领域相关的专业书籍,了解其应用和案例。 3. 在线课程和教程: 参加 Coursera、edX、Udacity 等平台上的 AI 和装修设计相关课程。 在 YouTube 等视频平台上查找教程和演示视频,了解 AI 在装修设计中的应用。 4. 技术论坛和社区: 加入相关的技术论坛和社区,如 Stack Overflow、Reddit 的相关板块,与其他专业人士交流和学习。 关注 AI 和装修设计相关的博客和新闻网站,了解最新的技术动态和应用案例。 5. 开源项目和代码库: 探索 GitHub 等开源平台上的 AI 和装修设计相关项目,了解其应用和实现。 6. 企业案例研究: 研究 AI 在装修设计领域应用的企业案例,了解 AI 技术在实际项目中的应用和效果。 7. 具体案例: 整个装修方案流程可由 GPT4 生成,包括图纸、预算、设计装修风格、施工、风水布局,最后出 3D 效果图,全屋显示。 此外,谷歌还有生成式 AI 课程,学习路径将引导您完成有关生成式 AI 产品和技术的精选内容集合,从大型语言模型的基础知识,到如何在 Google Cloud 上创建和部署生成式 AI 解决方案。链接为:https://www.cloudskillsboost.google/journeys/118 ,其中包含 10 个独立课程。
2025-02-20
如何把视频的内容,包括对话的文字提取并总结成文字?
要把视频的内容包括对话文字提取并总结成文字,可以按照以下步骤进行: 1. 对于有字幕的 B 站视频,如果视频栏下面有字幕按钮,说明视频作者已上传字幕或后台适配了 AI 字幕。 2. 安装油猴脚本: 。 3. 安装之后刷新浏览器,点击字幕会出现“下载”按钮。 4. 点击下载按钮,选择多种字幕格式,如带时间或不带时间的。 5. 将下载的字幕文字内容全选复制发送给 GPTs 进行总结。 此外,还有一个集成的视频理解系统 MMVid,它由 Microsoft Azure AI 开发,结合了 GPT4V 的能力和其他视觉、音频和语音处理工具,能处理和理解长视频和复杂任务,能够自动识别和解释视频中的元素,如人物行为、情感表达、场景变化和对话内容,从而实现对视频故事线的理解,其核心功能是将视频中的多模态信息转录成详细的文本脚本,方便大语言模型理解视频内容。
2025-02-20
视频内容提取
视频内容提取的方法主要有以下几种: 1. 使用 OpenCV 从视频中提取帧,例如从包含野牛和狼的自然视频中提取帧,显示帧以确保正确读取。 2. 对于谷歌 Gemini 多模态提示词培训课中的示例,在数字营销中从视频提取关键元素,如标题、描述和元数据。首先加载数据,包括视频的 URI、URL 和 Path,然后导入视频,写好提示,为模型指定角色和明确任务,如提取标题、撰写摘要、提供以 JSON 格式的元数据。 3. 如果想用 AI 把小说做成视频,流程如下: 小说内容分析:使用如 ChatGPT 等 AI 工具分析小说,提取关键场景、角色和情节。 生成角色与场景描述:用如 Stable Diffusion 或 Midjourney 等工具生成视觉描述。 图像生成:使用 AI 图像生成工具创建图像。 视频脚本制作:将关键点和生成的图像组合成脚本。 音频制作:利用如 Adobe Firefly 等工具将文本转换为语音,添加背景和音效。 视频编辑与合成:使用如 Clipfly 或 VEED.IO 等软件合成视频。 后期处理:进行剪辑、添加特效和转场以提高质量。 审阅与调整:观看视频并根据需要调整。 输出与分享:完成编辑后输出并分享。 请注意,具体操作步骤和所需工具可能因项目需求和个人偏好不同而有所差异,且 AI 工具的可用性和功能可能会变化,建议获取最新信息和使用指南。
2025-02-20