与知识库对话 - 最近的AI新闻

回答

以下是近期的 AI 新闻汇总：

3 月 12 日：

【AI 3D】
- BlenderMCP：与 Claude AI 沟通，在 Blender 实现快速 3D 建模。
- MIDI：单幅图像到 3D 场景生成。
- Move AI：更新动作捕捉能力，提出 Gen 2 Spatial Motion。
【AI 写作】
- MM-StoryAgent：AI 多模态故事生成系统。
【AI 视频】
- VACE：阿里推出一体化视频创作和编辑技术。
- VideoPainter：腾讯开源视频编辑技术。
- Wonder Dynamics：推出摄像机轨道（Camera Track）和清洁板（Clean Plate）功能。
【其他】
- OpenAI：为开发者推出一套 AI Agent 开发套件。
- R1-Omni：阿里情感识别模型，通过视频识别情感。
- Luma AI：发布一种新的预训练范式 IMM，旨在突破算法瓶颈，提高生成预训练算法的性能。
- Manus：宣布与阿里通义千问团队达成战略合作。

3 月 14 日：

【AI 模型及其他】
- 谷歌：Gemini 应用能力升级，包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。
- OpenAI：4 项更新。
- Bolt：一键将 Figma 设计转换为可运行的 Web 应用。
- 阿里：推出 AI 旗舰应用“新夸克”。
- 360 智脑团队：开源推理模型 Light-R1-14B-DS，复现 Deepseek 的强化学习效果。
【AI 视频】
- Pika：更新 Pikaffects，新增多款变身特效。
- Freepik 与 Fal 平台：引入 Topaz AI 的提升“FPS 和视频分辨率”能力。
- Krea：上线 Veo 2 模型，支持图生视频功能，但生成成本较高。
【AI 绘图】
- LBM：用于快速图像到图像转换的潜在桥匹配方法，支持可控图像重新照明、角色去除和图像修复。
【AI 语音】
- Sesame：开源 TTS 语音模型 CSM-1B。

3 月 26 日：

【AI 模型及应用】
- OpenAI：推出 GPT-4o 图像生成能力。
- 谷歌：发布 Gemini 2.5 Pro Experimental 模型。
- Trea：已内置 DeepSeek-V3-0324。
【AI 音乐】
- 昆仑万维：发布全球首款音乐推理大模型 Mureka O1。
【AI 视频】
- 混元 Portrait：音频视频驱动图片肖像形成动画。
- PP-VCtrl：新可控制视频生成模型。
【AI 3D】
- Vibe Draw: 草图进行 3D 建模。
- PhysTwin：通过视频创建交互式物理数字孪生。
- GroomLight：用于重打光的人体头发外观建模的混合逆向渲染。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

3月12日 AI资讯汇总

猫叔留言：AI资讯公众号：超时空视角猫叔个人公众号：AI替代人类小红书/抖音：EverAI B站：Ever AI酱（❤这里会有教程及AI工具界面操作）[heading2]3月12日AI资讯[content]【AI 3D】BlenderMCP：与Claude AI沟通,在blender实现快速3D建模MIDI：单幅图像到3D场景生成Move AI：更新动作捕捉能力，提出Gen 2 Spatial Motion【AI写作】MM-StoryAgent：AI多模态故事生成系统【AI视频】VACE：阿里推出一体化视频创作和编辑技术VideoPainter：腾讯开源视频编辑技术Wonder Dynamics：推出摄像机轨道（Camera Track）和清洁板（Clean Plate）功能【其他】OpenAI：为开发者推出一套AI Agent开发套件R1-Omni：阿里情感识别模型，通过视频识别情感Luma AI：发布一种新的预训练范式IMM，旨在突破算法瓶颈，提高生成预训练算法的性能Manus：宣布与阿里通义千问团队达成战略合作

3月26日 AI资讯汇总

猫叔留言：AI资讯公众号：超时空视角猫叔个人公众号：AI替代人类小红书/抖音：EverAI B站：Ever AI酱（❤这里会有教程及AI工具界面操作）3月26日AI资讯【AI模型及应用】OpenAI：推出GPT-4o图像生成能力谷歌：发布Gemini 2.5 Pro Experimental模型Trea：已内置DeepSeek-V3-0324【AI音乐】昆仑万维：发布全球首款音乐推理大模型Mureka O1【AI视频】混元Portrait：音频视频驱动图片肖像形成动画PP-VCtrl：新可控制视频生成模型【AI 3D】Vibe Draw:草图进行3D建模PhysTwin：通过视频创建交互式物理数字孪生GroomLight：用于重打光的人体头发外观建模的混合逆向渲染

3月14日 AI资讯汇总

猫叔留言：AI资讯公众号：超时空视角猫叔个人公众号：AI替代人类小红书/抖音：EverAI B站：Ever AI酱（❤这里会有教程及AI工具界面操作）3月14日AI资讯【AI模型及其他】谷歌：Gemini应用能力升级，包含升级推理模型gemini 2.0 Flash Thinking Experimental等多个功能提升OpenAI：4项更新Bolt：一键将Figma设计转换为可运行的Web应用阿里：推出AI旗舰应用“新夸克”360智脑团队：开源推理模型Light-R1-14B-DS，复现Deepseek的强化学习效果【AI视频】Pika：更新Pikaffects，新增多款变身特效Freepik与Fal平台：引入Topaz AI的提升“FPS和视频分辨率”能力Krea：上线Veo 2模型，支持图生视频功能，但生成成本较高【AI绘图】LBM：用于快速图像到图像转换的潜在桥匹配方法，支持可控图像重新照明、角色去除和图像修复【AI语音】Sesame：开源TTS语音模型CSM-1B，