Chat with Wiki - 今天的AI新闻

Answer

以下是 3 月 4 日、3 月 12 日和 3 月 14 日的 AI 新闻汇总：

3 月 4 日：

【AI 3D】
- Meshcapade：预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝。
- InsTaG：通过几秒钟视频学习，快速形成逼真的 3D 说话头像效果。
- 3D-Mem：新型 3D 场景记忆框架。
【AI 绘图】
- 智谱：开源 AI 绘图 CogView4，可以在图像中生成中文字符。
- 海螺：推出 Image-01 多功能文本转图像模型。
【AI 视频】
- Runway：网友爆料 Runway 内测能力可根据参考图像进行 Video to Video 视频风格化。
- Vidu：API 开放平台全面开放。
【AI 模型】
- Google Colab：推出 Data Science Agent。
- 微软：为医疗行业提供首个统一语音 AI 助手：Dragon Copilot。
- Opera：宣布推出网页浏览器的 AI 代理。

3 月 12 日：

【AI 3D】
- BlenderMCP：与 Claude AI 沟通，在 blender 实现快速 3D 建模。
- MIDI：单幅图像到 3D 场景生成。
- Move AI：更新动作捕捉能力，提出 Gen 2 Spatial Motion。
【AI 写作】
- MM-StoryAgent：AI 多模态故事生成系统。
【AI 视频】
- VACE：阿里推出一体化视频创作和编辑技术。
- VideoPainter：腾讯开源视频编辑技术。
- Wonder Dynamics：推出摄像机轨道（Camera Track）和清洁板（Clean Plate）功能。
【其他】
- OpenAI：为开发者推出一套 AI Agent 开发套件。
- R1-Omni：阿里情感识别模型，通过视频识别情感。
- Luma AI：发布一种新的预训练范式 IMM，旨在突破算法瓶颈，提高生成预训练算法的性能。
- Manus：宣布与阿里通义千问团队达成战略合作。

3 月 14 日：

【AI 模型及其他】
- 谷歌：Gemini 应用能力升级，包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。
- OpenAI：4 项更新。
- Bolt：一键将 Figma 设计转换为可运行的 Web 应用。
- 阿里：推出 AI 旗舰应用“新夸克”。
- 360 智脑团队：开源推理模型 Light-R1-14B-DS，复现 Deepseek 的强化学习效果。
【AI 视频】
- Pika：更新 Pikaffects，新增多款变身特效。
- Freepik 与 Fal 平台：引入 Topaz AI 的提升“FPS 和视频分辨率”能力。
- Krea：上线 Veo 2 模型，支持图生视频功能，但生成成本较高。
【AI 绘图】
- LBM：用于快速图像到图像转换的潜在桥匹配方法，支持可控图像重新照明、角色去除和图像修复。
【AI 语音】
- Sesame：开源 TTS 语音模型 CSM-1B。

Content generated by AI large model, please carefully verify (powered by aily)

References

3月4日 AI资讯汇总

猫叔留言：AI资讯公众号：超时空视角猫叔个人公众号：AI替代人类小红书/抖音：EverAI B站：Ever AI酱（❤这里会有教程及AI工具界面操作）[heading2]3月4日AI资讯[content]【AI 3D】Meshcapade：预告可从视频/图像中捕捉面部表情并具有逼真的3D发丝InsTaG：通过几秒钟视频学习，快速形成逼真的3D说话头像效果3D-Mem：新型3D场景记忆框架【AI绘图】智谱：开源AI绘图CogView4，可以在图像中生成中文字符海螺：推出Image-01多功能文本转图像模型【AI视频】Runway：网友爆料Runway内测能力可根据参考图像进行Video to Video视频风格化Vidu：API开放平台全面开放【AI模型】Google Colab：推出Data Science Agent微软：为医疗行业提供首个统一语音AI助手：Dragon CopilotOpera：宣布推出网页浏览器的AI代理

3月12日 AI资讯汇总

猫叔留言：AI资讯公众号：超时空视角猫叔个人公众号：AI替代人类小红书/抖音：EverAI B站：Ever AI酱（❤这里会有教程及AI工具界面操作）[heading2]3月12日AI资讯[content]【AI 3D】BlenderMCP：与Claude AI沟通,在blender实现快速3D建模MIDI：单幅图像到3D场景生成Move AI：更新动作捕捉能力，提出Gen 2 Spatial Motion【AI写作】MM-StoryAgent：AI多模态故事生成系统【AI视频】VACE：阿里推出一体化视频创作和编辑技术VideoPainter：腾讯开源视频编辑技术Wonder Dynamics：推出摄像机轨道（Camera Track）和清洁板（Clean Plate）功能【其他】OpenAI：为开发者推出一套AI Agent开发套件R1-Omni：阿里情感识别模型，通过视频识别情感Luma AI：发布一种新的预训练范式IMM，旨在突破算法瓶颈，提高生成预训练算法的性能Manus：宣布与阿里通义千问团队达成战略合作

3月14日 AI资讯汇总

猫叔留言：AI资讯公众号：超时空视角猫叔个人公众号：AI替代人类小红书/抖音：EverAI B站：Ever AI酱（❤这里会有教程及AI工具界面操作）3月14日AI资讯【AI模型及其他】谷歌：Gemini应用能力升级，包含升级推理模型gemini 2.0 Flash Thinking Experimental等多个功能提升OpenAI：4项更新Bolt：一键将Figma设计转换为可运行的Web应用阿里：推出AI旗舰应用“新夸克”360智脑团队：开源推理模型Light-R1-14B-DS，复现Deepseek的强化学习效果【AI视频】Pika：更新Pikaffects，新增多款变身特效Freepik与Fal平台：引入Topaz AI的提升“FPS和视频分辨率”能力Krea：上线Veo 2模型，支持图生视频功能，但生成成本较高【AI绘图】LBM：用于快速图像到图像转换的潜在桥匹配方法，支持可控图像重新照明、角色去除和图像修复【AI语音】Sesame：开源TTS语音模型CSM-1B，