Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

最近有什么新的AI

Answer

以下是近期的一些新的 AI 相关资讯:

  • 3 月 12 日:
    • 【AI 3D】BlenderMCP 能与 Claude AI 沟通,在 Blender 实现快速 3D 建模;MIDI 可实现单幅图像到 3D 场景生成;Move AI 更新动作捕捉能力,提出 Gen 2 Spatial Motion。
    • 【AI 写作】MM-StoryAgent 是 AI 多模态故事生成系统。
    • 【AI 视频】VACE 是阿里推出的一体化视频创作和编辑技术;VideoPainter 是腾讯开源的视频编辑技术;Wonder Dynamics 推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。
    • 【其他】OpenAI 为开发者推出一套 AI Agent 开发套件;R1-Omni 是阿里情感识别模型,通过视频识别情感;Luma AI 发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能;Manus 宣布与阿里通义千问团队达成战略合作。
  • 3 月 21 日:
    • 【AI 绘画】网传神秘 Halfmoon 文本转图像模型为 Reve 对比 Midjourney 效果;Topaz Labs 推出 Gigapixel v8.3.0,将任何图像放大 16 倍;FLORA 引入 gemini 2.0 自然语言编辑图像能力。
    • 【AI 视频】pika 超创内测“操控原视频中物体运动”能力;Krea 上线视频模型训练能力,可控制视频风格/动作/物体等。
    • 【AI 3D】SpatialLM 是用于空间理解的大型语言模型。
    • 【AI 模型及应用】OpenAI 发布 2 个语音模型(文本转语音/语音转文本)+1 个演示网站;Claude 支持搜索功能。
  • 10 月 19 日:
    • Perplexity AI 新功能:内部知识搜索,结合公共网页和内部知识库,适用于各类团队;Space 空间,支持团队协作、个性化 AI 以及文件上传与存储功能。
    • XGO Rider 机器人:桌面双轮足式 AI 机器人,具备自平衡功能,是 STEM 学习工具,支持编程执行任务,提升动手能力。
    • Mistral 新 AI 模型:Les Ministraux,专为边缘设备设计,优化隐私优先任务,具备 128k 上下文窗口,性能优于 Llama 和 Gemma 模型。
Content generated by AI large model, please carefully verify (powered by aily)

References

3月12日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)[heading2]3月12日AI资讯[content]【AI 3D】BlenderMCP:与Claude AI沟通,在blender实现快速3D建模MIDI:单幅图像到3D场景生成Move AI:更新动作捕捉能力,提出Gen 2 Spatial Motion【AI写作】MM-StoryAgent:AI多模态故事生成系统【AI视频】VACE:阿里推出一体化视频创作和编辑技术VideoPainter:腾讯开源视频编辑技术Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能【其他】OpenAI:为开发者推出一套AI Agent开发套件R1-Omni:阿里情感识别模型,通过视频识别情感Luma AI:发布一种新的预训练范式IMM,旨在突破算法瓶颈,提高生成预训练算法的性能Manus:宣布与阿里通义千问团队达成战略合作

3月21日 AI资讯汇总 副本

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)3月21日AI资讯【AI绘画】网传神秘Halfmoon:文本转图像模型为Reve对比Midjourney效果Topaz Labs:推出Gigapixel v8.3.0,将任何图像放大16倍。FLORA:引入gemini 2.0自然语言编辑图像能力【AI视频】pika:超创内测“操控原视频中物体运动”能力Krea:上线视频模型训练能力,可控制视频风格/动作/物体等【AI 3D】SpatialLM:用于空间理解的大型语言模型【AI模型及应用】OpenAI:发布2个语音模型(文本转语音/语音转文本)+1个演示网站Claude:支持搜索功能[heading2]

XiaoHu.AI日报

🔔Xiaohu.AI日报「10月19日」✨✨✨✨✨✨✨✨1⃣️🔍Perplexity AI新功能:内部知识搜索:结合公共网页和内部知识库,适用于各类团队。Space空间:团队协作、个性化AI支持,文件上传与存储功能。🔗[https://x.com/imxiaohu/status/1847190899744559275](https://x.com/imxiaohu/status/1847190899744559275)2⃣️🤖XGO Rider机器人:桌面双轮足式AI机器人,具备自平衡功能。STEM学习工具,支持编程执行任务,提升动手能力。🔗[https://xiaohu.ai/p/14701](https://xiaohu.ai/p/14701)🔗[https://x.com/imxiaohu/status/1847242643354619954](https://x.com/imxiaohu/status/1847242643354619954)3⃣️🌟Mistral新AI模型:Les Ministraux,专为边缘设备设计,优化隐私优先任务。具备128k上下文窗口,性能优于Llama和Gemma模型。🔗[https://xiaohu.ai/p/14789](https://xiaohu.ai/p/14789)🔗[https://x.com/imxiaohu/status/1847280532939587869](https://x.com/imxiaohu/status/1847280532939587869)

Others are asking
目前的AI设计软件,能直接生成课程海报吗
目前的 AI 设计软件能够直接生成课程海报。例如 Claude 这款工具,其 Artifact 功能强大,无需专业设计技能和代码编写,也无需使用 PS 等软件,仅通过输入提示词和对话交流,就能生成课程海报,还能根据需求进行修改,如合并课程、添加日历、调整色彩等。 此外,还有一些其他的 AI 海报生成工具: 1. Canva(可画):https://www.canva.cn/ ,提供大量模板和设计元素,AI 功能可协助选择颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ ,智能设计工具采用先进人工智能技术,自动分析和生成设计方案。 3. VistaCreate:https://create.vista.com/ ,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ ,通过简单拖放界面创建演示文稿、社交媒体帖子等视觉内容,集成丰富模板库和自动图像编辑功能。 另外,还有一个海报设计的案例分享——东阿阿胶。其步骤包括得到需求、提取元素、绘制线稿、用 controlnet 转绘上色、ps 优化、定稿。具体为:确定需求并提取元素,如风格要潮流插画、有唐代元素和国潮等;绘制线稿,根据需求调整元素,如将驴子换成琵琶等;拆分元素线稿,绘制单个元素使其更精致,方便后期替换;利用拼接好的线稿跑图抽卡,选出合适的进行 ps 优化;最后根据客户需求进行元素替换得到定稿。上色运用的大模型为 GhostMix 鬼混_V2.0,lora 模型为“盒子系列——平面国潮插画_v1.0:182ba9e2f576”,controlnet 模型为“Module:lineart_coarse,Model:contr”。
2025-03-26
不懂得提问ai,得出的答案总是不满意,又得费很多时间自己改
以下是一些关于如何向 AI 提问以获得满意答案的建议: 1. 避免追问 AI,因为这可能导致回答越来越离谱。可以使用 ChatGPT 的 temporary chat 功能,保证 AI 在没有任何记忆的情况下生成最新鲜的回答。 2. 当 AI 回答不理想时,可以告诉它退一步,重新审视整个结构,设想从零开始如何设计,以获得更简洁、直观的解决方案。 3. 如果 AI 自己猜测并修改问题,可让它依据日志判断问题所在。 4. 对于刚开始接触 AI 的用户,很多时候答案不符合预期并非 AI 能力问题,而是用户没有把问题和要求描述清楚。在提问时要把背景描述完整,把要求解释清楚,包括细节。 5. 推荐使用 5W1H 方法充分说明信息,即说清楚为什么(Why)、做什么(What)、啥时候(When)、涉及谁(Who)、在哪里(Where)、怎么做(How)。 6. 可以使用引号、分隔符号以及“首先、其次、最后”等连接词来组织 Prompt,赋予 AI 明确的角色,如专注于民商事法律领域的律师等。 7. 按照【设定角色+任务目标+上下文和背景信息+(正面要求)详细需求和细节性信息+(负面要求)限制和不需要的内容+回答的语言风格和形式】的格式进行提问。 8. 讲清楚背景和目的,例如律师在处理交通事故案件时,清晰描述案件事实、法规等。 9. 学会提出好问题,使用清晰、具体的语言,避免模糊表述,了解 AI 的工作原理和限制,以提高回答准确性。 10. 在应用 AI 之前,对工作流程进行细致拆解,将复杂任务分解成更小、更具体的环节,以便 AI 更精确执行。
2025-03-26
最近的AI新闻
以下是近期的 AI 新闻汇总: 3 月 12 日: 【AI 3D】 BlenderMCP:与 Claude AI 沟通,在 Blender 实现快速 3D 建模。 MIDI:单幅图像到 3D 场景生成。 Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】 MMStoryAgent:AI 多模态故事生成系统。 【AI 视频】 VACE:阿里推出一体化视频创作和编辑技术。 VideoPainter:腾讯开源视频编辑技术。 Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】 OpenAI:为开发者推出一套 AI Agent 开发套件。 R1Omni:阿里情感识别模型,通过视频识别情感。 Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。 Manus:宣布与阿里通义千问团队达成战略合作。 3 月 14 日: 【AI 模型及其他】 谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。 OpenAI:4 项更新。 Bolt:一键将 Figma 设计转换为可运行的 Web 应用。 阿里:推出 AI 旗舰应用“新夸克”。 360 智脑团队:开源推理模型 LightR114BDS,复现 Deepseek 的强化学习效果。 【AI 视频】 Pika:更新 Pikaffects,新增多款变身特效。 Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。 Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。 【AI 绘图】 LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。 【AI 语音】 Sesame:开源 TTS 语音模型 CSM1B。 3 月 26 日: 【AI 模型及应用】 OpenAI:推出 GPT4o 图像生成能力。 谷歌:发布 Gemini 2.5 Pro Experimental 模型。 Trea:已内置 DeepSeekV30324。 【AI 音乐】 昆仑万维:发布全球首款音乐推理大模型 Mureka O1。 【AI 视频】 混元 Portrait:音频视频驱动图片肖像形成动画。 PPVCtrl:新可控制视频生成模型。 【AI 3D】 Vibe Draw: 草图进行 3D 建模。 PhysTwin:通过视频创建交互式物理数字孪生。 GroomLight:用于重打光的人体头发外观建模的混合逆向渲染。
2025-03-26
ai能写科技论文吗?
AI 能够写科技论文。在论文写作领域,AI 技术的应用正在迅速发展,能提供从文献搜索、内容生成、语言润色到数据分析等多方面的辅助。 一些常用的论文写作相关 AI 工具和平台包括: 1. 文献管理和搜索:Zotero 能结合 AI 技术自动提取文献信息,Semantic Scholar 是由 AI 驱动的学术搜索引擎,可提供文献推荐和引用分析。 2. 内容生成和辅助写作:Grammarly 可通过 AI 技术提供文本校对、语法修正和写作风格建议,Quillbot 是基于 AI 的重写和摘要工具,能帮助精简和优化论文内容。 3. 研究和数据分析:Google Colab 提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于进行数据分析和可视化,Knitro 用于数学建模和优化,可帮助进行复杂的数据分析和模型构建。 4. 论文结构和格式:LaTeX 结合了自动化和模板,可高效处理论文格式和数学公式,Overleaf 是在线 LaTeX 编辑器,提供丰富模板库和协作功能,简化论文编写过程。 5. 研究伦理和抄袭检测:Turnitin 是广泛使用的抄袭检测工具,Crossref Similarity Check 通过与已发表作品比较,检测潜在抄袭问题。 但需要注意的是,虽然 AI 工具是好东西,但目前大多数人还停留在零碎使用的阶段,未系统应用到工作场景中。比如有人像小明那样,在挑选和切换工具时浪费不少时间,导致效率降低。问题不在于 AI,而在于没有形成适合自己的 AI 工作方法论和流程。未来,科技精英可能更多扮演“与 AI 协作”的角色,引导 AI 工作并保持审慎监督。使用这些 AI 工具时,要结合自己的写作风格和需求,选择最合适的辅助工具。
2025-03-26
ai编程
以下是关于 AI 编程的相关信息: Trae 国内版 是国内首个 AI IDE,自带豆包 1.5pro 和满血版 DeepSeek R1、V3 模型。 具有国内用户友好、使用完全免费、内置预览插件等特性。 网址:Trae.com.cn 或点击文末【阅读原文】直接访问。 借助 AI 学习编程的关键 打通学习与反馈循环,包括验证环境、建立信心、理解基本概念,实现“理解→实践→问题解决→加深理解”的循环。 使用流行语言和框架,先运行再优化,小步迭代,借助 AI 生成代码后请求注释或解释,遇到问题三步走:复现、精确描述、回滚。 用好 AI 编程工具(如 Cursor)的关键技能 准确描述需求,清晰表达目标和问题。 具备架构能力,将复杂系统拆解为松耦合的模块。 拥有专业编程能力,能够判断 AI 生成代码的优劣。 具备调试能力,快速定位问题并解决,可独立或借助 AI 完成调试。
2025-03-26
ai编程
以下是关于 AI 编程的相关信息: Trae 国内版 是国内首个 AI IDE,自带豆包 1.5pro 和满血版 DeepSeek R1、V3 模型。 具有以下特性: 对国内用户友好,有中国官网、中文界面、国内模型,稳定且快速。 使用完全免费,无需折腾会员,下载后可直接使用。 内置预览插件,写完代码一键运行,所见即所得。 网址:Trae.com.cn 或点击文末【阅读原文】直接访问。 借助 AI 学习编程的关键 打通学习与反馈循环,包括验证环境、建立信心、理解基本概念,实现“理解→实践→问题解决→加深理解”的循环。 建议使用流行语言和框架(如 React、Next.js、TailwindCSS),先运行再优化,小步迭代,一次解决一个小功能,借助 AI 生成代码后请求注释或解释以帮助理解代码,遇到问题时采取复现、精确描述、回滚的步骤。 用好 AI 编程工具(如 Cursor)的关键技能 准确描述需求,清晰表达目标和问题。 具备架构能力,将复杂系统拆解为松耦合的模块,便于 AI 高效处理。 拥有专业编程能力,能够判断 AI 生成代码的优劣。 具备调试能力,快速定位问题并解决,可独立或借助 AI 完成调试。
2025-03-26
最近有什么新产品
以下是近期的一些 AI 新产品: Microsoft 在 Build 2023 发布了 50 多项与 AI 相关的新产品。 Google 将图像生成功能整合进商业营销工具与 Bard,并正式开始测试 AI 版搜索引擎。 Meta 开源了基于圣经训练的、能识别超过 4,000 种口语、对 1,100 多种语言进行语音文字互换的 MMS 模型。 NVIDIA 突破万亿美元市值,其 CEO 黄仁勋在 COMPUTEX 大会上推出一系列产品,包括搭载 256 颗 GH200 Grace Hopper 超级芯片的新型 DGX GH200 超算。 此外,还有以下新产品: 包括 4 个有用的和 3 个好玩的新产品,5 个初创公司的新产品以及 2 家大公司的新动态。 有用的新产品从通用场景及垂直场景进行了划分,还单列了模型训练、AI 安全、代码学习和 AI 代理等关注度较高的类别。 好玩的新产品各有特色,如 Andrej Karpathy 本人开发的电影搜索工具、梦境生成与存储器、虚拟音乐电台等。 15 个初创企业的新产品,从开源和闭源的角度进行了划分,开源产品有 8 个,闭源有 7 个。 14 个大公司的新产品,包括微软、谷歌、英伟达、苹果、Palantir 等公司,还有来自俄罗斯的 Sberbank。 在软件方面: :一家专注于人工智能技术的创新公司,最近推出了全新的开源图像生成模型 DeepFloyd IF,能生成高质量图像,具有良好的可控性和稳定性。 :一个社区组织,致力于为制作人和音乐家开发开源的音频生成工具。 ,用于微调 HuggingFace 语言模型。 :一个去中心化的研究社区,旨在将机器学习和生物学相结合,推动科学研究的民主化。 :一种新颖、开放和协作的医学 AI 研究方法。 :最新最先进的开源文本图像模型,语言理解能力强,生成的图像真实感高。 :一个应用程序套件,可帮助使用 AI 轻松修改图像。
2025-03-26
最近有什么新产品
以下是近期的一些 AI 新产品: Microsoft 在 Build 2023 发布了 50 多项与 AI 相关的新产品。 Google 将图像生成功能整合进商业营销工具与 Bard,并正式开始测试 AI 版搜索引擎。 Meta 开源了基于圣经训练的、能识别超过 4,000 种口语、对 1,100 多种语言进行语音文字互换的 MMS 模型。 NVIDIA 突破万亿美元市值,其华人 CEO 黄仁勋在 COMPUTEX 大会上推出一系列产品,包括搭载 256 颗 GH200 Grace Hopper 超级芯片的新型 DGX GH200 超算。 此外,还有以下具体的新产品: 有用的和好玩的新产品:包括 4 个有用的、3 个好玩的、5 个初创公司的新产品以及 2 家大公司的新动态。 初创公司的新产品如:StabilityAI 推出的全新开源图像生成模型 DeepFloyd IF;Harmonai 为制作人和音乐家开发的开源音频生成工具;CarperAI 开源的 Transformer Reinforcement Learning X等。 好玩的产品如 Andrej Karpathy 本人开发的电影搜索工具等。 4 月动态中的新产品: 15 个初创企业的新产品,分为开源和闭源。 39 个有用的和 10 个好玩的新产品,包括从通用场景、垂直场景划分的产品,以及模型训练、AI 安全、代码学习和 AI 代理等类别。 14 个大公司的新产品,如微软、谷歌、英伟达、苹果、Palantir 等公司的产品。
2025-03-26
最近有什么比赛
以下是为您整理的近期相关比赛: 元子:小白的 30min 百宝箱测评中提到,作者所在的小队伍“来都来了”最近在参加各种比赛,发现百宝箱开始大力搞比赛。 AI 绘画大赛: 开学综合症主题 AI 绘画大赛,时间为 2023/08/24 00:00~09/08 00:00,线上举办,热度 64。 开启超现实之旅——达利艺术风格 AI 绘画大赛,时间为 2023/08/29 00:00~09/10 00:00,线上举办,热度 38。 2023IKCEST 第五届“一带一路”国际大数据竞赛,时间为 2023/07/10 00:00~09/15 00:00,线上举办,热度 33。 阿里云×森马 AIGC T 恤设计大赛,时间为 2023/08/21 00:00~09/21 00:00,线上举办,热度 112。 大模型技术应用创新大赛,时间为 2023/08/01 00:00~08/31 23:59,线上举办,热度 29。 自如设计周 AI 创意设计大赛,时间为 2023/08/28 00:00~09/11 23:59,线上举办,热度 61。 共此七夕▏画出最爱的 TA,最高可得 1000 积分哦,时间为 2023/08/21 00:00~09/03 00:00,线上举办,热度 67。 【水浒将星录】AI 绘图大赛,时间为 2023/08/18 00:00~09/28 23:59,线上举办,热度 283。 温度新闻 x 无界 AI 迎亚运 AI 绘画大赛,时间为 2023/08/17 00:00~08/31 23:59,线上举办,热度 108。 奇迹少女大电影海报 AI 创意大赛,时间为 2023/08/07 00:00~08/16 23:59,线上举办,热度 505。 绘梦敦煌 AI 绘画大赛,时间为 2023/07/20 00:00~08/20 23:59,线上举办,热度 168。 AI 比赛列表: 【灵璧 AI】安徽文创,截止日期为 01150315,奖金奖项为一等奖 2k1 二等奖 1k2 三等奖 8005,主题为赛道一:数字艺术创作 赛道三:数字故事讲述,作品类型为赛道一:数字艺术创作,利用 AIGC 技术创作数字绘画、数字雕塑等艺术作品;赛道二:互动体验设计,设计互动体验项目,如 AR/VR 体验、互动游戏等;赛道三:数字故事讲述,创作以虞姬及灵璧特色历史文化为主题的数字故事,如动画短片等。关键要求为只能提交一份作品。以压缩包上传,材料包含创作作品的源文件、prompt 指令、制作过程的关键过程截图、录屏与说明等。提交方式为邮箱: 。 创无界智未来·文旅应用赛,截止日期为 01010330,奖金奖项为一等奖 10w1 二等奖 6w2 三等奖 3w3,主题为四个赛道,提交方式为官网,链接为 。 【凌家滩】AI 创作大赛,截止日期为 01010415,奖金奖项为一等奖 2w1 二等奖 8k2 三等奖 2k3 优秀奖 010,主题为“文化遗产的数字化重现与未来表达”,作品类型为 AI 图像/AIMV/AI 视频。
2025-03-22
最近推出的排名靠前的知名AI产品,与微软竞争的是什么产品?
以下是一些与微软竞争的知名 AI 产品: 1. ChatGPT:在移动领域占据榜首位置,其月活跃用户数领先幅度明显缩小。 2. Bing:微软基于 AI 技术全新打造的搜索引擎。 3. Microsoft Security Copilot:能够在几分钟内提供可操作的建议,简化对攻击的紧急理解,揭示威胁,甚至预测攻击者最有可能的下一步行动。 4. Loop:一个协作工具,独立于 MS Office,但又与之密切相关。 5. Bard:谷歌推出的官方 ChatGPT 竞争者。 6. Dora AI:可以通过一个 prompt,借助 AI 3D 动画,生成强大网站。 7. Chat.DID:有史以来首个允许人们以人类方式与 AI 进行视频聊天的 APP。 8. Pika:一个 AI 视频平台,使任何人都能将他们的创意愿景变为现实。
2025-03-20
最近有什么新的AI工具或者功能出现吗?
以下是一些新出现的 AI 工具和功能: 游戏方面: Unity 推出了两款 AI 工具。其中,新 Copliot 工具可通过与 Muse Chat 聊天快速启动创建游戏项目,如一键生成塔防类游戏基础框架、创建人物角色动作,还能协助编码和创建 3D 材质、动画等内容。Muse Chat 现已经开放 Waiting list,可通过 https://create.unity.com/aibeta 申请加入,官方提示这个暑假会进一步开放。 Unity Sentis 是第一个将 AI 模型嵌入到实时 3D 引擎中的跨平台解决方案,能在 Unity 运行时为游戏或应用程序嵌入 AI 模型,增强游戏玩法和其他功能,目前还在封测阶段。 AI 智能体方面: 企业自动化出现新架构,工具使用或函数调用被视为从 RAG 到主动行为的第一个半步,为现代人工智能栈增加了新层。一些流行的原语如网页浏览、代码解释和授权+认证已经出现,使 LLMs 能够执行特定操作。 ProductHunt 2023 年度最佳产品榜单中的 AI Infra 类别: Langfuse 是大模型应用的开源追踪和分析工具,提供开源可观测性和分析功能,包括可观测性的可视化界面探索和调试复杂的日志和追踪,以及分析的使用直观仪表板改善成本、降低成本、减少延迟,提高响应质量。 Eden AI 可将顶尖 AI API 融合为一,能为每项 AI 任务选择正确的 AI API 来提高准确性和降低成本,集中管理使用限制和成本监测,并探索新兴的 AI 能力。 Langdock 能在几分钟内创建、部署、测试和监控 ChatGPT 插件,将 API 连接到 Langdock 并作为插件部署到多个大模型应用中,然后使用内置测试功能确保正常工作并进行监控。 LLM Spark 是用于构建生产就绪大模型应用的开发平台。
2025-03-20