Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

请告诉我有关AI的最新资讯

Answer

以下是近期的 AI 资讯汇总:

4 月 1 日:

  • 【AI 模型及应用】OpenAI 将会开源一个推理模型,ChatGPT 即将推出推理强度控制选项,Gpt4o 生图能力面向免费用户;Gemini 2.5 Pro 免费使用,任何人都可以使用 Canvas 进行编码和创作。
  • 【AI 视频】Higgsfield 发布 50 多个电影级摄影机动作预设,提升动态镜头表现力;luma 为 Ray 2 引入摄像机运动概念,可基于预设镜头并组合编辑;Remakes 支持基于用户上传图像直接编辑,并融合 Remade 视频特效,简化创意流程;Meta 宣布推出 MoCha 系统,实现电影级说话角色合成效果。
  • 【AI 3D】HSMR 推出从单张图像重建人体 3D 骨骼和网格模型的系统;krea 引入 AI 3D 生成能力,扩展其创意工具的功能范围;PGC 推出基于物理的单一姿势高斯布料模拟技术,提升数字服装的真实感。
  • 【AI 音频】MiniMax Audio 发布全新 Speech-02 语音模型,提升语音合成质量。

3 月 21 日:

  • 【AI 绘画】网传神秘 Halfmoon 文本转图像模型为 Reve 对比 Midjourney 效果;Topaz Labs 推出 Gigapixel v8.3.0,将任何图像放大 16 倍;FLORA 引入 gemini 2.0 自然语言编辑图像能力。
  • 【AI 视频】pika 超创内测“操控原视频中物体运动”能力;Krea 上线视频模型训练能力,可控制视频风格/动作/物体等。
  • 【AI 3D】SpatialLM 用于空间理解的大型语言模型。
  • 【AI 模型及应用】OpenAI 发布 2 个语音模型(文本转语音/语音转文本)+1 个演示网站;Claude 支持搜索功能。

3 月 14 日:

  • 【AI 模型及其他】谷歌 Gemini 应用能力升级,包含升级推理模型 gemini 2.0、Flash Thinking Experimental 等多个功能提升;OpenAI 4 项更新;Bolt 一键将 Figma 设计转换为可运行的 Web 应用;阿里推出 AI 旗舰应用“新夸克”;360 智脑团队开源推理模型 Light-R1-14B-DS,复现 Deepseek 的强化学习效果。
  • 【AI 视频】Pika 更新 Pikaffects,新增多款变身特效;Freepik 与 Fal 平台引入 Topaz AI 的提升“FPS 和视频分辨率”能力;Krea 上线 Veo 2 模型,支持图生视频功能,但生成成本较高。
  • 【AI 绘图】LBM 用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。
  • 【AI 语音】Sesame 开源 TTS 语音模型 CSM-1B。
Content generated by AI large model, please carefully verify (powered by aily)

References

4月1日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)04月01日AI资讯【AI模型及应用】OpenAI:将会开源一个推理模型,ChatGPT即将推出推理强度控制选项,Gpt4o生图能力面向免费用户Gemini 2.5 Pro:免费使用,任何人都可以使用Canvas进行编码和创作【AI视频】Higgsfield:发布50多个电影级摄影机动作预设,提升动态镜头表现力。luma:为Ray 2引入摄像机运动概念,可基于预设镜头并组合编辑Remakes:支持基于用户上传图像直接编辑,并融合Remade视频特效,简化创意流程。Meta:宣布推出MoCha系统,实现电影级说话角色合成效果【AI 3D】HSMR:推出从单张图像重建人体3D骨骼和网格模型的系统krea:引入AI 3D生成能力,扩展其创意工具的功能范围。PGC:推出基于物理的单一姿势高斯布料模拟技术,提升数字服装的真实感。【AI音频】MiniMax Audio:发布全新Speech-02语音模型,提升语音合成质量。[heading3]

3月21日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)3月21日AI资讯【AI绘画】网传神秘Halfmoon:文本转图像模型为Reve对比Midjourney效果Topaz Labs:推出Gigapixel v8.3.0,将任何图像放大16倍。FLORA:引入gemini 2.0自然语言编辑图像能力【AI视频】pika:超创内测“操控原视频中物体运动”能力Krea:上线视频模型训练能力,可控制视频风格/动作/物体等【AI 3D】SpatialLM:用于空间理解的大型语言模型【AI模型及应用】OpenAI:发布2个语音模型(文本转语音/语音转文本)+1个演示网站Claude:支持搜索功能[heading2]

3月14日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)3月14日AI资讯【AI模型及其他】谷歌:Gemini应用能力升级,包含升级推理模型gemini 2.0 Flash Thinking Experimental等多个功能提升OpenAI:4项更新Bolt:一键将Figma设计转换为可运行的Web应用阿里:推出AI旗舰应用“新夸克”360智脑团队:开源推理模型Light-R1-14B-DS,复现Deepseek的强化学习效果【AI视频】Pika:更新Pikaffects,新增多款变身特效Freepik与Fal平台:引入Topaz AI的提升“FPS和视频分辨率”能力Krea:上线Veo 2模型,支持图生视频功能,但生成成本较高【AI绘图】LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复【AI语音】Sesame:开源TTS语音模型CSM-1B,

Others are asking
学习AI的必读书目
以下是学习 AI 的一些必读书目推荐: 《GPT1 到 Deepseek R1 所有公开论文 The 2025 AI Engineer Reading List》:涵盖了人工智能工程的 10 个领域,包括 LLMs、基准、提示、RAG、代理、CodeGen、视觉、语音、扩散、微调等,适合从零开始的学习者。 对于新手学习 AI,建议先阅读「」部分,熟悉 AI 的术语和基础概念。 还可以在「」中找到为初学者设计的课程,特别推荐李宏毅老师的课程。 三本神经科学相关书籍: 《认知神经学科:关于心智的生物学》(作者:Michael S.Gazzaniga;Richard B.Lvry;George R.Mangun):世界权威的认知神经科学教材,系统介绍认知神经科学的多个方面。 《神经科学原理》(作者:Eric R.Kandel;James H.Schwartz):让您了解神经元的细胞和分子生物学、突触传递等内容。 《神经生物学:从神经元到脑》(作者:John G.Nicholls 等著):神经生物学领域的世界级名著,涵盖神经科学的多方面内容。
2025-04-12
LOGO 设计的 AI 工具有哪些
以下是一些用于 LOGO 设计的 AI 工具: 1. Looka:这是一个在线 Logo 设计平台,使用 AI 理解用户的品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答关于品牌和设计风格的问题来生成 Logo 选项。 3. Designhill:其 Logo 制作器使用 AI 技术创建个性化 Logo,用户可选择设计元素和风格,AI 基于输入生成方案。 4. LogoMakr:提供简单易用的 Logo 设计工具,用户可拖放设计,利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助的设计建议。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,根据用户输入的品牌名称和行业类别快速生成方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助用户创建个性化 Logo。 您还可以访问网站的 AI 生成 Logo 工具版块获取更多好用的工具:https://waytoagi.com/category/20 。 此外,以下是一些设计海报的 AI 产品: 1. Canva(可画):https://www.canva.cn/ 是非常受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可帮助选择合适颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ 简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能帮助用户快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子等视觉内容,集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,简化设计流程。 内容由 AI 大模型生成,请仔细甄别。
2025-04-12
可完全白嫖的AI生成圖片大模型
以下是可完全白嫖的 AI 生成图片大模型的相关内容: 1. 搭建流程: 搭建 OneAPI:汇聚整合多种大模型接口,方便更换使用各种大模型,可参考相关链接。 搭建 FastGpt:知识库问答系统,可将知识文件放入,接入大模型作为分析知识库的大脑并回答问题,若不想接入微信,搭建完此系统即可,其有问答界面。 搭建 chatgptonwechat:接入微信,配置 FastGpt 把知识库问答系统接入到微信,建议先用小号以防封禁风险。 2. 准备工作: 领取免费云服务器:阿里、腾讯对新用户提供免费试用服务器,如腾讯云的轻量应用服务器、阿里云的服务器 ECS,服务器系统配置选择宝塔系统。 领取免费大模型接口:阿里的通义千问大模型接口,创建 API key;智谱 AI(ChatGLM)、科大讯飞(SparkDesk)也有免费接口,国内大模型多限制一定免费额度的 Token;谷歌的 Gemini 大模型、海外版 Coze 的 GPT4 模型免费且能图片识别,但需给服务器挂梯子,可参考相关教程。 3. 配置 FastGpt、OneAPI: 创建 OneApi 的令牌,名称自取,时间设为永不过期、额度设为无限额度,提交并复制令牌。 配置 FastGpt,修改宝塔系统文件 dockercompose.yml 中的 OPENAI_BASE_URL(API 地址改为云服务的,http://内网 IP:3001,需加/v1)和 CHAT_API_KEY(改为复制的 OneApi 令牌),以及修改 config.json 中的"llmModels"(添加阿里大模型 qwenmax)和"vectorModels"(阿里向量模型 textembeddingv1),修改后保存关闭并重新启动使其生效。
2025-04-12
想自学ai训练师 推荐哪个视频去学习
以下是为您推荐的自学 AI 训练师的视频: 1. 3 月 26 日|自由讨论|离谱视频切磋大会 猫先生介绍自己的背景和擅长领域 AI 学习与实践的重要性 AI 交流会:分享项目经验和技能 讨论比赛规则和资源分配 AI 工具学习与合作 广州 AI 训练师叶轻衣分享使用 AI 工具的经验和想法 组队提升工作效率 AI 技术在 3D 动画制作中的应用与优势 链接:https://waytoagi.feishu.cn/minutes/obcnc915891t51l64uyonvp2?t=0 2. AI 大神 Karpathy 再发 LLM 入门介绍视频 神经网络训练的目标:训练神经网络的目标是让模型学习 token 在序列中彼此跟随的统计关系,即预测给定上下文(token 序列)后,下一个最有可能出现的 token。 Token 窗口:训练时,模型从数据集中随机抽取固定长度的 token 窗口(例如 8000 个 token)作为输入。 神经网络的输入与输出:输入为 Token 序列(上下文),输出为预测下一个 token 的概率分布,词汇表中每个 token 都有一个概率值。 随机初始化与迭代更新:神经网络初始参数是随机的,预测也是随机的。训练过程通过迭代更新参数,调整预测结果,使其与训练数据中的统计模式相匹配。 损失函数与优化:训练过程使用损失函数来衡量模型预测与真实 token 的差距。优化算法(如梯度下降)用于调整参数,最小化损失函数,提高预测准确率。 神经网络内部结构:Transformer 包含注意力机制和多层感知器等组件,能够有效地处理序列数据并捕捉 token 之间的复杂关系。 链接:无
2025-04-12
想自学ai训练师
如果您想自学成为 AI 训练师,以下是一些相关的知识和建议: 一、AI 训练的基本概念 训练是指通过大数据训练出一个复杂的神经网络模型。这需要使用大量标记过的数据来训练相应的系统,使其能够适应特定的功能。训练过程需要较高的计算性能,能够处理海量的数据,并具有一定的通用性,以便完成各种各样的学习任务。 二、相关领域的知识 1. 机器学习:机器学习是人工智能的一个分支,是实现人工智能的途径之一,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。 2. 自然语言处理:自然语言(NLP)认知和理解是让电脑把输入的语言变成有意思的符号和关系,然后根据目的再处理。自然语言生成系统则是把计算机数据转化为自然语言,是人工智能和语言学领域的分支学科。 三、学习资源和实践 您可以参考以下的一些资源和实践方式: 1. 参加相关的线上交流会,例如 3 月 26 日的自由讨论活动,其中会分享项目经验、技能以及使用 AI 工具的经验和想法。 2. 了解一些健身的 AI 产品,如 Keep(https://keep.com/)、Fiture(https://www.fiture.com/)、Fitness AI(https://www.fitnessai.com/)、Planfit(https://planfit.ai/)等,虽然这些主要是健身领域的应用,但也能帮助您了解 AI 在不同场景中的应用和创新。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-04-12
有哪些自动生成ppt的ai平台
以下是一些自动生成 PPT 的 AI 平台: 1. Kimi.ai:选 PPT 助手暂时免费效果好,网址为 http://kimi.ai 。 2. 讯飞智文:网址为 https://zhiwen.xfyun.cn/ 。 3. Mindshow.fun:支持 Markdown 导入,网址为 http://Mindshow.fun 。 4. Tome.app:AI 配图效果好,网址为 http://Tome.app 。 5. Chatppt.com:自动化程度高。 6. Gamma:在线 PPT 制作网站,网址为 https://gamma.app/ 。 7. 美图 AI PPT:网址为 https://www.xdesign.com/ppt/ 。 这些工具通过自动化和智能化的设计流程,极大地简化了 PPT 的制作工作。目前市面上大多数 AI 生成 PPT 通常按照以下思路完成设计和制作: 1. AI 生成 PPT 大纲。 2. 手动优化大纲。 3. 导入工具生成 PPT。 4. 优化整体结构。 您可以根据自己的需求和喜好选择合适的 AI PPT 工具,以提高工作效率和演示效果。 扩展阅读: 1. 《》 2. 《》(质朴发言) 相似问题: 1. 有没有生成 PPT 的应用推荐,不用翻墙的。 2. 免费生成 PPT 的网站有哪些。 3. 推荐一款文字生成 ppt 的工具。 4. 免费 ai 制作 ppt 软件。 5. 推荐 3 款好用的 AI 制作 ppt 工具。 请注意,内容由 AI 大模型生成,请仔细甄别。
2025-04-12
我想了解最新的ai的即时信息(最新资讯与ai工具)
以下是为您提供的最新 AI 即时信息和工具: 4 月 1 日 AI 资讯: 【AI 模型及应用】 OpenAI:将会开源一个推理模型,ChatGPT 即将推出推理强度控制选项,Gpt4o 生图能力面向免费用户。 Gemini 2.5 Pro:免费使用,任何人都可以使用 Canvas 进行编码和创作。 【AI 视频】 Higgsfield:发布 50 多个电影级摄影机动作预设,提升动态镜头表现力。 luma:为 Ray 2 引入摄像机运动概念,可基于预设镜头并组合编辑。 Remakes:支持基于用户上传图像直接编辑,并融合 Remade 视频特效,简化创意流程。 Meta:宣布推出 MoCha 系统,实现电影级说话角色合成效果。 【AI 3D】 HSMR:推出从单张图像重建人体 3D 骨骼和网格模型的系统。 krea:引入 AI 3D 生成能力,扩展其创意工具的功能范围。 PGC:推出基于物理的单一姿势高斯布料模拟技术,提升数字服装的真实感。 【AI 音频】 MiniMax Audio:发布全新 Speech02 语音模型,提升语音合成质量。 3 月 19 日 AI 资讯: 【AI 模型】 英伟达:发布全球首个开源人形机器人基础模型 Isaac GR00T N1 及相关 GTC 信息。 谷歌 Gemini:放出了两个功能 Canvas 和 Audio Overview。 【AI 视频】 STAbility AI:发布 Stable Virtual Camera,2D 图像转化 3D 视频。 Domo AI:推出“图片说话”功能,带口型匹配。 【AI 3D】 Roblox:推出 AI 3D 技术 Cube 3D。 Claude MCP Unity 版本推出。 【AI 音乐】 AI 音乐工具 Udio:推出 v1.5 Allegro。 LVAS Agent:基于多智能体协作的长视频音频合成。 获取 AI 资讯的渠道: 公众号:超时空视角、AI 替代人类。 小红书/抖音:EverAI。 B 站:Ever AI 酱(这里会有教程及 AI 工具界面操作)。 关于“通往 AGI 之路”知识库和社区平台: WaytoAGI(通往 AGI 之路)是一个致力于人工智能(AI)学习的中文知识库和社区平台。为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。 汇集了上千个人工智能网站和工具,提供最新的 AI 工具、AI 应用、AI 智能体和行业资讯。 提供丰富的学习资源,包括文章、教程、工具推荐以及最新的 AI 行业资讯等。 社区定期组织活动,如视频挑战赛、模型创作大赛等,鼓励成员在实践中学习,促进交流与合作。 引领并推广开放共享的知识体系,倡导共学共创等形式,孵化了 AI 春晚、离谱村等大型共创项目。 在没有任何推广的情况下,WaytoAGI 一年时间已有超过 100 万用户和超千万次的访问量。 目前合作过的公司/产品包括阿里云,通义千问,淘宝,智谱,支付宝,豆包,火山引擎,marscode,coze,堆友,即梦,可灵,MiniMax 海螺 AI,阶跃星辰,百度,Kimi,吐司,liblib,华硕,美团,美的,360,伊利,魔搭,央视频,Civitai,Openart,Tripo3D,青椒云等。
2025-04-10
最新的AI资讯
以下是为您汇总的最新 AI 资讯: 3 月 17 日: 【AI 3D】UE5MCP 提出将 AI 驱动的自动化集成到虚幻引擎中,可用于游戏关卡设计、游戏编程等。 【AI 视频】可灵接入 Deepseek R1,帮助书写 AI 视频提示词;Long Context Tuning for Video Generation 用于场景级视频生成的长上下文调整技术。 【AI 绘图】Thera 是新 sota 超分辨率模型,允许任意尺寸图像进行高清化。 【AI 语音】赤兔 Chitu 是清华团队模型推理引擎,可实现 DeepSeek 推理成本降低一半,性能翻番;Anthropic 预推出 Harmony 新功能,可将本地目录集成 Claude 中。 百度文心大模型 4.5 和文心大模型 X1 正式发布,免费向用户开放。 3 月 4 日: 【AI 3D】Meshcapade 预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝;InsTaG 能通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果;3DMem 是新型 3D 场景记忆框架。 【AI 绘图】智谱开源 AI 绘图 CogView4,可在图像中生成中文字符;海螺推出 Image01 多功能文本转图像模型。 【AI 视频】Runway 内测能力可根据参考图像进行 Video to Video 视频风格化;Vidu 的 API 开放平台全面开放。 【AI 模型】Google Colab 推出 Data Science Agent;微软为医疗行业提供首个统一语音 AI 助手:Dragon Copilot;Opera 宣布推出网页浏览器的 AI 代理。 3 月 20 日: 【AI 模型】OpenAI 推出 o1pro API;Adobe 表示将向其用户提供 Veo2、Runway 等非 Adobe 生态模型。 【AI 视频】阶跃星辰推出 StepVideoTI2V:30B 参数图生视频模型。 【AI 3D】Amodal3R 可从遮挡二维图像进行非模态三维重建;Bolt3D 能单图内生成交互式 3D 场景。 【AI 音乐】阶跃星辰推出 StepVideoTI2V:30B 参数图生视频模型;Orpheus 是开源 TTS 模型。
2025-03-21
育儿智能体落地实践推荐,相关案例和资讯
以下是为您整理的育儿智能体落地实践的相关案例和资讯: 在“通往 AGI 之路知识库使用指南”中,提到了智能纪要、智能章节等内容。包括博主精美解释六大策略,小七姐在社区带来共学课程及直播分享与回放,介绍了官方最佳 prompt 的 6 个实践办法。还提到了 AI 智能体的进阶、案例拆解及扣子的应用,如景淮老师的相关成果,阐述扣子、千帆百炼属于智能体范畴,扣子更偏 ToC 应用。同时提到 Cos 平台功能全面,社区共学成果显著,学习 AI agent 建议先吃透 prompt,官方文档内容全面,社区小伙伴参加 cos 比赛常获奖并分享经验。 在“张翼然:AI 赋能教学,创新引领未来.pdf_AI 赋能教学创新引领未来”中,涵盖了教育目标由知识本位向能力为重的转型、群智协同与知识动态生成、核心能力、关键价值等方面。还包括设计实验或观察方法、收集与分析数据、得出结论并撰写报告等研究过程的指导,以及黎加厚关于让教师掌握教育智能体金钥匙的相关内容。同时探讨了 AIGC 教育革命、AI 从工具到助手、赋能教师提升效率与能力、大语言模型的教学潜力、AI 与教育场景融合拓展教学边界与创新场景、一线教师的 AI 需求与高效工具推荐、AI 赋能课堂的核心逻辑、AI 与人类智能的共生放大学生思考力塑造深度学习能力、解码 AI 教学案例、能力的普遍性与局限性、现阶段 AI 在教育领域应用的局限性等内容。 在“扣子案例合集社区内容分享”中,包含了如“用 Coze 扣子轻松搭个 Bot,从此告别‘标题党’”“扣子官方:用扣子/Coze 揭秘吴恩达的 4 种 AI Agent 设计模式”“扣子官方:这届 00 后已经学会用扣子/Coze‘偷懒’了”“【2 万字长文】如何用 Kimi 全自动创建扣子智能体?这喂饭级教程将揭晓一切!”“保姆级教程:Coze 打工你躺平”“扣子 Coze 智能体开发实战教程|智能体开发”等案例。
2025-03-20
有什么ai学习的最新资讯么
以下是关于 AI 学习的最新资讯: WaytoAGI(通往 AGI 之路)是一个致力于人工智能学习的中文知识库和社区平台。它为学习者提供系统全面的 AI 学习路径,覆盖从基础概念到实际应用的各个方面。在没有任何推广的情况下,一年时间已有超过 100 万用户和超千万次的访问量。目前合作过的公司/产品包括阿里云、通义千问、淘宝、智谱等众多知名企业和产品。 3 月 4 日的 AI 资讯: 【AI 3D】Meshcapade 预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝;InsTaG 通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果;3DMem 为新型 3D 场景记忆框架。 【AI 绘图】智谱开源 AI 绘图 CogView4,可在图像中生成中文字符;海螺推出 Image01 多功能文本转图像模型。 【AI 视频】Runway 被网友爆料内测能力可根据参考图像进行 Video to Video 视频风格化;Vidu 的 API 开放平台全面开放。 【AI 模型】Google Colab 推出 Data Science Agent;微软为医疗行业提供首个统一语音 AI 助手 Dragon Copilot;Opera 宣布推出网页浏览器的 AI 代理。 对于新手学习 AI,建议持续学习和跟进,AI 是快速发展的领域,新的研究成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。考虑加入 AI 相关的社群和组织,参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。
2025-03-14
本周最新的AI资讯
以下是本周最新的 AI 资讯: 3 月 12 日: 【AI 3D】:BlenderMCP 与 Claude AI 沟通,在 Blender 实现快速 3D 建模;MIDI 可实现单幅图像到 3D 场景生成;Move AI 更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】:MMStoryAgent 是 AI 多模态故事生成系统。 【AI 视频】:VACE 是阿里推出的一体化视频创作和编辑技术;VideoPainter 是腾讯开源的视频编辑技术;Wonder Dynamics 推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】:OpenAI 为开发者推出一套 AI Agent 开发套件;R1Omni 是阿里情感识别模型,通过视频识别情感;Luma AI 发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能;Manus 宣布与阿里通义千问团队达成战略合作。 3 月 4 日: 【AI 3D】:Meshcapade 预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝;InsTaG 通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果;3DMem 是新型 3D 场景记忆框架。 【AI 绘图】:智谱开源 AI 绘图 CogView4,可以在图像中生成中文字符;海螺推出 Image01 多功能文本转图像模型。 【AI 视频】:Runway 网友爆料其内测能力可根据参考图像进行 Video to Video 视频风格化;Vidu 的 API 开放平台全面开放。 【AI 模型】:Google Colab 推出 Data Science Agent;微软为医疗行业提供首个统一语音 AI 助手:Dragon Copilot;Opera 宣布推出网页浏览器的 AI 代理。 AIGC Weekly32: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位: Shopify 的 AI 助手现已上线。Sidekick 是一个帮助机器人,它知道如何在 Shopify 中执行任何操作提取相关数据、操作新功能或创建报告: Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能: OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展: Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器:
2025-03-13
最新的Ai资讯
以下是 3 月 4 日、10 日、12 日的 AI 资讯汇总: 3 月 4 日: 【AI 3D】 Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝。 InsTaG:通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果。 3DMem:新型 3D 场景记忆框架。 【AI 绘图】 智谱:开源 AI 绘图 CogView4,可以在图像中生成中文字符。 海螺:推出 Image01 多功能文本转图像模型。 【AI 视频】 Runway:网友爆料 Runway 内测能力可根据参考图像进行 Video to Video 视频风格化。 Vidu:API 开放平台全面开放。 【AI 模型】 Google Colab:推出 Data Science Agent。 微软:为医疗行业提供首个统一语音 AI 助手:Dragon Copilot。 Opera:宣布推出网页浏览器的 AI 代理。 3 月 10 日: 【AI 3D】 MeshPad:草图创建 3D 网格,支持编辑修改,实现直观和交互式的 3D 建模。 【AI 写作】 Muse:专门为小说创作训练的 AI 模型工具,可实现在线的小说续写修改,创意头脑风暴以及同时基于画布形式的故事创作。可免费试用。 【AI 视频】 Luma:发布 Ray2 Flash 视频模型,生成速度快 3 倍,成本便宜三倍。 【其他】 OpenAI:为旗下模型推出模型对比页面,可对于模型基础能力进行直观对比了解。 谷歌:为开发者推出 Gemini 嵌入模型 Gemini Embedding。 中国成功研制“祖冲之三号”量子计算原型机。 3 月 12 日: 【AI 3D】 BlenderMCP:与 Claude AI 沟通,在 blender 实现快速 3D 建模。 MIDI:单幅图像到 3D 场景生成。 Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。 【AI 写作】 MMStoryAgent:AI 多模态故事生成系统。 【AI 视频】 VACE:阿里推出一体化视频创作和编辑技术。 VideoPainter:腾讯开源视频编辑技术。 Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。 【其他】 OpenAI:为开发者推出一套 AI Agent 开发套件。 R1Omni:阿里情感识别模型,通过视频识别情感。 Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。 Manus:宣布与阿里通义千问团队达成战略合作。
2025-03-13
ai在教学中的最新应用
以下是 AI 在教学中的一些最新应用: 1. MIT 为孩子开设免费的 AI 课程,涵盖了 AI 在跨学科领域的应用,如 AI 与气候、AI 与大学录取、AI 对美国大选的影响等。孩子们需要思考如何用气候数据写好故事、预测气候变换走向,从数据分析角度了解大学录取中的相关问题,以及识别 AI 深度伪造的新媒体材料等。 2. 张翼然提出用 AI 为教师减负,为有初步 AI 使用经验、渴望了解最新技术进展并交流的老师提供了相关技巧和分享。例如,在智慧技术助理加持下探索教学新样态,分享全球 AI 技术在教育界的新发展和应用案例。 3. 从 AI 助教到智慧学伴的应用探索中,提出调整教学理念,将 AI 作为教学辅助工具和合作伙伴。学习利用 AI 工具的优势应用于教学,如自动生成练习、个性化反馈等,同时确认输出质量。根据 AI 能力设计开放性作业,调整考核方式,继续发挥教师在提供情感支持、培养团队合作等方面的优势。
2025-04-11
最新的生命科学有关的 AI动向
以下是生命科学领域有关 AI 的最新动向: 在医疗健康生物制药方面,AI 技术极大地加速了研究,在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用。例如,AI 提前三年诊断胰腺癌;两名高中生与医疗技术公司合作发现与胶质母细胞瘤相关的新靶基因;AI 帮助抗衰老,筛查出高效的药物候选物;利用 AI 寻找阿尔兹海默症的治疗方法;通过神经网络分析患者体液中的生物标志物,早期诊断帕金森。 Nature Methods 主题特刊聚焦于 AI 在生物学中的应用,探讨了计算生物学多领域,强调高精度蛋白质结构预测成就,提及了 AI 在蛋白质组学数据分析中的应用、机器学习可解释性挑战,以及科研人员对 AI 工具培训的需求,同时探讨了 AI 与生物医学数据结合的新时代。 Flagship Pioneering 创始人 Noubar Afeyan 提出 AI for Science 的下一步是 MultiAgent,旨在实现类似自动驾驶的科研自动化,推动生命科学领域的革命性进展。
2025-04-10
请问有什么AI最新在零售行业的应用,最好有趣,实用有建设性
以下是 AI 在零售行业的一些有趣、实用且有建设性的最新应用: 1. 舆情、投诉、突发事件监测及分析:通过 AI 技术实时监测和分析消费者的反馈和市场动态,帮助企业及时做出应对策略。 2. 品牌营销内容撰写及投放:利用 AI 生成吸引人的营销文案,并精准投放到目标受众。 3. 自动化库存管理:基于历史销售数据和其他相关因素,预测未来的库存需求,优化库存配置,降低成本。 4. 自动生成或完成 SKU 类别选择、数量和价格分配:提高商品管理的效率和准确性。 5. 客户购物趋势分析及洞察:深入了解消费者的购物偏好和趋势,为企业的产品开发和营销策略提供依据。 此外,在医疗药品零售领域,AI 也有广泛的应用: 1. 药品推荐系统:根据用户购买记录和症状描述等数据,推荐合适的非处方药品和保健品,提高销售转化率。 2. 药品库存管理:分析历史销售数据、天气、疫情等因素,预测药品需求量,优化库存策略。 3. 药品识别与查询:借助计算机视觉技术,用户通过手机拍摄药品图像即可获取相关信息。 4. 客户服务智能助手:基于自然语言处理技术,回答顾客关于购药、用药、保健等常见问题。 5. 药店运营分析:分析销售、顾客流量、库存等大数据,发现潜在问题和优化空间。 6. 药品质量监控:利用机器视觉、图像识别等技术检测药品的包装、标签、颜色等是否合格。 7. 药品防伪追溯:利用区块链等技术实现全流程的药品溯源,保障药品供应链的安全和可信度。 总之,AI 技术在零售行业的应用能够提升购物体验、优化运营管理、降低成本,并为企业创造更多的价值。
2025-04-10
有AI+游戏的最新案例吗
以下是一些 AI+游戏的最新案例: 由 5 人独立游戏工作室 Proxima 开发的 AI 冒险独立游戏 Suck Up!上线三周油管播放超千万。这是一款沙盒社交冒险游戏,团队尝试加入了名为 Nemo 的 AI NPC,基于 LLM 驱动,Nemo 能在接收到用户命令或其他线索后,调动感知、记忆,并转化为可执行的游戏行动。去年上半年,该工作室因获得 160 万美元投资引起轰动,上线后也受到资本关注。玩家对其玩法和模式提出了很多创意想法,如设计成就系统、上线多人模式等。 开发者正在使用 AI 生成音乐来填充游戏过程与游戏 UI 中需要使用到的各类音效、不同游戏场景中用以渲染氛围的各种音乐。像 MusicLM 等模型已经支持生成多音轨的作品。 2023 年 Genfun.ai 和 Meshy 联合制作的游戏《Soul Chronicle》,是首款实时 3D+AIGC+UGC 的 MMO 手游,最大突破是制作出了与游戏完美融合的 3D AIGC 技术,可在游戏中实时生成角色皮肤。 2024 年 Bitmagic 释出的《Roleverse》平台,可在平台内使用提示在游戏内定制角色,对角色进行缩放、挤压和拉伸,也能轻松对游戏世界进行编辑。 AI 技术在游戏行业的应用由来已久,且不断发展。从最初的简单内容和随机元素生成,到辅助游戏设计,再到如今能够生成更复杂的游戏内容,如动态场景、智能 NPC 行为等。AI 对游戏创作的影响包括美术与风格、剧情与叙事、关卡与玩法、音效与音乐、测试与优化等方面。同时,AI 能基于玩家游戏行为评估玩家技能水平和游戏风格,动态调整游戏难度等,提升玩家体验。此外,游戏还能成为 AI 模型能力的最佳试验场。
2025-04-01
3月最新的文章创作提示词
以下是 3 月最新的文章创作提示词相关内容: 云舒的文章总结卡 2.0 提示词:全面支持 DeepseekV3,效果媲美 Claude3.7,新增竖版卡片方便手机阅读。支持 Claude3.7 及 DeepseekV3,V3 需要为 0324 更新的版本,DS 官网及 API 已更新,如调用其它平台 API 需要查看 DS 版本号。提示词复制链接:。包括横版(1080 x 800 卡片提示词)和竖版(750 x 不限高卡片提示词)。抽卡平台方面,各平台均需下载 html 文件,打开后才能查看真实效果,平台自带预览因兼容性问题无法正常展示效果。Claude 使用平台包括 Claude3.7 官网、API、Cursor,使用时需要下载为 HTML 文件打开查看效果,Claude 的预览暂时无法支持查看真实效果。Deepseek 使用平台包括 Deepseek 官网、API(V3 需要为 0324 更新的版本,DS 官网及 API 已更新,如调用其它平台 API 需要查看 DS 版本号),Deepseek 需要复制代码到 html 文件里,然后保存进行查看。Cursor 微调增加图片时,将下载的 html 文件及图片放到同一个文件夹即可。 2025 年 3 月 12 日的更新:《》归藏的这篇文章介绍了一套简单易用的提示词,可以将任何文档快速转化为精美的网页杂志,适合各行各业。只需复制文本并添加图片、视频链接,即可轻松生成视觉吸引力强的作品。无论是旅行攻略、求职简历还是明星介绍,这些网页都能让信息更直观、条理更清晰。 韦恩用 DeepSeek V3 做的实验:作者好奇 DeepSeek V3 能否很好地遵循设计,输出确定性的内容,于是做了一个企业交付相关的实验。创作过程包括想法到动手、改变策略、寻求建议、基本满意了等阶段。开始效果不稳定,下载封面图片会变形,后来改为 HTML 转图片,效果比较稳定,并在公众号里测试效果良好,解决了公众号水印影响美观的问题。
2025-03-31
你现在是一个特别厉害的预言家,告诉我ai什么时候能统治世界
目前关于 AI 何时能统治世界尚无确切定论。但从相关研究来看,各国已将 AI 上升为国家战略,视其为下一代全球竞争的制高点。如果某一国家率先突破真正的 AGI,其国际地位和影响力或将急剧攀升。例如俄罗斯总统普京曾警告“谁在人工智能上领先,谁就能统治世界”。 AGI 实现后可能会在未来 20 年给人类社会带来多方面的变革。在经济与社会结构方面,AGI 可能带来生产力的爆炸式增长,同时导致大规模技术性失业,财富可能更多地集中于拥有 AGI 资本的少数人。在文化、价值观与信仰方面,AGI 将挑战人类对智能与意识的认知,引发对“人之为人”意义的新思考,人类价值观可能在科学理性与精神信仰之间重新定位。在政治与权力结构方面,AGI 可能重塑全球权力版图,拥有先进 AI 的国家和跨国企业将获得前所未有的影响力,可能出现“AI 寡头”新统治阶层,引发社会分化,各国还可能陷入 AGI 军备竞赛。 此外,有观点认为 2045 年,人工智能将超越人类智能,届时人类的知识、思考能力等将发生巨大变化。但目前这仍只是一种预测。
2025-04-09
请你告诉我当今最先进的数字人技术是什么
当今最先进的数字人技术包括以下几种: 1. 由 HeyGen 与 Sora 集成推出的全新数字人技术:由 AI 完全生成的虚拟人,能够模拟并超越真人演员的动作、表情和行为。可灵活调整动作和表情,无需重复拍摄,视频长度无限制,且并非基于真人模型的“数字克隆”,而是全新的 AI 虚拟形象。 2. 英伟达发布的 Groot Teleop 技术:使用 Apple Vision Pro,能让人进入虚拟机器人身体进行操控与训练,还能训练机器人操作动作,并将成果转移至真实机器人,实现了虚拟与现实的无缝连接,为机器人训练带来了新模式。 此外,真人驱动的数字人技术也在不断发展,重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业以及直播带货等领域。随着视觉算法的进步,在没有昂贵动捕设备的情况下,也能通过摄像头捕捉到人体骨骼和人脸的关键点信息,从而达到不错的效果。
2025-03-28
我是一个AI Agent初学者,现在我想要捏一款Agent,目的是喂给Agent固定材料之后对其做提问,让Agent学习完我的材料之后,在不联网的情况下对我问出的问题做出贴切材料的回答,现在请你告诉我如何操作
以下是捏制一个满足您需求的 AI Agent 的操作步骤: 1. 规划: 制定任务的关键方法,总结任务目标与执行形式。 将任务分解为可管理的子任务,确立逻辑顺序和依赖关系。 设计每个子任务的执行方法。 2. 实施: 在 Coze 上搭建工作流框架,设定每个节点的逻辑关系。 详细配置子任务节点,并验证每个子任务的可用性。 3. 完善: 整体试运行 Agent,识别功能和性能的卡点。 通过反复测试和迭代,优化至达到预期水平。 AI Agent 相关概念: AI Agent 是基于大型语言模型(LLM)和其他技术实现的智能实体,其核心功能在于自主理解、规划决策、执行复杂任务。 Chain:通常一个 AI Agent 可能由多个 Chain 组成。一个 Chain 视作是一个步骤,可以接受一些输入变量,产生一些输出变量。大部分的 Chain 是大语言模型完成的 LLM Chain。 Router:可以使用一些判定(甚至可以用 LLM 来判定),然后让 Agent 走向不同的 Chain。例如:如果这是一个图片,则 a;否则 b。 Tool:Agent 上可以进行的一次工具调用。例如,对互联网的一次搜索,对数据库的一次检索。 常见的 AI Agent 类型包括: Responser Agent:主 agent,用于回复用户(伪多模态)。 Background Agent:背景 agent,用于推进角色当前状态(例如进入下一个剧本,抽检生成增长的记忆体)。 Daily Agent:每日 agent,用于生成剧本,配套的图片,以及每日朋友圈。 Background Agent 每隔一段时间运行一次(默认 3 分钟),分析期间的历史对话,变更人物关系(亲密度,了解度等),变更反感度,如果超标则拉黑用户,抽简对话内容,提取人物和用户的信息成为“增长的记忆体”,按照时间推进人物剧本,有概率主动聊天(与亲密度正相关,跳过夜间时间)。
2025-03-23
我是一个教育行业产品经理,我想要学习如何做一个产品经理智能体帮我做方案,告诉我我需要学习的知识
作为教育行业的产品经理,若要学习制作能为您做方案的产品经理智能体,您需要掌握以下知识: 智能体的应用: 自动驾驶:智能体感知周围环境,做出驾驶决策。 家居自动化:智能家居设备根据环境和用户行为自动调节。 游戏 AI:游戏中的对手角色和智能行为系统。 金融交易:金融市场中的智能交易算法根据市场数据做出交易决策。 客服聊天机器人:通过自然语言处理与用户互动,提供自动化的客户支持。 机器人:各类机器人中集成的智能控制系统。 智能体的设计与实现: 定义目标:明确智能体需要实现的目标或任务。 感知系统:设计传感器系统,采集环境数据。 决策机制:定义智能体的决策算法,根据感知数据和目标做出决策。 行动系统:设计执行器或输出设备,执行智能体的决策。 学习与优化:如果是学习型智能体,设计学习算法,使智能体能够从经验中改进。 智能体产品功能详解: 智能体广场: 上传文档至知识库:点击【上传知识】按钮,可上传文档文件或 URL 导入,支持多种文档类型,文档大小有限制,可配置知识的切片方式,完成后知识将进入数据处理状态。 多智能体 AI 搜索引擎方案: 第一步,快速搜索补充参考信息:根据用户任务使用搜索工具补充更多信息,如使用工具 API WebSearchPro。 第二步,用模型规划和分解子任务:使用大模型把用户问题拆分成若干子搜索任务,并转换为 JSON 格式。 第三步,用搜索智能体完成子任务:AI 搜索智能体具备联网搜索和自主分析并进行多轮搜索任务的能力。 第四步,总结子任务生成思维导图:智能体能调用各种插件,如思维导图、流程图、PPT 工具等。
2025-03-17
我现在需要做我的毕业设计名为“基于深度学习的草莓目标识别系统”,你能告诉我如何制作以及用到这里的哪些ai工具、
对于您的“基于深度学习的草莓目标识别系统”毕业设计,以下是一些制作的步骤和可能用到的 AI 工具: 制作步骤: 1. 数据收集:收集大量包含草莓的图像数据,并对其进行标注,例如标记出草莓的位置和类别。 2. 数据预处理:对收集到的数据进行清洗、增强、裁剪等操作,以提高数据质量和模型的泛化能力。 3. 选择模型架构:可以考虑使用常见的深度学习目标检测模型,如 Faster RCNN、YOLO 等。 4. 训练模型:使用预处理后的数据对选择的模型进行训练。 5. 模型评估:使用测试集对训练好的模型进行评估,如准确率、召回率等指标。 6. 模型优化:根据评估结果对模型进行调整和优化,例如调整超参数、增加数据量、使用更复杂的模型等。 可能用到的 AI 工具: 1. TensorFlow:一个广泛使用的深度学习框架,提供了丰富的模型构建和训练工具。 2. PyTorch:另一个流行的深度学习框架,具有灵活的编程接口和强大的计算能力。 3. OpenCV:用于图像处理和数据预处理。 4. LabelImg:用于图像数据的标注。 希望以上内容对您有所帮助,祝您毕业设计顺利!
2025-03-09
请你用简单易懂的语言告诉我comfyui和SD的区别
ComfyUI 和 SD(Stable Diffusion)主要有以下区别: 1. UI 界面:SD WebUI 的 UI 更接近传统产品,有很多输入框和按钮;ComfyUI 的 UI 界面复杂,除输入框外,还有很多块状元素和复杂的连线。 2. 学习成本:ComfyUI 的学习成本比 SD WebUI 高。 3. 工作流方式:ComfyUI 主要通过连线搭建自动化工作流,从左到右依次运行;SD WebUI 则通过输入框和按钮配置参数。 4. 灵活性和拓展性:ComfyUI 具有更高的自由和拓展性,可以根据自身需求搭建、调整甚至改造工作流,无需依赖开发者,还能开发并改造节点;SD WebUI 在这方面相对较弱。 5. 功能实现:从功能角度看,两者提供的功能本质相同,但 ComfyUI 通过改变节点方式能实现不同功能,如一个节点是直接加载图片,另一个是通过画板绘制图片,从而实现导入图片生图和绘图生图等不同功能。
2025-03-08