Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

今天的AI新闻

Answer

以下是 3 月 4 日、3 月 12 日和 3 月 14 日的 AI 新闻汇总:

3 月 4 日:

  • 【AI 3D】
    • Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的 3D 发丝。
    • InsTaG:通过几秒钟视频学习,快速形成逼真的 3D 说话头像效果。
    • 3D-Mem:新型 3D 场景记忆框架。
  • 【AI 绘图】
    • 智谱:开源 AI 绘图 CogView4,可以在图像中生成中文字符。
    • 海螺:推出 Image-01 多功能文本转图像模型。
  • 【AI 视频】
    • Runway:网友爆料 Runway 内测能力可根据参考图像进行 Video to Video 视频风格化。
    • Vidu:API 开放平台全面开放。
  • 【AI 模型】
    • Google Colab:推出 Data Science Agent。
    • 微软:为医疗行业提供首个统一语音 AI 助手:Dragon Copilot。
    • Opera:宣布推出网页浏览器的 AI 代理。

3 月 12 日:

  • 【AI 3D】
    • BlenderMCP:与 Claude AI 沟通,在 blender 实现快速 3D 建模。
    • MIDI:单幅图像到 3D 场景生成。
    • Move AI:更新动作捕捉能力,提出 Gen 2 Spatial Motion。
  • 【AI 写作】
    • MM-StoryAgent:AI 多模态故事生成系统。
  • 【AI 视频】
    • VACE:阿里推出一体化视频创作和编辑技术。
    • VideoPainter:腾讯开源视频编辑技术。
    • Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能。
  • 【其他】
    • OpenAI:为开发者推出一套 AI Agent 开发套件。
    • R1-Omni:阿里情感识别模型,通过视频识别情感。
    • Luma AI:发布一种新的预训练范式 IMM,旨在突破算法瓶颈,提高生成预训练算法的性能。
    • Manus:宣布与阿里通义千问团队达成战略合作。

3 月 14 日:

  • 【AI 模型及其他】
    • 谷歌:Gemini 应用能力升级,包含升级推理模型 gemini 2.0 Flash Thinking Experimental 等多个功能提升。
    • OpenAI:4 项更新。
    • Bolt:一键将 Figma 设计转换为可运行的 Web 应用。
    • 阿里:推出 AI 旗舰应用“新夸克”。
    • 360 智脑团队:开源推理模型 Light-R1-14B-DS,复现 Deepseek 的强化学习效果。
  • 【AI 视频】
    • Pika:更新 Pikaffects,新增多款变身特效。
    • Freepik 与 Fal 平台:引入 Topaz AI 的提升“FPS 和视频分辨率”能力。
    • Krea:上线 Veo 2 模型,支持图生视频功能,但生成成本较高。
  • 【AI 绘图】
    • LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复。
  • 【AI 语音】
    • Sesame:开源 TTS 语音模型 CSM-1B。
Content generated by AI large model, please carefully verify (powered by aily)

References

3月4日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)[heading2]3月4日AI资讯[content]【AI 3D】Meshcapade:预告可从视频/图像中捕捉面部表情并具有逼真的3D发丝InsTaG:通过几秒钟视频学习,快速形成逼真的3D说话头像效果3D-Mem:新型3D场景记忆框架【AI绘图】智谱:开源AI绘图CogView4,可以在图像中生成中文字符海螺:推出Image-01多功能文本转图像模型【AI视频】Runway:网友爆料Runway内测能力可根据参考图像进行Video to Video视频风格化Vidu:API开放平台全面开放【AI模型】Google Colab:推出Data Science Agent微软:为医疗行业提供首个统一语音AI助手:Dragon CopilotOpera:宣布推出网页浏览器的AI代理

3月12日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)[heading2]3月12日AI资讯[content]【AI 3D】BlenderMCP:与Claude AI沟通,在blender实现快速3D建模MIDI:单幅图像到3D场景生成Move AI:更新动作捕捉能力,提出Gen 2 Spatial Motion【AI写作】MM-StoryAgent:AI多模态故事生成系统【AI视频】VACE:阿里推出一体化视频创作和编辑技术VideoPainter:腾讯开源视频编辑技术Wonder Dynamics:推出摄像机轨道(Camera Track)和清洁板(Clean Plate)功能【其他】OpenAI:为开发者推出一套AI Agent开发套件R1-Omni:阿里情感识别模型,通过视频识别情感Luma AI:发布一种新的预训练范式IMM,旨在突破算法瓶颈,提高生成预训练算法的性能Manus:宣布与阿里通义千问团队达成战略合作

3月14日 AI资讯汇总

猫叔留言:AI资讯公众号:超时空视角猫叔个人公众号:AI替代人类小红书/抖音:EverAI B站:Ever AI酱(❤这里会有教程及AI工具界面操作)3月14日AI资讯【AI模型及其他】谷歌:Gemini应用能力升级,包含升级推理模型gemini 2.0 Flash Thinking Experimental等多个功能提升OpenAI:4项更新Bolt:一键将Figma设计转换为可运行的Web应用阿里:推出AI旗舰应用“新夸克”360智脑团队:开源推理模型Light-R1-14B-DS,复现Deepseek的强化学习效果【AI视频】Pika:更新Pikaffects,新增多款变身特效Freepik与Fal平台:引入Topaz AI的提升“FPS和视频分辨率”能力Krea:上线Veo 2模型,支持图生视频功能,但生成成本较高【AI绘图】LBM:用于快速图像到图像转换的潜在桥匹配方法,支持可控图像重新照明、角色去除和图像修复【AI语音】Sesame:开源TTS语音模型CSM-1B,

Others are asking
想转型AI产品经理,推荐学习的资料有?
以下是为您推荐的学习资料,有助于您从产品经理转型为 AI 产品经理: 1. 林粒粒呀的相关视频,如“小白如何理解技术原理与建立框架”,其中介绍了思维链、RAG、PAL、ReAct 等概念,并且提到 Transformer 是仿生算法的阶段性实现。 思维链:谷歌在 2022 年一篇论文提到思维链可以显著提升大语言模型在复杂推理的能力,即使不用小样本提示,也可以在问题后面加一句【请你分步骤思考】。 RAG:检索增强生成(RetrievalAugmented Generation),外部知识库切分成段落后转成向量,存在向量数据库。用户提问并查找到向量数据库后,段落信息会和原本的问题一块传给 AI,可搭建企业知识库和个人知识库。 PAL:程序辅助语言模型(ProgramAided Language Model),2022 年一篇论文中提出,对于语言模型的计算问题,核心在于不让 AI 直接生成计算结果,而是借助其他工具比如 Python 解释器作为计算工具。 ReAct:2022 年一篇《React:在语言模型中协同推理与行动》的论文提出了 ReAct 框架,即 reason 与 action 结合,核心在于让模型动态推理并采取行动与外界环境互动。比如用搜索引擎对关键字进行搜索,观察行动得到的结果。可借助 LangChain 等框架简化构建流程。 2. 余一的相关内容,如《AI 时代个人生存/摸鱼探索指南.Beta》《从 2023 年报,看中国上市公司怎么使用生成式 AI》。 3. 相关网页链接: 创新公司观察: 2022 2024 年融资 2000w 美金以上的公司列表和详细公司分析:https://ameliadev.notion.site/202220242000w08f50fafd81b420fa7f26ecd6c0b3243?pvs=4 AI Grant 公司列表和详细公司分析(三期):https://ameliadev.notion.site/AIGranta52f291e81f34b418c9919497961e831?pvs=4 AIGC 行业与商业观察(2024.1):https://gamma.app/docs/AIGCDev9q1bax2pspnlxqu 【AI 产品/功能构建】: 顶级科技公司产品团队正在构建哪些 AI 功能【总览】:https://gamma.app/docs/AIzawqmb2ff3cv958 顶级科技公司产品团队正在构建哪些 AI 功能【产品分析】:https://gamma.app/docs/AItebxqet8ubz3rje 顶级科技公司产品团队正在构建哪些 AI 功能【思考借鉴】
2025-03-18
有什么使用AI驱动的游戏项目吗?其中有哪些比较热门
以下是一些使用 AI 驱动的游戏项目及热门情况: 1. 《Among Us》:由只有 5 名员工的工作室 Innersloth 制作。 2. 《微软模拟飞行》:有新的游戏类型和与新内容实时生成结合的特点。 3. 《AI Dungeon》和《Hidden Door》:基于文本的早期游戏例子。 4. 《Suck Up!》:2023 年 12 月由 Proxima 工作室开发的“喜剧欺骗游戏”,玩家扮演吸血鬼与 LLM 驱动的 NPC 对话,上线仅两周全网播放火速突破千万。 此外,还有以下趋势和特点: 1. 由人工智能辅助的“微型游戏工作室”逐步崛起,小型工作室能创造的游戏规模将增长。 2. 每年发布的游戏数量会增加。 3. 新的游戏类型将会被创造出来,例如以人工智能创造的角色为特色的 Spellbrush 的 RPG 游戏 Arrowmancer。 4. 有的游戏开发商使用人工智能让玩家在游戏中创建自己的头像。 生成式 AI 将使生产高质量游戏变得更加简单、更快和更便宜,同时使玩家能够真正定制他们的游戏体验。我们已经看到像 Scenario、Iliad 这样可以创建游戏资源的 AI 工具,以及像 Promethean 这样可以构建整个虚拟世界的平台。甚至可以用像 Inworld、Charisma 和 Convai 这样的产品生成非玩家角色(NPC)。
2025-03-18
有没有适合记录会议纪要的AI
以下是一些适合记录会议纪要的 AI 工具和方法: 1. 案例一:【普通人秒变效率王】AI 工作流秒记会议纪要 视频讲解:https://m.okjike.com/originalPosts/65fa9d1112ed2fda68e6215e?s=eyJ1IjoiNTlhZDcyZDUwYjAyYTEwMDEyMjc3YmZmIiwiZCI6MX0%3D 工作流概述: 文本导出:使用飞书妙记将会议对话导出为 txt 文件 纪要生成:启动 Kimichat 输入会议纪要 prompt 提示词并上传 txt 文件 内容完善:与 Kimichat 对话并补充会议中未记录或需强调的信息 纪要微调:审阅 Kimichat 生成的会议纪要草稿进行必要微调 成品输出:确认会议纪要内容无误后,输出最终版文档 和 Kimichat 的完整对话(点击可直接复用并接着聊):https://kimi.moonshot.cn/share/cnsk08phmfr6s04umlrg 2. 总结类 AI 工具: 3. 免费的会议语音转文字工具: 飞书妙记:https://www.feishu.cn/product/minutes ,飞书的办公套件之一 通义听悟:https://tingwu.aliyun.com/home ,阿里推出的 AI 会议转录工具 讯飞听见:https://www.iflyrec.com/ ,讯飞旗下智慧办公服务平台 Otter AI:https://otter.ai/ ,转录采访和会议纪要 更多会议记录工具请访问网站:https://waytoagi.com/sites/category/29 。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-03-18
我自己想做一个英语背单词的游戏,让AI写出Markdown代码运行后,发现问题很大,但是我有不知如何修改这些代码。所以我觉得自己应该懂Markdown 代码语言。但是我不知道Markdown是最适合的编程语言吗?
Markdown 语言不太适合用于编写复杂的英语背单词游戏。虽然 Markdown 简单易用,常用于文档格式化,但在实现游戏逻辑和功能方面存在较大局限性。 如果您想开发英语背单词游戏,更适合使用编程语言,如 Python 等。在处理代码问题时,您可以参考以下方法: 1. 对于编程小白,向 AI 提供代码范例,尤其是新进入代码节点的 IDE 中的范例,减少对 AI 所写代码的改动。 2. 向 AI 说清楚输入变量与输出变量的类型。 3. 说明与工作流中匹配或想要的变量名称,以减少二次修改。 4. 列出输入变量的具体书写形式,对于复杂形式可使用特定方法获取。 5. 说清楚代码要实现的功能,复杂功能尽量将运行逻辑描述清楚,多用变量名称指代涉及的变量。 如果代码运行效果不尽人意,可把当前的代码、输入变量、预期结果提供给 AI,并告知错误的结果或者报错信息,让 AI 帮忙寻找问题并提供修改方案。提问时可参考以下方式: 以上是我目前的 python 代码,我的输入变量。 但是代码运行后的实际结果却是。 另外,在游戏开发与修改过程中,还需注意文件的存放要求、功能优化、平台上传等方面的问题。例如,三个重要文件需在一个文件夹,本地内置图像、音乐等也需在同一文件夹。游戏功能可增加关卡、调整金币获取和技能点花费、解决 Bug 等。研究将游戏发布到 4399 开放平台时,需注册、实名制,审核较严格。获取游戏素材可从官网免费下载或淘宝购买抠好的素材。
2025-03-18
什么ai可以帮我修改简历美化简历
以下是一些可以帮助您修改和美化简历的 AI 工具: 1. 超级简历优化助手:分析简历内容并提供优化建议,帮助用户优化简历提高求职成功率。 2. ResumeMatcher:AI 驱动的开源简历优化工具,提供智能关键词匹配、深入分析见解,提升简历通过 ATS 筛选的几率。 3. KickResume:提供 AI 简历重写服务,使用 OpenAI 的 GPT4 语言模型,能在几秒钟内修复简历错误、使其更专业,并使用行业术语和关键词优化简历,帮助用户通过 ATS 筛选,生成与求职职位匹配的求职信。
2025-03-18
AIGC 检测
以下是一些常见的 AIGC 检测相关的信息: AIGC 论文检测网站和工具: 1. Turnitin:是广泛使用的学术剽窃检测工具,增加了检测 AI 生成内容的功能。使用方法是上传论文,系统自动分析并提供详细报告,标示出可能由 AI 生成的部分。 2. Copyscape:主要用于检测网络上的剽窃行为,虽不是专门的 AIGC 检测工具,但可发现可能被 AI 生成的重复内容。输入文本或上传文档,系统扫描网络查找相似或重复内容。 3. Grammarly:提供语法检查和剽窃检测功能,剽窃检测部分可帮助识别可能由 AI 生成的非原创内容。将文本粘贴到编辑器中,选择剽窃检测功能,系统提供分析报告。 4. Unicheck:基于云的剽窃检测工具,适用于教育机构和学术研究,可检测 AI 生成内容的迹象。上传文档或输入文本,系统分析并生成报告,显示潜在的剽窃和 AI 生成内容。 5. :专门设计用于检测 AI 生成内容的工具,使用先进算法分析文本,识别是否由 GPT3 或其他 AI 模型生成。上传文档或输入文本,系统提供详细报告。 6. :提供免费的 AI 内容检测工具,可识别文本是否由 AI 生成。将文本粘贴到在线工具中,点击检测按钮,系统提供分析结果。 7. GPTZero:专门设计用于检测由 GPT3 生成内容的工具,适用于教育和出版行业。上传文档或输入文本,系统分析并提供报告,显示文本是否由 GPT3 生成。 8. Content at Scale:提供 AI 内容检测功能,帮助用户识别文本是否由 AI 生成。将文本粘贴到在线检测工具中,系统分析并提供结果。 判断一张图片是否 AI 生成: 可以使用一些网站,例如 ILLUMINARTY(https://app.illuminarty.ai/)。但在测试过程中可能存在误判,比如将结构严谨的真实摄影作品识别为 AI 作图,这是因为鉴定 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。
2025-03-18
我想要学习如何获取ai新闻并每天自动发送到微信等平台
以下是获取 AI 新闻并每天自动发送到微信等平台的方法: 1. 通过 Coze 实现多模态资讯的跨平台推送: 创意构思:创建 Bot 作为专属的资讯助手,通过 Coze 这样的 AI agent 流程获取最新资讯,并以多模态形式自动推送到不同平台,如微信群、企业微信群、飞书云文档多维表格等。可根据用户定制化检索需求,自动化抓取热点资讯,进行分析处理,整合成资讯文档返回 Bot 对话界面,并同步自动发送到不同平台。 效果呈现:Coze Bot 可通过不同提问触发检索功能,实现企业微信群自动同步获得资讯检索结果、与企业微信群的信息同步联动,还能获取飞书云文档多维表格中的用户需求,以及在微信群聊中调用 Coze Bot 进行对话交互检索信息。 2. 伊登:最新 Deepseek+coze 实现新闻播报自动化工作流: 工作流程: 内容获取:输入新闻链接,系统自动提取核心内容。添加网页图片链接提取插件获取网页里的图片,利用图片链接提取节点获取新闻主图,使用链接读取节点提取文字内容,接上大模型节点重写新闻成为口播稿子。 3. 用 Coze 免费打造自己的微信 AI 机器人: 搭建步骤: 组装&测试“AI 前线”Bot 机器人:返回个人空间,在 Bots 栏下找到创建的“AI 前线”,点击进入。将写好的 prompt 黏贴到【编排】模块,在【技能】模块添加需要的技能,在【预览与调试】模块输入问题与机器人对话。 发布“AI 前线”Bot 机器人:测试 OK 后,点击右上角“发布”按钮可将其发布到微信、飞书等渠道。若要发布到微信公众号,选择微信公众号渠道,点击右侧“配置”按钮,在微信公众号平台找到自己的 App ID 填入确定即可。
2025-03-17
百度的ai大模型免费的新闻?
以下是关于百度 AI 大模型免费的相关新闻: 2024 年 5 月 21 日,阿里云宣布通义千问主力模型 QwenLong 的 API 输入价格大幅下降,同时下午百度宣布文心大模型两大主力模型全面免费。 2024 年 2 月 13 日,百度宣布文心一言将全面免费,AI 价格战加剧。
2025-03-17
如何实现公众号用智能体+工作流,每天自动发《头条新闻》
要实现公众号用智能体+工作流每天自动发《头条新闻》,可以参考以下步骤: 伊登:最新 Deepseek+coze 实现新闻播报自动化工作流 工作流程详解 第一步:内容获取 1. 只需输入新闻链接,系统就能自动提取核心内容。开始节点,入参包括新闻链接和视频合成插件 api_key。 2. 添加网页图片链接提取插件,承接开始节点的新闻链接。 3. 获取网页里的图片,以 1ai.net 的资讯为例,输入新闻后提取出很多链接,其中第一条链接通常是新闻主图,其他内容多为不重要的 icon。 4. 添加图片链接提取节点,若为节省写代码时间,可直接用大模型节点提取,只拿提取的链接集合的第一条,即可搞定新闻的主要图片。 5. 接着利用调整图片的节点,将 url 属性的图片内容转化为 image 属性的图片(因为 url 节点在画板中是 string 的格式,所以必须转为 img 格式)。 6. 对于文字部分,使用链接读取节点将文字内容提取出来。 7. 在提取链接后面接上一个大模型节点,用来重写新闻成为口播稿子,可使用最强的 DeepseekR1 模型生成有吸引力的口播内容。小 tips,如果想要加上自己的特征,可以在提示词里写:“开头加上‘这里是伊登 AI’之类的个性化台词防伪”。PS:这里的 deepseekR1 基础版本是限额使用,我们可以在专业版手动接入 DeepseekR1 手动接入推理模型。 第二步:画面生成 思路是做成一帧一帧的主图+台词,配合语音合成,保证音屏同步。 1. 用批量化节点,做成一帧一帧的画面,用画板节点完成。批量处理节点输入的是格式变化后的 json 格式的文案。 2. 画面生成的重点是:在批处理中,先把一些固定内容在画板节点安排好,比如背景图片。然后引入变量元素,比如新闻图片(已经提取并转换为 img 属性)、新闻标题(来自链接读取)、口播台词(已经提取并二创)。小 tips:想要找好看的背景图推荐去可画,挑选一个好看的视频模板然后,保存为【图片】格式,然后放在画板节点,当作底图。 第三步:语音合成 使用声音合成的官方插件,引用批处理的一句一句的新闻文案内容,可调节语速和语气,多种播音风格可选。在画板和语音合成的节点后面加入图片音频合成插件。PS:这个插件需要收费,登录 https://ts.fyshark.com//userInfo,【钱包】充值获取 token,【个人中心】获取 token,放入这个节点中,不过充值 10 元可以做好久了,这个插件适合小白同学,也有不收费的插件,但是比较吃操作,如果感兴趣也可以关注后续出相关教程。这个插件的 img_audio_video 的功能是把图片+视频合成,这样就实现了一段一段的口播新闻内容。 【拔刀刘】自动总结公众号内容,定时推送到微信(附完整实操教程) 三、搭建工作流 13、循环将推送内容插入数据库 将本轮推送给用户的内容,写入数据库,下次从 rss 列表中如果再抓取到相同内容,直接跳过,避免重复推送。使用「循环」节点,输入项为第 8 步代码输出的 content_urls,这里有完整的文章内容信息。循环体设置:使用「数据库」节点,输入项为本循环节点 item 中的 url 和 suid,SQL 也是用 AI 生成的。设置循环节点的输出项:output,参数随便选,后边也用不到了。 14、结束节点 选择第 11 步输出的内容,可以在 bot 中也查看到推送的内容。 15、试运行 工作流终于搭建完了,点击右上角的试运行,选择绑定的 bot,输入数据测试。Key:输入你的 server 酱的 sendkey。rss_list:如果你没有现成的数据,可以白嫖我这个,复制下方这两条数据测试使用。试运行结果:如果工作流设置的没有问题,你会在工作流中看到这样的结果。同时,微信上也会收到这条推送,可以查看总结内容,点击链接可以查看公众号原文。点击右上角发布。
2025-03-16
请推荐最新的AI相关进展新闻
以下是一些最新的 AI 相关进展新闻: 在医疗领域: ChatGPT 和 Google Bard 等技术极大加速了医疗健康生物制药的研究,AI 在抗癌、抗衰老、早期疾病防治等方面发挥着重要作用。例如,AI 提前三年诊断胰腺癌;两名高中生与医疗技术公司合作发现与胶质母细胞瘤相关的新靶基因;AI 帮助抗衰老,筛查出高效的药物候选物;利用 AI 寻找阿尔兹海默症的治疗方法;使用神经网络分析患者体液中的生物标志物以早期诊断帕金森。 在技术应用方面: AI Agent 的突破让行业看到更多可能性,如机器人获得自主行动能力。AI 编程工具的进展预示着人机协作模式的变革。 2024 年 AI 关键进展时间线包括:2 月 OpenAI 发布视频生成模型 Sora;3 月 Suno 发布 V3 版本;4 月 Meta 发布高性能开源大模型 Llama3;5 月 GPT4 发布等。 赛博月刊显示,AI 音频公司在效果和延迟方面取得突破,3D 世界生成领域处于初级阶段但有望在明年取得巨大进步,AI 应用的更新集中在搜索、知识库、编程等领域,越来越多应用公司受到资本青睐。
2025-03-16
快速帮我补充下大模型的发展时间线和关键节点,以及当前最前沿的新闻
大模型的发展时间线和关键节点如下: 2017 年:发布《Attention Is All You Need》论文。 2018 年: Google 提出 BERT,创新性地采用双向预训练并行获取上下文语义信息及掩码语言建模。 OpenAI 提出 GPT,开创仅使用自回归语言建模作为预训练目标的方式。 2021 年:Meta 提出 Large LAnguage Model Approach(LLAMA),成为首个开源模型。 2022 年 11 月 30 日:ChatGPT 发布,在全球范围内掀起人工智能浪潮。 2022 年 12 月:字节云雀大模型等出现。 2023 年: 国内大模型发展大致分为准备期(国内产学研迅速形成大模型共识)、成长期(数量和质量逐渐增长)、爆发期(开源闭源大模型层出不穷,形成百模大战态势)。 关键进展包括:Meta 开源 Llama2、OpenAI 发布多模态 GPT4V 及 GPT4 Turbo、百川智能开源 Baichuan7B 及 Baichuan2、百度升级文心一言 4.0、清华&智谱 AI 开源 ChatGLM2 及清华开源 ChatGLM3、腾讯发布混元助手等。 当前最前沿的新闻包括:过去半年,国内领军大模型企业实现了大模型代际追赶的奇迹,从 7 月份与 GPT3.5 的 20 分差距,到 11 月份测评时已在总分上超越 GPT3.5。
2025-03-14
帮我总结一下最近一周值得关注的AI新闻
以下是最近一周值得关注的 AI 新闻: 2024 年 6 月,苹果发布了 AI 原生操作系统,加强了硬件和模型布局;Claude Sonnet 3.5 发布,挑战 OpenAI;视频生成领域 Runway Gen3 和快手可灵表现优秀;AI 3D 技术逐渐崭露头角;Google 和月之暗面推出长上下文缓存技术。整体趋势是技术不断进步,各领域竞争激烈。 快手发布可灵网页版及大量模型更新;阶跃星辰发布多款模型;商汤打造类似 GPT4o 的实时语音演示;GraphRAG:微软开源新型 RAG 架构。 红杉资本美国合伙人 Pat Grady 在最新访谈中表示,AI 技术将为服务行业带来变革机遇,而非取代软件公司。AI 的潜力在于赋能服务行业,但人际关系和实际执行仍需人工。对于基础模型公司,Grady 认为它们可能像数据库公司一样发展,提供开发者 API,有机会进入应用层。他认为现有模型已足够强大,关键在于工程化优化和认知架构设计。 Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位。 Shopify 的 AI 助手 Sidekick 现已上线,它知道如何在 Shopify 中执行任何操作,包括提取相关数据、操作新功能或创建报告。 Artifact(Ins 创始人做的 AI 新闻浏览软件)推出了自定义内容阅读语音的功能。 OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,主要目的是确保 AI 模型的安全发展。 Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器。 2024 年 1 月,斯坦福大学 Mobile Aloha;1 月 10 号 LumaAl Genie 文生 3D;1 月 11 号 GPT store 上线;1 月 MagnificAl 高清放大爆火;1 月最后一天苹果 Vision Pro 宣布发售。
2025-03-06
今天有什么ai新动态
以下是近期的 AI 新动态: 2024 年 3 月:AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。 2024 年 4 月:英伟达发布硬件,股价飙升。 2024 年 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 2024 年 7 月:快手开源 LivePortrait 模型,实现表情迁移。 2024 年 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 2024 年 9 月:阿里云发布模型,海螺 AI 参战,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。 2024 年 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。 12 月 5 日的 AI 新动态: Clone Robotics:仿生机器人公司致力于生产高仿真产品,技术和外观的进步让人类与机器人的边界变得越来越模糊。 Humane 发布 AI 驱动操作系统 CosmOS,具有多种核心功能,支持多种输入方式,并可实时从互联网获取数据为用户提供服务。 DeepMind 发布天气预测 AI 模型 GenCast,可预测未来 15 天的天气和极端天气风险,与顶级预测系统相比表现更优,且模型代码、权重和预测数据已开源。 OpenAI 的 ChatGPT 用户突破 3 亿。 在法律法规方面: 虽然 AI 概念不新,但近期数据生成和处理的进步改变了该领域及其产生的技术。例如,生成式 AI 模型的能力发展带来机会的同时也引发了关于潜在风险的新辩论。 并非所有 AI 风险都源于不良行为者的故意行为,有些可能是意外后果或缺乏适当控制导致的。 对 AI 特定风险及其潜在危害进行了初步评估,并参考了其威胁的价值,包括安全、公平、隐私、人权、社会福祉和繁荣等。 交叉的 AI 风险评估确定了一系列高级风险,框架将寻求通过适当干预来优先处理和减轻这些风险。例如,安全风险包括对人类和财产的身体损害以及对心理健康的损害。
2025-03-12
截止今天最强的模型是哪个
目前很难确切地指出截止今天最强的模型是哪一个。以下是一些表现出色的模型: Gemini Ultra:在报告的 32 个基准测试中,在 30 个基准测试中取得了 SOTA,包括多个领域的测试。它是第一个在 MMLU 上实现人类专家水平表现的模型,在多模态推理任务方面也有显著进展。 o3 模型:在 ARCAGI 测试中达到了 87.5%的准确率,几乎与人类水平相当。OpenAI 表示下一代 o3mini 模型的推理能力很强。 Gemini 2.0 Flash:Google 发布的该模型在重要的基准能力上,直接追平甚至部分超越了 Gemini 1.5 Pro,且模型速度有极大提升。 Llama 3.1:是迄今为止最大版本,其在推理、数学、多语言和长上下文任务中能够与 GPT4 相抗衡。 需要注意的是,模型的性能评估会因不同的基准测试和应用场景而有所差异,而且技术在不断发展,最强模型的定义也可能随之变化。
2025-03-05
今天有没有新的 ai 资讯
以下是为您汇总的近期 AI 资讯: 12 月 25 日: Recraft AI :更新了 60 种新的图像风格,是 AI 平面设计工具,用户可生成和编辑插画、海报、产品周边等,对所有用户每日有免费试用点数,允许商业使用。地址:https://www.recraft.ai/ AI 公文智能体“学习强国公文助手”在文小言 APP 正式上线,可进行文汇检索、AI 公文书写、AI 公文润色等。使用方式:下载文小言 APP,找寻学习强国公文助手。 2 月 13 日: Magnific AI 的图像高清化能力已在 freepik AI 上提供,订阅用户可用。地址:https://www.freepik.com/ai 百度上线深度搜索功能,同时宣布文心一言将从 4 月 1 日起全面免费。地址:https://mp.weixin.qq.com/s/lk7g2bhjBX45NHYDxU2D3w OpenAI CEO Sam Altman 深夜透露 GPT 未来路线图,数周或数月内将推出代号“Orion”的 GPT4.5,后期将融合 o 系与 GPT 系列推出 GPT5,同时结合多项新能力。ChatGPT 的免费用户也将可用到 GPT5,订阅用户享有更高智能的 GPT5。今晨 OpenAI 又更新,Openai O1 和 O3Mini 支持 CHATGPT 中的文件和图像上传,上调 O3MiniHigh 使用限制,所有 Pro 用户可在多端使用 Deep research 能力。如有问题可联系后台,电子邮箱:alolg@163.com 12 月 24 日: DisPose :由清华大学与北京大学等组织联合发布的可控人体图像动画方法,输入动作视频参考和人物图像可形成新的角色舞蹈视频。地址:https://lihxxx.github.io/DisPose/ InvSR :开源图像超分辨率模型,提升图像分辨率的开源新工具,只需一个采样步骤即可增强图像,可高清修复图像。地址、在线试用地址:https://github.com/zsyOAOA/InvSR?tab=readmeovfilerailway_caronlinedemo 、https://huggingface.co/spaces/OAOA/InvSR
2025-02-14
今天AI 的news
以下是今日有关 AI 的一些新闻: AI 大神 Karpathy 再发 LLM 入门介绍视频,提到了 LLM 的未来能力与发展趋势,包括具备多模态能力、发展为智能体、无处不在的隐形化、测试时训练、处理长上下文等。同时还介绍了跟踪 LLM 最新进展的资源,如 LLM 排行榜、AI News Newsletter 以及在 X(Twitter)上关注相关研究者和从业者。 XiaoHu.AI 日报 1 月 02 日的内容包括:小互 AI 年度总结,涵盖 2024 AI 技术与工具盘点;AI 对招聘市场的深刻影响(ZoomInfo 研究),如自 2022 年起 AI 相关职位的增长情况,以及多家公司设立 AI 相关领导角色等;微软论文疑似透露 OpenAI 模型参数。
2025-02-10
今天有什么AI资讯
以下是为您整理的今日 AI 资讯: 近期热门融资 AI 产品速递 1 st :包括多种搜索模式且重隐私的搜索引擎 You.com、通过 Sparkpages 来满足用户个性化搜索需求的 Genspark、刚被 OpenAI 收购的提供实时搜索和分析数据库服务的 Rockset、人类与 AI 共存的社交软件 Butterflies AI、可以对销售通话进行记录和辅导的 AI 助手 MeetRecord。 宝玉日报 2 月 3 日: AI 对软件工程的影响:涵盖自动代码生成、智能调试、AI 驱动的 DevOps 和敏捷开发优化等方面。 OpenAI CEO 宣布开发 AI 设备,目标颠覆智能手机,同时表达了对自研 AI 芯片的兴趣。 OpenAI 推出全新 Deep Research,让 ChatGPT 成为您的研究助理。 AIGC Weekly32 上周精选: Netflix 列出了一个年薪 90 万美元的机器学习平台产品经理的 AI 产品工作岗位。 Shopify 的 AI 助手 Sidekick 已上线,能帮助执行相关操作。 Artifact 推出了自定义内容阅读语音的功能。 OpenAI、谷歌、微软和 Anthropic 组建了前沿模型论坛,确保 AI 模型的安全发展。 Open AI 悄咪咪下线了他们的 ChatGPT 生成内容的检测器。
2025-02-08
到今天,大语言模型还会产生“幻觉”吗
截至今天,大语言模型仍会产生“幻觉”。 大语言模型偶尔会根据输入输出一些荒谬或不符合事实的内容,目前各家大语言模型在该问题上的表现都不尽如人意。产生“幻觉”的原因包括: 1. 样本存在错误(Imitative Falsehoods):如果大语言模型学习的“教材”中有错误,它也容易给出错误回答。缓解该问题的一个办法是上采样(Up Sampling)。 2. 信息过时(Outdated Factual Knowledge):以前正确的信息现在可能过时了。 此外,大语言模型通过训练数据猜测下一个输出结果,可能因错误数据导致给出错误答案,优质数据集对其很重要。如果在其训练过程中,模型被暴露于大量知识之中,它并没有完美地记忆所见到的信息,并不十分清楚自己的知识边界,可能会尝试回答有关深奥话题的问题,并虚构听起来有道理但实际不正确的内容。 在构建应用程序时,可以使用一些技术来避免这种情况,例如要求模型先从文本中找到相关引文,然后使用引文回答问题,并将答案追溯回源文件,这通常有助于减少“幻觉”的发生。
2025-01-22