Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

最新具身智能新闻

Answer

以下是关于具身智能的最新新闻:

具身智能是将机器学习算法适配至物理实体,从而与物理世界交互的人工智能范式。以 ChatGPT 为代表的“软件智能体”通过网页端、手机 APP 与用户交互,而具身智能体则将大模型嵌入到物理实体上,通过机器配备的传感器与人类交流。人形机器人是具身智能的代表产品。

具身智能的三要素包括本体(硬件载体)、智能(大模型、语音、图像、控制、导航等算法)、环境(本体所交互的物理世界),三者高度耦合是高级智能的基础。不同环境下会有不同形态的硬件本体适应,如室内平地适用轮式机器人,崎岖地面适用四足机器人。

具身智能体的行动分为“感知-决策-行动-反馈”四个步骤,感知模块负责收集和处理信息,通过多种传感器感知和理解环境。常见的传感器有可见光相机、红外相机、深度相机、激光雷达、超声波传感器、压力传感器、麦克风等。

最近,具身智能的概念很火。例如稚晖君开源人形机器人全套图纸+代码引发圈内热议,各类具身智能产品如李飞飞的 Voxposer、谷歌的 RT1 和 RT2、RTX、字节跳动的 Robot Flamingo、斯坦福的 ACT 和卡耐基梅隆的 3D_diffuser_act 等,在不同任务和场景中展示了强大能力,并有潜力带来革命性变革。本文拆分为上下两篇,明天会更新下篇,聚焦人机交互、发展讨论。本文部分参考中国信息通信研究院和北京人形机器人创新有限公司的《具身智能发展报告》。

Content generated by AI large model, please carefully verify (powered by aily)

References

一篇具身智能的最新全面综述!(上)

具身智能,即“具身+智能”,是将机器学习算法适配至物理实体,从而与物理世界交互的人工智能范式。以ChatGPT为代表的“软件智能体”(或称“离身智能体”)使用大模型通过网页端、手机APP与用户进行交互,能够接受语音、文字、图片、视频的多种模态的用户指令,从而实现感知环境、规划、记忆以及工具调用,执行复杂的任务。在这些基础之上,具身智能体则将大模型嵌入到物理实体上,通过机器配备的传感器与人类交流,强调智能体与物理环境之间的交互。通俗一点讲,就是要给人工智能这个聪明的“头脑”装上一副“身体”。这个“身体”可以是一部手机,可以是一台自动驾驶汽车。而人形机器人则是集各类核心尖端技术于一体的载体,是具身智能的代表产品。具身智能的三要素:本体、智能、环境具身智能的三要素:“本体”,即硬件载体;“智能”,即大模型、语音、图像、控制、导航等算法;“环境”,即本体所交互的物理世界。本体、智能、环境的高度耦合才是高级智能的基础。不同环境下的会有不同形态的硬件本体以适应环境。比如室内平地更适用轮式机器人,崎岖不平的地面更适用四足机器人(机器狗)。在具身智能体与环境的交互中,智能算法可以通过本体的传感器以感知环境,做出决策以操控本体执行动作任务,从而影响环境。在智能算法与环境的交互中还可以通过“交互学习”和拟人化思维去学习和适应环境,从而实现智能的增长。具身智能的四个模块:感知-决策-行动-反馈一个具身智能体的行动可以分为“感知-决策-行动-反馈”四个步骤,分别由四个模块完成,并形成一个闭环。感知模块

一篇具身智能的最新全面综述!(上)

感知模块负责收集和处理信息,通过多种传感器感知和理解环境。在机器人上,常见的传感器有:1.可见光相机:负责收集彩色图像。2.红外相机:负责收集热成像、温度测量、夜视和透视。红外相机能够检测物体发出的热辐射,即使在完全黑暗的环境中也能生成图像。这种能力使得红外相机适用于夜视和热成像。红外相机可以测量物体表面的温度,广泛应用于设备过热检测、能源审计和医学成像等领域。某些红外相机能够穿透烟雾、雾气和其他遮挡物,适用于应急救援和安全监控。3.深度相机:负责测量图像中每个点与相机之间的距离,获取场景的三维坐标信息。4.激光雷达(LiDAR):负责测量目标物体的距离和速度。通过发射激光脉冲并接收反射回来的光来计算与物体的距离,生成高精度的三维点云数据,广泛应用于自动驾驶和机器人导航。5.超声波传感器:负责避障。通过发射超声波脉冲并接收这些脉冲的反射来确定机器人与障碍物之间的距离,判断障碍物是否存在。6.压力传感器:负责测量机器人手或脚部的压力,用于行走和抓取力的控制以及避障。7.麦克风:负责收音。

一篇具身智能的最新全面综述!(上)

最近,具身智能的概念很火。不论是这几天[稚晖君开源人形机器人全套图纸+代码](http://mp.weixin.qq.com/s?__biz=MzIyNjM2MzQyNg==&mid=2247686482&idx=1&sn=e38d9d5eedcb1355fb65f617812016ed&chksm=e87dc81fdf0a410991d12d60cf0354c1a35fe2e35593bd09c93649551627444d6b78e32a0bd9&scene=21#wechat_redirect),引发圈内热议。还是各类具身智能产品,如李飞飞的Voxposer、谷歌的RT1和RT2、谷歌的RTX、字节跳动的Robot Flamingo、斯坦福的ACT和卡耐基梅隆的3D_diffuser_act,均在不同任务和场景中展示了强大的能力,并有潜力带来革命性的变革。那什么是具身智能呢?它又有什么用?一文带你了解。本文拆分为上下两篇,明天会更新下篇,聚焦人机交互、发展讨论。本文部分参考中国信息通信研究院和北京人形机器人创新有限公司的《具身智能发展报告》具身智能基本概念

Others are asking
什么是具身智能?
具身智能是人工智能领域的一个子领域。它强调智能体(如机器人、虚拟代理等)通过与物理世界或虚拟环境的直接交互来发展和展现智能。 其核心在于智能体的“身体”或“形态”,这些身体可以是物理形态(如机器人的机械结构),也可以是虚拟形态(如在模拟环境中的虚拟角色)。身体不仅为智能体提供与环境互动的手段,也影响其学习和发展。 具身智能的研究涉及多个学科,包括机器人学、认知科学、神经科学和计算机视觉等。在机器人学中,关注设计能自主行动和适应环境的机器人;在认知科学和神经科学中,探索大脑处理与身体相关信息的机制及应用于人造智能系统;在计算机视觉中,致力于开发使智能体理解和解释视觉信息的算法。 具身智能在机器人领域(如服务机器人、工业自动化和辅助技术等)有重要应用,能让机器人更好地理解和适应人类生活环境,提供更自然有效的人机交互。在虚拟现实、增强现实和游戏设计等领域也有广泛应用,创造更具沉浸感和交互性的体验。 具身智能的三要素为“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界),本体、智能、环境的高度耦合是高级智能的基础。其行动可分为“感知决策行动反馈”四个步骤,分别由四个模块完成并形成闭环。 尽管具身智能取得显著进展,但仍面临诸多挑战,如设计智能体身体以最大化智能表现、让智能体在复杂环境中有效学习以及处理与人类社会的伦理和安全问题等。
2025-02-20
具身智能是什么?
具身智能是人工智能领域的一个子领域,指智能体(如机器人、虚拟代理等)通过与物理世界或虚拟环境的直接交互来发展和展现智能。 其核心在于智能体的“身体”或“形态”,这些身体可以是物理形态,如机器人的机械结构,也可以是虚拟形态,如在模拟环境中的虚拟角色。身体不仅为智能体提供了与环境互动的手段,也影响其学习和发展。 具身智能的研究涉及多个学科,包括机器人学、认知科学、神经科学和计算机视觉等。在机器人学中,关注如何设计能自主行动和适应环境的机器人;在认知科学和神经科学中,探索大脑处理与身体相关信息的机制及应用于人造智能系统;在计算机视觉中,致力于开发使智能体能够理解和解释视觉信息,从而进行有效空间导航和物体识别的算法。 具身智能在机器人领域有重要应用,特别是在服务机器人、工业自动化和辅助技术等方面,能让机器人更好地理解和适应人类生活环境,提供更自然有效的人机交互。此外,在虚拟现实、增强现实和游戏设计等领域也有广泛应用,创造更具沉浸感和交互性的体验。 具身智能的三要素包括“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界),本体、智能、环境的高度耦合是高级智能的基础。其行动可分为“感知决策行动反馈”四个步骤,并形成一个闭环。 尽管具身智能取得了显著进展,但仍面临诸多挑战,如设计智能体身体以最大化智能表现、让智能体在复杂多变环境中有效学习,以及处理与人类社会的伦理和安全问题等。
2025-02-19
具身智能是什么?
具身智能是人工智能领域的一个子领域,指智能体(如机器人、虚拟代理等)通过与物理世界或虚拟环境的直接交互来发展和展现智能。 其核心在于智能体的“身体”或“形态”,这些身体可以是物理形态,如机器人的机械结构,也可以是虚拟形态,如在模拟环境中的虚拟角色。身体不仅为智能体提供了与环境互动的手段,也影响其学习和发展。 具身智能的研究涉及多个学科,包括机器人学、认知科学、神经科学和计算机视觉等。在机器人学中,关注如何设计能自主行动和适应环境的机器人;在认知科学和神经科学中,探索大脑处理与身体相关信息的机制及应用于人造智能系统;在计算机视觉中,致力于开发使智能体能够理解和解释视觉信息,从而进行有效空间导航和物体识别的算法。 具身智能的应用广泛,在机器人领域,特别是服务机器人、工业自动化和辅助技术等方面,能让机器人更好地理解和适应人类生活环境,提供更自然有效的人机交互。在虚拟现实、增强现实和游戏设计等领域,能创造更具沉浸感和交互性的体验。 具身智能有三要素:本体(硬件载体)、智能(大模型、语音、图像、控制、导航等算法)、环境(本体所交互的物理世界),本体、智能、环境的高度耦合是高级智能的基础。其行动可分为“感知决策行动反馈”四个步骤,分别由四个模块完成并形成闭环。 尽管具身智能取得了显著进展,但仍面临诸多挑战,如如何设计智能体的身体以最大化其智能表现,如何让智能体在复杂多变环境中有效学习,以及如何处理智能体与人类社会的伦理和安全问题等。
2025-02-18
具身智能
具身智能是人工智能领域的一个子领域。 它强调智能体(如机器人、虚拟代理等)通过与物理世界或虚拟环境的直接交互来发展和展现智能。智能不仅仅是处理信息的能力,还包括感知环境、自主导航、操作物体、学习和适应环境等能力。 具身智能的核心在于智能体的“身体”或“形态”,其可以是物理形态(如机器人的机械结构)或虚拟形态(如模拟环境中的虚拟角色)。这些身体为智能体提供了与环境互动的手段,并影响其学习和发展。 具身智能的研究涉及多个学科,如机器人学、认知科学、神经科学和计算机视觉等。在机器人学中,关注设计能自主行动和适应环境的机器人;在认知科学和神经科学中,探索大脑处理与身体相关信息的机制及应用于人造智能系统;在计算机视觉中,致力于开发使智能体理解和解释视觉信息的算法。 具身智能在机器人领域(如服务机器人、工业自动化和辅助技术等)、虚拟现实、增强现实和游戏设计等领域有广泛应用。 具身智能的三要素包括“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界),三者高度耦合是高级智能的基础。其行动分为“感知决策行动反馈”四个步骤,并形成闭环。 尽管具身智能取得了显著进展,但仍面临诸多挑战,如智能体身体的设计、在复杂多变环境中的有效学习以及与人类社会相关的伦理和安全问题等。
2024-12-31
具身智能
具身智能是人工智能领域的一个子领域。 它强调智能体(如机器人、虚拟代理等)通过与物理世界或虚拟环境的直接交互来发展和展现智能。智能不仅仅是处理信息的能力,还包括感知环境、自主导航、操作物体、学习和适应环境等能力。 具身智能的核心在于智能体的“身体”或“形态”,其可以是物理形态(如机器人的机械结构)或虚拟形态(如模拟环境中的虚拟角色)。这些身体为智能体提供了与环境互动的手段,并影响其学习和发展。 具身智能的研究涉及多个学科,如机器人学、认知科学、神经科学和计算机视觉等。在机器人学中,关注设计能自主行动和适应环境的机器人;在认知科学和神经科学中,探索大脑处理与身体相关信息的机制及应用于人造智能系统;在计算机视觉中,致力于开发使智能体理解和解释视觉信息的算法。 具身智能在机器人领域(服务机器人、工业自动化和辅助技术等)、虚拟现实、增强现实和游戏设计等领域有广泛应用。通过具身智能,机器人能更好地理解和适应人类生活环境,提供更自然有效的人机交互,也能创造更具沉浸感和交互性的体验。 具身智能的三要素包括“本体”(硬件载体)、“智能”(大模型、语音、图像、控制、导航等算法)、“环境”(本体所交互的物理世界),三者高度耦合是高级智能的基础。不同环境下有不同形态的硬件本体适应环境。 具身智能的行动可分为“感知决策行动反馈”四个步骤,形成一个闭环。 在追求人工通用智能(AGI)的过程中,具身 Agent 正成为核心研究范式,它强调智能系统与物理世界的紧密结合。与传统深度学习模型相比,LLMbased Agent 能主动感知和理解所在物理环境并互动,进行“具身行动”。 尽管具身智能取得显著进展,但仍面临诸多挑战,如设计智能体身体以最大化智能表现、让智能体在复杂环境中有效学习、处理智能体与人类社会的伦理和安全问题等。未来研究将继续探索这些问题以推动其发展和应用。
2024-12-31
基于多模态大模型的具身智能 技术原理是什么
基于多模态大模型的具身智能技术原理主要包括以下方面: 决策模块是具身智能系统的核心,负责接收感知模块的环境信息,进行任务规划和推理分析,以指导行动模块生成动作。早期决策模块主要依赖人工编程规则和专用任务算法,而基于近端策略优化算法和 Qlearning 算法的强化学习方法在具身智能自主导航等任务中展现出更好的决策灵活性,但在复杂环境适应能力等方面存在局限。 大模型的出现极大增强了具身智能体的智能程度,提高了环境感知、语音交互和任务决策能力。具身智能体的大模型是 AIGA,调用机械臂、相机等身体部件,其发展方向是视觉语言动作模型(VLA)和视觉语言导航模型(VLN)。 VLA 输入语言、图像或视频流,输出语言和动作,在统一框架内融合互联网、物理世界和运动信息,实现从自然语言指令到可执行动作指令的直接转换。 VLN 输入语言、图像或视频流,输出语言和移动轨迹,用于统一指令输入框架,使大模型直接生成运动方向、目标物体位置等操作信息。 Google Deepmind 从大模型入手打造具身智能,率先提出 Robotics Transformer 系列模型,如 RT1 等,并不断升级。RT1 基于模仿学习中的行为克隆学习范式,输入短的图像序列和指令,输出每个时间步的动作。随着数据量增加,有从分层模型过渡到端到端模型的趋势。 北大 HMI Lab 团队构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力。 在具身智能应用中,更强调“动态”学习方式,如强化学习、模拟学习等,让机器人与环境不断交互学习,通过奖励机制优化行为,获得最优决策策略,摒弃传统控制论算法物理建模的弊端。
2024-12-27
新手如何更好使用该网站,主要了解人工智能或者AGI进展,主流软件的学习和应用
对于新手想要更好地使用该网站来了解人工智能或 AGI 进展以及主流软件的学习和应用,以下是一些相关内容: AE 软件: 基本功能:可通过图层软件抠元素加插件做特效,如利用 auto field 自动填充工具,轨道遮罩功能让图层按特定形状变化等。 与 AI 结合运用:如用 runway 生成烟花爆炸素材,结合 AE 的图层混合模式、遮罩等功能实现特效可控的画面。 其他应用:用内容识别填充功能处理视频画面,如抹掉入镜的人;从素材网站获取粒子素材为画面添加氛围感。 学习路径:可在 B 站找丰富的 AE 软件入门课程自学,也可从包图网下载工程文件学习。 学习方法:通过拆解视频、留意路边广告特效、按层级逻辑思考画面运动来学习 AE,还可参考模板。 与 AI 的关系:AI 出现后,AE 使用减少,有些动效可用 AI 完成。 在短剧中的应用:在火焰、文字、光线等方面有少量应用。 AI 相关技术与活动: AI 音乐创作:通过输入更高级的词汇与 AI 音乐对话能产生更好效果,有 AI 音乐的版块、挑战、分享会和教程,可通过王贝加入 AI 音乐社区。 数字人语音合成:介绍了声音克隆技术,提到了微软、阿里等的相关成果,常用的是 JPT service。 Config UI 的应用:能降低成本、提高效率,在图书出版、引流等方面有应用,岗位稀缺,社区有相关共学课程。 社区共创项目:包括东京的 confii 生态大会、AI 文旅视频、娃卡奖、李普村共创故事、AI 春晚等活动。 作业与报名:作业是询问对 AI 方向的兴趣和想做的项目,活动报名可通过填写名字和申请新增学校参与。 线下寄送物料组织活动:会给大家寄送线下活动物料,在学校内组织。 AI 春晚即将开始:去年 300 人 30 天共创了 AI 春晚,今年的也即将开始,可报名参与多种岗位。 AIPO 活动及相关挑战:10 月 20 日的 AIPO 活动,可提前构思展示项目,有会话和视频相关的挑战赛。 共学活动与技能提升:接下来 10 天有从零基础到建站等内容的讲解,回放会放在链接里,可先从练习提示词入手。 硬件机器人材料购买:若搞硬件机器人,部分材料需尽快购买。 自媒体发布与流量扶持:在小红书发布活动内容带特定标签有流量扶持,作品也可发布在 GitHub 等平台。 活动奖项与历史玩法:设最佳创业奖和最佳投资奖各四个,有线下摆摊展示交流、IPO 路演等玩法,之前在多个城市举办过 AI 切磋大会。 工具使用与新大赛预告:可使用多种 AI 工具,新的大赛即将开启,有百万奖金池,相关动态会在社区活动栏目公布。 AI 音乐和数字人语音合成: AI 音乐方面,提到草爷、格林 king、狗哥带大家入门,有相关课程与教程,且淘宝上有套壳工具抄袭。社区伙伴做的 AI 音乐专辑不错。 数字人语音合成部分提到声音克隆,有新的声音克隆且音质很不错。 提到了微软新出的成果、阿里的 Cozy voice(指出其泛化能力不强)、大家常用的 GPT solve it、刚举办的 AI 3D 活动。 以小田的 config UI 基础工作流一日谈展开,讲述了多个案例,如许建拍摄场景图成本降低,郭佑萌在图书出版行业提升效率,影楼可进行换装等操作,文旅文创场景有有趣的合影生成方式,还提到该工作流岗位稀缺且社区有课程可供学习。 AJ 介绍平台资源,包括共学课程、专栏报告、数据等,还提及就业创业及一些企业专栏的内容。
2025-02-28
智能客服
以下是关于智能客服的相关内容: 在开源 AI 社区中,通过 Coze 开发了社群运营机器人作为智能客服。其具有以下功能和特点: 1. 知识库问答:将社区长期积累的文章和资料喂给机器人学习,它能通过 RAG 机制匹配用户问题给出准确稳定的答案。解决了如“AGI 是什么”“什么是 ChatGPT”等基础问题,提高了效率,保证了答案的准确性和一致性。此外,还会基于问题给出相关延伸阅读链接,鼓励用户主动学习,影响用户学习方式。 2. 定时推送:能将活动信息和社区动态定时推送给用户,避免用户错过重要活动。 另外,GPT 智能客服部署方面: 1. GPTs 是 GPT 的一种 ID 账号形态,类似微信公众号,用户可开发自己垂类应用。其开放门槛低,基本是 0 代码,开发方式包括自然语言(prompt)、知识库(knowledge)、第三方 API 对接(Action)。 2. GPTs 实现了目前最强的智能客服,具有对话流畅、多观点融合、答案准确等特点,但不太擅长推理计算。其实现原理是将 FAQ 上传到知识库,让 GPTs 具有客服应答能力。猜测类似检索增强生成技术(RAG),将知识库和问题一起做 embedding,扔给 LLM 作答。
2025-02-28
aI 智能体和大模型的区别是什么
AI 智能体和大模型的区别主要体现在以下几个方面: 1. 概念和定位:智能体简单理解就是 AI 机器人小助手,参照移动互联网,类似 APP 应用的概念。大模型是一种技术。 2. 服务对象:大模型是技术,面向用户提供服务的是基于大模型的产品,如智能体。 3. 功能特点:大模型具有强大的语言理解和生成能力,但存在局限性,如无法回答私有领域问题、无法及时获取最新信息、无法准确回答专业问题等。智能体通过集成特定的外部能力,能够弥补大模型的不足,例如实时信息获取、回答私有领域问题等。 4. 应用场景:智能体在 C 端有社交方向,用户注册后捏自己的 Agent 并让其与他人的 Agent 聊天;在 B 端可以帮助商家搭建 Agent。大模型适用于通用的语言处理任务。 5. 开发方式:有专门的智能体开发平台,如字节扣子、腾讯元器等。
2025-02-28
本地部署的AI模型如何制作智能体
以下是关于本地部署的 AI 模型制作智能体的相关信息: 阿里云百炼满血版 DeepSeek: 1. 开通满血版 R1 模型:在模型广场找到 DeepSeekR1 并进行授权。每个人会免费获得 100 万额度,过期未用则浪费。此模型由阿里云自主部署,并做了推理优化,性能强于多数本地部署版本。 2. 应用开发:新增模板,可从模板学习应用搭建。 3. 联网搜索:配置简单方便,结合 Deepseekr1 更强大,如搜索天气时会多方验证。 4. 新鲜的动态 few shot:可用于对模型某些表现不佳、易出幻觉的任务通过 prompt training 强行修正。 5. 工作流:用工作流让不同模型在同一任务创作。 行业变革中的智能体相关: Anthropic 的 Claude 3 拥有三个版本,最大规模的 Opus 适合复杂推理与自动化任务计划,其次的 Sonnet 适合个人助理及内容快速分析,如智能体任务,最快最便宜的 Haiku 可执行快速翻译、客服对话等任务。Meta、微软、Google、Apple 等均有可适配到移动终端上运行的开源模型。边缘算力竞争中,Apple、Google、高通等在终端占有量和芯片方面具有优势,PC 级别终端因智能集成复兴,未来可能有家用和办公用“智能体”终端诞生,Tesla EV 也在相关量级之上。 自制软件和赤脚开发者中的智能体相关: 大型语言模型可表现为智能体,能制定计划和决策以实现设定目标,可访问外部工具、数据库长期记忆等,并模仿逻辑思维模式。语言模型和智能体已部署到帮助专业开发人员的工具中,如 GitHub Copilot、Cursor 和 Replit,能读写代码、调试、创建文档和编写测试,使用此类工具可提高开发人员完成任务的速度。
2025-02-27
人工智能法律
以下是关于人工智能法律的相关内容: 《人工智能权利法案蓝图》提出了人工智能权利法案的相关内容。 《全球人工智能治理大变局之欧盟人工智能治理监管框架评述及启示》中提到: 1. 欧盟人工智能监管体系对中国的启示包括纳入道德伦理和人权考量的以风险为基准的统一人工智能治理。但伦理道德和人权的高度概括性、抽象性和不确定性给融入人工智能治理带来挑战,我国《科技伦理审查办法(试行)》是积极探索,但人工智能的特殊性可能无法体现,且“不可接受的风险”和“高风险”的界定存在不确定性和模糊性,以风险为基准的人工智能管理框架成效有待观望和研讨。 《人工智能法案》的相关规定包括: 1. 通过适当的设计、测试和分析,在开发前和整个开发过程中,用适当的方法(如让独立专家参与)证明对健康、安全、基本权利、环境、民主和法治的合理可预见风险的识别、减少和缓解,以及开发后剩余不可缓解风险的记录。 2. 处理和纳入仅受适当数据治理措施约束的数据集用于基础模型,特别是检查数据源的适用性和可能的偏差以及适当的缓解措施。 3. 设计和开发基础模型,以在其整个生命周期内通过适当的方法(如让独立专家参与模型评估、记录分析和广泛测试)实现适当水平的性能、可预测性、可解释性、可纠正性、安全性和网络安全性。 4. 设计和开发基础模型时,利用适用的标准来减少能源使用、资源使用和浪费,并提高能源效率和系统的整体效率,但不损害相关的现有联盟和国家法律。在第 40 条所述的标准公布之前,此义务不适用。基础模型应具备能够测量和记录能源和资源消耗以及在技术可行的情况下系统部署和使用在整个生命周期内可能产生的其他环境影响的能力。 5. 制定广泛的技术文档和易懂的使用说明,以使下游供应商能够遵守第 16 条和第 28(1)条规定的义务。 6. 建立质量管理体系,以确保并记录对本条的遵守情况,并有可能在满足这一要求方面进行试验。
2025-02-27
如何用扣子搭建自己的智能体
用扣子搭建自己的智能体可以参考以下步骤: 1. 创建智能体: 输入智能体的人设等信息。 为智能体起一个名称。 写一段智能体的简单介绍,介绍越详细越好,系统会根据介绍智能生成符合主题的图标。 2. 配置工作流: 放上创建的工作流。 对于工作流中的特定节点,如【所有视频片段拼接】,注意插件 api_token 的使用,避免直接发布导致消耗个人费用,可以将其作为工作流的输入,让用户自行购买后输入使用。 3. 测试与发布: 配置完成后进行测试。 确认无误后再发布。 扣子(Coze)是字节跳动旗下的新一代一站式 AI Bot 开发平台,无论是否具备编程基础,都能在该平台上迅速构建基于 AI 模型的各类问答 Bot。开发完成后还可发布到各种社交平台和通讯软件上供用户交互聊天。同时,像菠萝作词家这样的智能体,是专为特定需求设计的,能够帮助解决相关领域的问题。
2025-02-27
通义千问最新模型
通义千问最新模型情况如下: 发布了一个模型并开源了两个模型。 Qwen2.5Max:全新升级发布,比肩 Claude3.5Sonnet,几乎全面超越 GPT4o、DeepSeekV3 及 Llama3.1405B。是阿里云通义团队对 MoE 模型的最新探索成果,预训练数据超过 20 万亿 tokens。在多项公开主流模型评测基准上录得高分,开发者可在 Qwen Chat(https://chat.qwenlm.ai/)平台免费体验模型,企业和机构也可通过阿里云百炼平台直接调用新模型 API 服务。 Qwen2.5VL:全新视觉模型实现重大突破,增强物体识别与场景理解,支持文本、图表、布局分析,可处理长达 1 小时视频内容,具备设备操作的 Agent 能力。 Qwen2.51M:推出 7B、14B 两个尺寸,在处理长文本任务中稳定超越 GPT4omini,同时开源推理框架,在处理百万级别长文本输入时可实现近 7 倍的提速,首次将开源 Qwen 模型的上下文扩展到 1M 长度。在上下文长度为 100 万 Tokens 的大海捞针任务中,7B 模型出现少量错误。在更复杂的长上下文理解任务中,Qwen2.51M 系列模型在大多数长上下文任务中显著优于之前的 128K 版本,Qwen2.514BInstruct1M 模型不仅击败了 Qwen2.5Turbo,还在多个数据集上稳定超越 GPT4omini。
2025-02-26
在办公场景中,deepseek有哪些最新的应用场景?
在办公场景中,DeepSeek 有以下最新的应用场景: 1. 作为赋能职场的多场景 AI 工具,支持从创意到实现的全流程智能化服务,能快速将创意转化为高质量视频,具备角色一致性技术与分镜自动成片功能,并且支持美学意象风格短片创作。 2. 提供基础模型和深度思考模型两种模式,分别适用于高效便捷任务和复杂推理分析任务。 3. 可用于制作可视化图表、PPT 大纲及设计海报等,通过智能体框架实现人机高效协作。 相关报告发布在,如: 民生证券:《 华创证券:《 此外,清华大学陶炜博士生团队撰写的《》详细介绍了 DeepSeek 的应用场景,包括智能对话、文本生成、语义理解、计算推理等,并通过多个实际场景(如工作、学习、生活和社交)展示了如何利用 DeepSeek 解决问题,还强调了提示语设计的重要性,指出通过精准的提示语可以引导 AI 生成高质量的内容,并提出了提示语设计的策略和技巧。
2025-02-25
RAG最新进展
RAG(检索增强生成)是由 Lewis 等人于 2020 年中期提出的一种大语言模型领域的范式。 其发展经历了以下阶段: 1. 2017 年创始阶段,重点是通过预训练模型吸收额外知识以增强语言模型,主要集中在优化预训练方法。 2. 大型语言模型如 GPT 系列在自然语言处理方面取得显著成功,但在处理特定领域或高度专业化查询时存在局限性,易产生错误信息或“幻觉”,特别是在查询超出训练数据或需要最新信息时。 3. RAG 包括初始的检索步骤,查询外部数据源获取相关信息后再回答问题或生成文本,此过程为后续生成提供信息,确保回答基于检索证据,提高输出准确性和相关性。 4. 在推断阶段动态检索知识库信息能解决生成事实错误内容的问题,被迅速采用,成为完善聊天机器人能力和使大语言模型更适用于实际应用的关键技术。 RAG 在多个基准测试中表现出色,如在 Natural Questions、WebQuestions 和 CuratedTrec 等中表现抢眼。用 MSMARCO 和 Jeopardy 问题进行测试时,生成的答案更符合事实、具体和多样,FEVER 事实验证使用后也有更好结果。基于检索器的方法越来越流行,常与 ChatGPT 等流行大语言模型结合使用提高能力和事实一致性,在 LangChain 文档中有相关使用例子。 同时,对增强生成检索的兴趣增长促使了嵌入模型质量的提高,传统 RAG 解决方案中的问题也得到解决。
2025-02-20
哪里可以学习最新AI
以下是一些学习最新 AI 的途径和建议: 1. 持续学习和跟进:AI 是快速发展的领域,新成果和技术不断涌现。关注 AI 领域的新闻、博客、论坛和社交媒体,保持对最新发展的了解。 2. 加入相关社群和组织:参加研讨会、工作坊和会议,与其他 AI 爱好者和专业人士交流。例如“通往 AGI 之路”这样的中文知识库和社区平台,它汇集了上千个人工智能网站和工具,提供最新的 AI 工具、应用、智能体和行业资讯,还有丰富的学习资源、实践活动,并倡导开放共享的知识体系。 3. 参考学习日记:如《雪梅 May 的 AI 学习日记》,其中提到适合纯 AI 小白的学习模式,即输入→模仿→自发创造。但需注意学习内容可能因 AI 发展而变化,可在相关社区发现自己感兴趣的领域,学习最新内容。 4. 利用免费开源资源:很多学习资源是免费开源的,充分利用这些资源进行学习。
2025-02-18
最新的AI行业动态和进展有哪些,包含2025年
以下是关于最新的 AI 行业动态和进展(包含 2025 年)的内容: 2024 年: 图片超短视频的精细操控:包括表情、细致动作、视频文字匹配。 有一定操控能力的生成式短视频:风格化、动漫风最先成熟,真人稍晚。 AI 音频能力长足进展:带感情的 AI 配音基本成熟。 “全真 AI 颜值网红”出现,可以稳定输出视频,可以直播带货。 游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式。 AI 男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈。 实时生成的内容开始在社交媒体内容、广告中出现。 AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验。 AI 的商业模式开始有明确用例:数据合成、工程平台、模型安全等。 可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功。 中国 AI 达到或超过 GPT4 水平;美国出现 GPT5;世界上开始现“主权 AI”。 华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)。 AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧。 AI 立法、伦理讨论仍然大规模落后于技术进展。 2025 2027 年: AI 3D 技术、物理规则成熟:正常人无法区别 AI 生成还是实景拍摄。 全真 AI 虚拟人成熟:包含感情的 AI NPC 成熟,开放世界游戏成熟;游戏中几乎无法区别真人和 NPC。 AR/VR 技术大规模商用。 接近 AGI 的技术出现。 人与 AI 配合的工作方式成为常态,很多日常决策开始由 AI 来执行。 AI 生产的数据量超过全人类生产数据量,“真实”成为稀缺资源。 具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破。 “人的模型”出现,出现“集中化 AGI”与“个人 AGI”的历史分叉。 AI 引发的社会问题开始加重,结构性失业开始出现。 AGI 对于地缘政治的影响开始显露。 此外,还有以下相关动态: 算力瓶颈不只是单纯的技术和建设问题,而是影响整个行业竞争格局的重要变量。 逐渐进入多模态灵活转换的新时代,实现文本、图像、音频、视频及其他更多模态之间的互相理解和相互转换。 人类劳动形式逐步“软件化”,复杂劳动被抽象为可调用的软件服务,劳动流程被大幅标准化和模块化,劳动能力像“即插即用”的工具一样易于获取。 AI 行业目前仍处于严重亏损的阶段,商业化进程仍有巨大提升空间。 云厂商是产业链中毋庸置疑的“链主”。 2024 年,头部 AI 应用的品类变化并不显著。创意工具(如图像和视频内容创作)依然占据最大比重。To P(面向专业用户)应用展现出强大的市场潜力,ToB(面向企业)应用发展路径相对复杂,ToC 应用面临较大的挑战。 在 AI 应用领域,Copilot 和 AI Agent 是两种主要的技术实现方式。 北美和欧洲贡献了 AI 移动应用市场三分之二的份额,众多中国 AI 公司积极出海。 2024 年 10 月的大事记包括: Gartner 发布 2025 年十大战略技术趋势。 DeepSeek 开源多模态 LLM 框架 Janus。 司南开源大模型能力评估模型 CompassJudger。 Anthropic 发布新功能 computer use,发布 Claude 3.5 Haiku,更新 Claude 3.5 Sonnet。 Stability AI 发布 Stable Diffusion 3.5。 x.AI 正式推出 API。 ComfyUI V1 官方桌面版开放内测。 华为发布纯血操作系统鸿蒙 OS NEXT。 Jina AI 推出高性能分类器 Classifier API。 OpenAI 发布图像生成模型 sCM。 Midjourney 上线外部图片编辑器。 Runway 发布动画视频功能 ActOne。 Ideogram 推出 AI 画板工具 Canvas。 Genmo 开源视频生成模型 Mochi 1。 荣耀发布操作系统 MagicOS 9.0。 美国 14 岁少年与 C.AI 聊天后离世。 新华社发文表示警惕「AI 污染」乱象。 港中文&趣丸推出 TTS 模型 MaskGCT。 科大讯飞发布讯飞星火 4.0 Turbo。 阿里通义代码模式开始内测。 Anthropic Claude 新增数据分析功能。 北京市大中小学推广 AI 学伴和 AI 导学应用。 稚晖君开源「灵犀 X1」全套资料。 OpenAI 高管 Miles Brundage 离职。
2025-02-17
最新的AI行业动态和进展有哪些
以下是最新的 AI 行业动态和进展: 1. 《2024 年度 AI 十大趋势报告》发布,其中提到大模型创新方面,架构优化加速涌现,融合迭代大势所趋;Scaling Law 泛化方面,推理能力成皇冠明珠,倒逼计算和数据变革;AGI 探索方面,视频生成点燃世界模型,空间智能统⼀虚拟和现实;AI 应用格局方面,第⼀轮洗牌结束,聚焦 20 赛道 5 大场景;AI 应用竞争方面,多领域竞速运营大于技术,AI 助手兵家必争;AI 应用增长方面,AI+X 赋能类产品大干快上,原生 AI 爆款难求;AI 产品趋势方面,多模态上马,Agent 席卷⼀切,高度个性化呼之欲出;AI 智变千行百业,左手变革生产力,右手重塑行业生态;AI 行业渗透率方面,数据基础决定初速度,用户需求成为加速度;AI 创投方面,投融资马太效应明显,国家队出手频率提升。 2. 2024 年 9 月的 AI 行业大事记: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 3. 2024 年,国内 AI 行业融资总金额增加,但事件数同比下降,马太效应越发明显,资本更青睐热点和高成熟度赛道。智能驾驶在各细分赛道中独占鳌头,AI+教育、AI+游戏、AI+医疗等赛道投资总额也有增长。政府积极推进 AI 原生行业发展,北京、上海、武汉等城市出台系列政策吸引人才和企业,国家队频繁投资体现政策支持。
2025-02-17
我是一名高校新媒体工作人员,由于文字能力一般,需要能力较强的ai文本工具,用于撰写公文,新闻稿,公众号推文,总结简报等。请推荐至少5个,并进行对比分析
以下为您推荐至少 5 个适用于高校新媒体工作人员的 AI 文本工具,并进行对比分析: Copy.ai: 功能强大,提供丰富的新闻写作模板和功能。 可快速生成新闻标题、摘要、正文等内容,节省写作时间,提高效率。 Writesonic: 专注于写作,提供新闻稿件生成、标题生成、摘要提取等功能。 智能算法能根据用户提供信息生成高质量新闻内容,适合新闻写作和编辑人员。 Jasper AI: 人工智能写作助手,写作质量较高,支持多种语言。 虽主打博客和营销文案,也可用于生成新闻类内容。 Grammarly: 不仅是语法和拼写检查工具,还提供一些排版功能,可改进文档整体风格和流畅性。 QuillBot: AI 驱动的写作和排版工具,能改进文本清晰度和流畅性,同时保持原意。 秘塔写作猫: 是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,还能实时同步翻译。 支持全文改写,一键修改,实时纠错并给出修改建议,智能分析文章属性并打分。 笔灵 AI 写作: 是智能写作助手,能应对多种文体写作,如心得体会、公文写作、演讲稿、小说、论文等。 支持一键改写/续写/扩写,智能锤炼打磨文字。 腾讯 Effidit 写作: 由腾讯 AI Lab 开发,能探索用 AI 技术提升写作者的写作效率和创作体验。 选择工具时,您可根据具体需求(如文档类型、个人偏好等)进行考虑。例如,若主要需求是生成新闻类内容,Copy.ai、Writesonic 和 Jasper AI 可能更适合;若还需兼顾排版和语法检查,Grammarly 和 QuillBot 是不错的选择;若注重中文内容的改写,秘塔写作猫、笔灵 AI 写作和腾讯 Effidit 写作可优先考虑。
2025-02-26
最近的ai新闻
以下是最近的一些 AI 新闻: 2024 年 7 月: 苹果发布了 AI 原生操作系统,加强了硬件和模型布局。 Claude Sonnet 3.5 发布,挑战 OpenAI。 视频生成领域 Runway Gen3 和快手可灵表现优秀。 AI 3D 技术逐渐崭露头角。 Google 和月之暗面推出长上下文缓存技术。 快手发布可灵网页版及大量模型更新。 阶跃星辰发布多款模型。 商汤打造类似 GPT4o 的实时语音演示。 GraphRAG:微软开源新型 RAG 架构。 2024 年 9 月: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM、Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 2024 年 1 月: 斯坦福大学 Mobile Aloha。 1 月 10 号 LumaAl Genie 文生 3D。 1 月 11 号 GPT store 上线。 1 月 MagnificAl 高清放大爆火。 1 月最后一天苹果 Vision Pro 宣布发售。 此外,红杉资本美国合伙人 Pat Grady 在最新访谈中表示,AI 技术将为服务行业带来变革机遇,而非取代软件公司。AI 的潜力在于赋能服务行业,但人际关系和实际执行仍需人工。对于基础模型公司,Grady 认为它们可能像数据库公司一样发展,提供开发者 API,有机会进入应用层。他认为现有模型已足够强大,关键在于工程化优化和认知架构设计。
2025-02-24
2月24日ai新闻
以下是 2 月 24 日的 AI 新闻: 帆哥:2024AI 大事纪 3 月:AI 发展持续升温,潞晨科技发布 OpenSora,Suno 发布 V3 版本爆火。 4 月:英伟达发布硬件股价飙升。 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 7 月:快手开源 LivePortrait 模型,表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 9 月:阿里云发布模型,海螺 AI 参战,AI 新动态不断,Google 发布 GameGen 实时生成游戏,通义千问 2.5 系列全家桶开源,华为发布 cloud matrix 云计算基础设施,GPT 高级语音模式上线,Meta 发布 AI 眼镜 Orion,AI 代码编辑器 cursor 爆火。 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。 2 月 24 日社区动态速览 2 月 23 日,AI 切磋大会在 23 个城市同步举行,预计有近 4000 人参与,主题围绕 DeepSeek,邀请各行业专家分享应用场和见解。 向阳乔木介绍了通过结合 VS Code、Cline 插件和 Deepseek API 等工具提升 AI 应用能力的方法,用户可实现自动发送邮件等功能,Cline 作为 AI 编程工具支持多种大模型,用户可通过火山引擎等平台获取 API,通过 MCP 协议可扩展 LLM 功能。 南瓜博士探讨了如何有效引导儿童和青少年从初级认知阶段过渡到更高级的思维模式。 通往 AGI 之路 21 个 mj 风格,105 个 prompt。 张小珺邀请 MIT 计算机科学与人工智能实验室的在读博士松琳解读 DeepSeek、Kimi、MiniMax 注意力机制新论文。 CB Insights 发布重磅报告指出 2025 年人工智能市场的六大趋势。
2025-02-24
openai最近有什么新闻
以下是 OpenAI 最近的一些新闻: 1. 12 天连续直播相关结果,昨天 OpenAI 把 o1 模型在 API 中正式发布,之前发布的是 o1 Preview 历史版本,正式版思考花费的 token 少了 60%。 2. 北京时间 9 月 13 号凌晨 1 点多,OpenAI 宣布推出模型 o1preview 与 o1mini,拥有 Plus 版本的用户会陆续收到新模型权限,可在 Web 客户端中尝鲜体验。 3. OpenAI 更新风控与账号共享识别力度,可能会偷偷降低 ChatGPT 模型的调用规格,如 o1pro 降级为 o1。 4. 奥特曼谈 AI 推理能力进展,o1(2024 年 9 月)排名全球第 9800 名,o3(2024 年 12 月)提升至第 175 名,现内部模型已达全球第 50 名,预计今年内登顶第一。
2025-02-17
最近有什么ai的大新闻吗
以下是 2024 年 3 月至 10 月 AI 领域的一些大新闻: 3 月:潞晨科技发布 OpenSora,Suno 发布 V3 版本。 4 月:英伟达发布硬件,股价飙升。 5 月:苹果发布 AI 芯片,张吕敏发布 IC light,AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 7 月:快手开源 LivePortrait 模型,实现表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 9 月:阿里云发布模型,海螺 AI 参战;商汤 Vimi 相机开放微博小程序,元象开源中国最大 MoE 大模型 XVERSEMoEA36B,OpenAI 发布 o1 模型,人工智能生成合成内容标识办法(征求意见稿),Jina AI 发布 ReaderLM 和 Jina Embeddings V3,DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,云栖大会,通义万相 AI 生视频上线,快手可灵 1.5 模型新增运动笔刷能力,腾讯元器智能体对外发布,秘塔科技产品经理 JD 走红 AI 圈,阶跃跃问接入 Step2 万亿参数 MoE 语言大模型,大模型测试基准研究组正式成立,钉钉 365 会员上线,讯飞星火 API 全新升级,豆包大模型全系列发布&更新,Vidu API 正式开放,加速企业级视频创作,OpenAI 发布高级语音功能。 10 月:Pika 发布 1.5 模型,诺奖颁发给 AI 奠基人,特斯拉发布机器人,Adobe 发布 Illustrator+Al 生成矢量图,智谱 AI 发布 autoGLM,腾讯混元开源 3D 模型。
2025-02-15
最近有什么ai大新闻
以下是 2024 年 AI 领域的一些大新闻: 9 月: 9 月 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 9 月 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 9 月 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 9 月 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 9 月 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 9 月 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 9 月 21 日:大模型测试基准研究组正式成立。 9 月 23 日:钉钉 365 会员上线。 9 月 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 9 月 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 其他月份: 1 月:斯坦福大学 Mobile Aloha;1 月 10 号 LumaAl Genie 文生 3D;1 月 11 号 GPT store 上线;1 月 MagnificAl 高清放大爆火;1 月最后一天苹果 Vision Pro 宣布发售。 3 月:潞晨科技发布 OpenSora;Suno 发布 V3 版本爆火。 4 月:英伟达发布硬件股价飙升。 5 月:苹果发布 AI 芯片;张吕敏发布 IC light;AI 竞争白热化;伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金。 7 月:快手开源 LivePortrait 模型,表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 10 月:Pika 发布 1.5 模型;诺奖颁发给 AI 奠基人;特斯拉发布机器人;Adobe 发布 Illustrator+Al 生成矢量图;智谱 AI 发布 autoGLM;腾讯混元开源 3D 模型。
2025-02-14