Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

2024ai 大事记

Answer

以下是 2024 年 AI 大事纪的相关内容: 1 月:

  • 斯坦福大学 Mobile Aloha。
  • 1 月 10 号 LumaAl Genie 文生 3D。
  • 1 月 11 号 GPT store 上线。
  • MagnificAl 高清放大爆火。
  • 1 月最后一天苹果 Vision Pro 宣布发售。 3 月:
  • 潞晨科技发布 OpenSora。
  • Suno 发布 V3 版本爆火。 4 月:英伟达发布硬件股价飙升。 5 月:
  • 苹果发布 AI 芯片。
  • 张吕敏发布 IC light。 7 月:快手开源 LivePortrait 模型,表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 9 月:
  • 阿里云发布模型,海螺 AI 参战。
  • Google 发布 GameGen 实时生成游戏。
  • 通义千问 2.5 系列全家桶开源。
  • 华为发布 cloud matrix 云计算基础设施。
  • GPT 高级语音模式上线。
  • Meta 发布 AI 眼镜 Orion。
  • AI 代码编辑器 cursor 爆火。 10 月:
  • Pika 发布 1.5 模型。
  • 诺奖颁发给 AI 奠基人。
  • 特斯拉发布机器人。
  • Adobe 发布 Illustrator+Al 生成矢量图。
  • 智谱 AI 发布 autoGLM。
  • 腾讯混元开源 3D 模型。
  • 云深处发布机器人山猫机器狗。
  • Apple 发布 Mac mini。 12 月:
  • 李飞飞发布空间智能成果。
  • 腾讯开源混元视频模型。
  • Open AI 开 12 天发布会。
  • 微软发布 Trellis 最强开源图生 3D。
  • Gemini2.0 视觉交互智能体。
  • 智元机器人开始量产。
  • 谷歌发布 Veo-2 能生成 4K 视频。

需要注意的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。

Content generated by AI large model, please carefully verify (powered by aily)

References

帆哥:2024AI大事纪

欢迎大家在评论区继续补充一些没有提到的信息,经过帆哥授权收录到了公众号:https://mp.weixin.qq.com/s/jkVCcY-YVGb5uFPuei6iOA本文档由沙粒科技@AI研究室-帆哥整理https://space.bilibili.com/2161614转载或商业用途需注明来源2024你最印象深刻的科技新闻是什么?SORA?具身机器人?还是各种AI视频轮番PK?我们总结了2024年发生的大多数AI大事,希望能够带你一起回顾这个大事频发的一年。想获得视频中的图表三联请在上面b站后台私信发送“AI”即可获得2024感谢大家!2025咱们再向星辰大海继续出发!开源时间轴大事件时间轴免责声明:本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热、度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。AI视频总结:视频回顾了2024年AI领域的重大事件,包括众多模型发布、开源竞争、科技公司动态、诺贝尔奖颁发等,总结了这一年是应用之年,未出现新算法,列出了时间轴方便总结回顾[00:00]1月AI大事件频发[00:03]回顾2024年AI大事件,1月大事件频发[01:04]1月斯坦福大学Mobile Aloha[01:11]1月10号LumaAl Genie文生3D[01:16]1月11号GPT store上线[01:26]1月MagnificAl高清放大爆火[01:37]1月最后一天苹果Vision Pro宣布发售

帆哥:2024AI大事纪

[09:53]10月,美国大选川普获胜[09:58]10月,云深处发布机器人山猫机器狗[10:05]10月,Apple发布Mac mini[10:14]12月,李飞飞发布空间智能成果[10:18]12月,腾讯开源混元视频模型[10:24]12月,Open AI开12天发布会[10:38]12月,微软发布Trellis最强开源图生3D[10:45]12月,Gemini2.0视觉交互智能体[10:46]12月,智元机器人开始量产[10:50]12月,谷歌发布Veo-2能生成4K视频[10:54]12月AI成果与展望[10:54]视频回顾2024年AI大事,12月成果多,未来展望引思考[11:07]12月宇树科技机器狗爆火,似奔着打架去[11:18]12月SORA兑现引关注,被测试出奇怪问题[12:10]2024年是AI应用之年,未现新算法[12:40]明年大概率拼算力和数据,无新算法

帆哥:2024AI大事纪

[02:44]3月AI发展持续升温[02:44]3月潞晨科技发布OpenSora[03:13]3月Suno发布V3版本爆火[03:49]4月英伟达发布硬件股价飙升[04:43]5月苹果发布AI芯片[04:53]5月张吕敏发布IC light[05:27]5月AI竞争白热化[05:28]5月伊莉雅离开OpenAI,AI竞争白热化[05:58]伊利亚成立新公司,估值超五亿美金[06:34]7月快手开源LivePortrait模型,表情迁移[07:10]8月StabilityAI老板成立新公司发布flux大模型[07:34]9月阿里云发布模型,海螺AI参战[08:12]9月AI新动态不断[08:14]9月,Google发布GameGen实时生成游戏[08:25]9月,通义千问2.5系列全家桶开源[08:30]9月,华为发布cloud matrix云计算基础设施[08:33]9月,GPT高级语音模式上线[08:39]9月,Meta发布AI眼镜Orion[08:49]9月,AI代码编辑器cursor爆火[09:02]10月,Pika发布1.5模型[09:08]10月,诺奖颁发给AI奠基人[09:17]10月,特斯拉发布机器人[09:23]10月,Adobe发布Illustrator+Al生成矢量图[09:32]10月,智谱AI发布autoGLM[09:49]10月,腾讯混元开源3D模型

Others are asking
明略科技:2024年中国AI Agent行业研究
以下是关于 2024 年中国 AI Agent 行业的相关研究报告: 2024 年 9 月: 《》 《》 2024 年 8 月: 《》深入分析了 AI Agent 的市场定义、发展阶段、核心组件及其在企业用户场景中的应用。 《》指出企业实施 AI Agent 的主要目标是降低运营成本,尤其是在知识库管理、数据分析、营销与客户服务等领域。 2024 年 5 月: 《》提到 AI Agent 市场处于早期阶段,其商业价值在于提升工作均值、实现行业知识库构建、改变工作流程及生产关系。未来,AI Agent 将作为数字生产力,通过与工作流的结合,成为企业知识资产积累与复用的关键角色,推动技术革命。
2025-02-10
告诉我最新的国际ai资讯(比如从2024年有什么ai被发明了,国际上一共有什么大的ai公司,中国的ai发展的怎么样了(deepseek怎么样))
以下是为您整理的最新国际 AI 资讯: 2024 年 2 月 5 日:百度智能云成功点亮昆仑芯三代万卡集群,这是国内首个正式点亮的自研万卡集群。 在 Lex Fridman 的播客中,Dylan Patel 和 Nathan Lambert 深入探讨了中国的 DeepSeek AI 模型,特别是 DeepSeekV3 和 DeepSeekR1。Nathan 强调 DeepSeek 是最开放的模型之一,采用 MIT 许可,鼓励商业用途,推动行业走向开源。 2025 年 AI 语音助手研究显示,语音技术是 AI 应用的关键,企业和用户都将受益。2024 年将是语音助手快速发展的时期,技术不断升级,市场竞争加剧,涌现出多种创业公司。未来,AI 语音将成为服务的“万能钥匙”,应用场景广泛,从医疗到教育,推动行业变革与创新。 2024 年 1 月 17 日:随着预训练技术遭遇瓶颈,GPT5 迟迟未能问世,从业者开始从不同角度寻找突破。以 o1 为标志,大模型正式迈入“PostTraining”时代;开源发展迅猛,Llama 3.1 首次击败闭源模型;中国本土大模型 DeepSeek V3,在 GPT4o 发布仅 7 个月后,用 1/10 算力实现了几乎同等水平。同时,大模型的日渐成熟也让产业重心从基础模型转向应用落地。AI 在编程领域爆发,“数字员工”崛起。 李飞飞在访谈中探讨了 AI Agent 的发展及其未来。她强调 AI Agent 应作为工具和赋能者,而非主导者,确保人们的自主性。李飞飞回顾了 ImageNet 的创立背景,并提到正在推动的“空间智能”概念,旨在理解和融合物理与数字三维世界。她认为,未来这两者的界限将逐渐模糊,从而带来更大变革。
2025-02-08
2024 AI工具排行榜
以下是 2024 年部分 AI 工具的相关信息: 开发者工具: 23 年 12 月至 24 年 3 月的访问量排行榜中,非大厂的 Top1 公司是 Langchain,其 3 月 PV 为 356 万,单 PV 价值为 56.18 美元。 赛道方面,天花板潜力 TAM 为 120 亿美元,总体趋势平稳增长,月平均增速为 82 万 PV/月,原生产品占比高。 竞争方面,Top1 占 19%,Top3 占 54%,马太效应弱,网络效应强,大厂已入局,技术门槛中。 教育工具: 23 年 12 月至 24 年 3 月的访问量排行榜中,非大厂的 Top1 公司是 Quizlet,其 3 月 PV 为 1.3 亿。 赛道方面,天花板潜力 TAM 约为 30 亿,总体趋势快速增长,月平均增速为 1793 万 PV/月,原生产品占比低。 竞争方面,Top1 占 45%,Top3 占 76%,马太效应弱,网络效应弱,大厂未入局,技术门槛中。 此外,在展望 2025 时,AI 行业的创新机会方面,2024 年 9 月 OpenAI 发布了新一代语言模型 o1,业界推测其采用了全新的训练与推理方案,结合强化学习技术,显著增强了推理能力,可能借鉴了下围棋的 AlphaGo Zero 的技术思路。
2025-01-26
2024年视频换脸技术
2024 年视频换脸技术面临一些挑战和发展趋势: 挑战方面: 可控性和一致性存在挑战,如人脸转动中保持观感不变形、多个生成片段保持人物一致性、遵循生成指令等,目前视频生成的体感仍需改进,需要底层模型的进步。 成本较高,生成一段 5 秒视频的成本最低约为 1 元人民币,限制了 C 端玩法和大规模应用。 发展趋势: 原生多模态成为 AI 架构的主流选择,从 OpenAI 的 GPT4V 到 Anthropic 的 Claude3V 和 xAI 的 Grok1.5V 等,行业正从简单的模态叠加向真正的多模态融合迈进。原生多模态模型采用统一的编码器解码器架构,在预训练阶段完成多模态信息的深度融合,提升了模型的理解能力,实现了模态间的无缝转换和互补增强,能够处理更复杂的任务。 自 2023 年末开始,Runway、Pika、Meta、Google 等不断推出视频生成/编辑工具,2024 年是 AI 视频技术逐渐成熟并开始商用的一年,下半年或 2025 年可能会看到 AI3D 技术的突破。抖音的成功证明音频、视频加入泛社交/娱乐产品会带来质的飞跃,AI 陪聊赛道中视频、音频技术的加入也将带来内容生产和社交方式的质变。
2025-01-24
2024大模型典型应用案例集
以下是 2024 大模型的一些典型应用案例及相关信息: 《2024 大模型典型示范应用案例集》汇集了 97 个优秀案例,展示了大模型技术在教育、医疗、金融、政务等多个行业和领域的应用。案例由阿里云、百度、华为等领先企业实施,上海成为应用落地的热点地区,大中型企业是主要试验场。AI 智能体和知识库成为提升大模型落地实效的关键手段。 在智能终端行业,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 整体来看,在主流大模型厂商中,百度表现突出,拿下最关键的中标项目数量、中标金额两项第一。截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%,其增长主要由互联网、教育、金融等行业对模型训练和推理的高需求带动。 企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。 相关报告: 《信达证券:AI 行业设计领域专题报告:Adobe AI 功能覆盖全面,Canva、美图等力争上游》 《中国信通院:大模型基准测试体系研究报告(2024 年)》 《埃森哲:人工智能行业:2024 在生成式人工智能时代重塑工作、劳动力和员工》 此外,还有一些相关活动,如: 2024 年是国内大模型技术加速落地的关键年份,各大厂商如百度、阿里、字节等在 AI 大模型领域展开激烈竞争。百度凭借 40 个中标项目和 2.74 亿元中标金额在行业中处于领先地位。尤其在金融、智能终端等行业,百度文心大模型的应用广泛,表现亮眼。 🏮「非遗贺春」魔多蛇年春节 AI 模型创作大赛,大赛时间 2024 年 12 月 24 日2025 年 1 月 15 日。大赛奖池【¥12000】现金奖励+官方高含金量荣誉证书+会员与算力激励+流量激励。双赛道同时开启,赛道一【春节】+赛道二【爱非遗 AI 传承】。本次活动由浙江省非遗保护中心(浙江省非遗馆)指导×浙江省非遗保护基金会主办×魔多 AI 联合承办,由提供社区传播支持。
2025-01-16
2024年人工智能指数报告 下载
以下是为您提供的 2024 年人工智能指数报告的相关下载信息: 1. 《》由微软和领英联合发布,揭示了人工智能(AI)在工作场所的快速增长和深远影响。 2. 可在知识星球下载的报告: 《》深入分析了 AI Agent 的市场定义、发展阶段、核心组件及其在企业用户场景中的应用。 《》企业实施 AI Agent 的主要目标是降低运营成本,尤其是在知识库管理、数据分析、营销与客户服务等领域。 3. 《》数据处理应从模型为中心转向数据为中心,并强调向量数据库在提升模型服务能力中的核心作用。 4. 斯坦福大学发布的基础模型透明度指数相关报告:在上一届 SOAI 发布后不久,斯坦福大学发布了其首个基础模型透明度指数,模型开发者的平均得分为 37 分。在团队的中期更新中,这一分数攀升至 58 分。2024 年 5 月,该指数的最新一期基于 100 项指标,评估了 14 家领先的基础模型开发者的透明度,这些指标涵盖“上游”因素数据、劳动力、计算、围绕能力和风险的“模型级”因素、围绕分布的“下游”标准以及社会影响。计算和使用政策的评分出现了最强劲的改善,而“上游”评分仍然疲弱。 5. 《2024 年人工智能现状:辉煌、戏谑和“牛市”》报告链接:
2025-01-11
我想学 AI入门
以下是新手学习 AI 的建议: 1. 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,您将找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛(比如图像、音乐、视频等),您可以根据自己的兴趣选择特定的模块进行深入学习。 一定要掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎您实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 此外,入门强化学习时,可参考以下学习计划:像这个链接里面:https://github.com/ty4z2008/Qix/blob/master/dl.md 就有很多资料。在学习之前先明确自己的目的,比如以搞懂 DQN 算法作为入门目标。
2025-02-17
目前针对H5,有哪些可以和ai结合的案例
目前在 H5 领域,与 AI 结合的案例相对较少。但一些可能的方向包括:利用 AI 进行个性化内容推荐,根据用户的浏览历史和偏好为其推送相关的 H5 页面内容;通过 AI 实现智能客服,在 H5 页面中为用户提供实时的问题解答和帮助;运用 AI 图像识别技术,让用户可以通过拍照或上传图片在 H5 页面中获取相关信息或进行互动。
2025-02-17
deepseek的产生对AI行业的影响
DeepSeek 的产生对 AI 行业具有多方面的影响: 1. 华尔街分析师的反应: DeepSeek 展示出媲美领先 AI 产品性能的模型,但成本仅为其一小部分,在全球主要市场的 App Store 登顶。 Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑。 高盛预测其可能改变科技巨头与初创公司的竞争格局,降低 AI 行业进入门槛。 2. 实际使用体验: 在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。 数学能力经过优化,表现不错;编程能力略逊于 GPT,据用户反馈。 GRPO 算法替代传统 PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。 3. 训练成本方面: 训练成本远高于传闻的 600 万美元,总计约 13 亿美元。 定价低于实际成本,导致高额亏损。 MixtureofExpert 方法降低计算需求,但大规模内存使用可能反而增加总成本。 4. 竞争格局影响: 以低成本开发顶级 AI 模型的 Mistral AI 被中国 DeepSeek 迅速赶超。 DeepSeek 的“极简算力”模式可能削弱 Mistral 的竞争优势。
2025-02-17
如何用ai进行小红书排版和内容
以下是关于如何用 AI 进行小红书排版和内容的相关信息: 画小二:Coze 工作流之抖音热门视频转小红书图文详细配置,包括整体结构图、各模块参数配置(如开始模块、Get_Video 模块、LinkReaderPlugin 模块、标题大模型、内容大模型、图片 Prompt 大模型、文生图 ImageToolPro 模块、输出结果参数配置)。在标题和内容创作方面,有具体的技能和要求,如采用二极管标题法创作吸引人的标题,生成口语化、含表情符号、200 字左右的正文,并抽取 seo 关键词生成标签等。 利用 AI 节约 10 倍内容创作时间:介绍了“小红书文案专家”,其功能价值包括生成小红书文案初稿、辅助创作、节约时间等。设计思路包括解决时间有限和配图麻烦的痛点,通过工作流让 AI 按照运营思路工作,一期产品功能有提取链接内容、整理成小红书风格、加入 emoji 表情包、配图片等,二期计划功能有增加全网搜索热点等。 AI 摊主速成脑暴会:涉及 AI 娱乐与算命、技术与工具教学、个性化小工具、体验型项目等分类,每个分类下有具体的内容和示例项目,如 AI 算命、Prompt 技巧传授、小红书爆款文案、桌宠体验等。
2025-02-17
如何用AI制作故事板
以下是使用 AI 制作故事板的一些方法和步骤: 1. 确定主题和风格:比如丝绸之路的古风主题,并选择合适的模型和指令,如 Fanbook 中的 niji6 模型及sref 指令,确定视频尺寸为 16:9。 2. 设定故事主线和镜头:在有故事剧本及相关资料的基础上,按照场景、地点、镜号、画面描述、台词、音效等维度进行分镜头的填充。 3. 精简人物对话:尽可能精简人物的对话,提炼重点,根据台词长短合理安排画面数量。 4. 借助语言大模型获取灵感:当对某一句台词没有足够的画面灵感时,可以借助语言大模型,如 Kimi,让其帮助写好画面描述甚至加上对音效的需求。 5. 利用相关工具和应用程序: Project Odyssey 第二季中的 Playhouse 可使用人工智能为 2D 或 3D 角色制作动画,控制 3D 场景中的每个元素。 Playbook 是基于扩散的 3D 场景引擎,利用 ComfyUI 进行图像和视频生成。 Tripo AI 能在 8 秒内生成带纹理的 3D 网格模型,还开发了自动绑定、动画和风格化功能。 SAGA 是一款优秀的剧本创作和故事板应用程序,由强大的生成式人工智能模型支持。 6. 结合多种 AI 工具:在拍摄纪录片《未来的超级个体》时,结合使用 GPT4 完成内容策划和脚本撰写,使用 Dalle3 和 Midjourney 完成故事板的画面生成,使用 Perplexity AI 进行信息搜索和分析。
2025-02-17
AI数字人
AI 数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货。其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 2. 算法驱动的数字人:强调自驱动,人为干预更少,技术实现更复杂。其大致流程包含三个核心算法: ASR(语音识别):能将用户音频数据转化为文字,便于数字人理解和生成回应,以实现像人与人一样的对话交互。 AI Agent(人工智能体):充当数字人的大脑,可接入大语言模型,拥有记忆模块等使其更真实。 TTS(文字转语音):将数字人依靠 LLM 生成的文字输出转换为语音,保持语音交互一致性。 此外,还有一些与 AI 数字人相关的摊位活动,如为企业和个人提供数字劳动力,解决重复性、创意性工作难题的“AI 数字员工”体验 demo,包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等;以及“AIGC 数字艺术挂画”“数字生命赋予每个人的新生”“AI 智能体应用”“Ai 心理疏导”“AIGC(图生图)趣味定制;AI 数字人定制”等。
2025-02-17
2024AI 大事记
以下是 2024 年 AI 大事纪: 1 月: 斯坦福大学 Mobile Aloha 1 月 10 号 LumaAl Genie 文生 3D 1 月 11 号 GPT store 上线 MagnificAl 高清放大爆火 1 月最后一天苹果 Vision Pro 宣布发售 3 月: 潞晨科技发布 OpenSora Suno 发布 V3 版本爆火 4 月:英伟达发布硬件股价飙升 5 月: 苹果发布 AI 芯片 张吕敏发布 IC light AI 竞争白热化 伊莉雅离开 OpenAI,伊利亚成立新公司,估值超五亿美金 7 月:快手开源 LivePortrait 模型,表情迁移 8 月:StabilityAI 老板成立新公司发布 flux 大模型 9 月: 阿里云发布模型,海螺 AI 参战 Google 发布 GameGen 实时生成游戏 通义千问 2.5 系列全家桶开源 华为发布 cloud matrix 云计算基础设施 GPT 高级语音模式上线 Meta 发布 AI 眼镜 Orion AI 代码编辑器 cursor 爆火 10 月: Pika 发布 1.5 模型 诺奖颁发给 AI 奠基人 特斯拉发布机器人 Adobe 发布 Illustrator+Al 生成矢量图 智谱 AI 发布 autoGLM 腾讯混元开源 3D 模型 云深处发布机器人山猫机器狗 Apple 发布 Mac mini 12 月: 李飞飞发布空间智能成果 腾讯开源混元视频模型 Open AI 开 12 天发布会 微软发布 Trellis 最强开源图生 3D Gemini2.0 视觉交互智能体 智元机器人开始量产 谷歌发布 Veo2 能生成 4K 视频 宇树科技机器狗爆火,似奔着打架去 SORA 兑现引关注,被测试出奇怪问题 需要说明的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-10