Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

2024ai 大事记

Answer

以下是 2024 年 AI 大事纪的相关内容: 1 月:

  • 斯坦福大学 Mobile Aloha。
  • 1 月 10 号 LumaAl Genie 文生 3D。
  • 1 月 11 号 GPT store 上线。
  • MagnificAl 高清放大爆火。
  • 1 月最后一天苹果 Vision Pro 宣布发售。 3 月:
  • 潞晨科技发布 OpenSora。
  • Suno 发布 V3 版本爆火。 4 月:英伟达发布硬件股价飙升。 5 月:
  • 苹果发布 AI 芯片。
  • 张吕敏发布 IC light。 7 月:快手开源 LivePortrait 模型,表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 9 月:
  • 阿里云发布模型,海螺 AI 参战。
  • Google 发布 GameGen 实时生成游戏。
  • 通义千问 2.5 系列全家桶开源。
  • 华为发布 cloud matrix 云计算基础设施。
  • GPT 高级语音模式上线。
  • Meta 发布 AI 眼镜 Orion。
  • AI 代码编辑器 cursor 爆火。 10 月:
  • Pika 发布 1.5 模型。
  • 诺奖颁发给 AI 奠基人。
  • 特斯拉发布机器人。
  • Adobe 发布 Illustrator+Al 生成矢量图。
  • 智谱 AI 发布 autoGLM。
  • 腾讯混元开源 3D 模型。
  • 云深处发布机器人山猫机器狗。
  • Apple 发布 Mac mini。 12 月:
  • 李飞飞发布空间智能成果。
  • 腾讯开源混元视频模型。
  • Open AI 开 12 天发布会。
  • 微软发布 Trellis 最强开源图生 3D。
  • Gemini2.0 视觉交互智能体。
  • 智元机器人开始量产。
  • 谷歌发布 Veo-2 能生成 4K 视频。

需要注意的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。

Content generated by AI large model, please carefully verify (powered by aily)

References

帆哥:2024AI大事纪

欢迎大家在评论区继续补充一些没有提到的信息,经过帆哥授权收录到了公众号:https://mp.weixin.qq.com/s/jkVCcY-YVGb5uFPuei6iOA本文档由沙粒科技@AI研究室-帆哥整理https://space.bilibili.com/2161614转载或商业用途需注明来源2024你最印象深刻的科技新闻是什么?SORA?具身机器人?还是各种AI视频轮番PK?我们总结了2024年发生的大多数AI大事,希望能够带你一起回顾这个大事频发的一年。想获得视频中的图表三联请在上面b站后台私信发送“AI”即可获得2024感谢大家!2025咱们再向星辰大海继续出发!开源时间轴大事件时间轴免责声明:本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热、度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。AI视频总结:视频回顾了2024年AI领域的重大事件,包括众多模型发布、开源竞争、科技公司动态、诺贝尔奖颁发等,总结了这一年是应用之年,未出现新算法,列出了时间轴方便总结回顾[00:00]1月AI大事件频发[00:03]回顾2024年AI大事件,1月大事件频发[01:04]1月斯坦福大学Mobile Aloha[01:11]1月10号LumaAl Genie文生3D[01:16]1月11号GPT store上线[01:26]1月MagnificAl高清放大爆火[01:37]1月最后一天苹果Vision Pro宣布发售

帆哥:2024AI大事纪

[09:53]10月,美国大选川普获胜[09:58]10月,云深处发布机器人山猫机器狗[10:05]10月,Apple发布Mac mini[10:14]12月,李飞飞发布空间智能成果[10:18]12月,腾讯开源混元视频模型[10:24]12月,Open AI开12天发布会[10:38]12月,微软发布Trellis最强开源图生3D[10:45]12月,Gemini2.0视觉交互智能体[10:46]12月,智元机器人开始量产[10:50]12月,谷歌发布Veo-2能生成4K视频[10:54]12月AI成果与展望[10:54]视频回顾2024年AI大事,12月成果多,未来展望引思考[11:07]12月宇树科技机器狗爆火,似奔着打架去[11:18]12月SORA兑现引关注,被测试出奇怪问题[12:10]2024年是AI应用之年,未现新算法[12:40]明年大概率拼算力和数据,无新算法

帆哥:2024AI大事纪

[02:44]3月AI发展持续升温[02:44]3月潞晨科技发布OpenSora[03:13]3月Suno发布V3版本爆火[03:49]4月英伟达发布硬件股价飙升[04:43]5月苹果发布AI芯片[04:53]5月张吕敏发布IC light[05:27]5月AI竞争白热化[05:28]5月伊莉雅离开OpenAI,AI竞争白热化[05:58]伊利亚成立新公司,估值超五亿美金[06:34]7月快手开源LivePortrait模型,表情迁移[07:10]8月StabilityAI老板成立新公司发布flux大模型[07:34]9月阿里云发布模型,海螺AI参战[08:12]9月AI新动态不断[08:14]9月,Google发布GameGen实时生成游戏[08:25]9月,通义千问2.5系列全家桶开源[08:30]9月,华为发布cloud matrix云计算基础设施[08:33]9月,GPT高级语音模式上线[08:39]9月,Meta发布AI眼镜Orion[08:49]9月,AI代码编辑器cursor爆火[09:02]10月,Pika发布1.5模型[09:08]10月,诺奖颁发给AI奠基人[09:17]10月,特斯拉发布机器人[09:23]10月,Adobe发布Illustrator+Al生成矢量图[09:32]10月,智谱AI发布autoGLM[09:49]10月,腾讯混元开源3D模型

Others are asking
2024AI 大事记
以下是 2024 年 AI 大事纪: 1 月: 斯坦福大学 Mobile Aloha 1 月 10 号 LumaAl Genie 文生 3D 1 月 11 号 GPT store 上线 MagnificAl 高清放大爆火 1 月最后一天苹果 Vision Pro 宣布发售 3 月: 潞晨科技发布 OpenSora Suno 发布 V3 版本爆火 4 月:英伟达发布硬件股价飙升 5 月: 苹果发布 AI 芯片 张吕敏发布 IC light AI 竞争白热化 伊莉雅离开 OpenAI,伊利亚成立新公司,估值超五亿美金 7 月:快手开源 LivePortrait 模型,表情迁移 8 月:StabilityAI 老板成立新公司发布 flux 大模型 9 月: 阿里云发布模型,海螺 AI 参战 Google 发布 GameGen 实时生成游戏 通义千问 2.5 系列全家桶开源 华为发布 cloud matrix 云计算基础设施 GPT 高级语音模式上线 Meta 发布 AI 眼镜 Orion AI 代码编辑器 cursor 爆火 10 月: Pika 发布 1.5 模型 诺奖颁发给 AI 奠基人 特斯拉发布机器人 Adobe 发布 Illustrator+Al 生成矢量图 智谱 AI 发布 autoGLM 腾讯混元开源 3D 模型 云深处发布机器人山猫机器狗 Apple 发布 Mac mini 12 月: 李飞飞发布空间智能成果 腾讯开源混元视频模型 Open AI 开 12 天发布会 微软发布 Trellis 最强开源图生 3D Gemini2.0 视觉交互智能体 智元机器人开始量产 谷歌发布 Veo2 能生成 4K 视频 宇树科技机器狗爆火,似奔着打架去 SORA 兑现引关注,被测试出奇怪问题 需要说明的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-10
2024ai大事件
以下是 2024 年 AI 领域的大事纪: 1 月: 斯坦福大学 Mobile Aloha 1 月 10 号 LumaAl Genie 文生 3D 1 月 11 号 GPT store 上线 MagnificAl 高清放大爆火 1 月最后一天苹果 Vision Pro 宣布发售 3 月: 潞晨科技发布 OpenSora Suno 发布 V3 版本爆火 4 月:英伟达发布硬件股价飙升 5 月: 苹果发布 AI 芯片 张吕敏发布 IC light AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金 7 月:快手开源 LivePortrait 模型,表情迁移 8 月:StabilityAI 老板成立新公司发布 flux 大模型 9 月: 阿里云发布模型,海螺 AI 参战 Google 发布 GameGen 实时生成游戏 通义千问 2.5 系列全家桶开源 华为发布 cloud matrix 云计算基础设施 GPT 高级语音模式上线 Meta 发布 AI 眼镜 Orion AI 代码编辑器 cursor 爆火 10 月: Pika 发布 1.5 模型 诺奖颁发给 AI 奠基人 特斯拉发布机器人 Adobe 发布 Illustrator+Al 生成矢量图 智谱 AI 发布 autoGLM 腾讯混元开源 3D 模型 云深处发布机器人山猫机器狗 Apple 发布 Mac mini 12 月: 李飞飞发布空间智能成果 腾讯开源混元视频模型 Open AI 开 12 天发布会 微软发布 Trellis 最强开源图生 3D Gemini2.0 视觉交互智能体 智元机器人开始量产 谷歌发布 Veo2 能生成 4K 视频 需要注意的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-09
2024年《全球人工智能治理研究报告》议题“国家主权原则和人工智能发展”的内容及理解
以下是 2024 年《全球人工智能治理研究报告》中关于“国家主权原则和人工智能发展”的相关内容: 在 2024 年人工智能发展状况的安全与全球治理方面: 英国创建了世界上第一个人工智能安全研究所(AISA),其有三个核心功能:在部署前对高级模型进行评估;建立国家能力并开展研究;协调国际合作伙伴。AISA 还发布了 Inspect 框架用于 LLM 安全评估。英国宣布与美国等效机构签署谅解备忘录,并计划在美国旧金山设立办事处。 英国通过其高级研究与发明机构(ARIA),花费 5900 万英镑开发“守门员”系统,负责了解和减少关键领域中其他人工智能代理的风险。英国政府还计划设立“AI 安全研究实验室”,旨在汇集政府关于敌对国家使用进攻性 AI 的知识。美国能源部利用内部测试床评估人工智能对关键基础设施和能源安全的风险。 在技术和方法方面: 离线直接比对方法不会很快大规模取代 RLHF。谷歌 DeepMind 团队发现 RLHF 在涵盖总结、有用性、对话性等数据集上的测试中胜出,能更有效地改善生成任务。Cohere for AI 探索放弃近端策略优化 RLHF 中的算法,有利于其 RLOO 训练器,可降低 GPU 使用率和提高训练速度。 但 RLHF 存在可能滋生谄媚行为的问题,如 Anthropic 认为 SOTA AI 助手表现出奉承行为是因为人类偏好数据等。开发透明度虽在提高,但仍有很大改进空间。 在安全研究方面: 随着 AI 发展,新功能带来新漏洞,开发人员加大了对“越狱”的研究。OpenAI 提出通过“指令层次结构”修复攻击,Anthropic 表明“警告防御”的潜力,Gray Swan AI 的安全专家试用“断路器”。LLM 测试初创公司 Haize Labs 与 Hugging Face 合作创建首个红队抵抗组织基准。除越狱外,还存在更隐蔽的攻击,潜在攻击面广泛,涵盖从训练到偏好数据和微调等内容。 对于“国家主权原则和人工智能发展”的理解,可能需要综合考虑各国在人工智能安全研究和治理方面的举措,以及技术发展对国家主权可能产生的影响。各国积极建立相关机构和采取措施,表明在人工智能快速发展的背景下,维护国家主权和安全的重要性。同时,技术发展中的问题和挑战也需要各国共同协作应对,以实现人工智能的健康、安全和可持续发展。
2024-12-31
2024年度中文大模型基准测评报告
以下是关于 2024 年度中文大模型基准测评报告的相关信息: 2024 年 7 月 10 日: 《SuperCLUE:中文大模型基准测评 2024 年上半年报告》指出,2024 年上半年中文大模型技术取得显著进展,国内外模型差距缩小至 5%以内。国内开源模型如 Qwen272B 表现优异,超越众多闭源模型。端侧小模型发展迅速,落地可行性大幅提升。该报告通过多维度、多层次测评体系,全面评估了大模型的通用能力和专项能力,为行业发展提供了客观数据支持。同时也指出,尽管大模型在多领域展现潜力,但仍面临技术挑战和应用落地问题。 2024 年 11 月 8 日: SuperCLUE 团队发布的新一期《SuperCLUE:中文大模型基准测评 2024 年 10 月报告》中有四点核心发现:1)OpenAI 发布 o1 后,全球大模型竞争加剧;2)国内大模型第一梯队竞争激烈,持续迭代表现不俗;3)国内外大模型在不同任务上表现各有优势;4)端侧小模型表现惊艳。 此外,Sora:大型视觉模型的背景、技术、局限性和机遇综述【官方论文】的参考文献包括: T.Shen,R.Jin,Y.Huang,C.Liu,W.Dong,Z.Guo,X.Wu,Y.Liu,和 D.Xiong,“大型语言模型对齐:一项调查”,arXiv 预印本 arXiv:2309.15025,2023 年。 X.Liu,X.Lei,S.Wang,Y.Huang,Z.Feng,B.Wen,J.Cheng,P.Ke,Y.Xu,W.L.Tam,X.Zhang,L.Sun,H.Wang,J.Zhang,M.Huang,Y.Dong,和 J.Tang,“Alignbench:大型语言模型中文对齐的基准测试”,2023 年。 P.Christiano,J.Leike,T.B.Brown,M.Martic,S.Legg,和 D.Amodei,“基于人类偏好的深度强化学习”,2023 年。 T.Yu,Y.Yao,H.Zhang,T.He,Y.Han,G.Cui,J.Hu,Z.Liu,H.T.Zheng,M.Sun,和 T.S.Chua,“RLHFV:通过细粒度校正人类反馈实现可信赖的 MLLMs 行为对齐”,2023 年。 M.S.Jahan 和 M.Oussalah,“使用自然语言处理进行仇恨言论自动检测的系统综述。”,《神经计算》,第 126232 页,2023 年。 OpenAI,“Sora 安全。”https://openai.com/sorasafety,2024 年。
2024-12-27
2024年热门AI模型
以下是 2024 年的热门 AI 模型: 在编码任务方面,DeepSeek 的 deepseekcoderv2 成为社区的最爱。 阿里巴巴发布的 Qwen2 系列在视觉能力方面给社区留下深刻印象。 清华大学自然语言处理实验室资助的 OpenBMB 项目催生了 MiniCPM 项目,是可在设备上运行的小型参数模型。 在图像视频领域,国外 Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,且在定制化方面进步显著,还推出了 Stable Video 3D。OpenAI 的 Sora 能生成长达一分钟的视频,并保持三维一致性等。Google DeepMind 的 Veo 能将文本和图像提示与视频输入结合生成高分辨率视频。 在生物医学领域,Profluent 的 CRISPRCas 图谱微调后生成功能性基因编辑器,如开源的 OpenCRISPR1。心智基础模型 BrainLM 基于功能性磁共振成像建立,能检测血氧变化等。 在气象预测领域,微软创建的 Aurora 能预测大气化学,比数值模型更优且速度更快。 获得诺贝尔物理学奖和化学奖的 AI 推动了机器学习理论创新,并揭示了蛋白质折叠问题。 蛋白质结构预测方面,有 DeepMind 和 Isomorphic Labs 发布的 AlphaFold 3。 DeepMind 展示的新实验生物学能力 AlphaProteo 能设计出高亲和力的蛋白结合剂。 Meta 发布的 ESM3 是前沿多模态生成模型,在蛋白质序列、结构和功能上训练。 学习设计人类基因组编辑器的语言模型——CRISPRCas 图谱。
2024-12-16
2024年AI视频、图像领域市场情况
2024 年在 AI 视频、图像领域,市场呈现出以下情况: 国内方面: 中国开源项目在全球受到关注,成为积极开源贡献者。 DeepSeek 在编码任务中表现出色,推出的 deepseekcoderv2 受到欢迎。 阿里巴巴发布的 Qwen2 系列在视觉能力方面给社区留下深刻印象。 清华大学的自然语言处理实验室资助的 OpenBMB 项目催生了 MiniCPM 项目。 国外方面: Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,且在定制化方面有显著进步,还推出了 Stable Video 3D。 OpenAI 的 Sora 能够生成长达一分钟的视频,并保持三维一致性、物体持久性和高分辨率。 Google DeepMind 的 Veo 能将文本和可选图像提示与嘈杂压缩视频输入相结合,创建独特的压缩视频表示。 从市场数据来看,2024 全年全球 AI 移动应用内付费收入预计为 30 亿美元,其中图像和视频类 AI 应用占据主导地位,收入占比高达 53%。从地区分布来看,北美和欧洲贡献了三分之二的市场份额。 在行业格局方面,云厂商成为 AI 供应链的“链主”,掌握着庞大的商业生态和技术资源。头部阵营基本稳定,大型云厂商在产业链中的地位无可撼动。
2024-12-15
如何用可灵AI?来统一自己的国漫风格
以下是一些关于用 AI 绘画(如 Midjourney)来统一国漫风格的建议: 1. 明确关键词:例如,您可以选择与国漫风格相关的具体元素和特征作为关键词,如特定的人物形象、色彩搭配、场景元素等。 2. 参考已有案例:像上述提到的新海诚风格插画、国潮插画等案例,分析其关键词和生成的图片特点,从中获取灵感。 3. 不断尝试和调整:输入关键词后,根据生成的图片效果进行评估,然后对关键词进行修改和优化,以逐渐接近您想要的国漫风格。 4. 注重细节描述:在关键词中加入更多关于细节的描述,比如人物的表情、服饰的纹理、画面的光影效果等,有助于提高生成图片的质量和符合度。 希望这些建议对您有所帮助。
2025-01-10
用AI 写PPT的流程
用 AI 写 PPT 的流程如下: 1. 让 GPT4 生成 PPT 大纲,这一环节可能比较耗时,需要反复沟通和迭代,以确保大纲符合要求。 2. 将生成的大纲导入到 WPS 当中,启用 WPS AI 一键生成 PPT。 3. 让 chatPPT 为生成的 PPT 添加一些动画,以增强效果。 4. 手动修改细节,如字体、事实性错误等。 在生成大纲的过程中,可能需要花费较多时间与 GPT4 交流,明确主题和内容。WPS AI 能够对大纲进行优化和丰富,并且可以根据需求对生成的 PPT 进行主题配色和字体的修改。需要注意的是,目前 WPS 的相关功能可能免费,但未来可能会收费。
2025-01-10
免费的视频生成AI有什么
以下是一些免费的视频生成 AI 工具: 1. Hidreamai(国内,有免费额度): 网址:https://hidreamai.com//AiVideo 支持文生视频、图生视频。 提示词使用中文、英文都可以。 文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 2. ETNA(国内): 网址:https://etna.7volcanoes.com/ 是一款由七火山科技开发的文生视频 AI 模型,能根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8 15 秒,画质可达 4K,最高 38402160,画面细腻逼真,帧率 60fps。 3. Pika: 被网友评价为目前全球最好用的文本生成视频 AI。 功能:直接发送指令或上传图片生成 3 秒动态视频。 费用:目前内测免费。 生成服务托管在 discord 中。 加入方式:在浏览器中打开链接 https://discord.gg/dmtmQVKEgt 点击加入邀请。在“generate”子区输入指令或上传图片生成视频。 更多的文生视频的网站可以查看这里:https://www.waytoagi.com/category/38 。请注意,内容由 AI 大模型生成,请仔细甄别。
2025-01-10
我有一个mp3,希望AI帮我生成一个MTV的视频,
目前的 AI 技术还难以直接根据一个 MP3 文件生成一个完整的 MTV 视频。但您可以利用一些相关的工具和技术来逐步实现类似的效果。 例如,您可以使用一些视频编辑软件,先根据 MP3 的主题和情感构思视频的画面内容,然后收集或制作相关的图片、视频素材。 另外,一些 AI 绘画工具可以根据您对画面的描述生成图像,您可以将这些生成的图像融入到视频中。 但需要注意的是,这个过程需要您具备一定的视频编辑技能和创意构思能力。
2025-01-10
ai 写作
以下是关于 AI 写作的相关内容: AI 写作是现阶段较好的赛道,基于对大模型发展现状的观察和“开车”“写作”任务对比,该赛道有完美的产品模型匹配和产品市场匹配,且天花板高。其业务包含营销和小说、短剧创作,开发了智能营销矩阵平台,参与喜马拉雅短故事和短剧写作课程,捣鼓出小财鼠程序版 agent。 定义好文字为能引起人的生理共鸣与情绪,AI 因预训练数据量大能学会引发共鸣,从而写出好文字。 用 AI 写出好文字的方法包括:选好模型,评估模型的文风和语言能力、是否有过度道德说教与正面描述趋势、in context learning 能力和遵循复杂指令的能力;克服平庸,平衡“控制”与“松绑”;显式归纳想要的文本特征,通过 prompt 中的描述与词语映射到预训练数据中的特定类型文本,往 prompt 里塞例子。 在使用 AI 创作时,是以某个模型为基础进行调优的。选好的模型是第一步,模型之间的能力差异非常之大,很多时候对效果有决定性影响。挑选模型的第一个重要指标是文风和语言能力,要去除让人觉得是 AI 写的奇怪文风。 在论文写作领域,AI 技术应用迅速发展,提供多方面辅助。常用的 AI 工具和平台有: 1. 文献管理和搜索:Zotero 可自动提取文献信息,Semantic Scholar 是 AI 驱动的学术搜索引擎。 2. 内容生成和辅助写作:Grammarly 提供文本校对等,Quillbot 可重写和摘要。 3. 研究和数据分析:Google Colab 支持 AI 和机器学习研究,Knitro 用于数学建模和优化。 4. 论文结构和格式:LaTeX 结合自动化和模板处理格式,Overleaf 是在线 LaTeX 编辑器。 5. 研究伦理和抄袭检测:Turnitin 和 Crossref Similarity Check 检测抄袭。使用这些工具时要结合自身需求选择合适的辅助工具。
2025-01-10
2025最新AI排名
以下是关于 2025 年 AI 的一些相关信息: 过去一年,头部 AI 应用的品类变化不显著。对比美国 2023 年与 2024 年的 AI 应用 Top50 榜单,整体类别基本稳定。创意工具(如图像和视频内容创作)占最大比重,大语言模型助手、AI 陪伴和模型中心等类别为主流。新上榜的有美食、约会和音乐创意工具等小品类。 2024 年 9 月,OpenAI 发布新一代语言模型 o1,业界推测其采用全新训练与推理方案,结合强化学习技术,增强了推理能力,可能通过生成内部“思维链”模拟人类系统 2 思维方式。 2025 年 AI 发展趋势包括:AI 原生应用融资激增,更多公司实现 5000 万美元 ARR;并购活动增加,IPO 低迷;基础模型在多方面持续改进,尤其是多模态和推理模型;国防部加大 AI 投入;生成内容激增,视频成新焦点;AI 安全威胁与对抗加剧;监管进展缓慢。整体来看,生成式 AI 将持续主导市场。
2025-01-10