Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

2024AI 大事记

Answer

以下是 2024 年 AI 大事纪: 1 月:

  • 斯坦福大学 Mobile Aloha
  • 1 月 10 号 LumaAl Genie 文生 3D
  • 1 月 11 号 GPT store 上线
  • MagnificAl 高清放大爆火
  • 1 月最后一天苹果 Vision Pro 宣布发售 3 月:
  • 潞晨科技发布 OpenSora
  • Suno 发布 V3 版本爆火 4 月:英伟达发布硬件股价飙升 5 月:
  • 苹果发布 AI 芯片
  • 张吕敏发布 IC light
  • AI 竞争白热化
  • 伊莉雅离开 OpenAI,伊利亚成立新公司,估值超五亿美金 7 月:快手开源 LivePortrait 模型,表情迁移 8 月:StabilityAI 老板成立新公司发布 flux 大模型 9 月:
  • 阿里云发布模型,海螺 AI 参战
  • Google 发布 GameGen 实时生成游戏
  • 通义千问 2.5 系列全家桶开源
  • 华为发布 cloud matrix 云计算基础设施
  • GPT 高级语音模式上线
  • Meta 发布 AI 眼镜 Orion
  • AI 代码编辑器 cursor 爆火 10 月:
  • Pika 发布 1.5 模型
  • 诺奖颁发给 AI 奠基人
  • 特斯拉发布机器人
  • Adobe 发布 Illustrator+Al 生成矢量图
  • 智谱 AI 发布 autoGLM
  • 腾讯混元开源 3D 模型
  • 云深处发布机器人山猫机器狗
  • Apple 发布 Mac mini 12 月:
  • 李飞飞发布空间智能成果
  • 腾讯开源混元视频模型
  • Open AI 开 12 天发布会
  • 微软发布 Trellis 最强开源图生 3D
  • Gemini2.0 视觉交互智能体
  • 智元机器人开始量产
  • 谷歌发布 Veo-2 能生成 4K 视频
  • 宇树科技机器狗爆火,似奔着打架去
  • SORA 兑现引关注,被测试出奇怪问题

需要说明的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。

Content generated by AI large model, please carefully verify (powered by aily)

References

帆哥:2024AI大事纪

欢迎大家在评论区继续补充一些没有提到的信息,经过帆哥授权收录到了公众号:https://mp.weixin.qq.com/s/jkVCcY-YVGb5uFPuei6iOA本文档由沙粒科技@AI研究室-帆哥整理https://space.bilibili.com/2161614转载或商业用途需注明来源2024你最印象深刻的科技新闻是什么?SORA?具身机器人?还是各种AI视频轮番PK?我们总结了2024年发生的大多数AI大事,希望能够带你一起回顾这个大事频发的一年。想获得视频中的图表三联请在上面b站后台私信发送“AI”即可获得2024感谢大家!2025咱们再向星辰大海继续出发!开源时间轴大事件时间轴免责声明:本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热、度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。AI视频总结:视频回顾了2024年AI领域的重大事件,包括众多模型发布、开源竞争、科技公司动态、诺贝尔奖颁发等,总结了这一年是应用之年,未出现新算法,列出了时间轴方便总结回顾[00:00]1月AI大事件频发[00:03]回顾2024年AI大事件,1月大事件频发[01:04]1月斯坦福大学Mobile Aloha[01:11]1月10号LumaAl Genie文生3D[01:16]1月11号GPT store上线[01:26]1月MagnificAl高清放大爆火[01:37]1月最后一天苹果Vision Pro宣布发售

帆哥:2024AI大事纪

[09:53]10月,美国大选川普获胜[09:58]10月,云深处发布机器人山猫机器狗[10:05]10月,Apple发布Mac mini[10:14]12月,李飞飞发布空间智能成果[10:18]12月,腾讯开源混元视频模型[10:24]12月,Open AI开12天发布会[10:38]12月,微软发布Trellis最强开源图生3D[10:45]12月,Gemini2.0视觉交互智能体[10:46]12月,智元机器人开始量产[10:50]12月,谷歌发布Veo-2能生成4K视频[10:54]12月AI成果与展望[10:54]视频回顾2024年AI大事,12月成果多,未来展望引思考[11:07]12月宇树科技机器狗爆火,似奔着打架去[11:18]12月SORA兑现引关注,被测试出奇怪问题[12:10]2024年是AI应用之年,未现新算法[12:40]明年大概率拼算力和数据,无新算法

帆哥:2024AI大事纪

[02:44]3月AI发展持续升温[02:44]3月潞晨科技发布OpenSora[03:13]3月Suno发布V3版本爆火[03:49]4月英伟达发布硬件股价飙升[04:43]5月苹果发布AI芯片[04:53]5月张吕敏发布IC light[05:27]5月AI竞争白热化[05:28]5月伊莉雅离开OpenAI,AI竞争白热化[05:58]伊利亚成立新公司,估值超五亿美金[06:34]7月快手开源LivePortrait模型,表情迁移[07:10]8月StabilityAI老板成立新公司发布flux大模型[07:34]9月阿里云发布模型,海螺AI参战[08:12]9月AI新动态不断[08:14]9月,Google发布GameGen实时生成游戏[08:25]9月,通义千问2.5系列全家桶开源[08:30]9月,华为发布cloud matrix云计算基础设施[08:33]9月,GPT高级语音模式上线[08:39]9月,Meta发布AI眼镜Orion[08:49]9月,AI代码编辑器cursor爆火[09:02]10月,Pika发布1.5模型[09:08]10月,诺奖颁发给AI奠基人[09:17]10月,特斯拉发布机器人[09:23]10月,Adobe发布Illustrator+Al生成矢量图[09:32]10月,智谱AI发布autoGLM[09:49]10月,腾讯混元开源3D模型

Others are asking
2024ai 大事记
以下是 2024 年 AI 大事纪的相关内容: 1 月: 斯坦福大学 Mobile Aloha。 1 月 10 号 LumaAl Genie 文生 3D。 1 月 11 号 GPT store 上线。 MagnificAl 高清放大爆火。 1 月最后一天苹果 Vision Pro 宣布发售。 3 月: 潞晨科技发布 OpenSora。 Suno 发布 V3 版本爆火。 4 月:英伟达发布硬件股价飙升。 5 月: 苹果发布 AI 芯片。 张吕敏发布 IC light。 7 月:快手开源 LivePortrait 模型,表情迁移。 8 月:StabilityAI 老板成立新公司发布 flux 大模型。 9 月: 阿里云发布模型,海螺 AI 参战。 Google 发布 GameGen 实时生成游戏。 通义千问 2.5 系列全家桶开源。 华为发布 cloud matrix 云计算基础设施。 GPT 高级语音模式上线。 Meta 发布 AI 眼镜 Orion。 AI 代码编辑器 cursor 爆火。 10 月: Pika 发布 1.5 模型。 诺奖颁发给 AI 奠基人。 特斯拉发布机器人。 Adobe 发布 Illustrator+Al 生成矢量图。 智谱 AI 发布 autoGLM。 腾讯混元开源 3D 模型。 云深处发布机器人山猫机器狗。 Apple 发布 Mac mini。 12 月: 李飞飞发布空间智能成果。 腾讯开源混元视频模型。 Open AI 开 12 天发布会。 微软发布 Trellis 最强开源图生 3D。 Gemini2.0 视觉交互智能体。 智元机器人开始量产。 谷歌发布 Veo2 能生成 4K 视频。 需要注意的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-10
2024ai大事件
以下是 2024 年 AI 领域的大事纪: 1 月: 斯坦福大学 Mobile Aloha 1 月 10 号 LumaAl Genie 文生 3D 1 月 11 号 GPT store 上线 MagnificAl 高清放大爆火 1 月最后一天苹果 Vision Pro 宣布发售 3 月: 潞晨科技发布 OpenSora Suno 发布 V3 版本爆火 4 月:英伟达发布硬件股价飙升 5 月: 苹果发布 AI 芯片 张吕敏发布 IC light AI 竞争白热化,伊莉雅离开 OpenAI 并成立新公司,估值超五亿美金 7 月:快手开源 LivePortrait 模型,表情迁移 8 月:StabilityAI 老板成立新公司发布 flux 大模型 9 月: 阿里云发布模型,海螺 AI 参战 Google 发布 GameGen 实时生成游戏 通义千问 2.5 系列全家桶开源 华为发布 cloud matrix 云计算基础设施 GPT 高级语音模式上线 Meta 发布 AI 眼镜 Orion AI 代码编辑器 cursor 爆火 10 月: Pika 发布 1.5 模型 诺奖颁发给 AI 奠基人 特斯拉发布机器人 Adobe 发布 Illustrator+Al 生成矢量图 智谱 AI 发布 autoGLM 腾讯混元开源 3D 模型 云深处发布机器人山猫机器狗 Apple 发布 Mac mini 12 月: 李飞飞发布空间智能成果 腾讯开源混元视频模型 Open AI 开 12 天发布会 微软发布 Trellis 最强开源图生 3D Gemini2.0 视觉交互智能体 智元机器人开始量产 谷歌发布 Veo2 能生成 4K 视频 需要注意的是,本大事记经过一定筛选,带有一定倾向性,但不包含任何广告或其他商业考量,仅以新闻热度与大众反响为依据。仅代表个人看法,如有遗漏请谅解。
2025-01-09
2024年《全球人工智能治理研究报告》议题“国家主权原则和人工智能发展”的内容及理解
以下是 2024 年《全球人工智能治理研究报告》中关于“国家主权原则和人工智能发展”的相关内容: 在 2024 年人工智能发展状况的安全与全球治理方面: 英国创建了世界上第一个人工智能安全研究所(AISA),其有三个核心功能:在部署前对高级模型进行评估;建立国家能力并开展研究;协调国际合作伙伴。AISA 还发布了 Inspect 框架用于 LLM 安全评估。英国宣布与美国等效机构签署谅解备忘录,并计划在美国旧金山设立办事处。 英国通过其高级研究与发明机构(ARIA),花费 5900 万英镑开发“守门员”系统,负责了解和减少关键领域中其他人工智能代理的风险。英国政府还计划设立“AI 安全研究实验室”,旨在汇集政府关于敌对国家使用进攻性 AI 的知识。美国能源部利用内部测试床评估人工智能对关键基础设施和能源安全的风险。 在技术和方法方面: 离线直接比对方法不会很快大规模取代 RLHF。谷歌 DeepMind 团队发现 RLHF 在涵盖总结、有用性、对话性等数据集上的测试中胜出,能更有效地改善生成任务。Cohere for AI 探索放弃近端策略优化 RLHF 中的算法,有利于其 RLOO 训练器,可降低 GPU 使用率和提高训练速度。 但 RLHF 存在可能滋生谄媚行为的问题,如 Anthropic 认为 SOTA AI 助手表现出奉承行为是因为人类偏好数据等。开发透明度虽在提高,但仍有很大改进空间。 在安全研究方面: 随着 AI 发展,新功能带来新漏洞,开发人员加大了对“越狱”的研究。OpenAI 提出通过“指令层次结构”修复攻击,Anthropic 表明“警告防御”的潜力,Gray Swan AI 的安全专家试用“断路器”。LLM 测试初创公司 Haize Labs 与 Hugging Face 合作创建首个红队抵抗组织基准。除越狱外,还存在更隐蔽的攻击,潜在攻击面广泛,涵盖从训练到偏好数据和微调等内容。 对于“国家主权原则和人工智能发展”的理解,可能需要综合考虑各国在人工智能安全研究和治理方面的举措,以及技术发展对国家主权可能产生的影响。各国积极建立相关机构和采取措施,表明在人工智能快速发展的背景下,维护国家主权和安全的重要性。同时,技术发展中的问题和挑战也需要各国共同协作应对,以实现人工智能的健康、安全和可持续发展。
2024-12-31
2024年度中文大模型基准测评报告
以下是关于 2024 年度中文大模型基准测评报告的相关信息: 2024 年 7 月 10 日: 《SuperCLUE:中文大模型基准测评 2024 年上半年报告》指出,2024 年上半年中文大模型技术取得显著进展,国内外模型差距缩小至 5%以内。国内开源模型如 Qwen272B 表现优异,超越众多闭源模型。端侧小模型发展迅速,落地可行性大幅提升。该报告通过多维度、多层次测评体系,全面评估了大模型的通用能力和专项能力,为行业发展提供了客观数据支持。同时也指出,尽管大模型在多领域展现潜力,但仍面临技术挑战和应用落地问题。 2024 年 11 月 8 日: SuperCLUE 团队发布的新一期《SuperCLUE:中文大模型基准测评 2024 年 10 月报告》中有四点核心发现:1)OpenAI 发布 o1 后,全球大模型竞争加剧;2)国内大模型第一梯队竞争激烈,持续迭代表现不俗;3)国内外大模型在不同任务上表现各有优势;4)端侧小模型表现惊艳。 此外,Sora:大型视觉模型的背景、技术、局限性和机遇综述【官方论文】的参考文献包括: T.Shen,R.Jin,Y.Huang,C.Liu,W.Dong,Z.Guo,X.Wu,Y.Liu,和 D.Xiong,“大型语言模型对齐:一项调查”,arXiv 预印本 arXiv:2309.15025,2023 年。 X.Liu,X.Lei,S.Wang,Y.Huang,Z.Feng,B.Wen,J.Cheng,P.Ke,Y.Xu,W.L.Tam,X.Zhang,L.Sun,H.Wang,J.Zhang,M.Huang,Y.Dong,和 J.Tang,“Alignbench:大型语言模型中文对齐的基准测试”,2023 年。 P.Christiano,J.Leike,T.B.Brown,M.Martic,S.Legg,和 D.Amodei,“基于人类偏好的深度强化学习”,2023 年。 T.Yu,Y.Yao,H.Zhang,T.He,Y.Han,G.Cui,J.Hu,Z.Liu,H.T.Zheng,M.Sun,和 T.S.Chua,“RLHFV:通过细粒度校正人类反馈实现可信赖的 MLLMs 行为对齐”,2023 年。 M.S.Jahan 和 M.Oussalah,“使用自然语言处理进行仇恨言论自动检测的系统综述。”,《神经计算》,第 126232 页,2023 年。 OpenAI,“Sora 安全。”https://openai.com/sorasafety,2024 年。
2024-12-27
2024年热门AI模型
以下是 2024 年的热门 AI 模型: 在编码任务方面,DeepSeek 的 deepseekcoderv2 成为社区的最爱。 阿里巴巴发布的 Qwen2 系列在视觉能力方面给社区留下深刻印象。 清华大学自然语言处理实验室资助的 OpenBMB 项目催生了 MiniCPM 项目,是可在设备上运行的小型参数模型。 在图像视频领域,国外 Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,且在定制化方面进步显著,还推出了 Stable Video 3D。OpenAI 的 Sora 能生成长达一分钟的视频,并保持三维一致性等。Google DeepMind 的 Veo 能将文本和图像提示与视频输入结合生成高分辨率视频。 在生物医学领域,Profluent 的 CRISPRCas 图谱微调后生成功能性基因编辑器,如开源的 OpenCRISPR1。心智基础模型 BrainLM 基于功能性磁共振成像建立,能检测血氧变化等。 在气象预测领域,微软创建的 Aurora 能预测大气化学,比数值模型更优且速度更快。 获得诺贝尔物理学奖和化学奖的 AI 推动了机器学习理论创新,并揭示了蛋白质折叠问题。 蛋白质结构预测方面,有 DeepMind 和 Isomorphic Labs 发布的 AlphaFold 3。 DeepMind 展示的新实验生物学能力 AlphaProteo 能设计出高亲和力的蛋白结合剂。 Meta 发布的 ESM3 是前沿多模态生成模型,在蛋白质序列、结构和功能上训练。 学习设计人类基因组编辑器的语言模型——CRISPRCas 图谱。
2024-12-16
2024年AI视频、图像领域市场情况
2024 年在 AI 视频、图像领域,市场呈现出以下情况: 国内方面: 中国开源项目在全球受到关注,成为积极开源贡献者。 DeepSeek 在编码任务中表现出色,推出的 deepseekcoderv2 受到欢迎。 阿里巴巴发布的 Qwen2 系列在视觉能力方面给社区留下深刻印象。 清华大学的自然语言处理实验室资助的 OpenBMB 项目催生了 MiniCPM 项目。 国外方面: Stability AI 发布的 Stable Video Diffusion 能从文本提示生成高质量、真实视频,且在定制化方面有显著进步,还推出了 Stable Video 3D。 OpenAI 的 Sora 能够生成长达一分钟的视频,并保持三维一致性、物体持久性和高分辨率。 Google DeepMind 的 Veo 能将文本和可选图像提示与嘈杂压缩视频输入相结合,创建独特的压缩视频表示。 从市场数据来看,2024 全年全球 AI 移动应用内付费收入预计为 30 亿美元,其中图像和视频类 AI 应用占据主导地位,收入占比高达 53%。从地区分布来看,北美和欧洲贡献了三分之二的市场份额。 在行业格局方面,云厂商成为 AI 供应链的“链主”,掌握着庞大的商业生态和技术资源。头部阵营基本稳定,大型云厂商在产业链中的地位无可撼动。
2024-12-15
地方国民经济和社会发展规划、产业规划编制的Ai工具
以下是一些可以用于地方国民经济和社会发展规划、产业规划编制的 AI 工具: 在绘制逻辑视图、功能视图、部署视图方面: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,用户可通过拖放界面轻松创建架构图。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能。 3. ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 4. Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图创建。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,有丰富模板用于创建相关视图。 6. draw.io(现称为 diagrams.net):免费在线图表软件,支持创建逻辑视图和部署视图等。 7. PlantUML:文本到 UML 转换工具,通过编写描述性文本自动生成相关视图。 8. Gliffy:基于云的绘图工具,提供创建各种架构图的功能。 9. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 10. Rational Rose:IBM 的 UML 工具,支持创建多种视图。 在审核规划平面图方面: 1. HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型。 2. Maket.ai:面向住宅行业,在户型和室内软装设计方面有 AI 技术探索。 3. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期阶段可引入标准和规范。 4. Fast AI 人工智能审图平台:形成全自动智能审图流程,实现建筑全寿命周期内信息集成与管理。 但每个工具都有其特定应用场景和功能,建议根据具体需求选择合适的工具。
2025-01-10
如何系统学习ai知识
以下是系统学习 AI 知识的方法: 1. 编程语言基础:从 Python、JavaScript 等编程语言开始学习,掌握编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 工具和平台体验:使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 基础知识学习: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 实践项目参与:参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动,尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注前沿动态:关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展,思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 对于新手学习 AI,还可以: 1. 了解基本概念:阅读「」部分,熟悉 AI 的术语和基础概念,浏览入门文章,了解其历史、应用和发展趋势。 2. 开始学习之旅:在「」中找到为初学者设计的课程,推荐李宏毅老师的课程。通过在线教育平台(如 Coursera、edX、Udacity)按自己节奏学习并获取证书。 3. 选择兴趣模块深入:根据自身兴趣选择特定的 AI 模块(如图像、音乐、视频等)深入学习,掌握提示词技巧。 4. 实践和尝试:理论学习后进行实践,巩固知识,尝试使用各种产品并分享实践成果。 5. 体验 AI 产品:与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式,获得实际应用体验。
2025-01-10
有什么AI模型可以制作瞬息宇宙?比如Stable Diffusion,还有别的吗?
以下是一些可以用于制作类似效果的 AI 模型: 1. Adobe Firefly:内置在各种 Adobe 产品中,不过在质量方面稍逊于 DALLE 和 Midjourney,但它只使用有权使用的图像进行训练。 2. Stable Diffusion:开源模型,可以在任何高端计算机运行。开始时需要学会正确制作提示,一旦掌握能产生很好的结果,尤其适合将 AI 与其他源的图像结合。 3. DALLE:来自 OpenAI,已纳入 Bing(需使用创意模式)和 Bing 图像创建器,系统可靠但效果比 Midjourney 稍差。 4. Midjourney:2023 年中期最好的系统,学习曲线最低,只需键入特定指令就能得到很好的结果,需要 Discord。 此外,在游戏制作领域,已经出现了用于游戏中几乎所有资产的生成式人工智能模型,从 3D 模型到角色动画,再到对话和音乐。但文中未提及具体的模型名称。
2025-01-10
2025年1月9日,AI领域最新新闻
以下是 2025 年 1 月 9 日 AI 领域的部分最新新闻: 艾媒咨询发布的《》显示,中国 AI 大模型市场在 2024 年规模约为 294.16 亿元,预计 2026 年将突破 700 亿元。用户调研表明,超过半数用户频繁使用 AI 大模型,主要用于工作和学习。国产大模型正广泛应用于各行业,如金融、医疗、教育等,推动数字化转型。政策支持、算力发展和经济因素共同驱动产业发展。AI 大模型在网络安全、教育、金融等领域展现出巨大潜力,用户对其在这些领域的应用充满期待。 其它一些报告发布在: UiPath:《》 毕马威:《》 清华大学:《》 中央企业人工智能:《》 拾象投研团队预测 2025 年 AI 发展的关键趋势,包括微软可能转向 Anthropic 合作,Google 利用其强大资源缩小与领先者的差距,以及 Agent 成为新的软件核心,推动任务自动化和推理能力的提升。同时,数据的上下文层和合成数据技术的突破将是竞争的关键。硬件方面,推理需求激增将使 NVDA 继续在算力市场中保持领先地位。 讨论了即将进入的智能代理 AI 时代,特别是 Coding Agent 的崛起。随着 AI 编程能力的提升,许多人将有机会更快地开发产品,投资者对此充满期待。然而,关于 AI Coding 是否会取代传统程序员的争论仍然存在,分为保守派、乐观派和激进派。尽管未来仍不确定,但 AI 编程课程的需求已显著增加,显示出人们对这一领域的关注和焦虑。 过去一年,头部 AI 应用的品类变化并不显著。对比美国 2023 年与 2024 年的 AI 应用 Top50 榜单,整体类别基本保持稳定。其中,创意工具(如图像和视频内容创作)依然占据最大比重,大语言模型助手、AI 陪伴和模型中心等类别也继续稳居主流地位。新上榜的仅包括美食、约会和音乐创意工具等几个小品类。 模型进展(算法、算力和数据) AI 算法的“推陈出新” OpenAI 新模型——o1 在业界对传统预训练模型进展放缓的担忧中,2024 年 9 月,OpenAI 发布了新一代语言模型 o1。尽管技术细节未被完全公开,但业界推测 o1 采用了全新的训练与推理方案,结合强化学习技术,显著增强了模型的推理能力。o1 可能是通过生成内部“思维链”(Chain of Thought),模拟人类的系统 2 思维方式,在回答复杂问题时能够逐步推理、自我纠错和优化。 心理学家丹尼尔·卡尼曼(Daniel Kahneman)曾提出人类的系统 1 和系统 2 两种思维模式——前者快速、直觉,后者慢速、理性。业界专家认为,传统的 GPT4 等模型更像系统 1,快速生成答案但缺乏深度推理,而 o1 则更倾向于系统 2,通过逐步推理提升回答质量。 o1 可能借鉴了下围棋的 AlphaGo Zero 的技术思路,例如强化学习、自我博弈和思维链的结合。尽管围棋任务的规则性与自然语言的开放性不同,但这些技术不仅为 o1 提供了更强的推理能力,也预示着 AI 技术在复杂任务领域进一步突破的可能。
2025-01-10
什么是AIGC
AIGC 即 AI generated content,又称为生成式 AI,是一种利用人工智能技术生成各种类型内容的应用方式。 AIGC 能够通过机器学习和深度学习算法,根据输入的数据和指令生成符合特定要求的内容,其应用领域广泛,包括但不限于内容创作、广告、媒体等。 例如,在文字生成方面,可使用大型语言模型(如 GPT 系列模型)生成文章、故事、对话等内容;在图像生成方面,可使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等;在视频生成方面,可使用 Runway、KLING 等模型生成动画、短视频等。 AIGC 与 UGC(普通用户生产)、PGC(专业用户生产)都是内容生成的不同方式。UGC 是由用户生成的内容,优势在于内容丰富多样,能反映用户真实想法和创意,适用于社交媒体、社区论坛等互动性强的平台。PGC 是由专业人士或机构生成的内容,优势在于内容质量高、专业性强,适用于新闻媒体、专业网站等需要高质量内容的平台。 能进行 AIGC 的产品项目众多,媒介也多样。语言文字类有 OpenAI 的 GPT、Google 的 Bard、百度的文心一言等;语音声音类有 Google 的 WaveNet、微软的 Deep Nerual Network、百度的 DeepSpeech 等,还有合成 AI 孙燕姿大火的开源模型 Sovits;图片美术类有早期的 GEN 等图片识别/生成技术,去年大热的扩散模型带火了生成质量很高的 Midjourney、先驱者谷歌的 Disco Diffusion、一直在排队测试的 OpenAI 的 Dalle·2,以及 stability ai 和 runaway 共同推出的 Stable Diffusion。Stable Diffusion 是由初创公司 StabilityAI、CompVis 与 Runway 合作开发,2022 年发布的深度学习文本到图像生成模型,代码模型权重已公开发布,当前版本为 2.1 稳定版(2022.12.7),源代码库为 github.com/StabilityAI/stablediffusion。
2025-01-10