以下是 2024 年的热门 AI 模型:
**中国开源项目在今年赢得全球粉丝,并且已经成为积极开源贡献者。**其中几个模型在个别子领域中脱颖而出,成为强有力的竞争者。DeepSeek在编码任务中已成为社区的最爱,其组合了速度、轻便性和准确性而推出的deepseek-coder-v2。阿里巴巴最近发布了Qwen-2系列,社区对其视觉能力印象深刻,从具有挑战性的OCR任务到分析复杂的艺术作品,都完成的非常好。在较小的一端,清华大学的自然语言处理实验室资助了OpenBMB项目,该项目催生了MiniCPM项目。这些是可以在设备上运行的小型<2.5B参数模型。它们的2.8B视觉模型在某些指标上仅略低于GPT-4V。2024年是AI图像视频迅速发展的一年,这个赛道竞争异常激烈国外Stability AI发布的Stable Video Diffusion,是第一个能够从文本提示生成高质量、真实视频的模型之一,并且在定制化方面取得了显著的进步。并且在今年3月,他们推出了Stable Video 3D,该模型经过第三个对象数据集的微调,可以预测三维轨道。OpenAI的Sora能够生成长达一分钟的视频,同时保持三维一致性、物体持久性和高分辨率。它使用时空补丁,类似于在变压器模型中使用的令牌,但用于视觉内容,以高效地从大量视频数据集中学习。除此之外,Sora还使用了其原始大小和纵横比的视觉数据进行训练,从而消除了通常会降低质量的裁剪和缩放。Google DeepMind的Veo将文本和可选图像提示与嘈杂压缩视频输入相结合,通过编码器和潜在扩散模型处理它们,以创建独特的压缩视频表示。然后系统将此表示解码为最终的高分辨率视频。
Profluent的CRISPR-Cas图谱进行了微调,以生成具有新型序列的功能性基因编辑器。重要的是,这些编辑器首次被证明能够对体外的人类细胞DNA进行编辑。CRISPR-Cas图谱包含超过一百万个不同的CRISPR-Cas操作子,包括各种效应器系统,这些操作子是从组装的微生物基因组和宏基因组中挖掘出来的,覆盖了多种门类和生态系统。生成的序列比CRISPR-Cas图谱中的天然蛋白质更多样化,中位数相似度通常在40%至60%之间。一种针对Cas9蛋白质进行微调的模型可以生成新的编辑器,然后在人类细胞中进行了验证。其中一种编辑器提供了最佳的编辑性能,并且与SpCas9具有71.7%的序列相似性,现已开源为OpenCRISPR-1。心智基础模型:从fMRI学习大脑活动深度学习现在正在成为模拟大脑本身。BrainLM是一个基于功能性磁共振成像(fMRI)生成的6700小时人类脑活动记录而建立的基础模型,该模型可以检测到血氧变化;可以重建被遮盖的空间和时间脑活动序列,并且重要的是它可以泛化到保留分布;不仅如此,这个模型可以微调以预测临床变量例如年龄、神经质、创伤后应激障碍和焦虑症得分比图灵机或LSTM更好。科学领域的基础模型:大气微软的研究人员创建了Aurora,它是第一个预测大气化学(6种主要空气污染物,例如臭氧和一氧化碳),涉及数百个僵硬方程的模型,比数值模型更好。该模型也比使用数值预报的综合预报系统快5000倍。
最重要的突破是——在2024年,诺贝尔物理学奖和化学奖先后颁给AIAI不仅推动了机器学习的理论创新,还揭示了蛋白质折叠问题。其标志了人工智能AI已经真正成为一门科学学科和加速科学的工具。AI在生物医学气象等突破应用有哪些?基于深度学习和Transformer架构的蛋白质结构预测模型——AlphaFold 3由DeepMind和Isomorphic Labs发布的AlphaFold 3是一个基于深度学习和Transformer架构的蛋白质结构预测模型,能够高精度地预测包括蛋白质、DNA、RNA、配体等生物分子的结构和相互作用。它的出现将为细胞功能解析、药物设计和生物科学的发展提供有力支持。DeepMind展示新的实验生物学能力——AlphaProteo其秘密蛋白质设计团队推出第一个模型AlphaProteo是一种能够设计出具有三到三百倍亲和力的亚纳米摩尔蛋白结合剂的生成模型。生物学前沿模型的扩展:进化规模ESM3自2019年以来,Meta一直在发布基于Transformer的语言模型(进化规模模型),这些模型是通过大型氨基酸和蛋白质数据库进行训练的。今年,他们发布了ESM3,这是一种前沿多模态生成模型,它是在蛋白质序列、结构和功能上进行训练的,而不是仅仅在序列上进行训练。与传统的掩码语言建模不同,ESM3的训练过程使用可变掩码计划,使模型暴露于各种掩码序列、结构和功能的组合。ESM3能够学习预测任何模态组合的完成情况。学习设计人类基因组编辑器的语言模型——CRISPR-Cas图谱