Chat with Wiki - deepseek 进展

Answer

DeepSeek 在 AI 领域有以下进展：

在编码任务中已成为社区的最爱，推出了组合速度、轻便性和准确性的 deepseek-coder-v2。
发布了 2360 亿参数的 DeepSeek-V2，该模型由 60 位专家混合开源，在数学、编码和推理方面表现出色，具有 236B 参数，21B 在生成过程中被激活，在 MT-Bench 上表现优异，中文能力强且性价比高。

Content generated by AI large model, please carefully verify (powered by aily)

References

2024人工智能报告｜一文迅速了解今年的AI界都发生了什么？

**中国开源项目在今年赢得全球粉丝，并且已经成为积极开源贡献者。**其中几个模型在个别子领域中脱颖而出，成为强有力的竞争者。DeepSeek在编码任务中已成为社区的最爱，其组合了速度、轻便性和准确性而推出的deepseek-coder-v2。阿里巴巴最近发布了Qwen-2系列，社区对其视觉能力印象深刻，从具有挑战性的OCR任务到分析复杂的艺术作品，都完成的非常好。在较小的一端，清华大学的自然语言处理实验室资助了OpenBMB项目，该项目催生了MiniCPM项目。这些是可以在设备上运行的小型<2.5B参数模型。它们的2.8B视觉模型在某些指标上仅略低于GPT-4V。2024年是AI图像视频迅速发展的一年，这个赛道竞争异常激烈国外Stability AI发布的Stable Video Diffusion，是第一个能够从文本提示生成高质量、真实视频的模型之一，并且在定制化方面取得了显著的进步。并且在今年3月，他们推出了Stable Video 3D，该模型经过第三个对象数据集的微调，可以预测三维轨道。OpenAI的Sora能够生成长达一分钟的视频，同时保持三维一致性、物体持久性和高分辨率。它使用时空补丁，类似于在变压器模型中使用的令牌，但用于视觉内容，以高效地从大量视频数据集中学习。除此之外，Sora还使用了其原始大小和纵横比的视觉数据进行训练，从而消除了通常会降低质量的裁剪和缩放。Google DeepMind的Veo将文本和可选图像提示与嘈杂压缩视频输入相结合，通过编码器和潜在扩散模型处理它们，以创建独特的压缩视频表示。然后系统将此表示解码为最终的高分辨率视频。

XiaoHu.AI日报

-提供4K分辨率的人类自由视角视频。-利用该技术将虚拟角色放入场景，实现沉浸式互动。🔗项目地址：http://vcai.mpi-inf.mpg.de/projects/holochar/🔗详细介绍：https://xiaohu.ai/p/74845️⃣🌌DeepSeek发布2360亿参数的DeepSeek-V2：-60位专家混合开源模型，数学、编码和推理表现出色。-236B参数，21B在生成过程中被激活。-在MT-Bench上表现优异，中文能力强且性价比高。🔗详细介绍：https://xiaohu.ai/p/74686️⃣🔍Google Gemini网络安全产品：-检测并防御网络钓鱼攻击。-结合广泛的用户和网络监控发现威胁。-利用AI分析功能生成情报报告。🔗详细：https://xiaohu.ai/p/74607️⃣🚗Wayve获超10亿美元C轮融资：-开发“驾驶GPT”基础模型，实现具身体智能自动驾驶。-使车辆在各种环境中操作，几乎无需人为干预。-使车辆与人类互动、学习并理解人类行为。🔗详细内容：https://xiaohu.ai/p/74538️⃣🩺CURE模型预测治疗结果：-利用300万患者数据进行预训练并针对特定健康状况微调。

XiaoHu.AI日报