DeepSeek-V2 是由 60 位专家混合开发的开源模型。它具有 2360 亿参数,其中 21B 在生成过程中被激活。在 MT-Bench 上表现优异,中文能力强且性价比高。详细介绍可参考:https://xiaohu.ai/p/7468
**中国开源项目在今年赢得全球粉丝,并且已经成为积极开源贡献者。**其中几个模型在个别子领域中脱颖而出,成为强有力的竞争者。DeepSeek在编码任务中已成为社区的最爱,其组合了速度、轻便性和准确性而推出的deepseek-coder-v2。阿里巴巴最近发布了Qwen-2系列,社区对其视觉能力印象深刻,从具有挑战性的OCR任务到分析复杂的艺术作品,都完成的非常好。在较小的一端,清华大学的自然语言处理实验室资助了OpenBMB项目,该项目催生了MiniCPM项目。这些是可以在设备上运行的小型<2.5B参数模型。它们的2.8B视觉模型在某些指标上仅略低于GPT-4V。2024年是AI图像视频迅速发展的一年,这个赛道竞争异常激烈国外Stability AI发布的Stable Video Diffusion,是第一个能够从文本提示生成高质量、真实视频的模型之一,并且在定制化方面取得了显著的进步。并且在今年3月,他们推出了Stable Video 3D,该模型经过第三个对象数据集的微调,可以预测三维轨道。OpenAI的Sora能够生成长达一分钟的视频,同时保持三维一致性、物体持久性和高分辨率。它使用时空补丁,类似于在变压器模型中使用的令牌,但用于视觉内容,以高效地从大量视频数据集中学习。除此之外,Sora还使用了其原始大小和纵横比的视觉数据进行训练,从而消除了通常会降低质量的裁剪和缩放。Google DeepMind的Veo将文本和可选图像提示与嘈杂压缩视频输入相结合,通过编码器和潜在扩散模型处理它们,以创建独特的压缩视频表示。然后系统将此表示解码为最终的高分辨率视频。
-提供4K分辨率的人类自由视角视频。-利用该技术将虚拟角色放入场景,实现沉浸式互动。🔗项目地址:http://vcai.mpi-inf.mpg.de/projects/holochar/🔗详细介绍:https://xiaohu.ai/p/74845️⃣🌌DeepSeek发布2360亿参数的DeepSeek-V2:-60位专家混合开源模型,数学、编码和推理表现出色。-236B参数,21B在生成过程中被激活。-在MT-Bench上表现优异,中文能力强且性价比高。🔗详细介绍:https://xiaohu.ai/p/74686️⃣🔍Google Gemini网络安全产品:-检测并防御网络钓鱼攻击。-结合广泛的用户和网络监控发现威胁。-利用AI分析功能生成情报报告。🔗详细:https://xiaohu.ai/p/74607️⃣🚗Wayve获超10亿美元C轮融资:-开发“驾驶GPT”基础模型,实现具身体智能自动驾驶。-使车辆在各种环境中操作,几乎无需人为干预。-使车辆与人类互动、学习并理解人类行为。🔗详细内容:https://xiaohu.ai/p/74538️⃣🩺CURE模型预测治疗结果:-利用300万患者数据进行预训练并针对特定健康状况微调。
-提供4K分辨率的人类自由视角视频。-利用该技术将虚拟角色放入场景,实现沉浸式互动。🔗项目地址:http://vcai.mpi-inf.mpg.de/projects/holochar/🔗详细介绍:https://xiaohu.ai/p/74845️⃣🌌DeepSeek发布2360亿参数的DeepSeek-V2:-60位专家混合开源模型,数学、编码和推理表现出色。-236B参数,21B在生成过程中被激活。-在MT-Bench上表现优异,中文能力强且性价比高。🔗详细介绍:https://xiaohu.ai/p/74686️⃣🔍Google Gemini网络安全产品:-检测并防御网络钓鱼攻击。-结合广泛的用户和网络监控发现威胁。-利用AI分析功能生成情报报告。🔗详细:https://xiaohu.ai/p/74607️⃣🚗Wayve获超10亿美元C轮融资:-开发“驾驶GPT”基础模型,实现具身体智能自动驾驶。-使车辆在各种环境中操作,几乎无需人为干预。-使车辆与人类互动、学习并理解人类行为。🔗详细内容:https://xiaohu.ai/p/74538️⃣🩺CURE模型预测治疗结果:-利用300万患者数据进行预训练并针对特定健康状况微调。