清华大学发布了关于如何用好 DeepSeek 的相关内容,主要包括以下方面:
**中国开源项目在今年赢得全球粉丝,并且已经成为积极开源贡献者。**其中几个模型在个别子领域中脱颖而出,成为强有力的竞争者。DeepSeek在编码任务中已成为社区的最爱,其组合了速度、轻便性和准确性而推出的deepseek-coder-v2。阿里巴巴最近发布了Qwen-2系列,社区对其视觉能力印象深刻,从具有挑战性的OCR任务到分析复杂的艺术作品,都完成的非常好。在较小的一端,清华大学的自然语言处理实验室资助了OpenBMB项目,该项目催生了MiniCPM项目。这些是可以在设备上运行的小型<2.5B参数模型。它们的2.8B视觉模型在某些指标上仅略低于GPT-4V。2024年是AI图像视频迅速发展的一年,这个赛道竞争异常激烈国外Stability AI发布的Stable Video Diffusion,是第一个能够从文本提示生成高质量、真实视频的模型之一,并且在定制化方面取得了显著的进步。并且在今年3月,他们推出了Stable Video 3D,该模型经过第三个对象数据集的微调,可以预测三维轨道。OpenAI的Sora能够生成长达一分钟的视频,同时保持三维一致性、物体持久性和高分辨率。它使用时空补丁,类似于在变压器模型中使用的令牌,但用于视觉内容,以高效地从大量视频数据集中学习。除此之外,Sora还使用了其原始大小和纵横比的视觉数据进行训练,从而消除了通常会降低质量的裁剪和缩放。Google DeepMind的Veo将文本和可选图像提示与嘈杂压缩视频输入相结合,通过编码器和潜在扩散模型处理它们,以创建独特的压缩视频表示。然后系统将此表示解码为最终的高分辨率视频。
《[DeepSeek:从入门到精通](https://waytoagi.feishu.cn/record/QAURr4CNGeJ5GIcvU0nc9X3dndg)》是清华大学新闻与传播学院新媒体研究中心出品的指南。详细阐述了DeepSeek的功能,包括智能对话、文本生成、代码生成、自然语言理解等,并探讨了如何使用DeepSeek,包括推理模型与通用模型的区别、提示语设计策略以及如何从入门到精通。文章还介绍了提示语设计的核心技能、常见陷阱及应对方法,旨在帮助用户更好地掌握AI工具的使用,提升工作效率和创新能力。
ARK Invest的《[Big Ideas 2025](https://waytoagi.feishu.cn/record/WNEGrnxuNeZKCJc9z2ecEJJdnGd)》报告探讨了未来几年可能推动全球经济增长的颠覆性技术创新。报告聚焦于五大技术平台:人工智能、机器人、能源存储、公共区块链和多组学技术,并提出了11个“大创意”,涵盖从AI代理、比特币、稳定币到自动驾驶出租车、自主物流和可重复使用火箭等领域。报告指出,这些技术的融合将大幅提升生产力,推动行业变革,并创造长期投资机会。《[我所见过的梁文锋](https://zhuanlan.zhihu.com/p/21738083977)》“幻方某种程度上增强了对技术驱动型创新的信心,但也不都是坦途。我们经历了一个漫长的积累过程。外部看到的是幻方2015年后的部分,但其实我们做了16年。对顶级人才吸引最大的,肯定是去解决世界上最难的问题。我们就在做最难的事。”《[DeepSeek:从入门到精通](https://waytoagi.feishu.cn/record/QAURr4CNGeJ5GIcvU0nc9X3dndg)》是清华大学新闻与传播学院新媒体研究中心出品的指南。详细阐述了DeepSeek的功能,包括智能对话、文本生成、代码生成、自然语言理解等,并探讨了如何使用DeepSeek,包括推理模型与通用模型的区别、提示语设计策略以及如何从入门到精通。文章还介绍了提示语设计的核心技能、常见陷阱及应对方法,旨在帮助用户更好地掌握AI工具的使用,提升工作效率和创新能力。