以下是关于 DeepSeek V3 的相关信息:
Andrej Kaparthy赞扬Deepseek的技术报告值得一读很多中国人将DeepSeek-V3视作“国货之光”,也是中国式创新的一个范式。确实,中国聪明的研究人员和工程师非常擅长“多快好省”干大事,在资源紧缺有限的情况下(很多时候我们也不想),通过技术方法的创新和精进,实现超预期的成果。DeepSeek-V3对高性能算力的依赖如此之小,将训练和推理当作一个系统,给出了诸多新的技术思路,注重用工程思维高效解决算法和技术问题,集中力量办大事,这确实是中国公司、中国团队和中国研究人员更擅长的。Alexandr Wang从DeepSeek总结的经验是:美国人在休息,中国人在奋斗,以更低的成本、更快的速度和更强大的战斗力追赶。很有意思,美国科技界对中国比较友善的人士——其中包括马斯克——经常总结中国在一些领域的成功经验是聪明、勤奋和有方法,这当然没什么问题。但它解释不了,至少在AI领域解释不了的一个问题是:中国的其它大模型公司和AI人才同样聪明、勤奋和擅长方法创新,他们的很多技术方法创新也卓有成就(DeepSeek的分布式推理,我第一次注意到类似的创新是月之暗面的Mooncake),但为什么没有引发如此轰动的世界级效应?当然今后他们可能也会,但至少,为什么这次是DeepSeek?
简介:梁文锋出生于1980年代,广东省的一个五线城市(小镇学霸)。他的父亲是一名小学老师。梁文锋的家庭情况较为低调,公开资料中未提及其婚姻与家庭情况。梁文锋毕业于浙江大学,主修软件工程,本硕,人工智能方向。他在大学期间表现出色,展现了对计算机科学和数学的浓厚兴趣。梁文锋非常低调,几乎看不到媒体对他的采访,网上难以发现他的照片。本文编写时找到两篇记者采访,能否了解梁文峰的从量化到AI的背景及动因和抱负,包括创办深度求索储备的数万块GPU,以及如何组织AI本土研究人员。阅读DeepSeek V3的技术报告列出的研发人员名单近200人,均为本土CS,很多核心是清北及大学应届的CS硕博,即便核心人员也是毕业3-5年CS博士,研发人员充分信任不断自我选择,这是中国最像OpenAI研发组织分工和氛围的AI研究机构。本文引用了两篇记者采访,以及梁文峰自己为量化之父西蒙斯自传中文版本写的前序
来自宝玉:https://mp.weixin.qq.com/s/vAp2w-I5ozTw-7R6jreLMw[heading2]获取系统提示词的提示词[heading4]获取后系统提示词如下[heading4]获取后系统提示词(2)如下[heading4]英文系统提示词[heading1]R1和V3技术报告:[content][技术报告解读](https://waytoagi.feishu.cn/wiki/ZXnkwKXr8ipW2YkgFTKcxlXpnHc)[DeepSeek_R1.pdf](https://bytedance.feishu.cn/space/api/box/stream/download/all/S1iVbV8m4oKWMexQPJbcpcInnHf?allow_redirect=1)[DeepSeek_V3.pdf](https://bytedance.feishu.cn/space/api/box/stream/download/all/GuktbBuGto8oOCx0kRJcVy4RnNg?allow_redirect=1)