DeepSeek R1 的训练方式采用强化学习(RL),跳过了监督微调(SFT)阶段。而 ChatGPT 采用预训练+监督微调(SFT)的方式。
ChatGPT 这种方式适用于知识性问答。DeepSeek R1 能自发进行复杂推理,自我回溯、多角度思考,解题过程更完整,但其计算成本更高。在日常查询方面,GPT-4o 更快、更适合简单咨询。DeepSeek R1 则在高难度数学和编程问题上更具优势,且更加透明,研究细节可复现,权重可下载。
App Store排名:DeepSeek R1冲到了美国区App Store第一名,超越了OpenAI的ChatGPT。口碑与技术实力:DeepSeek没有市场部,也没有做任何市场投放,完全依靠技术实力和口碑赢得了用户的认可。[heading2]DeepSeek R1的技术特点[content]性能与成本:DeepSeek R1的效果比肩顶尖闭源模型o1,但价格仅为o1的27分之一。开源与创新:DeepSeek R1的开源让行业认知整体拉齐,得到了全世界的尊重和喜爱。[heading2]DeepSeek R1的创新模型R1 Zero[content]训练方式:R1 Zero跳过了监督微调(SFT)阶段,直接采用强化学习(RL)进行训练。研究结论:模型的思考能力是可以自我涌现出来的,这一发现具有革命性。[heading2]DeepSeek R1的影响[content]行业影响:DeepSeek R1的发布引发了美国科技界的恐慌,Meta内部对DeepSeek V3的出色表现感到震惊。市场影响:DeepSeek R1的低成本和高性能使得英伟达的市场地位受到挑战,其股价短期内大跌超3%,市值蒸发超300亿美元(27日盘前又跌14%)。[heading2]DeepSeek R1的未来展望[content]开源模型的进步:开源模型的进步将超越闭源模型,顶级模型的推理价格急速下降,技术更加普惠平权。AI编程与创作:AI编程将随着模型能力的提高,显著提升效率并降低门槛,AI的创作能力将不断提升,催生更多AI创作的可消费内容形式。
App Store排名:DeepSeek R1冲到了美国区App Store第一名,超越了OpenAI的ChatGPT。口碑与技术实力:DeepSeek没有市场部,也没有做任何市场投放,完全依靠技术实力和口碑赢得了用户的认可。[heading2]DeepSeek R1的技术特点[content]性能与成本:DeepSeek R1的效果比肩顶尖闭源模型o1,但价格仅为o1的27分之一。开源与创新:DeepSeek R1的开源让行业认知整体拉齐,得到了全世界的尊重和喜爱。[heading2]DeepSeek R1的创新模型R1 Zero[content]训练方式:R1 Zero跳过了监督微调(SFT)阶段,直接采用强化学习(RL)进行训练。研究结论:模型的思考能力是可以自我涌现出来的,这一发现具有革命性。[heading2]DeepSeek R1的影响[content]行业影响:DeepSeek R1的发布引发了美国科技界的恐慌,Meta内部对DeepSeek V3的出色表现感到震惊。市场影响:DeepSeek R1的低成本和高性能使得英伟达的市场地位受到挑战,其股价短期内大跌超3%,市值蒸发超300亿美元(27日盘前又跌14%)。[heading2]DeepSeek R1的未来展望[content]开源模型的进步:开源模型的进步将超越闭源模型,顶级模型的推理价格急速下降,技术更加普惠平权。AI编程与创作:AI编程将随着模型能力的提高,显著提升效率并降低门槛,AI的创作能力将不断提升,催生更多AI创作的可消费内容形式。
AI识别问题,生成JSON:调用天气查询工具,参数=“上海”。程序调用天气API,获取数据后反馈给AI。AI组织语言输出:“今天上海天气晴转小雨,1度,出门带伞,多穿点衣服。”🔗[https://x.com/dotey/status/1888104084835647516](https://x.com/dotey/status/1888104084835647516)3⃣️🧠强化学习如何让大模型学会“思考”?🔍Andrej Karpathy深度解析ChatGPT和DeepSeek R1GPT-4o采用预训练+监督微调(SFT),适用于知识性问答。DeepSeek R1采用强化学习(RL),能自发进行复杂推理,自我回溯、多角度思考,解题过程更完整。📌DeepSeek R1的优势更加透明,研究细节可复现,权重可下载。适用于高难度数学和编程问题,但计算成本更高。日常查询:GPT-4o更快、更适合简单咨询。🔗[https://x.com/dotey/status/1888095733154201674](https://x.com/dotey/status/1888095733154201674)