与知识库对话 - deepseek和chatgtp的训练方式有什么不同

回答

DeepSeek R1 的训练方式采用强化学习（RL），跳过了监督微调（SFT）阶段。而 ChatGPT 采用预训练+监督微调（SFT）的方式。

ChatGPT 这种方式适用于知识性问答。DeepSeek R1 能自发进行复杂推理，自我回溯、多角度思考，解题过程更完整，但其计算成本更高。在日常查询方面，GPT-4o 更快、更适合简单咨询。DeepSeek R1 则在高难度数学和编程问题上更具优势，且更加透明，研究细节可复现，权重可下载。

内容由 AI 大模型生成，请仔细甄别（powered by aily）

参考资料

详解：DeepSeek深度推理+联网搜索目前断档第一

App Store排名：DeepSeek R1冲到了美国区App Store第一名，超越了OpenAI的ChatGPT。口碑与技术实力：DeepSeek没有市场部，也没有做任何市场投放，完全依靠技术实力和口碑赢得了用户的认可。[heading2]DeepSeek R1的技术特点[content]性能与成本：DeepSeek R1的效果比肩顶尖闭源模型o1，但价格仅为o1的27分之一。开源与创新：DeepSeek R1的开源让行业认知整体拉齐，得到了全世界的尊重和喜爱。[heading2]DeepSeek R1的创新模型R1 Zero[content]训练方式：R1 Zero跳过了监督微调(SFT)阶段，直接采用强化学习(RL)进行训练。研究结论：模型的思考能力是可以自我涌现出来的，这一发现具有革命性。[heading2]DeepSeek R1的影响[content]行业影响：DeepSeek R1的发布引发了美国科技界的恐慌，Meta内部对DeepSeek V3的出色表现感到震惊。市场影响：DeepSeek R1的低成本和高性能使得英伟达的市场地位受到挑战，其股价短期内大跌超3%，市值蒸发超300亿美元（27日盘前又跌14%）。[heading2]DeepSeek R1的未来展望[content]开源模型的进步：开源模型的进步将超越闭源模型，顶级模型的推理价格急速下降，技术更加普惠平权。AI编程与创作：AI编程将随着模型能力的提高，显著提升效率并降低门槛，AI的创作能力将不断提升，催生更多AI创作的可消费内容形式。

详解：DeepSeek深度推理+联网搜索目前断档第一

宝玉日报

AI识别问题，生成JSON：调用天气查询工具，参数=“上海”。程序调用天气API，获取数据后反馈给AI。AI组织语言输出：“今天上海天气晴转小雨，1度，出门带伞，多穿点衣服。”?[https://x.com/dotey/status/1888104084835647516](https://x.com/dotey/status/1888104084835647516)3⃣️?强化学习如何让大模型学会“思考”？?Andrej Karpathy深度解析ChatGPT和DeepSeek R1GPT-4o采用预训练+监督微调（SFT），适用于知识性问答。DeepSeek R1采用强化学习（RL），能自发进行复杂推理，自我回溯、多角度思考，解题过程更完整。?DeepSeek R1的优势更加透明，研究细节可复现，权重可下载。适用于高难度数学和编程问题，但计算成本更高。日常查询：GPT-4o更快、更适合简单咨询。?[https://x.com/dotey/status/1888095733154201674](https://x.com/dotey/status/1888095733154201674)