DeepSeek R1 与 ChatGPT 的深度思考机制存在以下不同:
就我观察而言,大多数人讨论的DeepSeek,基本指的是它的深度思考版本——DeepSeek R1。DeepSeek R1不同于先前的普通模型(如ChatGPT-4、Claude 3.5 sonnet、豆包、通义等),它与OpenAI现在最先进的模型o1、o3一样,同属于一条技术路线:基于强化学习RL的推理(Reasoning)模型。其标志性表现就是,在回答用户问题前,R1会先进行“自问自答”式的推理思考,凭此提升最终回答的质量。这种“自问自答”,并非简单的自言自语,而是AI在模拟人类的深度思考。从用户初始问题“先有鸡还是先有蛋”出发,AI唤醒解决该问题所需的推理逻辑与知识,对问题进行多步推导,为最终回答提供更加完备的思考准备。这种能力,并非凭空而来。如果把AI比作人类,那么DeepSeek R1的“聪明”,源于其背后独特的“教育方式”。——在许多其他的AI模型还在接受“填鸭式教育”时,DeepSeek R1已经率先进入了“自学成才”的新阶段。
AI识别问题,生成JSON:调用天气查询工具,参数=“上海”。程序调用天气API,获取数据后反馈给AI。AI组织语言输出:“今天上海天气晴转小雨,1度,出门带伞,多穿点衣服。”🔗[https://x.com/dotey/status/1888104084835647516](https://x.com/dotey/status/1888104084835647516)3⃣️🧠强化学习如何让大模型学会“思考”?🔍Andrej Karpathy深度解析ChatGPT和DeepSeek R1GPT-4o采用预训练+监督微调(SFT),适用于知识性问答。DeepSeek R1采用强化学习(RL),能自发进行复杂推理,自我回溯、多角度思考,解题过程更完整。📌DeepSeek R1的优势更加透明,研究细节可复现,权重可下载。适用于高难度数学和编程问题,但计算成本更高。日常查询:GPT-4o更快、更适合简单咨询。🔗[https://x.com/dotey/status/1888095733154201674](https://x.com/dotey/status/1888095733154201674)
🔔Xiaohu.AI日报「1月30日」✨✨✨✨✨✨✨✨1⃣️💡ChatGPT悄悄更新了新功能新增“Use more intelligence”(使用更多智能)按钮,点击后变为“Think”可能类似DeepSeek,提供显式推理思考功能🔗[https://x.com/imxiaohu/status/1884963536708972933](https://x.com/imxiaohu/status/1884963536708972933)2⃣️🚨DeepSeek内部数据库泄露超百万条未加密日志泄露,包含用户聊天记录和API密钥该数据库无密码保护,任何人都能访问Wiz研究人员发现后通知DeepSeek,随后数据库被下线🔗[https://x.com/imxiaohu/status/1884959283957338504](https://x.com/imxiaohu/status/1884959283957338504)🔍Wiz团队确认:此次泄露由人为配置错误导致DeepSeek未正确设置访问权限,默认暴露端口无身份验证,任何人可访问数据库详细分析:🔗[https://www.xiaohu.ai/c/xiaohu-ai/deepseek-5988e1](https://www.xiaohu.ai/c/xiaohu-ai/deepseek-5988e1)3⃣️🦙扎克伯格公布Llama 4进展