OpenAI o1、Claude Sonnet 3.7 和 Gemini 2.0 pro 在不同方面具有各自的优势,难以简单地比较哪个的搜索能力更强。
OpenAI o1 推理能力强,适合作为架构师或算法顾问。
Claude Sonnet 3.7 擅长长上下文任务,在快速生成代码与网页设计方面表现出色。
Gemini 2.0 pro 长上下文支持较好(2M Tokens),适合代码反编译与混淆代码分析。
具体的搜索能力表现还会受到应用场景和具体任务的影响。
OpenAI o1:复杂算法与架构设计的首选,推理能力强,适合作为架构师或算法顾问。Claude 3.5/Cursor:快速生成代码与网页设计,Claude擅长长上下文任务,Cursor适合上下文控制较好的IDE开发。v0.dev:网页设计利器,支持设计稿生成网页。Gemini:长上下文支持(2M Tokens),适合代码反编译与混淆代码分析。组合搭配:复杂任务用o1设计,Claude生成代码,其他工具辅助实现网页与单元测试,效率翻倍。🔗详细分享博客:[https://baoyu.io/blog/ai-assisted-coding-tools](https://baoyu.io/blog/ai-assisted-coding-tools)
就我观察而言,大多数人讨论的DeepSeek,基本指的是它的深度思考版本——DeepSeek R1。DeepSeek R1不同于先前的普通模型(如ChatGPT-4、Claude 3.5 sonnet、豆包、通义等),它与OpenAI现在最先进的模型o1、o3一样,同属于一条技术路线:基于强化学习RL的推理(Reasoning)模型。其标志性表现就是,在回答用户问题前,R1会先进行“自问自答”式的推理思考,凭此提升最终回答的质量。这种“自问自答”,并非简单的自言自语,而是AI在模拟人类的深度思考。从用户初始问题“先有鸡还是先有蛋”出发,AI唤醒解决该问题所需的推理逻辑与知识,对问题进行多步推导,为最终回答提供更加完备的思考准备。这种能力,并非凭空而来。如果把AI比作人类,那么DeepSeek R1的“聪明”,源于其背后独特的“教育方式”。——在许多其他的AI模型还在接受“填鸭式教育”时,DeepSeek R1已经率先进入了“自学成才”的新阶段。
👨💻我目前在用哪个LLM模型[@孔某人的低维认知](https://mp.weixin.qq.com/s?__biz=Mzk0MDU2OTk1Ng==&mid=2247484446&idx=1&sn=44fc317ecabfc4ce67c6866109591f54&scene=21#wechat_redirect)API与开发场景:Claude 3.5 Sonnet,o1系列Chat:常规问题用ChatGPT的gpt-4o,复杂问题或设计WorkFlow用Claude写作:在观点调研和改错别字时使用o1-preview开发:在Cursor中使用Claude 3.5 Sonnet 20241022进行代码修改或开发,在Web窗口使用gpt-4o进行技术方案调研AI搜索:PC端使用Google,公众号搜索使用腾讯元宝👨💻My AI Usage these days@Elvis Saraviaclaude-3.5-sonnet:用于大多数创意和写作任务Gemini-1.5-Pro:用于视频相关任务ChatGPT:用于图像分析和Web搜索GPT-4o-mini和Gemini-Flash:用于Agent任务o1-mini:用于推理和知识密集型任务llama-3.1:用于本地LLMMidjourney:用于图像生成Runway:用于视频生成ElevenLabs:用于语音相关内容