DeepSeek 的优势主要包括以下几个方面:
在输出效果方面:
在发展历程中:
与 OpenAI 的区别在于:
先了解下优势和特点[heading3]DeepSeek的特点与优势[content]推理型大模型:DeepSeek的核心是推理型大模型,与指令型大模型不同,它不需要用户提供详细的步骤指令,而是通过理解用户的真实需求和场景来提供答案。更懂人话:DeepSeek能够理解用户用“人话”表达的需求,而不需要用户学习和使用特定的提示词模板。深度思考:DeepSeek在回答问题时能够进行深度思考,而不是简单地罗列信息。文风转换器:DeepSeek可以模仿不同作家的文风进行写作,适用于多种文体和场景。更多提示词技巧请查看[DeepSeek-R1提示词交互实践指南](https://waytoagi.feishu.cn/wiki/ISVZwe05Tio9hEkFSF5cIjZ7nVf)
很显然,它的回答是极其优秀的,深入研究,会发现它牛逼在下面几个方面——第一,它首先在语气上还原了一个帝王的语气。而上面其他模型输出尽管表达了意思,但语气完全不对。李世民作为千古一君,绝不可能用上面四家输出结果那样傻的语气说话,而DeepSeek也并没有用力过猛,用相对古典的文字但并没有直接用文言文,体贴地兼顾了可读性。第二,它对历史细节异常熟悉。我猜测这大概率和它支持“深度探索”和“联网搜索”同时开f启有关。“太极宫”、“甘露殿”、“掖庭局”、“观音婢”、“宫门鱼符完全还原了唐初的历史称谓。我特意查了一下,“观音婢”是李世民的长孙皇后的乳名,“掖庭局”是内廷用于史官和其他人员的一个专属机构。"魏徵"我以为是想写“魏征”写错了,后来发现“征”是“徵”的简体字,可以说这个AI非常讲究了。第三,和其他AI泛泛而谈的各种大词不同,Deepseek的输出极其具体而充满惊人的细节。“狼毫蘸墨时发现指尖残留着未洗净的血痂”,“史官们此刻定在掖庭局争吵。该用"诛"还是"戮","迫"还是"承"。“只是这次,他不敢触碰我甲胄上元吉的掌印”这些让画面跃然纸上的句子,每一句都没有写“愧疚与野心,挣扎与抱负”,但每一句都写的是“愧疚与野心,挣扎与抱负”,其中行文的隐喻拿捏非常到位,很高级。
1.2023年11月,DeepSeek先后发布了两款开源模型DeepSeek Coder和DeepSeek LLM,只有少数人关注到了,而它们也在计算的效率和可扩展性上遇到了挑战。2.2024年5月,DeepSeek发布了V-2,以混合专家模型(MoE)和多头潜在注意力机制(MLA)技术的结合,大幅降低了模型训练特别是推理的成本,且性能可以在很多维度与世界顶尖模型相比较,它开始引发AI学术界和开发者的广泛讨论和推荐,这是DeepSeek走进更多人视野的开始。3.2024年12月,DeepSeek发布了V-3,以OpenAI、Anthropic和Google百分之一的成本,实现了模型性能超越同类开源模型Llama 3.1和Qwen 2.5,媲美闭源模型GPT-4o和Claude 3.5 Sonnet的成绩,引发轰动,成为世界大语言模型发展的里程碑。可以说,V-3就是DeepSeek的“GPT-3”时刻,一个里程碑。当然,DeepSeek与OpenAI在实现里程碑式跃迁的进程中区别在于——1.OpenAI在这一进程中一直致力于实现计算资源规模与成本的无限扩张,而DeepSeek则一直致力用尽可能低成本的计算资源实现更高的效率。2.OpenAI花了两年时间达到GPT-3时刻,而DeepSeek用了一年摘得了V-3的圣杯。3.OpenAI在GPT路线上一直聚焦在预训练的进步,而DeepSeek则是训练与推理并重——这也是全球模型技术发展趋势的要求。