Chat with Wiki - 关于deepseek，优势与不同

Answer

DeepSeek 的优势主要包括以下几个方面：

核心是推理型大模型，无需用户提供详细步骤指令，能通过理解真实需求和场景提供答案。
能够理解用户用“人话”表达的需求，无需学习和使用特定提示词模板。
在回答问题时能够进行深度思考，而非简单罗列信息。
可以模仿不同作家的文风进行写作，适用于多种文体和场景。

在输出效果方面：

能还原特定的语气，如帝王的语气，且恰到好处，兼顾可读性。
对历史细节异常熟悉，支持“深度探索”和“联网搜索”，能准确还原历史称谓。
输出极其具体且充满惊人的细节，行文的隐喻拿捏高级。

在发展历程中：

2023 年 11 月，先后发布了两款开源模型 DeepSeek Coder 和 DeepSeek LLM，在计算的效率和可扩展性上遇到挑战。
2024 年 5 月，发布 V-2，以混合专家模型和多头潜在注意力机制技术结合，降低模型训练和推理成本，引发广泛讨论和推荐。
2024 年 12 月，发布 V-3，以低成本实现超越同类开源模型的性能，媲美闭源模型，成为里程碑。

与 OpenAI 的区别在于：

OpenAI 致力于实现计算资源规模与成本的无限扩张，DeepSeek 则致力用低成本计算资源实现更高效率。
OpenAI 花两年达到 GPT-3 时刻，DeepSeek 用一年摘得 V-3 圣杯。
OpenAI 在 GPT 路线上一直聚焦预训练的进步，DeepSeek 训练与推理并重。

Content generated by AI large model, please carefully verify (powered by aily)

References

详解：DeepSeek深度推理+联网搜索目前断档第一

先了解下优势和特点[heading3]DeepSeek的特点与优势[content]推理型大模型：DeepSeek的核心是推理型大模型，与指令型大模型不同，它不需要用户提供详细的步骤指令，而是通过理解用户的真实需求和场景来提供答案。更懂人话：DeepSeek能够理解用户用“人话”表达的需求，而不需要用户学习和使用特定的提示词模板。深度思考：DeepSeek在回答问题时能够进行深度思考，而不是简单地罗列信息。文风转换器：DeepSeek可以模仿不同作家的文风进行写作，适用于多种文体和场景。更多提示词技巧请查看[DeepSeek-R1提示词交互实践指南](https://waytoagi.feishu.cn/wiki/ISVZwe05Tio9hEkFSF5cIjZ7nVf)

DeepSeek 提示词方法论

很显然，它的回答是极其优秀的，深入研究，会发现它牛逼在下面几个方面——第一，它首先在语气上还原了一个帝王的语气。而上面其他模型输出尽管表达了意思，但语气完全不对。李世民作为千古一君，绝不可能用上面四家输出结果那样傻的语气说话，而DeepSeek也并没有用力过猛，用相对古典的文字但并没有直接用文言文，体贴地兼顾了可读性。第二，它对历史细节异常熟悉。我猜测这大概率和它支持“深度探索”和“联网搜索”同时开f启有关。“太极宫”、“甘露殿”、“掖庭局”、“观音婢”、“宫门鱼符完全还原了唐初的历史称谓。我特意查了一下，“观音婢”是李世民的长孙皇后的乳名，“掖庭局”是内廷用于史官和其他人员的一个专属机构。"魏徵"我以为是想写“魏征”写错了，后来发现“征”是“徵”的简体字，可以说这个AI非常讲究了。第三，和其他AI泛泛而谈的各种大词不同，Deepseek的输出极其具体而充满惊人的细节。“狼毫蘸墨时发现指尖残留着未洗净的血痂”，“史官们此刻定在掖庭局争吵。该用"诛"还是"戮"，"迫"还是"承"。“只是这次，他不敢触碰我甲胄上元吉的掌印”这些让画面跃然纸上的句子，每一句都没有写“愧疚与野心，挣扎与抱负”，但每一句都写的是“愧疚与野心，挣扎与抱负”，其中行文的隐喻拿捏非常到位，很高级。

DeepSeek 的秘方是硅谷味儿的

1.2023年11月，DeepSeek先后发布了两款开源模型DeepSeek Coder和DeepSeek LLM，只有少数人关注到了，而它们也在计算的效率和可扩展性上遇到了挑战。2.2024年5月，DeepSeek发布了V-2，以混合专家模型（MoE）和多头潜在注意力机制（MLA）技术的结合，大幅降低了模型训练特别是推理的成本，且性能可以在很多维度与世界顶尖模型相比较，它开始引发AI学术界和开发者的广泛讨论和推荐，这是DeepSeek走进更多人视野的开始。3.2024年12月，DeepSeek发布了V-3，以OpenAI、Anthropic和Google百分之一的成本，实现了模型性能超越同类开源模型Llama 3.1和Qwen 2.5，媲美闭源模型GPT-4o和Claude 3.5 Sonnet的成绩，引发轰动，成为世界大语言模型发展的里程碑。可以说，V-3就是DeepSeek的“GPT-3”时刻，一个里程碑。当然，DeepSeek与OpenAI在实现里程碑式跃迁的进程中区别在于——1.OpenAI在这一进程中一直致力于实现计算资源规模与成本的无限扩张，而DeepSeek则一直致力用尽可能低成本的计算资源实现更高的效率。2.OpenAI花了两年时间达到GPT-3时刻，而DeepSeek用了一年摘得了V-3的圣杯。3.OpenAI在GPT路线上一直聚焦在预训练的进步，而DeepSeek则是训练与推理并重——这也是全球模型技术发展趋势的要求。