Chat with Wiki - deepseek

Answer

DeepSeek 不是“中国式创新”的产物，其在硅谷受到关注和追逐并非近期之事。早在 2024 年 5 月 DeepSeek-V2 发布时，就以多头潜在注意力机制（MLA）架构的创新在硅谷引发小范围轰动，相关论文也在 AI 研究界被广泛分享和讨论。当时在国内舆论场，DeepSeek 被描绘成“大模型价格战的发起者”，形成平行时空般的差异。这表明 DeepSeek 的秘方是硅谷味儿的。

如果 V-3 是 DeepSeek 的 GPT-3 时刻，接下来的发展充满未知，但 DeepSeek 已成为中国最全球化的 AI 公司之一，赢得全球同行甚至对手尊重的秘方也是硅谷味儿的。

DeepSeek 在输出结果方面有诸多神来之笔，如在独白文本中自行加入括号中的场景描述，增强画面感，还能预判用户需求。例如对于“玄武门之变结束的当天，李世民在深夜写下一段独白，你觉得他会写什么？”这一简洁输入，能想到给输出加上文学性。但值得商榷的是，根据史实，魏征是在玄武门之变之后才见到李世民。

Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的，认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡，也都因为缺卡而拼命搞架构创新，这点没什么不同。要知道，DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候，它就以多头潜在注意力机制（MLA）架构的创新，在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时，一个非常有意思的现象是：X和Reddit上AI从业者在讨论DeepSeek-V2，同时，DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”，有点平行时空的感觉。这也许能说明：DeepSeek跟硅谷更有对话和交流的密码，它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻，那接下来将发生什么？是DeepSeek的GPT-3.5——也就是ChatGPT时刻，或是其它？没人知道，但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在，它也理应为全人类的人工智能事业做出更大的贡献。无论如何，DeepSeek已经是中国最全球化的AI公司之一，它赢得来自全球同行甚至对手的尊重的秘方，也是硅谷味儿的。

DeepSeek

第四，Deepseek这个输出结果另一个神来之笔，就是在独白文本中“自作主张”地加入了括号中的场景描述。这一操作，一下就让整个输出的画面感扑面而来，读者仿如亲历，而这完全没有在提示词中提出。（“夜风掀动案头《韩非子》，停在"夫妻者，非有骨肉之恩也"那页”）、“（墨迹在"弑"字上晕开一团）这些句子的确很难相信是AI写的。而（“忽然扔笔，抓起铜镜”）这句也隐喻了魏征的名言“以铜为镜，可以正衣襟；以史为镜，可以知兴衰；以人为镜，可以知得失”。你说这AI成精了，我都信。第五，最重要的，DeepSeek预判了用户的需求。再回顾一下我输入的提示词——“玄武门之变结束的当天，李世民在深夜写下一段独白，你觉得他会写什么？”我的输入已经非常简洁了，不能再压缩了，并且没有任何形容词，没有任何倾向性。但神奇的是，它显然知道我要什么，比如这当然不是一个要求精确的数理题，它自然想到要给输出加上文学性，这种预判在很大程度上表现出了“高级的智能”。当然，一个值得商榷的点是，根据史实，魏征是在玄武门之变之后才见到李世民