Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek

Answer

DeepSeek 具有独特的特点和发展历程:

  • 它不是“中国式创新”的产物,其秘方是硅谷味儿的。早在 2024 年 5 月 DeepSeek-V2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,而当时在国内被描摹成“大模型价格战的发起者”。
  • 如果 V-3 是 DeepSeek 的 GPT-3 时刻,接下来的发展充满未知,但 DeepSeek 已成为中国最全球化的 AI 公司之一,赢得全球尊重的秘方也是硅谷味儿的。
  • 在输出结果方面,Deepseek 有诸多神来之笔,如在独白文本中自行加入括号中的场景描述,增强画面感,还能预判用户需求,在简洁的提示词输入下,自然想到给输出加上文学性,展现出“高级的智能”。但存在根据史实值得商榷的点。
Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

DeepSeek

第四,Deepseek这个输出结果另一个神来之笔,就是在独白文本中“自作主张”地加入了括号中的场景描述。这一操作,一下就让整个输出的画面感扑面而来,读者仿如亲历,而这完全没有在提示词中提出。(“夜风掀动案头《韩非子》,停在"夫妻者,非有骨肉之恩也"那页”)、“(墨迹在"弑"字上晕开一团)这些句子的确很难相信是AI写的。而(“忽然扔笔,抓起铜镜”)这句也隐喻了魏征的名言“以铜为镜,可以正衣襟;以史为镜,可以知兴衰;以人为镜,可以知得失”。你说这AI成精了,我都信。第五,最重要的,DeepSeek预判了用户的需求。再回顾一下我输入的提示词——“玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?”我的输入已经非常简洁了,不能再压缩了,并且没有任何形容词,没有任何倾向性。但神奇的是,它显然知道我要什么,比如这当然不是一个要求精确的数理题,它自然想到要给输出加上文学性,这种预判在很大程度上表现出了“高级的智能”。当然,一个值得商榷的点是,根据史实,魏征是在玄武门之变之后才见到李世民

Others are asking
你能调用deepseekR1的API吗?
DeepSeekR1 的 API 调用步骤如下: 1. 首先到 DeepSeek 的官网(https://www.deepseek.com/),进入右上角的 API 开放平台。 2. 早期 DeepSeek 有赠送额度,如果没有赠送的余额,可以选择去充值。支持美元和人民币两种结算方式,以及各种个性化的充值方式。 3. 创建一个 API key,注意,API key 只会出现一次,请及时保存下来。 4. 接下来,下载 Cursor(https://www.cursor.com/),或者 VSCode(https://code.visualstudio.com/),只要代码编辑器可以下载插件即可。 5. 以 Cursor 作为代码编辑器为例,下载安装后,在插件页面搜索并安装 Roocline。 6. 安装完后,打开三角箭头,就可以看到 RooCline,选中并点击齿轮,进入设置,依次设置: API Provider:选择 DeepSeek。 API Key:填入已创建的 key。 模型:选择 DeepSeekreasoner。 语言偏好设置。 小贴士:记得把 HighRisk 选项都打开,这样 AI 才能帮您自动生成文件。 7. 最后做完所有不要忘记点击 Done 保存修改。 8. 在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。
2025-02-05
DeepSeek可以文生图吗
DeepSeek 可以文生图。 DeepSeek 深夜发布的大一统模型 JanusPro 将图像理解和生成统一在一个模型中。全新的 Emu3 仅通过预测下一个 token 这一建模范式进行训练,可完成文本、图像、视频三种模态数据的理解和生成。Emu3 支持高质量文生图,支持灵活的分辨率和风格。 JanusPro7B 远好于 Janus,更稳定,提示词更短。JanusPro 是一个统一理解和生成多模态语言模型(MLLM),它将多模态理解和生成的视觉编码解耦。 此外,DeepSeek 开源的多模态模型 JanusPro 寓意古罗马双面神雅努斯,既能进行视觉理解,也能生成图像。与 DALLE 3 相比,JanusPro 在参数上领先,并具备图像识别、地标识别等多种能力。该模型通过更优化的训练策略、更海量的数据和更大规模的参数(70 亿)实现了更强的智能表现。
2025-02-05
deepseek的提问方式和指令输入规则是什么
DeepSeek 的提问方式和指令输入规则如下: 核心原理认知: AI 特性定位:支持文本/代码/数学公式混合输入,具有动态上下文(约 4K tokens 上下文窗口)和任务适应性(可切换创意生成/逻辑推理/数据分析模式)。 系统响应机制:采用意图识别+内容生成双通道处理,自动检测 prompt 中的任务类型、输出格式、知识范围,对位置权重(开头/结尾)、符号强调敏感。 基础指令框架: 四要素模板:如果不知道如何表达,可套用框架指令。 格式控制语法:强制结构使用```包裹格式要求,占位符标记用{{}}标注需填充内容,优先级符号>表示关键要求,!表示禁止项。 进阶控制技巧: 思维链引导:分步标记法,如请逐步思考:1.问题分析→2.方案设计→3.风险评估;苏格拉底式追问,在得出最终结论前,请先列举三个可能存在的认知偏差。 知识库调用:领域限定指令,如基于 2023 版中国药典,说明头孢类药物的配伍禁忌;文献引用模式,如以 Nature 2022 年发表的论文为参考,解释 CRISPRCas9 最新突破。 性能监测体系:包括需求理解准确率(复杂需求首轮响应匹配度)、知识迁移能力(跨领域案例应用的合理性)、思维深度指数(解决方案的因果链条长度)。新一代交互范式建议采用「人机共谋」模式、启动「思维可视化」指令、实施「苏格拉底式对话」。通过将深度思考能力与场景化需求结合,可解锁 DeepSeek 的「认知增强」模式,建议通过 3 轮迭代测试(需求表达→深度追问→方案优化)建立个性化交互模式。
2025-02-05
deepseek的背景、能力范围和应用场景
DeepSeek 具有以下背景、能力范围和应用场景: 背景: DeepSeek 以小成本实现了媲美领先 AI 产品的性能,并在全球主要市场 App Store 登顶。 其创始人梁文锋强调团队文化与长远智能探索,引发全球 AI 热潮。 能力范围: 多模态理解:支持文本/代码/数学公式混合输入。 动态上下文:对话式连续记忆(约 4K tokens 上下文窗口)。 任务适应性:可切换创意生成/逻辑推理/数据分析模式。 系统响应机制:采用意图识别+内容生成双通道处理,自动检测 prompt 中的任务类型、输出格式、知识范围,对位置权重(开头/结尾)、符号强调敏感。 基础指令框架:包括四要素模板、格式控制语法等。 进阶控制技巧:如思维链引导、知识库调用、多模态输出等。 中文场景表现优秀,数学能力不错,编程能力逊于 GPT。 采用 GRPO 算法替代传统 PPO,提升语言评价灵活性与训练速度。 应用场景: 日常写作和表达。 数学和编程相关任务。 可基于特定领域如 2023 版中国药典进行知识调用。 能够进行图像理解和生成,如开源的多模态模型 JanusPro 具备图像识别、地标识别等多种能力。
2025-02-05
VS code使用deepseek
以下是关于在 VS code 中使用 DeepSeek 的相关信息: 首先,前往 DeepSeek 的官网(https://www.deepseek.com/),进入右上角的 API 开放平台。早期 DeepSeek 有赠送额度,如果没有赠送余额,可以选择充值,支持美元和人民币两种结算方式以及各种个性化的充值方式,并创建一个 API key,注意 API key 只会出现一次,请及时保存下来。 然后,下载 VS code(https://code.visualstudio.com/),只要代码编辑器可以下载插件即可。 接下来,以 Cursor 作为代码编辑器为例,下载安装后,在插件页面搜索并安装 Roocline。安装完后,打开三角箭头,就可以看到 RooCline,选中 RooCline,并点击齿轮,进入设置,依次设置: 配置基本参数: API Provider:选择 DeepSeek API Key:填入已创建的 key 模型:选择 DeepSeekreasoner 语言偏好设置 小贴士:记得把 HighRisk 选项都打开,这样 AI 才能帮你自动生成文件。 最后做完所有不要忘记点击 Done 保存修改,在聊天框输入产品需求。输入需求后点击星星优化提示词,最终,在 deepseekr1 的加持下基本上能一遍得到想要的结果,各种特效效果交互逻辑正确,画面优雅,交互效果不错。 您还可以在此处(https://docs.cursor.com/context/@symbols/@codebase)查看有关@Codebase 的更多信息。使用 Cursor 代码库聊天时,@Codebase 会进行更详细的搜索。
2025-02-05
deepseek
DeepSeek 不是“中国式创新”的产物,其在硅谷受到关注和追逐并非近期之事。早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,相关论文也在 AI 研究界被广泛分享和讨论。当时在国内舆论场,DeepSeek 被描绘成“大模型价格战的发起者”,形成平行时空的感觉。 DeepSeek 的秘方是硅谷味儿的。如果 V3 是 DeepSeek 的 GPT3 时刻,接下来的发展充满未知,但有趣的事还在后头。DeepSeek 应会为全人类的人工智能事业做出更大贡献,且已是中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷味儿的。 在案例方面,Deepseek 输出结果有诸多神来之笔,如在独白文本中自行加入括号中的场景描述,增强画面感,还能预判用户需求。如对于“玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?”的提示词,能想到给输出加上文学性,展现出“高级的智能”,但存在与史实不符的商榷点。
2025-02-05