Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek

Answer

DeepSeek 不是“中国式创新”的产物,其在硅谷受到关注和追逐并非近期之事。早在 2024 年 5 月 DeepSeek-V2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,相关论文也在 AI 研究界被广泛分享和讨论。而当时在国内,DeepSeek 被描绘成“大模型价格战的发起者”。

DeepSeek 的秘方是硅谷味儿的。如果 V-3 是其 GPT-3 时刻,接下来的发展充满未知,但 DeepSeek 已成为中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷味儿的。

在案例方面,Deepseek 的输出有诸多神来之笔,如在独白文本中自行加入括号中的场景描述,增强画面感,还能预判用户需求,在简洁的提示词输入下,自然想到给输出增加文学性,展现出“高级的智能”,但存在与史实不符的商榷点。

Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

DeepSeek

第四,Deepseek这个输出结果另一个神来之笔,就是在独白文本中“自作主张”地加入了括号中的场景描述。这一操作,一下就让整个输出的画面感扑面而来,读者仿如亲历,而这完全没有在提示词中提出。(“夜风掀动案头《韩非子》,停在"夫妻者,非有骨肉之恩也"那页”)、“(墨迹在"弑"字上晕开一团)这些句子的确很难相信是AI写的。而(“忽然扔笔,抓起铜镜”)这句也隐喻了魏征的名言“以铜为镜,可以正衣襟;以史为镜,可以知兴衰;以人为镜,可以知得失”。你说这AI成精了,我都信。第五,最重要的,DeepSeek预判了用户的需求。再回顾一下我输入的提示词——“玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?”我的输入已经非常简洁了,不能再压缩了,并且没有任何形容词,没有任何倾向性。但神奇的是,它显然知道我要什么,比如这当然不是一个要求精确的数理题,它自然想到要给输出加上文学性,这种预判在很大程度上表现出了“高级的智能”。当然,一个值得商榷的点是,根据史实,魏征是在玄武门之变之后才见到李世民

Others are asking
如何本地部署deepseek
要本地部署 DeepSeek,您可以参考以下步骤: 1. 访问网页链接:www.deepseek.com,点击“开始对话”。 2. 将装有提示词的代码发给 DeepSeek。 3. 认真阅读开场白之后,正式开始对话。 需要注意的是,DeepSeek 是一个非常强大且具有创新性的推理模型,它具有比肩 O1 的推理能力、参数少、训练开销与使用费用小、开源、免费、联网、本土开发等诸多优势。如果您在部署过程中遇到问题,建议您仔细检查每一个步骤是否正确操作。
2025-02-05
如何在服务器上部署deepseek r1
以下是在服务器上部署 DeepSeek R1 的步骤: 1. 环境配置: 访问 DeepSeek 的官网(https://www.deepseek.com/)。 进入右上角的 API 开放平台。 若没有赠送的余额,可以选择充值,支持美元和人民币两种结算方式以及各种个性化的充值方式。 创建一个 API key,注意 API key 只会出现一次,请及时保存下来。 2. 设置代码编辑器: 下载 Cursor(https://www.cursor.com/)或 VSCode(https://code.visualstudio.com/),只要代码编辑器可以下载插件即可。 以 Cursor 作为代码编辑器为例,下载安装后,在插件页面搜索并安装 Roocline。 安装完后,打开三角箭头,就可以看到 RooCline。 选中 RooCline,并点击齿轮,进入设置,依次设置: API Provider:选择 DeepSeek。 API Key:填入已创建的 key。 模型:选择 DeepSeekreasoner。 语言偏好设置。 记得把 HighRisk 选项都打开,这样 AI 才能帮你自动生成文件。最后做完所有不要忘记点击 Done 保存修改。 3. 在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。
2025-02-05
deepseek怎么使用
以下是 DeepSeek 的使用方法: 1. 访问网址:搜索 www.deepseek.com,点击“开始对话”。 2. 发送装有提示词的代码给 DeepSeek。 3. 认真阅读开场白之后,正式开始对话。 此外,DeepSeek 具有以下特点和相关知识: 核心原理认知: AI 特性定位:支持多模态理解,包括文本/代码/数学公式混合输入;具有动态上下文,对话式连续记忆约 4K tokens 上下文窗口;可切换创意生成/逻辑推理/数据分析模式。 系统响应机制:采用意图识别+内容生成双通道处理,自动检测 prompt 中的任务类型/输出格式/知识范围,对位置权重(开头/结尾)、符号强调敏感。 基础指令框架: 四要素模板。 格式控制语法,包括强制结构(使用```包裹格式要求)、占位符标记(用{{}}标注需填充内容)、优先级符号(>表示关键要求,!表示禁止项)。 进阶控制技巧: 思维链引导,如分步标记法、苏格拉底式追问。 知识库调用,包括领域限定指令、文献引用模式。 支持多模态输出。
2025-02-05
deepseek怎么学习
以下是关于学习 DeepSeek 的一些内容: 相关讨论和研究:包括 DeepSeek 在全球 AI 社区的意义、技术突破、资源分配策略、长上下文能力、量化商业模式以及对 AI 生态系统的影响,还有其在架构和工程上的创新,如 MoE、MLA、MTP 和 FP8 混合精度训练等。您可以通过以下链接获取详细信息: 核心原理认知: 多模态理解:支持文本/代码/数学公式混合输入。 动态上下文:对话式连续记忆(约 4K tokens 上下文窗口)。 任务适应性:可切换创意生成/逻辑推理/数据分析模式。 系统响应机制:采用意图识别+内容生成双通道处理,自动检测 prompt 中的任务类型、输出格式、知识范围,对位置权重(开头/结尾)、符号强调敏感。 基础指令框架: 不知道如何表达时可套用框架指令,包括四要素模板、格式控制语法(强制结构、占位符标记、优先级符号)。 进阶控制技巧: 思维链引导:分步标记法、苏格拉底式追问。 知识库调用:领域限定指令、文献引用模式。 多模态输出。 提示词使用: 效果对比:可通过 Coze 做小测试对比。 使用方法:搜索 www.deepseek.com 点击“开始对话”,将装有提示词的代码发给 Deepseek,认真阅读开场白后正式开始对话。 设计思路:将 Agent 封装成 Prompt 并储存在文件,实现同时使用联网和深度思考功能,优化输出质量,设计阈值系统,用 XML 进行规范设定。 完整提示词:v 1.3 特别鸣谢:李继刚、Thinking Claude、Claude 3.5 Sonnet 等为相关工作提供了帮助和灵感。
2025-02-05
如何在极空间部署deepseek
以下是在极空间部署 DeepSeek 的相关信息: 1. 效果对比:用 Coze 做了小测试,可对比查看 2. 如何使用: 搜索 www.deepseek.com,点击“开始对话” 将装有提示词的代码发给 Deepseek 认真阅读开场白之后,正式开始对话 3. 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改 用 XML 来进行更为规范的设定,而不是用 Lisp(对我来说有难度)和 Markdown(运行下来似乎不是很稳定) 4. 完整提示词:v 1.3 5. 特别鸣谢:李继刚的【思考的七把武器】在前期为提供了很多思考方向;Thinking Claude 是最喜欢使用的 Claude 提示词,也是设计 HiDeepSeek 的灵感来源;Claude 3.5 Sonnet 是最得力的助手 6. 环境配置指南: DeepSeek 平台设置:首先到 deepseek 的官网(https://www.deepseek.com/),进入右上角的 API 开放平台。早期 deepseek 有赠送额度,没有赠送余额可选择充值,支持美元和人民币两种结算方式及各种个性化充值方式,创建一个 API key,注意 API key 只会出现一次请及时保存。 设置代码编辑器:下载 cursor(https://www.cursor.com/)或 vscode(https://code.visualstudio.com/),以 cursor 为例,下载安装后在插件页面搜索并安装 Roocline,安装完后打开三角箭头可看到 RooCline,选中并点击齿轮进入设置,依次设置。配置基本参数:API Provider 选择 DeepSeek,API Key 填入已创建的 key,模型选择 DeepSeekreasoner,设置语言偏好。小贴士:记得把 HighRisk 选项都打开,最后做完所有不要忘记点击 Done 保存修改。在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。 7. 评论:游戏科学创始人、黑神话悟空制作人冯骥表示,DeepSeek 可能是个国运级别的科技成果。DeepSeek 具有强大的推理能力、便宜、开源、免费、联网、本土等优势。如果看到这条微博,应直接访问网页链接马上用起来,也有移动 APP。
2025-02-05
deepseek使用指南
以下是 DeepSeek 的使用指南: 1. 核心原理认知: AI 特性定位:支持文本/代码/数学公式混合输入,具有动态上下文(约 4K tokens 上下文窗口)和任务适应性(可切换创意生成/逻辑推理/数据分析模式)。 系统响应机制:采用意图识别+内容生成双通道处理,自动检测 prompt 中的任务类型、输出格式、知识范围,对位置权重(开头/结尾)、符号强调敏感。 2. 基础指令框架: 可以套用框架指令,如果不知道如何表达。 四要素模板示例。 格式控制语法:强制结构使用```包裹格式要求,占位符标记用{{}}标注需填充内容,优先级符号>表示关键要求,!表示禁止项。 3. 进阶控制技巧: 思维链引导:分步标记法,如请逐步思考:1.问题分析→2.方案设计→3.风险评估;苏格拉底式追问,即在得出最终结论前,请先列举三个可能存在的认知偏差。 知识库调用:领域限定指令,如基于 2023 版中国药典,说明头孢类药物的配伍禁忌;文献引用模式,如以 Nature 2022 年发表的论文为参考,解释 CRISPRCas9 最新突破。 4. 使用步骤: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 Deepseek。 认真阅读开场白之后,正式开始对话。 此外,DeepSeek 在设计思路上,将 Agent 封装成 Prompt 并储存在文件,以实现同时使用联网功能和深度思考功能,在模型默认能力基础上优化输出质量等。同时,也有完整提示词 v1.3 版本。
2025-02-05