Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek

Answer

DeepSeek 不是“中国式创新”的产物,其秘方是硅谷味儿的。早在 2024 年 5 月 DeepSeek-V2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,V2 的论文也在 AI 研究界被广泛分享和讨论。当时在国内舆论场,DeepSeek 被描摹成“大模型价格战的发起者”。

如果 V-3 是 DeepSeek 的 GPT-3 时刻,接下来会怎样无人知晓,但有趣的事还在后头。DeepSeek 应会为全人类的人工智能事业做更大贡献,且已是中国最全球化的 AI 公司之一,赢得尊重的秘方也是硅谷味儿的。

DeepSeek 在输出结果方面有一些神来之笔,如在独白文本中自行加入括号中的场景描述,增强画面感,还能预判用户需求。例如对于“玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?”这一简洁输入,能想到给输出加上文学性。但值得商榷的是,根据史实,魏征是在玄武门之变之后才见到李世民。

Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

DeepSeek

第四,Deepseek这个输出结果另一个神来之笔,就是在独白文本中“自作主张”地加入了括号中的场景描述。这一操作,一下就让整个输出的画面感扑面而来,读者仿如亲历,而这完全没有在提示词中提出。(“夜风掀动案头《韩非子》,停在"夫妻者,非有骨肉之恩也"那页”)、“(墨迹在"弑"字上晕开一团)这些句子的确很难相信是AI写的。而(“忽然扔笔,抓起铜镜”)这句也隐喻了魏征的名言“以铜为镜,可以正衣襟;以史为镜,可以知兴衰;以人为镜,可以知得失”。你说这AI成精了,我都信。第五,最重要的,DeepSeek预判了用户的需求。再回顾一下我输入的提示词——“玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?”我的输入已经非常简洁了,不能再压缩了,并且没有任何形容词,没有任何倾向性。但神奇的是,它显然知道我要什么,比如这当然不是一个要求精确的数理题,它自然想到要给输出加上文学性,这种预判在很大程度上表现出了“高级的智能”。当然,一个值得商榷的点是,根据史实,魏征是在玄武门之变之后才见到李世民

Others are asking
我需要用deepseek生成参考文献,我需要指令
以下是关于 DeepSeek 生成参考文献的相关指令: 1. 基础指令框架: 四要素模板:如果不知道如何表达,还是可以套用框架指令。 格式控制语法:强制结构使用```包裹格式要求,占位符标记用{{}}标注需填充内容,优先级符号>表示关键要求,!表示禁止项。 2. 进阶控制技巧: 思维链引导:分步标记法,如请逐步思考:1.问题分析→2.方案设计→3.风险评估;苏格拉底式追问,在得出最终结论前,请先列举三个可能存在的认知偏差。 知识库调用:领域限定指令,如基于 2023 版中国药典,说明头孢类药物的配伍禁忌;文献引用模式,如以 Nature 2022 年发表的论文为参考,解释 CRISPRCas9 最新突破。 3. 高级调试策略: 模糊指令优化:对于宽泛需求,添加维度约束;对于主观表述,量化标准。 迭代优化法:首轮生成获取基础内容,特征强化加强某段的技术细节描述,风格调整改用特定语气并添加结论部分,最终校验检查时间逻辑一致性和可能的事实性错误。 希望这些信息对您有所帮助。
2025-03-14
deepseek论文指令
以下是关于 DeepSeek 提示词的详细内容: 一、核心原理认知 1. AI 特性定位 多模态理解:支持文本/代码/数学公式混合输入。 动态上下文:对话式连续记忆(约 8K tokens 上下文窗口,换算成汉字是 4000 字左右)。 任务适应性:可切换创意生成/逻辑推理/数据分析模式。 2. 系统响应机制 采用意图识别+内容生成双通道。 自动检测 prompt 中的任务类型/输出格式/知识范围。 反馈敏感度:对位置权重(开头/结尾)、符号强调敏感。 二、基础指令框架 1. 四要素模板 2. 格式控制语法 强制结构:使用```包裹格式要求。 占位符标记:用{{}}标注需填充内容。 优先级符号:>表示关键要求,!表示禁止项。 三、进阶控制技巧 1. 思维链引导 分步标记法:请逐步思考:1.问题分析→2.方案设计→3.风险评估。 苏格拉底式追问:在得出最终结论前,请先列举三个可能存在的认知偏差。 2. 知识库调用 领域限定指令:基于 2023 版中国药典,说明头孢类药物的配伍禁忌。 文献引用模式:以 Nature 2022 年发表的论文为参考,解释 CRISPRCas9 最新突破。 3. 多模态输出 四、高级调试策略 1. 模糊指令优化 问题类型:宽泛需求、主观表述。 修正方案:添加维度约束、量化标准。 示例对比:原句“写小说”→修正“创作以 AI 觉醒为背景的悬疑短篇,采用多视角叙事结构”;原句“写得专业些”→修正“符合 IEEE 论文格式,包含 5 项以上行业数据引用”。 2. 迭代优化法 首轮生成:获取基础内容。 特征强化:请加强第三段的技术细节描述。 风格调整:改用学术会议报告语气,添加结论部分。 最终校验:检查时间逻辑一致性,列出可能的事实性错误。 五、行业应用案例 1. 技术开发场景 2. 商业分析场景 六、异常处理方案 1. 信息幻觉:追加请标注所有不确定陈述,并提供验证方法。 2. 格式偏离:使用严格遵循以下模板:第一行...第二行... 3. 深度不足:触发请继续扩展第三章节内容,添加案例佐证。 七、效能监测指标 1. 首次响应准确率:目标>75%。 2. 多轮对话效率:问题解决平均轮次<3。 3. 复杂任务分解:支持 5 级子任务嵌套。 八、高阶能力调用 1. 文风转换矩阵 指令结构:作家风格移植、文体杂交、学术口语化。 效果示例。 2. 领域穿透技术:行业黑话破解→“解释 Web3 领域的'胖协议瘦应用'理论”。 3. 商业决策支持 九、场景化实战策略 1. 创意内容生成 2. 技术方案论证 十、效能增强技巧 1. 对话记忆管理 上下文锚定:“记住当前讨论的芯片型号是麒麟 9010”。 信息回溯:“请复述之前确认的三个设计原则”。 焦点重置:“回到最初讨论的供应链问题”。 2. 输出质量控制 问题类型:过度抽象、信息过载、风格偏移。 修正指令。 十一、特殊场景解决方案 1. 长文本创作 分段接力法:“先完成故事大纲→逐章扩展→最后进行伏笔校验”“确保新章节与前文的三处细节呼应”。 2. 敏感内容处理 概念脱敏法:“用经济学原理类比说明网络审查机制”。 场景移植法:“假设在火星殖民地讨论该议题”。
2025-03-14
如何用deepseek学习写作
以下是关于如何用 DeepSeek 学习写作的一些方法和信息: 1. DeepSeek 深夜发布的大一统模型 JanusPro 能将图像理解和生成统一在一个模型中。它具有理解和生成两种模式,核心是 DeepSeek 语言模型,经过了预训练、监督微调及“精华浓缩法”保存学习成果。其采用 Transformer 大一统模型,具有任务导向、效率考量和架构简洁性等优势,通过参数共享、注意力机制实现图文深度对齐,具有灵活性。 2. WaytoAGI 近期有相关活动,如 DeepSeek+阿里云实训营全新升级上线,可在线直播学习。还有以“反转”为主题的短篇小说投稿活动,投稿地址在通往 AGI 之路腾讯频道【deepseek 专区】。 3. 提升写作能力的方法包括:借助 AI 分析好的文章,如找出最喜欢的文章投喂给 deepseek R1,并多次询问从不同角度的分析;让 AI 对自己写的文章进行点评,给出详细的优缺点分析及提升建议;还可以根据文章内容对作者进行心理侧写。
2025-03-14
如何用deepseek学习写作
以下是关于如何用 DeepSeek 学习写作的相关内容: 1. DeepSeek 的特点: 大一统模型 JanusPro 能将图像理解和生成统一在一个模型中,具有理解图片和生成图片的能力。 核心是 DeepSeek 语言模型,已学习大量知识。 经过预训练、监督微调、用“精华浓缩法”保存学习成果等特别训练法。 采用 Transformer 大一统模型,具有任务导向、效率考量和架构简洁性等优势,如一个大脑两种思维、参数共享、注意力机制和灵活性等关键设计。 2. 相关活动: DeepSeek+阿里云实训营全新升级上线,可在线直播学习稳定调用、开发满血版 DeepSeek 智能体等隐藏玩法。 有以“反转”为主题的短篇小说投稿活动,2 月 16 日晚 8 点截止并现场直播评选。 金融行业·大模型挑战赛初赛阶段(2024/12/3 2025/2/10)。 3. 具体使用方法: 借助 AI 分析好的文章,如找出喜欢的文章投喂给 deepseek R1,从写作角度、读者角度分析,指出缺点和不足及改善空间,对作者进行侧写等。 让 AI 对自己写的文章进行点评,给出详细的优缺点分析、指导和建议。 还可根据文章内容对作者进行心理侧写。
2025-03-14
为什么密塔要接入deepseek
密塔接入 DeepSeek 可能有以下原因: 1. 提升用户的 AI 学习体验:例如学而思接入 DeepSeek“深度思考模式”,预计将在 2 月内陆续于相关机型上线,以全面升级用户的 AI 学习体验。 2. 实现多任务统一:DeepSeek 的 JanusPro 模型将图像理解和生成统一在一个模型中,具有理解和生成两种本领,能够为相关应用提供更综合的能力支持。 3. 高效便捷:DeepSeek 编程工具接入速度较快,国内版本可直接用于编程,无需申请 API 即可使用。 4. 降低编程门槛:鼓励编程实践,降低了编程的门槛,使更多人能够参与其中。 以上信息仅供参考,具体原因可能还需根据密塔的具体需求和规划来确定。
2025-03-13
1、Puzzle 选择一个你(们)感兴趣的社会问题或者现象。 “赛博信仰”指在网络环境下衍生的一系列超现实、寄托心理期许的新兴文化现象。这种现象反映了人们在数字化时代中对精神寄托、心理安慰和未来预测的需求。赛博信仰不仅是一种文化现象,也反映了现代社会中人们对科技、信仰和现实之间关系的重新思考。 2、Facts 关于这个问题/现象,都有哪些基本事实? 比如有人购买电子形式的马克思、爱因斯坦的脑子,象征着对智慧的渴望;借助塔罗测试程序、deepseek算命等AI工具,尝试预知命运;夸赞鹿童、转发锦鲤
关于“赛博信仰”这一现象,目前所了解到的基本事实包括:有人购买电子形式的马克思、爱因斯坦的脑子以象征对智慧的渴望;借助塔罗测试程序、deepseek 算命等 AI 工具尝试预知命运;夸赞鹿童、转发锦鲤等。但目前掌握的相关事实相对有限,还需要进一步的研究和观察来更全面地了解这一现象。
2025-03-13