Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek

Answer

DeepSeek 是一家具有独特特点和影响力的公司:

  1. 其秘方具有硅谷风格:
    • 不是“中国式创新”的产物,不能简单地将其比喻成“AI 界的拼多多”或认为其秘方只是多快好省。
    • 早在 2024 年 5 月 DeepSeek-V2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动。
    • 是中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷风格。
  2. V-3 可能是 DeepSeek 的 GPT-3 时刻,未来发展充满未知但值得期待。
  3. 关于提示词 HiDeepSeek:
    • 效果对比:可通过 Coze 做小测试并对比。
    • 使用方法:包括搜索网站、点击“开始对话”、发送装有提示词的代码、阅读开场白后正式开始对话等步骤。
    • 设计思路:将 Agent 封装成 Prompt 并储存于文件以减轻调试负担,实现联网和深度思考功能,优化输出质量,设计阈值系统,用 XML 进行规范设定等。
    • 完整提示词:v 1.3。
    • 特别鸣谢:李继刚的【思考的七把武器】提供思考方向,Thinking Claude 是设计灵感来源,Claude 3.5 Sonnet 是得力助手。
Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

一个提示词,让 DeepSeek 的能力更上一层楼?——HiDeepSeek

用Coze做了个小测试,大家可以对比看看[e8c1a8c3012fedad10dc0dfcc8b1e263_raw.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Jz9cbKxDbocGtIxXFFEcdiHjnRc?allow_redirect=1)[heading1]如何使用?[content]Step1:搜索www.deepseek.com,点击“开始对话”Step2:将装有提示词的代码发给DeepseekStep3:认真阅读开场白之后,正式开始对话[heading1]设计思路[content]1.将Agent封装成Prompt,将Prompt储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担2.通过提示词文件,让DeepSeek实现:同时使用联网功能和深度思考功能3.在模型默认能力的基础上优化输出质量,并通过思考减轻AI味,增加可读性4.照猫画虎参考大模型的temperature设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改5.用XML来进行更为规范的设定,而不是用Lisp(对我来说有难度)和Markdown(运行下来似乎不是很稳定)[heading1]完整提示词[heading2]v 1.3[heading1]特别鸣谢[content]李继刚:【思考的七把武器】在前期为我提供了很多思考方向Thinking Claude:这个项目是我现在最喜欢使用的Claude提示词,也是我设计HiDeepSeek的灵感来源Claude 3.5 Sonnet:最得力的助手

Others are asking
我需要用deepseek生成参考文献,我需要指令
以下是关于 DeepSeek 生成参考文献的相关指令: 1. 基础指令框架: 四要素模板:如果不知道如何表达,还是可以套用框架指令。 格式控制语法:强制结构使用```包裹格式要求,占位符标记用{{}}标注需填充内容,优先级符号>表示关键要求,!表示禁止项。 2. 进阶控制技巧: 思维链引导:分步标记法,如请逐步思考:1.问题分析→2.方案设计→3.风险评估;苏格拉底式追问,在得出最终结论前,请先列举三个可能存在的认知偏差。 知识库调用:领域限定指令,如基于 2023 版中国药典,说明头孢类药物的配伍禁忌;文献引用模式,如以 Nature 2022 年发表的论文为参考,解释 CRISPRCas9 最新突破。 3. 高级调试策略: 模糊指令优化:对于宽泛需求,添加维度约束;对于主观表述,量化标准。 迭代优化法:首轮生成获取基础内容,特征强化加强某段的技术细节描述,风格调整改用特定语气并添加结论部分,最终校验检查时间逻辑一致性和可能的事实性错误。 希望这些信息对您有所帮助。
2025-03-14
deepseek论文指令
以下是关于 DeepSeek 提示词的详细内容: 一、核心原理认知 1. AI 特性定位 多模态理解:支持文本/代码/数学公式混合输入。 动态上下文:对话式连续记忆(约 8K tokens 上下文窗口,换算成汉字是 4000 字左右)。 任务适应性:可切换创意生成/逻辑推理/数据分析模式。 2. 系统响应机制 采用意图识别+内容生成双通道。 自动检测 prompt 中的任务类型/输出格式/知识范围。 反馈敏感度:对位置权重(开头/结尾)、符号强调敏感。 二、基础指令框架 1. 四要素模板 2. 格式控制语法 强制结构:使用```包裹格式要求。 占位符标记:用{{}}标注需填充内容。 优先级符号:>表示关键要求,!表示禁止项。 三、进阶控制技巧 1. 思维链引导 分步标记法:请逐步思考:1.问题分析→2.方案设计→3.风险评估。 苏格拉底式追问:在得出最终结论前,请先列举三个可能存在的认知偏差。 2. 知识库调用 领域限定指令:基于 2023 版中国药典,说明头孢类药物的配伍禁忌。 文献引用模式:以 Nature 2022 年发表的论文为参考,解释 CRISPRCas9 最新突破。 3. 多模态输出 四、高级调试策略 1. 模糊指令优化 问题类型:宽泛需求、主观表述。 修正方案:添加维度约束、量化标准。 示例对比:原句“写小说”→修正“创作以 AI 觉醒为背景的悬疑短篇,采用多视角叙事结构”;原句“写得专业些”→修正“符合 IEEE 论文格式,包含 5 项以上行业数据引用”。 2. 迭代优化法 首轮生成:获取基础内容。 特征强化:请加强第三段的技术细节描述。 风格调整:改用学术会议报告语气,添加结论部分。 最终校验:检查时间逻辑一致性,列出可能的事实性错误。 五、行业应用案例 1. 技术开发场景 2. 商业分析场景 六、异常处理方案 1. 信息幻觉:追加请标注所有不确定陈述,并提供验证方法。 2. 格式偏离:使用严格遵循以下模板:第一行...第二行... 3. 深度不足:触发请继续扩展第三章节内容,添加案例佐证。 七、效能监测指标 1. 首次响应准确率:目标>75%。 2. 多轮对话效率:问题解决平均轮次<3。 3. 复杂任务分解:支持 5 级子任务嵌套。 八、高阶能力调用 1. 文风转换矩阵 指令结构:作家风格移植、文体杂交、学术口语化。 效果示例。 2. 领域穿透技术:行业黑话破解→“解释 Web3 领域的'胖协议瘦应用'理论”。 3. 商业决策支持 九、场景化实战策略 1. 创意内容生成 2. 技术方案论证 十、效能增强技巧 1. 对话记忆管理 上下文锚定:“记住当前讨论的芯片型号是麒麟 9010”。 信息回溯:“请复述之前确认的三个设计原则”。 焦点重置:“回到最初讨论的供应链问题”。 2. 输出质量控制 问题类型:过度抽象、信息过载、风格偏移。 修正指令。 十一、特殊场景解决方案 1. 长文本创作 分段接力法:“先完成故事大纲→逐章扩展→最后进行伏笔校验”“确保新章节与前文的三处细节呼应”。 2. 敏感内容处理 概念脱敏法:“用经济学原理类比说明网络审查机制”。 场景移植法:“假设在火星殖民地讨论该议题”。
2025-03-14
如何用deepseek学习写作
以下是关于如何用 DeepSeek 学习写作的一些方法和信息: 1. DeepSeek 深夜发布的大一统模型 JanusPro 能将图像理解和生成统一在一个模型中。它具有理解和生成两种模式,核心是 DeepSeek 语言模型,经过了预训练、监督微调及“精华浓缩法”保存学习成果。其采用 Transformer 大一统模型,具有任务导向、效率考量和架构简洁性等优势,通过参数共享、注意力机制实现图文深度对齐,具有灵活性。 2. WaytoAGI 近期有相关活动,如 DeepSeek+阿里云实训营全新升级上线,可在线直播学习。还有以“反转”为主题的短篇小说投稿活动,投稿地址在通往 AGI 之路腾讯频道【deepseek 专区】。 3. 提升写作能力的方法包括:借助 AI 分析好的文章,如找出最喜欢的文章投喂给 deepseek R1,并多次询问从不同角度的分析;让 AI 对自己写的文章进行点评,给出详细的优缺点分析及提升建议;还可以根据文章内容对作者进行心理侧写。
2025-03-14
如何用deepseek学习写作
以下是关于如何用 DeepSeek 学习写作的相关内容: 1. DeepSeek 的特点: 大一统模型 JanusPro 能将图像理解和生成统一在一个模型中,具有理解图片和生成图片的能力。 核心是 DeepSeek 语言模型,已学习大量知识。 经过预训练、监督微调、用“精华浓缩法”保存学习成果等特别训练法。 采用 Transformer 大一统模型,具有任务导向、效率考量和架构简洁性等优势,如一个大脑两种思维、参数共享、注意力机制和灵活性等关键设计。 2. 相关活动: DeepSeek+阿里云实训营全新升级上线,可在线直播学习稳定调用、开发满血版 DeepSeek 智能体等隐藏玩法。 有以“反转”为主题的短篇小说投稿活动,2 月 16 日晚 8 点截止并现场直播评选。 金融行业·大模型挑战赛初赛阶段(2024/12/3 2025/2/10)。 3. 具体使用方法: 借助 AI 分析好的文章,如找出喜欢的文章投喂给 deepseek R1,从写作角度、读者角度分析,指出缺点和不足及改善空间,对作者进行侧写等。 让 AI 对自己写的文章进行点评,给出详细的优缺点分析、指导和建议。 还可根据文章内容对作者进行心理侧写。
2025-03-14
为什么密塔要接入deepseek
密塔接入 DeepSeek 可能有以下原因: 1. 提升用户的 AI 学习体验:例如学而思接入 DeepSeek“深度思考模式”,预计将在 2 月内陆续于相关机型上线,以全面升级用户的 AI 学习体验。 2. 实现多任务统一:DeepSeek 的 JanusPro 模型将图像理解和生成统一在一个模型中,具有理解和生成两种本领,能够为相关应用提供更综合的能力支持。 3. 高效便捷:DeepSeek 编程工具接入速度较快,国内版本可直接用于编程,无需申请 API 即可使用。 4. 降低编程门槛:鼓励编程实践,降低了编程的门槛,使更多人能够参与其中。 以上信息仅供参考,具体原因可能还需根据密塔的具体需求和规划来确定。
2025-03-13
1、Puzzle 选择一个你(们)感兴趣的社会问题或者现象。 “赛博信仰”指在网络环境下衍生的一系列超现实、寄托心理期许的新兴文化现象。这种现象反映了人们在数字化时代中对精神寄托、心理安慰和未来预测的需求。赛博信仰不仅是一种文化现象,也反映了现代社会中人们对科技、信仰和现实之间关系的重新思考。 2、Facts 关于这个问题/现象,都有哪些基本事实? 比如有人购买电子形式的马克思、爱因斯坦的脑子,象征着对智慧的渴望;借助塔罗测试程序、deepseek算命等AI工具,尝试预知命运;夸赞鹿童、转发锦鲤
关于“赛博信仰”这一现象,目前所了解到的基本事实包括:有人购买电子形式的马克思、爱因斯坦的脑子以象征对智慧的渴望;借助塔罗测试程序、deepseek 算命等 AI 工具尝试预知命运;夸赞鹿童、转发锦鲤等。但目前掌握的相关事实相对有限,还需要进一步的研究和观察来更全面地了解这一现象。
2025-03-13