Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

DEEPSEEK

Answer

DeepSeek 是一家具有独特特点和影响力的公司。

DeepSeek 不是“中国式创新”的产物,将其比喻成“AI 界的拼多多”是偏颇的。早在 2024 年 5 月 DeepSeek-V2 发布时,其以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,而当时在国内舆论场被描摹成“大模型价格战的发起者”。这表明 DeepSeek 与硅谷更有对话和交流的密码,其秘方是硅谷味儿的。

如果 V-3 是 DeepSeek 的 GPT-3 时刻,接下来的发展充满未知,但 DeepSeek 作为中国最全球化的 AI 公司之一,赢得全球同行尊重的秘方也是硅谷味儿的。

一个提示词“HiDeepSeek”能让 DeepSeek 的能力更上一层楼。通过 Coze 做的小测试可进行效果对比。使用方法为:首先搜索 www.deepseek.com 并点击“开始对话”;然后将装有提示词的代码发给 Deepseek;最后认真阅读开场白后正式开始对话。其设计思路包括将 Agent 封装成 Prompt 并储存在文件,通过提示词文件让 DeepSeek 实现同时使用联网和深度思考功能,在模型默认能力基础上优化输出质量等。完整提示词版本为 v1.3,特别鸣谢李继刚的【思考的七把武器】提供思考方向,以及 Thinking Claude 和 Claude 3.5 Sonnet。

Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

一个提示词,让 DeepSeek 的能力更上一层楼?——HiDeepSeek

用Coze做了个小测试,大家可以对比看看[e8c1a8c3012fedad10dc0dfcc8b1e263_raw.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Jz9cbKxDbocGtIxXFFEcdiHjnRc?allow_redirect=1)[heading1]如何使用?[content]Step1:搜索www.deepseek.com,点击“开始对话”Step2:将装有提示词的代码发给DeepseekStep3:认真阅读开场白之后,正式开始对话[heading1]设计思路[content]1.将Agent封装成Prompt,将Prompt储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担2.通过提示词文件,让DeepSeek实现:同时使用联网功能和深度思考功能3.在模型默认能力的基础上优化输出质量,并通过思考减轻AI味,增加可读性4.照猫画虎参考大模型的temperature设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改5.用XML来进行更为规范的设定,而不是用Lisp(对我来说有难度)和Markdown(运行下来似乎不是很稳定)[heading1]完整提示词[heading2]v 1.3[heading1]特别鸣谢[content]李继刚:【思考的七把武器】在前期为我提供了很多思考方向Thinking Claude:这个项目是我现在最喜欢使用的Claude提示词,也是我设计HiDeepSeek的灵感来源Claude 3.5 Sonnet:最得力的助手

Others are asking
有关Deepseek的知识内容
以下是关于 DeepSeek 的相关知识: 媒体报道和网络文章方面: 微博上热搜,主流媒体全报道。 众多作者发表了关于 DeepSeek 的文章,涵盖基础认知、提示词破解、进阶思考等类型,相关链接包括: 通往 AGI 之路:关于 DeepSeek 的所有事情【知识库持续更新中】,https://mp.weixin.qq.com/s/n0WrrJL0fVX6zLeTBWpZXA 数字生命卡兹克:DeepSeek 的提示词技巧,就是没有技巧,https://zhuanlan.zhihu.com/p/20544736305 (错误) 宝玉:教你如何破解 DeepSeek R1 系统提示词,https://mp.weixin.qq.com/s/vAp2wI5ozTw7R6jreLMw 橘子汽水铺:中国开源,震撼世界:DeepSeek R1 的变革、启示与展望,https://mp.weixin.qq.com/s/yGUgehbxKisVaHlOkxhuaw 橘子汽水铺:自学成才之路,DeepSeek R1 论文解读,https://mp.weixin.qq.com/s/gmdHyh6fsUdj1JhM1sV9bg 新智元:史上首次,DeepSeek 登顶中美 AppStore!NYU 教授:全球「AI 霸权」之争已结束,https://mp.weixin.qq.com/s/ybvV8RMX0yyS5YfG1qNWgg 一支烟花 AI:用流程图对比 DeepSeekR1,OpenAI O1,Claude 说明强化学习在 AI 大模型训练、推理的创新和意义,https://mp.weixin.qq.com/s/mdGtOcg1RuQOEBn31KhxQ 腾讯科技:一文读懂|DeepSeek 新模型大揭秘,为何它能震动全球 AI 圈,https://mp.weixin.qq.com/s/cp4rQx09wygE9uHBadI7RA 张小珺腾讯科技:一场关于 DeepSeek 的高质量闭门会:比技术更重要的是愿景,https://mp.weixin.qq.com/s/a7C5NjHbMGh2CLYk1bhfYw 在 AI 编程与炼金术:Build on Trae 中: 涉及 DeepSeek R1 的章节包括使用 DeepSeek R1 给老外起中文名、申请 DeepSeek R1 API、网页接入 DeepSeek API 等,相关链接包括:
2025-03-10
deepseek如何赋能职场应用实现工作提效?
DeepSeek 可以通过以下方式赋能职场应用实现工作提效: 1. 作为多场景 AI 工具,支持从创意到实现的全流程智能化服务,能快速将创意转化为高质量视频,具备角色一致性技术与分镜自动成片功能,并且支持美学意象风格短片创作。 2. 提供基础模型和深度思考模型两种模式,分别适用于高效便捷任务和复杂推理分析任务。 3. 可用于制作可视化图表、PPT 大纲及设计海报等,通过智能体框架实现人机高效协作。 4. 直接使用 DeepSeek 有多种方法,并且有诸多提示词技巧,在专业场景提效、教育学术赋能、商业创新与生活服务等领域用途广泛,像辅助办公、教学设计、电商运营等。 5. 可以与飞书多维表格结合,实现批量处理信息,提升工作效率,如批量转换文风、快速回复消息、利用 AI 生成文案等,让普通人无需编程知识也能轻松使用 AI。
2025-03-10
deepseek如何赋能职场应用实现工作提效?
DeepSeek 可以通过以下方式赋能职场应用实现工作提效: 1. 作为多场景 AI 工具,支持从创意到实现的全流程智能化服务,能快速将创意转化为高质量视频,具备角色一致性技术与分镜自动成片功能,并且支持美学意象风格短片创作。 2. 提供基础模型和深度思考模型两种模式,分别适用于高效便捷任务和复杂推理分析任务。 3. 用于制作可视化图表、PPT 大纲及设计海报等,通过智能体框架实现人机高效协作。 4. 直接使用 DeepSeek 有多种方法,并且有诸多提示词技巧,在专业场景提效、教育学术赋能、商业创新与生活服务等领域用途广泛,像辅助办公、教学设计、电商运营等。 5. 可以与飞书多维表格结合,实现批量处理信息,提升工作效率,如批量转换文风、快速回复消息、利用 AI 生成文案等。
2025-03-10
deepseek本地化部署
DeepSeek 的本地化部署相关内容如下: 拥有云服务器时的本地部署方法及满血版本地部署的实际情况。 在 freely.aliyun.com 可领取 500 元免费额度,但有使用限制,不能部署满血版和较大的增流模型。 介绍了 DLC、DSW 和 EAS 等模型部署平台服务的差别。 此外,还包括以下相关内容: 模型蒸馏微调:会带着大家复现模型的蒸馏和微调,并讲解相关知识。 Deepseek R1 模型的制作及相关模型比较:R1 是原生通过强化学习训练出的模型,蒸馏模型是基于数据微调出来的,基础模型能力强,蒸馏微调模型能力也会强。R1 模型通过强化学习,在训练过程中给予模型反馈,如路线规划是否成功到达终点、输出格式是否符合期望等,对正确路线增强权重,使做对的概率变高,导致思考逻辑变长。用 Deepseek RE Zero 蒸馏出带思考的数据,基于 Deepseek V3 微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成 R1。并且 Deepseek R1 反过来蒸馏数据微调 V3,形成互相帮助的局面,使两个模型都更强。 阿里云派平台:以云基础设施和 GPU 算力资源为底层,搭建 AI 框架并做优化,提供一键式快捷部署工具等。与百炼不同,它开放更多自由度,租户数据隔离。很多大模型在此训练,支持多机分布式部署等,既面向企业,也适合个人创业者,不同应用定价有差异。
2025-03-10
Deepseek简介
DeepSeek 是一家专注于人工智能基础技术研究的科技公司,致力于探索 AGI(通用人工智能)的实现路径。公司成立于 2023 年 9 月,总部位于中国杭州,定位是聚焦大模型研发与应用,提供高效、安全、可控的 AI 技术解决方案。 此外,DeepSeek 还有 DeepEP 相关内容,DeepEP 是一个针对混合专家(MoE)和专家并行(EP)的通信库,能提高 GPU 内核之间的吞吐量并降低延时,同时支持低精度操作(例如:FP8),但目前仅支持 Hopper GPU(例如:H100、H800 等)。
2025-03-10
deepseek论文指令
以下是关于 DeepSeek 提示词的详细内容: 一、核心原理认知 1. AI 特性定位 多模态理解:支持文本/代码/数学公式混合输入。 动态上下文:对话式连续记忆(约 8K tokens 上下文窗口,换算成汉字是 4000 字左右)。 任务适应性:可切换创意生成/逻辑推理/数据分析模式。 2. 系统响应机制 采用意图识别+内容生成双通道。 自动检测 prompt 中的任务类型/输出格式/知识范围。 反馈敏感度:对位置权重(开头/结尾)、符号强调敏感。 二、基础指令框架 1. 四要素模板 2. 格式控制语法 强制结构:使用```包裹格式要求。 占位符标记:用{{}}标注需填充内容。 优先级符号:>表示关键要求,!表示禁止项。 三、进阶控制技巧 1. 思维链引导 分步标记法:请逐步思考:1.问题分析→2.方案设计→3.风险评估。 苏格拉底式追问:在得出最终结论前,请先列举三个可能存在的认知偏差。 2. 知识库调用 领域限定指令:基于 2023 版中国药典,说明头孢类药物的配伍禁忌。 文献引用模式:以 Nature 2022 年发表的论文为参考,解释 CRISPRCas9 最新突破。 3. 多模态输出 四、高级调试策略 1. 模糊指令优化 问题类型:宽泛需求、主观表述。 修正方案:添加维度约束、量化标准。 示例对比:原句“写小说”→修正“创作以 AI 觉醒为背景的悬疑短篇,采用多视角叙事结构”;原句“写得专业些”→修正“符合 IEEE 论文格式,包含 5 项以上行业数据引用”。 2. 迭代优化法 首轮生成:获取基础内容。 特征强化:请加强第三段的技术细节描述。 风格调整:改用学术会议报告语气,添加结论部分。 最终校验:检查时间逻辑一致性,列出可能的事实性错误。 五、行业应用案例 1. 技术开发场景 2. 商业分析场景 六、异常处理方案 1. 信息幻觉:追加请标注所有不确定陈述,并提供验证方法。 2. 格式偏离:使用严格遵循以下模板:第一行...第二行... 3. 深度不足:触发请继续扩展第三章节内容,添加案例佐证。 七、效能监测指标 1. 首次响应准确率:目标>75%。 2. 多轮对话效率:问题解决平均轮次<3。 3. 复杂任务分解:支持 5 级子任务嵌套。 八、高阶能力调用 1. 文风转换矩阵 指令结构:作家风格移植、文体杂交、学术口语化。 效果示例。 2. 领域穿透技术 行业黑话破解:“解释 Web3 领域的'胖协议瘦应用'理论”。 商业决策支持。 九、场景化实战策略 1. 创意内容生成 2. 技术方案论证 十、效能增强技巧 1. 对话记忆管理 上下文锚定:“记住当前讨论的芯片型号是麒麟 9010”。 信息回溯:“请复述之前确认的三个设计原则”。 焦点重置:“回到最初讨论的供应链问题”。 2. 输出质量控制 问题类型:过度抽象、信息过载、风格偏移。 修正指令。 十一、特殊场景解决方案 1. 长文本创作 分段接力法:“先完成故事大纲→逐章扩展→最后进行伏笔校验”“确保新章节与前文的三处细节呼应”。 2. 敏感内容处理 概念脱敏法:“用经济学原理类比说明网络审查机制”。 场景移植法:“假设在火星殖民地讨论该议题”。
2025-03-09