Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek

Answer

DeepSeek 是一家具有独特特点和影响力的公司:

  1. 其秘方被认为是硅谷味儿的。将其比喻成“AI 界的拼多多”是偏颇的,它在 2024 年 5 月发布 DeepSeek-V2 时,以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,而当时在国内被描摹成“大模型价格战的发起者”,呈现出平行时空的感觉。
  2. 如果 V-3 是 DeepSeek 的 GPT-3 时刻,接下来的发展充满未知,但 DeepSeek 已成为中国最全球化的 AI 公司之一,赢得全球同行尊重的秘方也是硅谷味儿的。
  3. 一个提示词“HiDeepSeek”能让 DeepSeek 的能力更上一层楼。通过 Coze 做了效果对比测试,使用方法为:搜索 www.deepseek.com 点击“开始对话”,将装有提示词的代码发给 Deepseek,认真阅读开场白后正式开始对话。其设计思路包括将 Agent 封装成 Prompt 并储存在文件、让 DeepSeek 实现同时使用联网和深度思考功能、优化输出质量等。完整提示词版本为 v1.3,特别鸣谢李继刚和 Thinking Claude 等。
Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

一个提示词,让 DeepSeek 的能力更上一层楼?——HiDeepSeek

用Coze做了个小测试,大家可以对比看看[e8c1a8c3012fedad10dc0dfcc8b1e263_raw.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Jz9cbKxDbocGtIxXFFEcdiHjnRc?allow_redirect=1)[heading1]如何使用?[content]Step1:搜索www.deepseek.com,点击“开始对话”Step2:将装有提示词的代码发给DeepseekStep3:认真阅读开场白之后,正式开始对话[heading1]设计思路[content]1.将Agent封装成Prompt,将Prompt储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担2.通过提示词文件,让DeepSeek实现:同时使用联网功能和深度思考功能3.在模型默认能力的基础上优化输出质量,并通过思考减轻AI味,增加可读性4.照猫画虎参考大模型的temperature设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改5.用XML来进行更为规范的设定,而不是用Lisp(对我来说有难度)和Markdown(运行下来似乎不是很稳定)[heading1]完整提示词[heading2]v 1.3[heading1]特别鸣谢[content]李继刚:【思考的七把武器】在前期为我提供了很多思考方向Thinking Claude:这个项目是我现在最喜欢使用的Claude提示词,也是我设计HiDeepSeek的灵感来源Claude 3.5 Sonnet:最得力的助手

Others are asking
你如何评价manus和deepseek的事件性?从里程碑的角度来思考!
从里程碑的角度来看,DeepSeek 在处理这个事件时展现出了强大的语言生成和情境构建能力。它能够根据复杂且细致的需求,在思考 8 秒后生成一段富有历史感、情感深度和符合人物性格处境的独白。这段独白不仅考虑到了时间设定、文学修辞的运用,还兼顾了历史事实和人物的心理活动,展现出了较高的智能水平和创作能力。然而,对于 Manus 在这一事件中的作用或表现,由于提供的内容中未提及,无法进行评价。
2025-03-10
有关Deepseek的知识内容
以下是关于 DeepSeek 的相关知识: 媒体报道和网络文章方面: 微博上热搜,主流媒体全报道。 众多作者发表了关于 DeepSeek 的文章,涵盖基础认知、提示词破解、进阶思考等类型,相关链接包括: 通往 AGI 之路:关于 DeepSeek 的所有事情【知识库持续更新中】,https://mp.weixin.qq.com/s/n0WrrJL0fVX6zLeTBWpZXA 数字生命卡兹克:DeepSeek 的提示词技巧,就是没有技巧,https://zhuanlan.zhihu.com/p/20544736305 (错误) 宝玉:教你如何破解 DeepSeek R1 系统提示词,https://mp.weixin.qq.com/s/vAp2wI5ozTw7R6jreLMw 橘子汽水铺:中国开源,震撼世界:DeepSeek R1 的变革、启示与展望,https://mp.weixin.qq.com/s/yGUgehbxKisVaHlOkxhuaw 橘子汽水铺:自学成才之路,DeepSeek R1 论文解读,https://mp.weixin.qq.com/s/gmdHyh6fsUdj1JhM1sV9bg 新智元:史上首次,DeepSeek 登顶中美 AppStore!NYU 教授:全球「AI 霸权」之争已结束,https://mp.weixin.qq.com/s/ybvV8RMX0yyS5YfG1qNWgg 一支烟花 AI:用流程图对比 DeepSeekR1,OpenAI O1,Claude 说明强化学习在 AI 大模型训练、推理的创新和意义,https://mp.weixin.qq.com/s/mdGtOcg1RuQOEBn31KhxQ 腾讯科技:一文读懂|DeepSeek 新模型大揭秘,为何它能震动全球 AI 圈,https://mp.weixin.qq.com/s/cp4rQx09wygE9uHBadI7RA 张小珺腾讯科技:一场关于 DeepSeek 的高质量闭门会:比技术更重要的是愿景,https://mp.weixin.qq.com/s/a7C5NjHbMGh2CLYk1bhfYw 在 AI 编程与炼金术:Build on Trae 中: 涉及 DeepSeek R1 的章节包括使用 DeepSeek R1 给老外起中文名、申请 DeepSeek R1 API、网页接入 DeepSeek API 等,相关链接包括:
2025-03-10
deepseek如何赋能职场应用实现工作提效?
DeepSeek 可以通过以下方式赋能职场应用实现工作提效: 1. 作为多场景 AI 工具,支持从创意到实现的全流程智能化服务,能快速将创意转化为高质量视频,具备角色一致性技术与分镜自动成片功能,并且支持美学意象风格短片创作。 2. 提供基础模型和深度思考模型两种模式,分别适用于高效便捷任务和复杂推理分析任务。 3. 可用于制作可视化图表、PPT 大纲及设计海报等,通过智能体框架实现人机高效协作。 4. 直接使用 DeepSeek 有多种方法,并且有诸多提示词技巧,在专业场景提效、教育学术赋能、商业创新与生活服务等领域用途广泛,像辅助办公、教学设计、电商运营等。 5. 可以与飞书多维表格结合,实现批量处理信息,提升工作效率,如批量转换文风、快速回复消息、利用 AI 生成文案等,让普通人无需编程知识也能轻松使用 AI。
2025-03-10
deepseek如何赋能职场应用实现工作提效?
DeepSeek 可以通过以下方式赋能职场应用实现工作提效: 1. 作为多场景 AI 工具,支持从创意到实现的全流程智能化服务,能快速将创意转化为高质量视频,具备角色一致性技术与分镜自动成片功能,并且支持美学意象风格短片创作。 2. 提供基础模型和深度思考模型两种模式,分别适用于高效便捷任务和复杂推理分析任务。 3. 用于制作可视化图表、PPT 大纲及设计海报等,通过智能体框架实现人机高效协作。 4. 直接使用 DeepSeek 有多种方法,并且有诸多提示词技巧,在专业场景提效、教育学术赋能、商业创新与生活服务等领域用途广泛,像辅助办公、教学设计、电商运营等。 5. 可以与飞书多维表格结合,实现批量处理信息,提升工作效率,如批量转换文风、快速回复消息、利用 AI 生成文案等。
2025-03-10
DEEPSEEK
DeepSeek 是一家具有独特特点和影响力的公司。 DeepSeek 不是“中国式创新”的产物,将其比喻成“AI 界的拼多多”是偏颇的。早在 2024 年 5 月 DeepSeekV2 发布时,其以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,而当时在国内舆论场被描摹成“大模型价格战的发起者”。这表明 DeepSeek 与硅谷更有对话和交流的密码,其秘方是硅谷味儿的。 如果 V3 是 DeepSeek 的 GPT3 时刻,接下来的发展充满未知,但 DeepSeek 作为中国最全球化的 AI 公司之一,赢得全球同行尊重的秘方也是硅谷味儿的。 一个提示词“HiDeepSeek”能让 DeepSeek 的能力更上一层楼。通过 Coze 做的小测试可进行效果对比。使用方法为:首先搜索 www.deepseek.com 并点击“开始对话”;然后将装有提示词的代码发给 Deepseek;最后认真阅读开场白后正式开始对话。其设计思路包括将 Agent 封装成 Prompt 并储存在文件,通过提示词文件让 DeepSeek 实现同时使用联网和深度思考功能,在模型默认能力基础上优化输出质量等。完整提示词版本为 v1.3,特别鸣谢李继刚的【思考的七把武器】提供思考方向,以及 Thinking Claude 和 Claude 3.5 Sonnet。
2025-03-10
deepseek本地化部署
DeepSeek 的本地化部署相关内容如下: 拥有云服务器时的本地部署方法及满血版本地部署的实际情况。 在 freely.aliyun.com 可领取 500 元免费额度,但有使用限制,不能部署满血版和较大的增流模型。 介绍了 DLC、DSW 和 EAS 等模型部署平台服务的差别。 此外,还包括以下相关内容: 模型蒸馏微调:会带着大家复现模型的蒸馏和微调,并讲解相关知识。 Deepseek R1 模型的制作及相关模型比较:R1 是原生通过强化学习训练出的模型,蒸馏模型是基于数据微调出来的,基础模型能力强,蒸馏微调模型能力也会强。R1 模型通过强化学习,在训练过程中给予模型反馈,如路线规划是否成功到达终点、输出格式是否符合期望等,对正确路线增强权重,使做对的概率变高,导致思考逻辑变长。用 Deepseek RE Zero 蒸馏出带思考的数据,基于 Deepseek V3 微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成 R1。并且 Deepseek R1 反过来蒸馏数据微调 V3,形成互相帮助的局面,使两个模型都更强。 阿里云派平台:以云基础设施和 GPU 算力资源为底层,搭建 AI 框架并做优化,提供一键式快捷部署工具等。与百炼不同,它开放更多自由度,租户数据隔离。很多大模型在此训练,支持多机分布式部署等,既面向企业,也适合个人创业者,不同应用定价有差异。
2025-03-10