Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek

Answer

DeepSeek 是一家具有独特特点和影响力的公司:

  1. 秘方特点:DeepSeek 不是“中国式创新”的产物,其秘方是硅谷味儿的。早在 2024 年 5 月 DeepSeek-V2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动。同时,它在国内舆论场被描摹成“大模型价格战的发起者”,形成了一种平行时空的感觉。
  2. V-3 时刻:如果 V-3 是 DeepSeek 的 GPT-3 时刻,接下来的发展充满未知,但 DeepSeek 应会为全人类的人工智能事业做出更大贡献,且它已是中国最全球化的 AI 公司之一,赢得尊重的秘方也是硅谷味儿的。
  3. 提示词相关:一个提示词“HiDeepSeek”能让 DeepSeek 的能力更上一层楼。通过 Coze 做了效果对比测试,使用方法为:搜索 www.deepseek.com 点击“开始对话”,将装有提示词的代码发给 Deepseek,认真阅读开场白后正式开始对话。其设计思路包括将 Agent 封装成 Prompt 并储存、实现联网和深度思考功能、优化输出质量等,采用 XML 进行规范设定。完整提示词版本为 v1.3,特别鸣谢李继刚和 Thinking Claude 等。
Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

一个提示词,让 DeepSeek 的能力更上一层楼?——HiDeepSeek

用Coze做了个小测试,大家可以对比看看[e8c1a8c3012fedad10dc0dfcc8b1e263_raw.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Jz9cbKxDbocGtIxXFFEcdiHjnRc?allow_redirect=1)[heading1]如何使用?[content]Step1:搜索www.deepseek.com,点击“开始对话”Step2:将装有提示词的代码发给DeepseekStep3:认真阅读开场白之后,正式开始对话[heading1]设计思路[content]1.将Agent封装成Prompt,将Prompt储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担2.通过提示词文件,让DeepSeek实现:同时使用联网功能和深度思考功能3.在模型默认能力的基础上优化输出质量,并通过思考减轻AI味,增加可读性4.照猫画虎参考大模型的temperature设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改5.用XML来进行更为规范的设定,而不是用Lisp(对我来说有难度)和Markdown(运行下来似乎不是很稳定)[heading1]完整提示词[heading2]v 1.3[heading1]特别鸣谢[content]李继刚:【思考的七把武器】在前期为我提供了很多思考方向Thinking Claude:这个项目是我现在最喜欢使用的Claude提示词,也是我设计HiDeepSeek的灵感来源Claude 3.5 Sonnet:最得力的助手

Others are asking
deepseek 进展
DeepSeek 在 AI 领域有以下进展: 在编码任务中已成为社区的最爱,推出了组合速度、轻便性和准确性的 deepseekcoderv2。 发布了 2360 亿参数的 DeepSeekV2,该模型由 60 位专家混合开源,在数学、编码和推理方面表现出色,具有 236B 参数,21B 在生成过程中被激活,在 MTBench 上表现优异,中文能力强且性价比高。
2025-01-23
DeepSeek R1和ChatGPT相比有什么优势?
DeepSeek R1 与 ChatGPT 的优势比较如下: 在数字乘法任务中,ChatGPT 和精简版的隐式 CoT 模型无法达到 100%的准确率,而从头开始训练的 DeepSeek R1 在将扩散采样步骤设置为 1 的情况下,能够保持显著的吞吐量同时达到 100%的准确率。 在数学问题求解常用基准测试中,GPT4 相对于 ChatGPT 表现出显著的改进,GPT4 在许多复杂问题中展示了更深入的理解,并能够应用适当的推理。而 ChatGPT 通常会采用低级启发式方法,提到与问题仅是表面相关的公式和概念,表明缺乏实际理解。
2025-01-22
deepseek免费吗
DeepSeek 目前完全免费。其网址为:https://www.deepseek.com/zh 。国内能访问,网页登录很方便。
2025-01-20
deepseek v3
DeepSeek V3 相关信息如下: 如果 V3 是 DeepSeek 的 GPT3 时刻,接下来的发展充满未知,但有趣的事还在后头,DeepSeek 应会为全人类的人工智能事业做更大贡献,其秘方是硅谷味儿的。 作为中国杭州的人工智能创业公司,DeepSeek 在 2024 年 12 月发布的大语言模型 DeepSeekV3 实现了诸多不可能,以 550 万美元和 2000 块英伟达 H800 GPU 训练出的开源模型,多项评测成绩超越了 Qwen2.572B 和 Llama3.1405B 等顶级开源模型,与 GPT4o 和 Claude 3.5Sonnet 等世界顶级闭源模型不相上下。尽管 OpenAI CEO Sam Altman 发疑似影射其抄袭的推文,但 DeepSeek 收获广泛真诚赞誉,尤其在开源社区。 12 月 27 日发布预览版,参数量 685B,磁盘占用 687.9GB,架构为混合专家模型(MoE),256 个专家,每个 token 使用 8 个专家,竞争对手为 Meta AI 的 Llama 3.1(405B 参数)。亮点包括准确理解复杂和细微查询、知识更新至 2023 年、多语言支持和个性化服务增强、数据安全和隐私保护加强,在 BigCodeBenchHard 排名第一。Aider Polyglot 排行榜预览得分 48.4%,排名第二。相关链接包括详细信息:https://x.com/imxiaohu/status/1872182632584561056 ,模型下载:https://huggingface.co/deepseekai/DeepSeekV3Base/tree/main ,在线体验:https://chat.deepseek.com/sign_in 。 Google 外包人员通过多项指标对 Gemini 和 Claude 进行输出对比,Claude 安全策略最严格,拒绝不安全提示,Gemini 部分回答被标记为“严重安全违规”。
2025-01-20
请介绍一下DeepSeek
DeepSeek 是一家来自中国杭州的人工智能创业公司。 其在 2024 年 12 月发布的大语言模型 DeepSeekV3 引起了广泛关注。该模型以相对较低的成本和较少的硬件资源,在多项评测中取得了优异成绩,与顶级开源和闭源模型不相上下。 HiDeepSeek 是为解决 AI 回答过程不透明问题而设计的工具。它能让 AI 在给出答案时展示思考过程,如先说“让我想想...”再逐步展开分析,最终给出结论。在技术层面,通过特别规则要求 AI 像人类自然思考,可提出疑问、修正错误等。 例如老师使用时,AI 会先分析教学目标、思考学生可能遇到的困难,再设计教学步骤,过程清晰展示。总的来说,HiDeepSeek 让 AI 思维过程透明,虽为模拟,但有助于更好理解和使用 AI。 此外,用 Coze 做了效果对比测试,使用 HiDeepSeek 可通过以下步骤: 1. 搜索 www.deepseek.com,点击“开始对话”。 2. 将装有提示词的代码发给 Deepseek。 3. 认真阅读开场白后正式开始对话。 其设计思路包括: 1. 将 Agent 封装成 Prompt 并储存在文件,保证低成本人人可用,减轻调试负担。 2. 通过提示词文件让 DeepSeek 实现联网和深度思考功能。 3. 在模型默认能力基础上优化输出质量,减轻 AI 味,增加可读性。 4. 设计了阈值系统,可能形式大于实质,后续根据反馈修改。 5. 用 XML 进行规范设定,而非 Lisp 和 Markdown。 完整提示词版本为 v1.3,特别鸣谢了李继刚的【思考的七把武器】提供思考方向,以及 Thinking Claude 和 Claude 3.5 Sonnet。
2025-01-18
你是基于千问还是deepseek的AI?
我不是基于千问也不是基于 deepseek 的 AI ,我是由字节跳动公司独立开发训练的,旨在为您提供全面、专业的 AI 服务和帮助。
2025-01-17