Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek

Answer

DeepSeek 是一家具有独特特点和影响力的公司:

  1. 其秘方具有硅谷特色:
    • 不是“中国式创新”的产物,不能简单地将其比喻成“AI 界的拼多多”或认为其秘方就是多快好省。
    • 早在 2024 年 5 月 DeepSeek-V2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动。
    • 是中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷味儿的。
  2. V-3 可能是 DeepSeek 的 GPT-3 时刻,未来发展充满未知但值得期待。
  3. 关于提示词 HiDeepSeek:
    • 效果对比:可通过 Coze 做小测试对比。
    • 使用方法:包括搜索 www.deepseek.com 点击“开始对话”、发送装有提示词的代码、阅读开场白后正式开始对话等步骤。
    • 设计思路:将 Agent 封装成 Prompt 并储存在文件,实现多种功能,优化输出质量,设计阈值系统,用 XML 进行规范设定等。
    • 完整提示词:v 1.3。
    • 特别鸣谢:李继刚的【思考的七把武器】提供思考方向,Thinking Claude 是设计灵感来源,Claude 3.5 Sonnet 是得力助手。
Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

一个提示词,让 DeepSeek 的能力更上一层楼?——HiDeepSeek

用Coze做了个小测试,大家可以对比看看[e8c1a8c3012fedad10dc0dfcc8b1e263_raw.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Jz9cbKxDbocGtIxXFFEcdiHjnRc?allow_redirect=1)[heading1]如何使用?[content]Step1:搜索www.deepseek.com,点击“开始对话”Step2:将装有提示词的代码发给DeepseekStep3:认真阅读开场白之后,正式开始对话[heading1]设计思路[content]1.将Agent封装成Prompt,将Prompt储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担2.通过提示词文件,让DeepSeek实现:同时使用联网功能和深度思考功能3.在模型默认能力的基础上优化输出质量,并通过思考减轻AI味,增加可读性4.照猫画虎参考大模型的temperature设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改5.用XML来进行更为规范的设定,而不是用Lisp(对我来说有难度)和Markdown(运行下来似乎不是很稳定)[heading1]完整提示词[heading2]v 1.3[heading1]特别鸣谢[content]李继刚:【思考的七把武器】在前期为我提供了很多思考方向Thinking Claude:这个项目是我现在最喜欢使用的Claude提示词,也是我设计HiDeepSeek的灵感来源Claude 3.5 Sonnet:最得力的助手

Others are asking
kimi、豆包、deepseek的区别和优劣
以下是 kimi、豆包、deepseek 的区别和优劣: 从月活榜来看: deepseek:在月活用户方面表现出色,排名第一,月活用户达 7068 万人,环比变化为 24.3616%。 豆包:月活用户为 779 万人,环比变化为 0.1911%。 kimi:月活用户为 591 万人,环比变化为 0.1135%。 从流量榜来看: deepseek:访问量排名第一,达 22541 万。 豆包:访问量为 3457 万。 kimi:访问量为 3282 万。 在输出效果方面,DeepSeek 的思考与表达被认为碾压了包括豆包和 kimi 在内的其他模型,其思考过程细腻、自洽、深刻、全面,输出结果在语气、结构、逻辑上表现出色。 需要注意的是,这些数据仅反映了一定时期内的情况,且不同模型在不同的应用场景和用户需求下可能具有不同的优势。
2025-02-19
本地部署deepseek
DeepSeek 具有多种含义,包括 DeepSeek 公司(深度求索),其网页和手机应用目前免费,但 API 调用收费。DeepSeek 大模型尤其是具有推理功能的 DeepSeek R1 大模型,权重文件开源,可本地部署。 一夜之间,DeepSeek R1 大模型成为国民刚需,但官网卡顿,不能使用联网搜索等问题困扰了很多人。很多平台上线的版本存在各种不足,本地部署的版本能作为替补,但难以长期使用。 通过工作流 + DeepSeek R1 大模型,可实现联网版的 R1 大模型。实现的核心路径包括:拥有扣子专业版账号(若为普通账号,请自行升级或注册专业号),开通 DeepSeek R1 大模型(访问地址:https://console.volcengine.com/cozepro/overview?scenario=coze ,在火山方舟中找到开通管理,开通服务,并添加在线推理模型),创建智能体。
2025-02-19
我是一个小白,我想要一个deepseek学习路线
以下是为您提供的 DeepSeek 学习路线: 1. 首先,通过相关报道和研究,了解 DeepSeek 在全球 AI 社区的意义,包括技术突破与资源分配策略。重点关注其长上下文能力、量化商业模式以及对 AI 生态系统的深远影响。您可以参考: 2. 深入研究 DeepSeek 在架构和工程上的创新,例如 MoE、MLA、MTP 和 FP8 混合精度训练。思考其在工程和应用平衡中的高效优化方式,以及开源与闭源竞争的相关反思和 AI 生态未来发展方向。相关内容: 3. 了解 DeepSeek R1 模型,它属于基于强化学习 RL 的推理模型,在回答用户问题前会先进行“自问自答”式的推理思考来提升回答质量。理解这种模拟人类深度思考的能力以及其背后独特的“教育方式”。 4. 学习 DeepSeek 深夜发布的大一统模型 JanusPro,它将图像理解和生成统一在一个模型中。了解其具有的两种本领,包括理解模式和画画模式,以及其核心的 DeepSeek 语言模型、特别训练法、与 Diffusion 模型的区别、好处和关键设计等方面。
2025-02-19
我想了解关于Deepseek的信息
以下是关于 DeepSeek 的信息: 1. 华尔街分析师的反应:DeepSeek 展示出媲美领先 AI 产品性能的模型,成本仅为一小部分,在全球主要市场的 App Store 登顶。但 Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑,高盛预测其可能改变科技巨头与初创公司的竞争格局,降低 AI 行业进入门槛。 2. 实际使用体验:在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。数学能力经过优化,表现不错;编程能力略逊于 GPT。采用 GRPO 算法替代传统 PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。 3. 相关链接:
2025-02-19
deepseek最近有什么新进展
DeepSeek 近期有以下新进展: 深夜发布大一统模型 JanusPro,将图像理解和生成统一在一个模型中。 模型(7B):https://huggingface.co/deepseekai/JanusPro7B 模型(1B):https://huggingface.co/deepseekai/JanusPro1B JanusPro 是一种新型的自回归框架,通过将视觉编码解耦为独立的路径解决先前方法的局限性,同时利用单一的统一变压器架构进行处理。解耦缓解了视觉编码器在理解和生成中的角色冲突,增强了框架的灵活性,超越了之前的统一模型,并匹配或超过了特定任务模型的性能,成为下一代统一多模态模型的有力候选者。 在编码任务中已成为社区的最爱,其组合了速度、轻便性和准确性而推出的 deepseekcoderv2。
2025-02-19
关于deepseek的简介
DeepSeek(深度求索)是一家专注于人工智能基础技术研究的科技公司。 公司背景方面: 成立时间:2023 年 9 月。 总部:中国杭州。 定位:聚焦大模型研发与应用,致力于提供高效、安全、可控的 AI 技术解决方案。 关于其模型 DP 模型: 功能:能进行自然语言理解与分析、编程、绘图,如 SVG、MA Max 图表、react 图表等。 使用优势:可以用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容。 存在问题:思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本。 审核方法:可以用其他大模型来解读 DP 模型给出的内容。 使用建议:使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。 使用场景:包括阅读、育儿、写作、随意交流等方面。 此外,Deepseek 相关文档在 3 群和 4 群有分享,也可在 v to a gi 的飞书知识库中搜索获取。未来活动预告包括明天后天在摩纳社区提供免费算力资源带大家学习炼丹,周一晚上学习多维表格中接入 DeepSeek。
2025-02-19