Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek

Answer

DeepSeek 是一家具有独特特点和影响力的公司:

  1. 其秘方是硅谷味儿的。将其比喻成“AI 界的拼多多”是偏颇的,它在 2024 年 5 月发布 DeepSeek-V2 时,以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动。当时在国内舆论场被描摹成“大模型价格战的发起者”,形成平行时空的感觉。
  2. 如果 V-3 是 DeepSeek 的 GPT-3 时刻,接下来的发展充满未知,但 DeepSeek 已成为中国最全球化的 AI 公司之一,赢得全球同行尊重的秘方也是硅谷味儿的。
  3. 一个提示词“HiDeepSeek”能让 DeepSeek 的能力更上一层楼。通过 Coze 做了效果对比测试,使用方法为:搜索 www.deepseek.com 点击“开始对话”,将装有提示词的代码发给 Deepseek,认真阅读开场白后正式开始对话。其设计思路包括将 Agent 封装成 Prompt 并储存、实现联网和深度思考功能、优化输出质量、设计阈值系统、用 XML 进行规范设定等。完整提示词版本为 v1.3,特别鸣谢李继刚和 Thinking Claude 等。
Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

一个提示词,让 DeepSeek 的能力更上一层楼?——HiDeepSeek

用Coze做了个小测试,大家可以对比看看[e8c1a8c3012fedad10dc0dfcc8b1e263_raw.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Jz9cbKxDbocGtIxXFFEcdiHjnRc?allow_redirect=1)[heading1]如何使用?[content]Step1:搜索www.deepseek.com,点击“开始对话”Step2:将装有提示词的代码发给DeepseekStep3:认真阅读开场白之后,正式开始对话[heading1]设计思路[content]1.将Agent封装成Prompt,将Prompt储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担2.通过提示词文件,让DeepSeek实现:同时使用联网功能和深度思考功能3.在模型默认能力的基础上优化输出质量,并通过思考减轻AI味,增加可读性4.照猫画虎参考大模型的temperature设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改5.用XML来进行更为规范的设定,而不是用Lisp(对我来说有难度)和Markdown(运行下来似乎不是很稳定)[heading1]完整提示词[heading2]v 1.3[heading1]特别鸣谢[content]李继刚:【思考的七把武器】在前期为我提供了很多思考方向Thinking Claude:这个项目是我现在最喜欢使用的Claude提示词,也是我设计HiDeepSeek的灵感来源Claude 3.5 Sonnet:最得力的助手

Others are asking
deepseek资料
以下是关于 DeepSeek 的相关资料: 2025 年 2 月 6 日的智能纪要中,DP 模型能进行自然语言理解与分析、编程、绘图(如 SVG、MA Max 图表、react 图表等),使用优势是可以用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容,但存在思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本。审核方法可以用其他大模型来解读其给出的内容。使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。使用场景包括阅读、育儿、写作、随意交流等方面,还有案例展示,如通过与孩子共读时制作可视化互动游戏,以及左脚踩右脚式的模型交互。此外,还分享了音系学和与大模型互动的内容,如通过对比不同模型的回答来深入理解音系学,与大模型进行多轮对话来取队名。 1 月 27 日的宝玉日报中,包括拾象关于 DeepSeek r1 闭门学习讨论,讨论了其在全球 AI 社区的意义,如技术突破与资源分配策略,突出了长上下文能力、量化商业模式及对 AI 生态系统的影响,分析了创新路径及中国在 AI 追赶中的潜力与挑战。还有转自 Archerman Capital 关于 DeepSeek 的研究和思考,深入解析其在架构和工程上的创新,如 MoE、MLA、MTP 和 FP8 混合精度训练,强调不是简单模仿,对开源与闭源竞争进行了反思,并指出 AI 生态未来发展方向。 集合·DeepSeek 提示词方法论中,提供了一些相关文章和链接,如南瓜博士的相关文章,以及 DeepSeek 官方提示词和最新文章观点学术报告及业界评论的链接。同时还有 R1 模型的一些使用建议。 DeepSeek 的相关文档在 3 群和 4 群有分享,也可在 v to a gi 的飞书知识库中搜索获取。未来活动预告包括明天后天在摩纳社区提供免费算力资源带大家学习炼丹,周一晚上学习多维表格中接入 DeepSeek。
2025-02-08
deepseek
DeepSeek 是一家具有独特特点和影响力的公司: 1. 其秘方具有硅谷风格: 不是“中国式创新”的产物,不能简单地将其比喻成“AI 界的拼多多”或认为其秘方就是多快好省。 早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动。 是中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷风格。 2. V3 可能是 DeepSeek 的 GPT3 时刻,未来发展充满未知但值得期待。 3. 关于提示词 HiDeepSeek: 效果对比:可通过 Coze 做小测试并对比。 使用方法:包括搜索网站、点击“开始对话”、发送装有提示词的代码、阅读开场白后开始对话等步骤。 设计思路:将 Agent 封装成 Prompt 并储存于文件以减轻调试负担,实现联网和深度思考功能,优化输出质量,设计阈值系统,用 XML 进行规范设定等。 完整提示词:v 1.3。 特别鸣谢:李继刚的【思考的七把武器】提供思考方向,Thinking Claude 是设计灵感来源,Claude 3.5 Sonnet 是得力助手。
2025-02-08
deepseek是不是国内通用大模型第一名
DeepSeek 是在国内表现出色的模型之一。它发布的大一统模型 JanusPro 将图像理解和生成统一在一个模型中,具有统一 Transformer 架构,提供 1B 和 7B 两种规模,全面开源,支持商用,部署使用便捷,Benchmark 表现优异,能力更全面。同时,在 LMSYS 排行榜上,由 DeepSeek 等开发的模型取得了优异成绩,尤其在数学和编程方面表现出色。DeepSeek 在推理过程中通过多头隐式注意力减少内存需求,并且改进了 MoE 架构。但不能简单地说 DeepSeek 就是国内通用大模型第一名,其在不同方面的表现还需综合评估。
2025-02-08
稳定使用DeepSeek的方法
以下是稳定使用 DeepSeek 的方法: 1. 访问网址:搜索 www.deepseek.com,点击“开始对话”。 2. 操作步骤: 将装有提示词的代码发给 DeepSeek。 认真阅读开场白之后,正式开始对话。 3. 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 用 XML 来进行更为规范的设定,而不是用 Lisp(对开发者有难度)和 Markdown(运行下来似乎不是很稳定)。 此外,DeepSeek 在一些案例中也有出色表现,比如在卫夕指北的案例中,经过细腻、严谨、自洽、深刻的思考,输出了符合要求的结果。 在获取 2048 游戏代码方面,DeepSeek 具有诸多优势,如国内能访问、网页登录方便、目前完全免费等。同时,也介绍了其他获取代码的工具和方法,如 Cursor 等。
2025-02-08
告诉我最新的国际ai资讯(比如从2024年有什么ai被发明了,国际上一共有什么大的ai公司,中国的ai发展的怎么样了(deepseek怎么样))
以下是为您整理的最新国际 AI 资讯: 2024 年 2 月 5 日:百度智能云成功点亮昆仑芯三代万卡集群,这是国内首个正式点亮的自研万卡集群。 在 Lex Fridman 的播客中,Dylan Patel 和 Nathan Lambert 深入探讨了中国的 DeepSeek AI 模型,特别是 DeepSeekV3 和 DeepSeekR1。Nathan 强调 DeepSeek 是最开放的模型之一,采用 MIT 许可,鼓励商业用途,推动行业走向开源。 2025 年 AI 语音助手研究显示,语音技术是 AI 应用的关键,企业和用户都将受益。2024 年将是语音助手快速发展的时期,技术不断升级,市场竞争加剧,涌现出多种创业公司。未来,AI 语音将成为服务的“万能钥匙”,应用场景广泛,从医疗到教育,推动行业变革与创新。 2024 年 1 月 17 日:随着预训练技术遭遇瓶颈,GPT5 迟迟未能问世,从业者开始从不同角度寻找突破。以 o1 为标志,大模型正式迈入“PostTraining”时代;开源发展迅猛,Llama 3.1 首次击败闭源模型;中国本土大模型 DeepSeek V3,在 GPT4o 发布仅 7 个月后,用 1/10 算力实现了几乎同等水平。同时,大模型的日渐成熟也让产业重心从基础模型转向应用落地。AI 在编程领域爆发,“数字员工”崛起。 李飞飞在访谈中探讨了 AI Agent 的发展及其未来。她强调 AI Agent 应作为工具和赋能者,而非主导者,确保人们的自主性。李飞飞回顾了 ImageNet 的创立背景,并提到正在推动的“空间智能”概念,旨在理解和融合物理与数字三维世界。她认为,未来这两者的界限将逐渐模糊,从而带来更大变革。
2025-02-08
你与Deepseek比较,如何
以下是关于 DeepSeek 的相关信息: DeepSeek 训练成本远高于传闻,总计约 13 亿美元,定价低于实际成本导致高额亏损。MixtureofExpert 方法降低计算需求,但大规模内存使用可能增加总成本。 Mistral AI 曾获法国政府、英伟达、a16z 等支持,估值达 20 亿美元,但被中国 DeepSeek 迅速赶超,DeepSeek 的“极简算力”模式可能削弱 Mistral 的竞争优势。 将 DeepSeek 比喻成“AI 界的拼多多”是偏颇的,DeepSeek 在硅谷受到关注和追逐,早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新引发小范围轰动。 有对 DeepSeek“低成本”AI 的批评,用洋垃圾进行比喻,讽刺其为空洞的营销噱头。 以上信息来源包括相关网站和社交媒体的分享。
2025-02-08