Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek

Answer

DeepSeek 是一家具有独特特点和影响力的公司:

  1. 秘方是硅谷味儿的:将其比喻成“AI 界的拼多多”是偏颇的,其在硅谷受到关注和追逐并非近期之事。早在 2024 年 5 月 DeepSeek-V2 发布时,就以多头潜在注意力机制(MLA)架构的创新引发小范围轰动,而当时在国内舆论场被描摹成“大模型价格战的发起者”。这表明 DeepSeek 与硅谷更有对话和交流的密码。
  2. V-3 可能是 DeepSeek 的 GPT-3 时刻:若 V-3 真是如此,接下来的发展未知,但 DeepSeek 应会为全人类的人工智能事业做出更大贡献,且它已是中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷味儿的。
  3. 一个提示词能让 DeepSeek 能力更上一层楼:通过 Coze 做了效果对比测试,使用方法包括搜索 www.deepseek.com 点击“开始对话”,将装有提示词的代码发给 Deepseek,认真阅读开场白后正式开始对话。其设计思路包括将 Agent 封装成 Prompt 并储存在文件、通过提示词文件让 DeepSeek 实现同时使用联网和深度思考功能、优化输出质量等,还采用 XML 进行规范设定。特别鸣谢了李继刚和 Thinking Claude 等。
Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

一个提示词,让 DeepSeek 的能力更上一层楼?——HiDeepSeek

用Coze做了个小测试,大家可以对比看看[e8c1a8c3012fedad10dc0dfcc8b1e263_raw.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/Jz9cbKxDbocGtIxXFFEcdiHjnRc?allow_redirect=1)[heading1]如何使用?[content]Step1:搜索www.deepseek.com,点击“开始对话”Step2:将装有提示词的代码发给DeepseekStep3:认真阅读开场白之后,正式开始对话[heading1]设计思路[content]1.将Agent封装成Prompt,将Prompt储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担2.通过提示词文件,让DeepSeek实现:同时使用联网功能和深度思考功能3.在模型默认能力的基础上优化输出质量,并通过思考减轻AI味,增加可读性4.照猫画虎参考大模型的temperature设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改5.用XML来进行更为规范的设定,而不是用Lisp(对我来说有难度)和Markdown(运行下来似乎不是很稳定)[heading1]完整提示词[heading2]v 1.3[heading1]特别鸣谢[content]李继刚:【思考的七把武器】在前期为我提供了很多思考方向Thinking Claude:这个项目是我现在最喜欢使用的Claude提示词,也是我设计HiDeepSeek的灵感来源Claude 3.5 Sonnet:最得力的助手

Others are asking
请介绍一下DeepSeek
DeepSeek 是一家来自中国杭州的人工智能创业公司。 其在 2024 年 12 月发布的大语言模型 DeepSeekV3 引起了广泛关注。该模型以相对较低的成本和较少的硬件资源,在多项评测中取得了优异成绩,与顶级开源和闭源模型不相上下。 HiDeepSeek 是为解决 AI 回答过程不透明问题而设计的工具。它能让 AI 在给出答案时展示思考过程,如先说“让我想想...”再逐步展开分析,最终给出结论。在技术层面,通过特别规则要求 AI 像人类自然思考,可提出疑问、修正错误等。 例如老师使用时,AI 会先分析教学目标、思考学生可能遇到的困难,再设计教学步骤,过程清晰展示。总的来说,HiDeepSeek 让 AI 思维过程透明,虽为模拟,但有助于更好理解和使用 AI。 此外,用 Coze 做了效果对比测试,使用 HiDeepSeek 可通过以下步骤: 1. 搜索 www.deepseek.com,点击“开始对话”。 2. 将装有提示词的代码发给 Deepseek。 3. 认真阅读开场白后正式开始对话。 其设计思路包括: 1. 将 Agent 封装成 Prompt 并储存在文件,保证低成本人人可用,减轻调试负担。 2. 通过提示词文件让 DeepSeek 实现联网和深度思考功能。 3. 在模型默认能力基础上优化输出质量,减轻 AI 味,增加可读性。 4. 设计了阈值系统,可能形式大于实质,后续根据反馈修改。 5. 用 XML 进行规范设定,而非 Lisp 和 Markdown。 完整提示词版本为 v1.3,特别鸣谢了李继刚的【思考的七把武器】提供思考方向,以及 Thinking Claude 和 Claude 3.5 Sonnet。
2025-01-18
你是基于千问还是deepseek的AI?
我不是基于千问也不是基于 deepseek 的 AI ,我是由字节跳动公司独立开发训练的,旨在为您提供全面、专业的 AI 服务和帮助。
2025-01-17
DeepSeek
DeepSeek 具有独特的特点和发展历程: 秘方是硅谷味儿的:将其比喻成“AI 界的拼多多”是偏颇的,它在 2024 年 5 月发布 DeepSeekV2 时,以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动。同时,在中国舆论场被描摹成“大模型价格战的发起者”,形成平行时空的感觉。DeepSeek 与硅谷更有对话和交流的密码,其秘方具有硅谷风格。 V3 可能是 DeepSeek 的 GPT3 时刻:若 V3 真是如此,未来发展未知,但 DeepSeek 已是中国最全球化的 AI 公司之一,赢得全球尊重的秘方也是硅谷味儿的。 一个提示词能让 DeepSeek 能力更上一层楼:通过 Coze 做效果对比测试,使用方法为在 www.deepseek.com 点击“开始对话”,将装有提示词的代码发给 DeepSeek,阅读开场白后正式开始对话。其设计思路包括将 Agent 封装成 Prompt 并储存于文件、让 DeepSeek 实现联网和深度思考功能、优化输出质量等。完整提示词版本为 v1.3,特别鸣谢李继刚和 Thinking Claude 等。
2025-01-14
Deepseek详细介绍及优势
DeepSeek 是一家中国杭州的人工智能创业公司。其发布的 DeepSeekV2 具有以下特点: 由 60 位专家混合的开源模型,在数学、编码和推理方面表现出色。 拥有 2360 亿参数,其中 210 亿在生成过程中被激活。 在 MTBench 上表现优异,中文能力强且性价比高。 DeepSeekV3 则引发了人工智能界的震撼: 以 550 万美元和 2000 块英伟达 H800 GPU(中国市场的低配版 GPU)训练出的开源模型。 多项评测成绩超越了 Qwen2.572B 和 Llama3.1405B 等顶级开源模型,与 GPT4o 和 Claude 3.5Sonnet 等世界顶级闭源模型不相上下,而训练后者的成本保守估计要数亿美元和几十万块最强劲的英伟达 H100。 DeepSeek 收获了广泛而真诚的赞誉,尤其是在开源社区,受到开发者的支持。 详细介绍可参考以下链接: https://xiaohu.ai/p/7468
2025-01-13
可以简单说下deepseek的原理么
DeepSeek 是中国大模型创业公司中的一员,其背后的量化私募巨头幻方一年前储备了万张 A100 芯片。DeepSeek 发布的 DeepSeek V2 开源模型以低成本的性价比成为行业关注热点,推动了中国大模型价格战的爆发。 DeepSeek 的成功不仅在于技术创新,如提出的 MLA 架构和 DeepSeekMoESparse 结构,还在于其商业模式,即专注于研究和技术创新,而非追求快速商业化。其创始人梁文锋强调了原创式创新的重要性,并讨论了中国 AI 技术创新的未来趋势,以及与硅谷技术社区的差异和交流。 此外,DeepSeek 网站为 https://www.deepseek.com/zh ,使用方便,国内能访问,网页登录便捷,目前完全免费。在生成 2048 游戏代码方面,DeepSeek 对新手较为友好。在 MTBench 上表现优异,中文能力强且性价比高,拥有 2360 亿参数,其中 21B 在生成过程中被激活,60 位专家参与了混合开源模型,在数学、编码和推理方面表现出色。
2025-01-06
请介绍一下deepseek
DeepSeek 是一家低调但引人关注的大模型公司。其发布了 2360 亿参数的 DeepSeekV2 模型,该模型具有以下特点: 由 60 位专家参与的混合开源模型。 在数学、编码和推理方面表现出色。 拥有 236B 参数,其中 21B 在生成过程中被激活。 在 MTBench 上表现优异,中文能力强且性价比高。 关于 DeepSeek 的详细介绍,您可以通过以下链接获取更多信息:https://xiaohu.ai/p/7468 。此外,还有一篇文章《》对其进行了深入报道。
2025-01-04