Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek

Answer

DeepSeek 是一家具有独特特点和优势的公司。

DeepSeek 不是“中国式创新”的产物,其在硅谷受到关注和追逐并非近期才发生。早在 2024 年 5 月 DeepSeek-V2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,V2 的论文也在 AI 研究界被广泛分享和讨论。而当时在国内,DeepSeek 被描摹成“大模型价格战的发起者”。这表明 DeepSeek 与硅谷更有对话和交流的密码,其秘方是硅谷味儿的。

如果 V-3 是 DeepSeek 的 GPT-3 时刻,接下来的发展充满未知,但 DeepSeek 作为中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷味儿的。

DeepSeek 是推理型大模型,具有以下特点与优势:

  1. 不需要用户提供详细步骤指令,通过理解用户真实需求和场景提供答案。
  2. 能够理解用户用“人话”表达的需求,无需学习特定提示词模板。
  3. 回答问题时能进行深度思考,而非简单罗列信息。
  4. 可以模仿不同作家的文风进行写作,适用于多种文体和场景。

使用 DeepSeek 的正确方法包括:

  1. 可以扔掉提示词模板,用自然语言描述,直接描述真实场景和具体需求,使用提示词模板也完全没问题。
  2. 在提问时加上“说人话”“小学生能听懂”“菜市场大妈能听懂的话”等,让回答更加通俗易懂。
  3. 激发深度思考,如让 DeepSeek 进行批判性思考、反面思考和复盘,以恢复其深度思考能力。
  4. 通过指定模仿的作家和文体,让 DeepSeek 生成符合特定风格的文本。
Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

详解:DeepSeek深度推理+联网搜索 目前断档第一

先了解下优势和特点[heading3]DeepSeek的特点与优势[content]推理型大模型:DeepSeek的核心是推理型大模型,与指令型大模型不同,它不需要用户提供详细的步骤指令,而是通过理解用户的真实需求和场景来提供答案。更懂人话:DeepSeek能够理解用户用“人话”表达的需求,而不需要用户学习和使用特定的提示词模板。深度思考:DeepSeek在回答问题时能够进行深度思考,而不是简单地罗列信息。文风转换器:DeepSeek可以模仿不同作家的文风进行写作,适用于多种文体和场景。[heading3]使用DeepSeek的正确方法[content]可以扔掉提示词模板:用自然语言描述,直接描述真实场景和具体需求,提示词模板的目的是清晰表达,如果使用也完全没问题。。让DeepSeek“说人话”:在提问时加上“说人话”“小学生能听懂”“菜市场大妈能听懂的话”等,可以让DeepSeek的回答更加通俗易懂。激发深度思考:让DeepSeek进行批判性思考、反面思考和复盘,以恢复其深度思考能力。文风转换:通过指定模仿的作家和文体,让DeepSeek生成符合特定风格的文本。

Others are asking
Deepseek本地部署
DeepSeek 是一项非常出色的科技成果,由一家小规模的年轻中国公司开发完成。它具有以下显著特点: 1. 强大的推理能力,可与 O1 比肩。 2. 成本低廉,参数少,训练开销与使用费用小。 3. 开源,任何人都可自行下载与部署,并提供了详细的论文说明训练步骤与窍门,还有可运行在手机上的 mini 模型。 4. 免费,官方提供的服务完全免费,任何人随时随地可用。 5. 支持联网搜索,是暂时唯一支持联网搜索的推理模型。 如果您想使用 DeepSeek,可以直接访问相关网页链接或移动 APP 马上用起来。 另外,关于本地部署,SDXL 在生成时间上,对于高配电脑如 4080ti 显卡,速度在十秒左右,配置较低的需要自行测试。还可以安装 refine 插件,在文生图界面直接使用 refine 模型进一步绘画。 此外,基于多模态大模型的相关代码开源,有动手能力的小伙伴可以自己部署,如在手机上部署 llava,采用 server 方式需要 9 秒,最快只能加速到 1.5 秒,要达到毫秒级,移动端侧推理才是王道。
2025-02-01
能帮我写一份deepseek的洞察分析报告吗
以下是关于 DeepSeek 的洞察分析报告: 一、用户体验 用户 May 第一次使用 DeepSeek 后,有以下感受: 1. 深度思考过程展示:将如何写白皮书的思考过程全程展示,与习惯的 ChatGPT 黑盒子模式不同,这种坦白的方式体验良好。 2. 回答的白皮内容和排版: 有引用链接:答案的每一句话都标注了引用的网站,方便用户判断出处的严谨性。 有参考文献:直接在文末列出参考的白皮书,为用户查找相关资料提供便利。 回答内容质量:质量不错,没有明显的 AI 痕迹。 二、华尔街分析师的反应 DeepSeek 展示出媲美领先 AI 产品性能的模型,成本仅为一小部分,并在全球主要市场的 App Store 登顶。但也有不同观点,Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑,高盛预测其可能改变科技巨头与初创公司的竞争格局,降低 AI 行业进入门槛。 三、实际使用表现 1. 文字能力:在中文场景中高度符合日常和写作习惯,但在专业论文总结方面稍弱。 2. 数学能力:经过优化,表现不错。 3. 编程能力:略逊于 GPT,据用户反馈。 4. 技术创新:采用 GRPO 算法替代传统 PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。 四、相关动态 复旦大学 OpenMOSS 发布实时语音交互模型。
2025-02-01
查看deepseek v3 技术报告
以下是关于 DeepSeek V3 的相关信息: Andrej Kaparthy 赞扬 Deepseek 的技术报告值得一读。 很多中国人将 DeepSeekV3 视作“国货之光”,它对高性能算力的依赖小,将训练和推理当作一个系统,给出诸多新的技术思路,注重用工程思维高效解决算法和技术问题。 DeepSeek 的创始人梁文锋出生于 1980 年代,来自广东省的一个五线城市,毕业于浙江大学,主修软件工程,本硕,人工智能方向,非常低调。 阅读 DeepSeek V3 的技术报告列出的研发人员名单近 200 人,均为本土 CS,很多核心是清北及大学应届的 CS 硕博,即便核心人员也是毕业 3 5 年 CS 博士,研发人员充分信任不断自我选择,这是中国最像 OpenAI 研发组织分工和氛围的 AI 研究机构。 您可以通过以下链接获取相关技术报告:
2025-01-31
Deepseek网站
DeepSeek 相关信息如下: 一个提示词让 DeepSeek 能力更上一层楼: 效果对比:用 Coze 做了小测试,可对比查看。 如何使用: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 Deepseek。 认真阅读开场白后正式开始对话。 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本人人可用,减轻调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力基础上优化输出质量,减轻 AI 味,增加可读性。 设计阈值系统,可能形式大于实质,之后根据反馈可能修改。 用 XML 进行更规范设定,而非 Lisp 和 Markdown。 完整提示词:v 1.3 特别鸣谢:李继刚、Thinking Claude、Claude 3.5 Sonnet。 Yeadon:cursor 杀手!?超强性价比开发方案曝光!DeepSeekR1+RooCline: 环境配置指南: DeepSeek 平台设置:首先到 deepseek 的官网(https://www.deepseek.com/),进入右上角的 API 开放平台。早期 deepseek 有赠送额度,没有赠送余额可充值,支持美元和人民币两种结算方式及各种个性化充值方式,创建一个 API key,注意及时保存,因为 API key 只会出现一次。 设置代码编辑器:下载 cursor(https://www.cursor.com/)或 vscode(https://code.visualstudio.com/),以 cursor 为例,下载安装后在插件页面搜索并安装 Roocline,安装完打开三角箭头可看到 RooCline,选中并点击齿轮进入设置,依次设置基本参数,包括 API Provider 选择 DeepSeek、填入已创建的 key、选择 DeepSeekreasoner 模型、语言偏好设置等,记得把 HighRisk 选项都打开,最后点击 Done 保存修改,在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。 详解:DeepSeek 深度推理+联网搜索目前断档第一: 评论:游戏科学创始人、黑神话悟空制作人冯骥称 DeepSeek 可能是国运级别的科技成果,V3 已用一个月,R1 仅用 5 天。DeepSeek 做到了强大(比肩 O1 的推理能力)、便宜(参数少,训练开销与使用费用小了一个数量级)、开源(任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可以运行在手机上的 mini 模型)、免费(官方目前提供的服务完全免费,任何人随时随地可用)、联网(暂时唯一支持联网搜索的推理模型)、本土(由没有海外经历甚至没有资深从业经验的本土团队开发完成)。呼吁大家访问网页链接马上用起来,也有移动 APP。
2025-01-31
deepseek
DeepSeek 是一家具有独特特点和优势的公司: 它不是“中国式创新”的产物,其在硅谷受到关注和追逐并非近期才发生。早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新引发小范围轰动,而在国内舆论场却被描摹成“大模型价格战的发起者”。 如果 V3 是 DeepSeek 的 GPT3 时刻,未来充满未知但值得期待,DeepSeek 应能为全人类的人工智能事业做出更大贡献,且已是中国最全球化的 AI 公司之一,其赢得尊重的秘方是硅谷味儿的。 作为推理型大模型,它具有以下特点: 无需用户提供详细步骤指令,能通过理解真实需求和场景提供答案。 能理解用户用“人话”表达的需求,无需特定提示词模板。 回答问题时能深度思考,而非简单罗列信息。 可以模仿不同作家的文风进行写作,适用于多种文体和场景。 使用 DeepSeek 的正确方法包括: 用自然语言描述,直接描述真实场景和具体需求,提示词模板可用可不用。 在提问时加上“说人话”“小学生能听懂”“菜市场大妈能听懂的话”等,让回答更通俗易懂。 激发其进行批判性思考、反面思考和复盘,恢复深度思考能力。 通过指定模仿的作家和文体,让其生成符合特定风格的文本。
2025-01-31
deepseek 使用手册
以下是关于 DeepSeek 的使用手册: 1. 效果对比:用 Coze 做了小测试,可对比查看 2. 如何使用: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 DeepSeek。 认真阅读开场白之后,正式开始对话。 3. 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 用 XML 来进行更为规范的设定,而不是用 Lisp(对我来说有难度)和 Markdown(运行下来似乎不是很稳定)。 4. 完整提示词:v 1.3 5. 特别鸣谢:李继刚的【思考的七把武器】在前期为提供了很多思考方向;Thinking Claude 是现在最喜欢使用的 Claude 提示词,也是设计 HiDeepSeek 的灵感来源;Claude 3.5 Sonnet 是最得力的助手。 6. 使用技巧: DeepSeek 的特点与优势: 推理型大模型:核心是推理型大模型,与指令型大模型不同,它不需要用户提供详细的步骤指令,而是通过理解用户的真实需求和场景来提供答案。 更懂人话:能够理解用户用“人话”表达的需求,而不需要用户学习和使用特定的提示词模板。 深度思考:在回答问题时能够进行深度思考,而不是简单地罗列信息。 文风转换器:可以模仿不同作家的文风进行写作,适用于多种文体和场景。 使用 DeepSeek 的正确方法: 可以扔掉提示词模板:用自然语言描述,直接描述真实场景和具体需求,提示词模板的目的是清晰表达,如果使用也完全没问题。 让 DeepSeek“说人话”:在提问时加上“说人话”“小学生能听懂”“菜市场大妈能听懂的话”等,可以让 DeepSeek 的回答更加通俗易懂。 激发深度思考:让 DeepSeek 进行批判性思考、反面思考和复盘,以恢复其深度思考能力。 文风转换:通过指定模仿的作家和文体,让 DeepSeek 生成符合特定风格的文本。
2025-01-31