Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek的优势

Answer

DeepSeek 的优势包括以下几个方面:

  1. 核心是推理型大模型,不需要用户提供详细步骤指令,能通过理解用户真实需求和场景提供答案。
  2. 能够理解用户用“人话”表达的需求,无需用户学习和使用特定提示词模板。
  3. 在回答问题时能够进行深度思考,而非简单罗列信息。
  4. 可以模仿不同作家的文风进行写作,适用于多种文体和场景。
  5. 在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯。
  6. 数学能力经过优化,表现不错。
  7. 展示出媲美领先 AI 产品性能的模型,但成本仅为其一小部分,在全球主要市场的 App Store 登顶。

需要注意的是,DeepSeek 在专业论文总结方面稍弱,编程能力略逊于 GPT(据用户反馈)。

Content generated by AI large model, please carefully verify (powered by aily)

References

详解:DeepSeek深度推理+联网搜索 目前断档第一

先了解下优势和特点[heading2]DeepSeek的特点与优势[content]推理型大模型:DeepSeek的核心是推理型大模型,与指令型大模型不同,它不需要用户提供详细的步骤指令,而是通过理解用户的真实需求和场景来提供答案。更懂人话:DeepSeek能够理解用户用“人话”表达的需求,而不需要用户学习和使用特定的提示词模板。深度思考:DeepSeek在回答问题时能够进行深度思考,而不是简单地罗列信息。文风转换器:DeepSeek可以模仿不同作家的文风进行写作,适用于多种文体和场景。更多提示词技巧请查看[DeepSeek-R1提示词交互实践指南](https://waytoagi.feishu.cn/wiki/ISVZwe05Tio9hEkFSF5cIjZ7nVf)

XiaoHu.AI日报

🔔Xiaohu.AI日报「1月27日」✨✨✨✨✨✨✨✨1⃣️💹华尔街分析师对DeepSeek的反应:DeepSeek展示出媲美领先AI产品性能的模型,但成本仅为其一小部分,在全球主要市场的App Store登顶。Jefferies警告其技术可能打破资本开支狂热,Citi对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局,降低AI行业进入门槛。🔗[https://www.xiaohu.ai/c/xiaohu-ai/deepseek](https://www.xiaohu.ai/c/xiaohu-ai/deepseek)2⃣️📝DeepSeek的实际使用体验:在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。数学能力经过优化,表现不错;编程能力略逊于GPT,据用户反馈。GRPO算法替代传统PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。🔗[https://x.com/imxiaohu/status/1883843200756170873](https://x.com/imxiaohu/status/1883843200756170873)🔗[https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43](https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43)3⃣️🎙️复旦大学OpenMOSS发布实时语音交互模型:

XiaoHu.AI日报

🔔Xiaohu.AI日报「1月27日」✨✨✨✨✨✨✨✨1⃣️💹华尔街分析师对DeepSeek的反应:DeepSeek展示出媲美领先AI产品性能的模型,但成本仅为其一小部分,在全球主要市场的App Store登顶。Jefferies警告其技术可能打破资本开支狂热,Citi对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局,降低AI行业进入门槛。🔗[https://www.xiaohu.ai/c/xiaohu-ai/deepseek](https://www.xiaohu.ai/c/xiaohu-ai/deepseek)2⃣️📝DeepSeek的实际使用体验:在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。数学能力经过优化,表现不错;编程能力略逊于GPT,据用户反馈。GRPO算法替代传统PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。🔗[https://x.com/imxiaohu/status/1883843200756170873](https://x.com/imxiaohu/status/1883843200756170873)🔗[https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43](https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43)3⃣️🎙️复旦大学OpenMOSS发布实时语音交互模型:

Others are asking
deepseek
DeepSeek 是一家具有独特特点和影响力的公司: 1. 其秘方具有硅谷风格: 不是“中国式创新”的产物,不能简单地将其比喻成“AI 界的拼多多”或认为其秘方只是多快好省。 早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动。 是中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷风格。 2. V3 可能是 DeepSeek 的 GPT3 时刻,未来发展充满未知但值得期待。 3. 关于提示词 HiDeepSeek: 效果对比:可通过 Coze 做小测试并对比。 使用方法:包括搜索网站、点击“开始对话”、发送装有提示词的代码、阅读开场白后开始对话等步骤。 设计思路:将 Agent 封装成 Prompt 并储存在文件,实现多种功能,优化输出质量,设计阈值系统,用 XML 进行规范设定等。 完整提示词:v 1.3。 特别鸣谢:李继刚的【思考的七把武器】提供思考方向,Thinking Claude 是设计灵感来源,Claude 3.5 Sonnet 是得力助手。
2025-02-20
deepseek怎么用
以下是关于 DeepSeek 的使用方法: 1. 访问 www.deepseek.com ,点击“开始对话”。 2. 将装有提示词的代码发给 DeepSeek 。 3. 认真阅读开场白之后,正式开始对话。 此外,获取 DeepSeekR1 满血版密钥的步骤如下: 1. 注册并登录火山引擎,点击立即体验进入控制台。链接为:https://zjsms.com/iP5QRuGW/ (火山引擎是字节跳动旗下的云服务平台,在 AI 领域最为大众所熟知的应该是“豆包大模型”,这里就是源头) 2. 创建一个接入点,点击在线推理创建推理接入点。 3. 为接入点命名为 DeepSeekR1。然后可能会提示:“该模型未开通,开通后可创建推理接入点”。如果有提示,就点击“立即开通”,开通一下就可以了。如果无提示则直接到:第 5 步,点击确认接入。 4. 点击“立即开通”跳转到此页面,勾选全部模型和协议,一路点击开通即可。(这里是免费的) 5. 确认以下无误后,点击“确认接入”按钮。 6. 自动返回创建页面。发现多出一行接入点名是“DeepSeekR1”(我们刚才自己设置的命名)。重点来了:这个就是推理点的 ID,复制他放到您的微信里,发给自己保存一下。 7. 保存后再点击【API 调用】按钮,进入后点击【选择 API Key 并复制】。 8. 如果您已经有 API key 了,就直接查看并复制。如果没有,则点击【创建 API key】。 9. 把这个复制好之后,也放到您自己微信里,保存好。 DeepSeek 的设计思路包括: 1. 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 2. 通过提示词文件,让 DeepSeek 实现:同时使用联网功能和深度思考功能。 3. 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 4. 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 5. 用 XML 来进行更为规范的设定,而不是用 Lisp(对我来说有难度)和 Markdown(运行下来似乎不是很稳定)。 关于 DeepSeek 的使用分享: 1. DP 模型的功能:能进行自然语言理解与分析、编程、绘图,如 SVG、MA Max 图表、react 图表等。 2. 使用优势:可以用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容。 3. 存在问题:思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本。 4. 审核方法:可以用其他大模型来解读 DP 模型给出的内容。 5. 使用建议:使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。 6. 使用场景:包括阅读、育儿、写作、随意交流等方面。 7. 案例展示:通过与孩子共读时制作可视化互动游戏,以及左脚踩右脚式的模型交互来展示 DP 模型的应用。 另外,DeepSeek 文档可以在 3 群和 4 群分享中获取,也可在 v to a gi 的飞书知识库中搜索获取。未来活动预告:明天后天在摩纳社区提供免费算力资源带大家学习炼丹,周一晚上学习多维表格中接入 DeepSeek 。
2025-02-20
deepseek提示词
以下是关于 deepseek 提示词的相关内容: 生成单词方面:输入单词主题、图片风格、单词数量,如非洲动物、真实风格、2。选择 deepseekr1 模型,可生成指定数量的单词数组,以数组方式输出,包括单词、中文、美式音标及相关例句和翻译。提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,且输出必须为符合要求的数组形式。 时代关键诉求方面:在 deepseek 时代,完整的长提示词可能不如片段有效,甚至干扰模型思考流程,带来 Token 浪费和上下文污染。新一代 LLM 的正确打开方式是“关键诉求直通车”模式,如像对聪明助理打暗号:“主题:环保|要最新案例|结尾有力道”,让模型自主发挥。 生成相机运动轨迹方面:以往的提示词是场景、构图、尺寸、位置、形态、半身全身、环境的组合,现在把这些提示词喂给 DeepSeek,要求以“相机运动轨迹”的方式来描写,可得到新提示词,如“相机向上飞升至上空轨道视角,拍摄站在泳池旁的女子”,海螺 AI 能对空间理解和遵循语义,自然生成相关内容,甚至为主角匹配相应物品。
2025-02-20
deepseek经常服务器繁忙的解决方案?
以下是一些解决 DeepSeek 服务器繁忙的方案: 1. 尝试以下搜索网站: 秘塔搜索:https://metaso.cn 360 纳米 AI 搜索:https://www.n.cn/ 硅基流动:https://siliconflow.cn/zhcn/ 字节跳动火山擎:https://console.partner.volcengine.com/auth/login?redirectURI=%2Fpartner%2F 百度云千帆:https://login.bce.baidu.com/ 英伟达:https://build.nvidia.com/deepseekai/deepseekr1 Groq:https://groq.com/ Chutes:https://chutes.ai/app 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 Github:https://github.com/marketplace/models/azuremldeepseek/DeepSeekR1/playground POE:https://poe.com/DeepSeekR1 Cursor:https://cursor.sh/ Monica:https://monica.im/invitation?c=ACZ7WJJ9 Lambda:https://lambdalabscom/6 Cerebras:https://cerebras.ai Perplexity:https://www.perplexity.ai 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 2. 可以通过以下步骤使用网页聊天解决: 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 配置“DeepSeekR1”模型的 API key:基础 URL:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 添加“DeepSeekR1”模型。 3. 还可以使用以下网站(部分需要魔法,不做教学支持): 秘塔搜索:https://metaso.cn 360 纳米 AI 搜索:https://www.n.cn/(bot.n.cn) 硅基流动:https://cloud.siliconflow.cn/i/RjJgQqae AskManyAI:https://dazi.co/login?i=7db38e6e 字节跳动火山引擎:https://console.volcengine.com/ark/region:ark+cnbeijing/experience 百度云千帆:https://console.bce.baidu.com/qian3an/modelcenter/model/buildIn/list 英伟达 NIM Groq:https://groq.com/ Fireworks:https://fireworks.ai/models/fireworks/deepseekr1 Chutes:https://chutes.ai/app/chute/ Github:https://github.com/marketplace/models/azuremldeepseek/DeepSeekR1/playground POE:https://poe.com/DeepSeekR1 Cursor:https://cursor.sh/ Monica:https://monica.im/invitation?c=ACZ7WJJ9 Lambda:https://lambdalabs.com/ Cerebras:https://cerebras.ai Perplexity:https://www.perplexity.ai 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1
2025-02-20
如何正确的向deepseek提问来辅助我写一篇文献
以下是向 DeepSeek 提问来辅助写文献的正确方法: 1. 借助 AI 分析好的文章: 找出您最喜欢的文章,投喂给 DeepSeek R1(适合大多数有推理模型的 AI)。 第一次询问:请从写作角度分析这篇文章。 第二次询问:请再从读者角度分析这篇文章。 第三次询问:这篇文章还存在什么缺点和不足,有什么改善和提升的空间。 对作者进行侧写,分析成长背景、个人经历和知识结构对文章的影响。 2. 让 AI 对您写的文章进行点评: 表述为“现在我希望你是一名资深中文写作教师/小学语文老师/中学语文老师/公文写作培训师,拥有 30 年教育经验,是一名传授写作技巧的专家。请先阅读我提供给你的文章,然后对文章进行分析,然后教我如何提升写作水平。请给出详细的优缺点分析,指出问题所在,并且给出具体的指导和建议。为了方便我能理解,请尽量多举例子而非理论陈述。” 3. 根据文章内容对作者进行心理侧写: 表述为“我希望你扮演一个从业 20 多年,临床诊治过两千多例心理分析案例的人性洞察和意识分析方面的专家,精通心理学、人类学、文史、文化比较。先阅读后附文章全文,然后对作者进行人格侧写。要尖锐深刻,不要吹捧包装,不要提出一些只能充当心理安慰的肤浅的见解。包括作者的基本画像、核心性格特质、认知与价值观、潜在心理动机、行为模式推测、矛盾与盲点、文化符号映射。” 此外,还有用 DeepSeek 扮演一本书的作者辅助阅读书籍的案例,比如在读项飚的《跨越边界的社区》时,让 DeepSeek 解释作者为什么这么写,它会从时代背景的张力、浙江村的实践智慧、方法论上的颠覆等层面进行剖析。
2025-02-20
DeepSeek提示词
以下是关于 DeepSeek 提示词的相关内容: 生成小红书爆款单词视频: 开始:输入单词主题、图片风格、单词数量。 生成单词数组:选择 deepseekr1 模型,输入单词主题、单词数量,为用户输出指定数量的单词,并以数组方式输出,包括单词、中文、美式音标、英文句子及其中文翻译。提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,且输出必须为符合要求的数组形式。 Deepseek 时代提示词之关键诉求: 观察发现完整的提示词可能不如片段有效,甚至干扰模型思考流程,过长提示会带来 Token 浪费和上下文污染,在多轮对话中,用户只需在关键点进行引导,让模型自主发挥,“关键诉求直通车”模式是新一代 LLM 的正确打开方式。新旧提示法对比,传统方法像唠叨家长,新型技巧像对聪明助理打暗号。 集合·DeepSeek 提示词方法论: 核心原理认知:包括 AI 特性定位(多模态理解、动态上下文、任务适应性)和系统响应机制(采用意图识别+内容生成双通道,自动检测 prompt 中的任务类型、输出格式、知识范围,对位置权重、符号强调敏感)。 基础指令框架:如果不知道如何表达,可套用框架指令,包括四要素模板、格式控制语法(强制结构、占位符标记、优先级符号)。 进阶控制技巧:包括思维链引导(分步标记法、苏格拉底式追问)、知识库调用(领域限定指令、文献引用模式)、多模态输出。
2025-02-20
给我总结一下不同的AI工具在写作时可以提供什么样的帮助,他们的优势是什么
以下是不同的 AI 工具在写作时所能提供的帮助及其优势: 邮件写作: Grammarly:提供语法检查、拼写纠正、风格建议和语气调整等功能。易于使用,支持多种平台,适用于多种语言。 Hemingway Editor:简化句子结构,提高可读性,标记复杂句和冗长句。界面简洁,重点突出,适用于改善写作风格和简洁性。 ProWritingAid:全面的语法和风格检查,提供详细的写作报告和建议。功能强大,支持多种平台和集成,特别适合专业写作者。 Writesonic:基于 AI 生成各种类型的文本,包括电子邮件、博客文章、广告文案等。生成速度快,适合需要快速创作和灵感的用户。 Lavender:专注于邮件写作优化,提供个性化建议和模板,帮助用户提高邮件打开率和回复率。 论文写作: 文献管理和搜索: Zotero:结合 AI 技术,自动提取文献信息,帮助管理和整理参考文献。 Semantic Scholar:AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 内容生成和辅助写作: Grammarly:提供文本校对、语法修正和写作风格建议,提高语言质量。 Quillbot:基于 AI 的重写和摘要工具,精简和优化论文内容。 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于进行数据分析和可视化。 Knitro:用于数学建模和优化,进行复杂的数据分析和模型构建。 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,提供丰富模板库和协作功能,简化编写过程。 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:检测潜在抄袭问题。 文章润色: Wordvice AI:集校对、改写转述和翻译等功能于一体,基于大型语言模型提供全面的英文论文润色服务。 ChatGPT:由 OpenAI 开发的大型语言模型,可用于多方面写作辅助。 Quillbot:人工智能文本摘要和改写工具,可快速筛选和改写文献资料。 HyperWrite:基于 AI 的写作助手和大纲生成器,帮助写作前进行头脑风暴和大纲规划。 Wordtune:AI 驱动的文本改写和润色工具,优化文章语言表达。 Smodin:提供 AI 驱动的论文撰写功能,根据输入生成符合要求的学术论文。 总之,这些 AI 工具在写作的不同方面发挥作用,涵盖了校对、改写、大纲生成、内容生成等环节,可有效提高写作效率和质量。用户应根据自身需求选择合适的工具。但使用时需注意仔细甄别内容。
2025-02-20
deepseek相比其他AI工具有什么优势
DeepSeek 相比其他 AI 工具的优势主要体现在以下方面: 1. 在写文方面全面领先。 2. 训练成本虽高,但定价低于实际成本。 然而,DeepSeek 也存在一些不足: 1. 对于协助编程,最大的上下文长度只有 64k,导致无法处理更长的上下文和更复杂的代码项目。 2. 在写文时,长文会太发散,文风用力过猛,可能导致审美疲劳,且模型多样性不够,相同 prompt 提问多次答案雷同。
2025-02-20
我想做一个产品(生涯规划领域的垂直大模型),这个产品服务的对象是所有人:帮助所有人进行更好的职业规划。每个人都能通过使用这个产品更好地了解自己,了解自己的天赋、兴趣、优势,然后找到自己的热爱的领域和热爱的事业,并且能够个性化地推荐相关的行业和职业,包括职业的主要工作内容和核心能力要求等等。 请对这个产品进行可行性分析,并给出产品的发展规划,别忘了给这个项目起一个名字。
以下是对您提出的生涯规划领域垂直大模型产品的可行性分析和发展规划,并为项目取名为“生涯智途”。 可行性分析: 1. 需求广泛:帮助人们进行职业规划是一个普遍存在的需求,涵盖了各个年龄段和职业阶段的人群。 2. 数据可用性:可以通过各种渠道收集大量与职业相关的数据,包括行业报告、职位描述、人才需求等。 3. 技术支持:当前大模型技术的发展为实现这样的产品提供了可能,能够处理和分析大量复杂的数据。 发展规划: 1. 数据收集与整理:广泛收集各类职业数据,建立丰富的数据库,确保数据的准确性和完整性。 2. 模型训练与优化:利用收集到的数据进行模型训练,不断优化模型,提高预测和推荐的准确性。 3. 功能开发: 个性化测评:开发能够准确评估用户天赋、兴趣、优势的功能模块。 精准推荐:根据用户的特点,提供个性化的行业和职业推荐,并详细介绍职业的工作内容和核心能力要求。 持续学习与更新:随着行业变化,及时更新数据和模型,以提供最新的职业信息。 4. 用户体验优化:设计简洁、易用的界面,提供良好的用户交互体验。 5. 市场推广:通过线上线下多种渠道进行推广,提高产品的知名度和用户覆盖面。 希望以上分析和规划对您有所帮助。
2025-02-18
deepseek和普通的AI大模型相比,优势是什么?
DeepSeek 与普通的 AI 大模型相比具有以下优势: 1. 强大、便宜、开源、免费、联网和本土等六大优势,全面超过现有 AI 大模型。 2. 以仅 27 分之一的成本实现卓越表现,挑战了高价闭源模型的传统观念。 3. 创新的 R1 Zero 模型显示出模型思考能力的自我涌现,或将引领 AGI 的新方向。 4. 在推理过程中通过多头隐式注意力减少内存需求,并且改进了 MoE 架构。 5. 其深度思考版本 DeepSeek R1 属于基于强化学习 RL 的推理模型,在回答用户问题前会先进行“自问自答”式的推理思考,提升最终回答的质量。 6. 在中国 LMSYS 排行榜上取得优异成绩,尤其在数学和编程方面表现出色。
2025-02-13
deepseek和普通的AI大模型相比,优势是什么?
DeepSeek 相比普通的 AI 大模型具有以下优势: 1. 强大、便宜、开源、免费、联网和本土等六大优势,全面超过现有 AI 大模型。 2. 以仅 27 分之一的成本实现卓越表现,挑战了高价闭源模型的传统观念。 3. 创新的 R1 Zero 模型显示出模型思考能力的自我涌现,或将引领 AGI 的新方向。 4. 在推理过程中通过多头隐式注意力减少内存需求,并且改进了 MoE 架构。 5. 在 LMSYS 排行榜上取得优异成绩,尤其在数学和编程方面表现出色。在推理过程中,R1 会先进行“自问自答”式的推理思考,提升最终回答的质量,模拟人类的深度思考。
2025-02-13
关于deepseek,优势与不同
DeepSeek 的优势主要包括以下几个方面: 1. 核心是推理型大模型,无需用户提供详细步骤指令,能通过理解真实需求和场景提供答案。 2. 能够理解用户用“人话”表达的需求,无需学习和使用特定提示词模板。 3. 在回答问题时能够进行深度思考,而非简单罗列信息。 4. 可以模仿不同作家的文风进行写作,适用于多种文体和场景。 在输出效果方面: 1. 能还原特定的语气,如帝王的语气,且恰到好处,兼顾可读性。 2. 对历史细节异常熟悉,支持“深度探索”和“联网搜索”,能准确还原历史称谓。 3. 输出极其具体且充满惊人的细节,行文的隐喻拿捏高级。 在发展历程中: 1. 2023 年 11 月,先后发布了两款开源模型 DeepSeek Coder 和 DeepSeek LLM,在计算的效率和可扩展性上遇到挑战。 2. 2024 年 5 月,发布 V2,以混合专家模型和多头潜在注意力机制技术结合,降低模型训练和推理成本,引发广泛讨论和推荐。 3. 2024 年 12 月,发布 V3,以低成本实现超越同类开源模型的性能,媲美闭源模型,成为里程碑。 与 OpenAI 的区别在于: 1. OpenAI 致力于实现计算资源规模与成本的无限扩张,DeepSeek 则致力用低成本计算资源实现更高效率。 2. OpenAI 花两年达到 GPT3 时刻,DeepSeek 用一年摘得 V3 圣杯。 3. OpenAI 在 GPT 路线上一直聚焦预训练的进步,DeepSeek 训练与推理并重。
2025-02-06