Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek

Answer

DeepSeek 的秘方是硅谷味儿的。早在 2024 年 5 月 DeepSeek-V2 发布时,其以多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,相关论文也在 AI 研究界被广泛分享和讨论。而当时在国内,DeepSeek 被描摹成“大模型价格战的发起者”。

如果 V-3 是 DeepSeek 的 GPT-3 时刻,接下来的发展充满未知,但 DeepSeek 已成为中国最全球化的 AI 公司之一,其赢得全球同行尊重的秘方也是硅谷味儿的。

在案例方面,Deepseek 的输出有诸多神来之笔,如在独白文本中自行加入括号中的场景描述,增强画面感,还能预判用户需求,在简洁的提示词输入下,自然想到给输出加上文学性,展现出“高级的智能”,但也存在值得商榷之处,如与史实的某些不符。

Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

DeepSeek

第四,Deepseek这个输出结果另一个神来之笔,就是在独白文本中“自作主张”地加入了括号中的场景描述。这一操作,一下就让整个输出的画面感扑面而来,读者仿如亲历,而这完全没有在提示词中提出。(“夜风掀动案头《韩非子》,停在"夫妻者,非有骨肉之恩也"那页”)、“(墨迹在"弑"字上晕开一团)这些句子的确很难相信是AI写的。而(“忽然扔笔,抓起铜镜”)这句也隐喻了魏征的名言“以铜为镜,可以正衣襟;以史为镜,可以知兴衰;以人为镜,可以知得失”。你说这AI成精了,我都信。第五,最重要的,DeepSeek预判了用户的需求。再回顾一下我输入的提示词——“玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?”我的输入已经非常简洁了,不能再压缩了,并且没有任何形容词,没有任何倾向性。但神奇的是,它显然知道我要什么,比如这当然不是一个要求精确的数理题,它自然想到要给输出加上文学性,这种预判在很大程度上表现出了“高级的智能”。当然,一个值得商榷的点是,根据史实,魏征是在玄武门之变之后才见到李世民

Others are asking
如何用deepseek学习写作
以下是关于如何用 DeepSeek 学习写作的一些方法和信息: 1. DeepSeek 深夜发布的大一统模型 JanusPro 能将图像理解和生成统一在一个模型中。它具有理解和生成两种模式,核心是 DeepSeek 语言模型,经过了预训练、监督微调及“精华浓缩法”保存学习成果。其采用 Transformer 大一统模型,具有任务导向、效率考量和架构简洁性等优势,通过参数共享、注意力机制实现图文深度对齐,具有灵活性。 2. WaytoAGI 近期有相关活动,如 DeepSeek+阿里云实训营全新升级上线,可在线直播学习。还有以“反转”为主题的短篇小说投稿活动,投稿地址在通往 AGI 之路腾讯频道【deepseek 专区】。 3. 提升写作能力的方法包括:借助 AI 分析好的文章,如找出最喜欢的文章投喂给 deepseek R1,并多次询问从不同角度的分析;让 AI 对自己写的文章进行点评,给出详细的优缺点分析及提升建议;还可以根据文章内容对作者进行心理侧写。
2025-03-14
如何用deepseek学习写作
以下是关于如何用 DeepSeek 学习写作的相关内容: 1. DeepSeek 的特点: 大一统模型 JanusPro 能将图像理解和生成统一在一个模型中,具有理解图片和生成图片的能力。 核心是 DeepSeek 语言模型,已学习大量知识。 经过预训练、监督微调、用“精华浓缩法”保存学习成果等特别训练法。 采用 Transformer 大一统模型,具有任务导向、效率考量和架构简洁性等优势,如一个大脑两种思维、参数共享、注意力机制和灵活性等关键设计。 2. 相关活动: DeepSeek+阿里云实训营全新升级上线,可在线直播学习稳定调用、开发满血版 DeepSeek 智能体等隐藏玩法。 有以“反转”为主题的短篇小说投稿活动,2 月 16 日晚 8 点截止并现场直播评选。 金融行业·大模型挑战赛初赛阶段(2024/12/3 2025/2/10)。 3. 具体使用方法: 借助 AI 分析好的文章,如找出喜欢的文章投喂给 deepseek R1,从写作角度、读者角度分析,指出缺点和不足及改善空间,对作者进行侧写等。 让 AI 对自己写的文章进行点评,给出详细的优缺点分析、指导和建议。 还可根据文章内容对作者进行心理侧写。
2025-03-14
为什么密塔要接入deepseek
密塔接入 DeepSeek 可能有以下原因: 1. 提升用户的 AI 学习体验:例如学而思接入 DeepSeek“深度思考模式”,预计将在 2 月内陆续于相关机型上线,以全面升级用户的 AI 学习体验。 2. 实现多任务统一:DeepSeek 的 JanusPro 模型将图像理解和生成统一在一个模型中,具有理解和生成两种本领,能够为相关应用提供更综合的能力支持。 3. 高效便捷:DeepSeek 编程工具接入速度较快,国内版本可直接用于编程,无需申请 API 即可使用。 4. 降低编程门槛:鼓励编程实践,降低了编程的门槛,使更多人能够参与其中。 以上信息仅供参考,具体原因可能还需根据密塔的具体需求和规划来确定。
2025-03-13
1、Puzzle 选择一个你(们)感兴趣的社会问题或者现象。 “赛博信仰”指在网络环境下衍生的一系列超现实、寄托心理期许的新兴文化现象。这种现象反映了人们在数字化时代中对精神寄托、心理安慰和未来预测的需求。赛博信仰不仅是一种文化现象,也反映了现代社会中人们对科技、信仰和现实之间关系的重新思考。 2、Facts 关于这个问题/现象,都有哪些基本事实? 比如有人购买电子形式的马克思、爱因斯坦的脑子,象征着对智慧的渴望;借助塔罗测试程序、deepseek算命等AI工具,尝试预知命运;夸赞鹿童、转发锦鲤
关于“赛博信仰”这一现象,目前所了解到的基本事实包括:有人购买电子形式的马克思、爱因斯坦的脑子以象征对智慧的渴望;借助塔罗测试程序、deepseek 算命等 AI 工具尝试预知命运;夸赞鹿童、转发锦鲤等。但目前掌握的相关事实相对有限,还需要进一步的研究和观察来更全面地了解这一现象。
2025-03-13
你是一名DEEPSEEK专家,请用大白话交给小白掌握deepseek的使用,举例说明
DeepSeek 的使用对于小白来说可能有点复杂,但我尽量用大白话给您解释清楚。 比如说,您想让 DeepSeek 帮您生成“玄武门之变结束的当天,李世民在深夜写下一段独白,你觉得他会写什么?”这样的内容。 DeepSeek 会这样来处理: 1. 先回顾玄武门之变的历史背景,比如这场政变发生在 626 年,李世民杀了兄弟,逼父亲退位等。 2. 思考李世民当晚的心理,可能有释然、愧疚、恐惧、自责等多种复杂情绪,还要考虑他是被迫还是早有预谋。 3. 要让生成的独白不仅符合历史事实,还要有文学性,体现人性的复杂。比如要平衡他的野心与自责,对未来的抱负与对过去的悔恨。 4. 考虑当时的文化背景,像儒家思想对孝悌的重视,李世民的行为违背了这些伦理,他可能会内心挣扎,还可能为自己的行为找正当理由。 5. 按照您的需求,给独白加上一些文学修辞,像比喻、对仗、意象等,增强画面感。 另外,DeepSeek 还有个很厉害的地方,就是它能在独白文本中“自作主张”地加入括号里的场景描述,让整个输出更有画面感。比如“(夜风掀动案头《韩非子》,停在‘夫妻者,非有骨肉之恩也’那页)”、“(墨迹在‘弑’字上晕开一团)”、“(忽然扔笔,抓起铜镜)”这些句子,很难相信是 AI 写的。 总之,使用 DeepSeek 时要考虑很多方面的因素,它能根据您的提示词和需求,生成很精彩的内容。
2025-03-13
defy对比deepseek有哪些区别和优势
Defy 与 DeepSeek 的区别和优势如下: DeepSeek 的优势: 1. 参数量大(685B),磁盘占用为 687.9 GB,采用混合专家模型(MoE),有 256 个专家,每个 token 使用 8 个专家。 2. 理解能力提升,能准确理解复杂和微妙的查询。 3. 知识更新至 2023 年,提供更及时、更相关的信息。 4. 多语言支持和个性化服务增强。 5. 数据安全和隐私保护加强。 6. 在 BigCodeBenchHard 排名第一。 7. 展示出媲美领先 AI 产品性能的模型,但成本仅为其一小部分,在全球主要市场的 App Store 登顶。 8. 文字能力突出,尤其在中文场景中高度符合日常、写作习惯。 9. 数学能力经过优化,表现不错。 关于 Defy 的相关信息未在提供的内容中提及,无法进行对比。
2025-03-13