Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek到底是什么?打个比方

Answer

DeepSeek 是一个在 AI 领域受到关注的品牌。它在硅谷受到关注和追逐,早在 2024 年 5 月 DeepSeek-V2 发布时,就以多头潜在注意力机制(MLA)架构的创新引发了小范围轰动。DeepSeek 不是“中国式创新”的产物,其秘方更具硅谷风格。

DeepSeek 是基于 AI 模型的产品,需要搭配具体模型,如 DeepSeek V3(类 GPT-4o)和 DeepSeek R1(类 OpenAI o1)。它展示出媲美领先 AI 产品性能的模型,但成本较低,在全球主要市场的 App Store 登顶。在实际使用体验方面,在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。数学能力经过优化表现不错,编程能力略逊于 GPT。

需要注意的是,将 DeepSeek 比喻成“AI 界的拼多多”是偏颇的,认为其秘方就是多快好省也是不全面的。

Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

宝玉 日报

Deep Research是基于AI模型的产品,使用GPT-4o、o3等推理模型,结合UI交互、搜索引擎等。DeepSeek只是品牌名,需要搭配具体模型,如DeepSeek V3(类GPT-4o)和DeepSeek R1(类OpenAI o1)。🔗[https://x.com/dotey/status/1886816305719681203](https://x.com/dotey/status/1886816305719681203)4⃣️📖比尔·盖茨新回忆录《Source Code》成长故事:从“怪胎少年”到微软创始人的经历。婚姻与财富:离婚后两年陷入低谷,如今与前甲骨文CEO遗孀宝拉·赫德交往。社交媒体担忧:认为社交平台已到危险“临界点”,尤其对青少年影响深远。对AI与科技的看法:更关注现实问题,而非“冷冻身体”或延长寿命研究。📖文章原文:🔗[https://www.thetimes.com/life-style/celebrity/article/bill-gates-interview-new-book-memoir-wh766b9bs](https://www.thetimes.com/life-style/celebrity/article/bill-gates-interview-new-book-memoir-wh766b9bs)📖完整译文:🔗[https://mp.weixin.qq.com/s/5QXrlyEsFLQAodF2xVmmZA?token=1639803888&lang=zh_CN](https://mp.weixin.qq.com/s/5QXrlyEsFLQAodF2xVmmZA?token=1639803888&lang=zh_CN)5⃣️🤖Figure机器人公司宣布退出OpenAI合作

XiaoHu.AI日报

🔔Xiaohu.AI日报「1月27日」✨✨✨✨✨✨✨✨1⃣️💹华尔街分析师对DeepSeek的反应:DeepSeek展示出媲美领先AI产品性能的模型,但成本仅为其一小部分,在全球主要市场的App Store登顶。Jefferies警告其技术可能打破资本开支狂热,Citi对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局,降低AI行业进入门槛。🔗[https://www.xiaohu.ai/c/xiaohu-ai/deepseek](https://www.xiaohu.ai/c/xiaohu-ai/deepseek)2⃣️📝DeepSeek的实际使用体验:在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。数学能力经过优化,表现不错;编程能力略逊于GPT,据用户反馈。GRPO算法替代传统PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。🔗[https://x.com/imxiaohu/status/1883843200756170873](https://x.com/imxiaohu/status/1883843200756170873)🔗[https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43](https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43)3⃣️🎙️复旦大学OpenMOSS发布实时语音交互模型:

Others are asking
deepseek提示词
以下是关于 deepseek 提示词的相关内容: 1. 生成小红书爆款单词视频: 开始时输入单词主题、图片风格、单词数量。 选择 deepseekr1 模型生成单词数组,以数组方式输出,包括单词、中文、美式音标、英文句子及其中文翻译。 提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,且以特定数组形式呈现。 2. Deepseek 时代提示词之关键诉求: 完整的长提示词可能不如片段有效,甚至干扰模型思考流程,带来 Token 浪费和上下文污染,特别是在多轮对话中。 新一代 LLM 的正确打开方式是“关键诉求直通车”模式,如像对聪明助理打暗号,让模型自主发挥。 3. 让 DeepSeek 生成相机运动轨迹的提示词: 以往的提示词包括场景、构图、尺寸、位置、形态、半身全身、环境等组合。 现在要求以“相机运动轨迹”的方式描写,如“相机向上飞升至上空轨道视角,拍摄站在泳池旁的女子”。 对空间理解和对语义的遵循能让相关元素自然生成,如生成有光影变化的泳池,为主角匹配场景的拖鞋。
2025-03-03
DeepSeek提示词
以下是关于 DeepSeek 提示词的相关内容: 1. 生成小红书爆款单词视频: 开始:输入单词主题、图片风格、单词数量,如非洲动物、真实风格、2。 生成单词数组:选择 deepseekr1 模型,输入单词主题、单词数量,为用户输出指定数量的单词,并以数组方式输出,包括单词、中文、美式音标、英文句子及其中文翻译。提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,且输出必须为符合要求的数组形式。 2. Deepseek 时代提示词之关键诉求: 观察发现完整的提示词可能不如片段有效,甚至可能干扰模型的思考流程,过长提示会带来大量的 Token 浪费和上下文污染,特别是在多轮对话中。在 deepseek 时代,用户只需要在关键点进行引导,让模型自主发挥,“关键诉求直通车”模式是新一代 LLM 的正确打开方式。新旧提示法对比,传统方法像唠叨家长,新型技巧像对聪明助理打暗号。 3. 让 DeepSeek 生成相机运动轨迹的提示词:以往的提示词是场景、构图、尺寸、位置、形态、半身全身、环境的组合,现在把这些提示词喂给 DeepSeek,要求以“相机运动轨迹”的方式来描写,可以得到新提示词,如“相机向上飞升至上空轨道视角,拍摄站在泳池旁的女子”。对空间理解和对语义的遵循能让有光影变化的泳池自然地生成出来,海螺 AI 甚至还知道给主角穿上与场景匹配的拖鞋。
2025-03-03
如何给deepseek写提示词
以下是关于给 DeepSeek 写提示词的相关内容: 1. 效果对比:用 Coze 做了小测试,可对比查看。 2. 使用方法: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 DeepSeek。 认真阅读开场白后正式开始对话。 3. 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用,减轻调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力基础上优化输出质量,减轻 AI 味,增加可读性。 设计阈值系统,可能会根据反馈修改。 用 XML 进行更规范设定,而非 Lisp 和 Markdown。 4. 完整提示词:版本 v1.3。 5. 特别鸣谢:李继刚的【思考的七把武器】提供思考方向,Thinking Claude 是设计灵感来源,Claude 3.5 Sonnet 是得力助手。 6. 生成单词方面: 输入单词主题、图片风格、单词数量。 选择 deepseekr1 模型,输入单词主题、单词数量,DeepSeek 为用户输出指定数量单词,以数组方式输出。 提示词中,角色为专业单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,以符合要求的数组形式呈现。 7. 生成相机运动轨迹的提示词:以往提示词是场景、构图、尺寸等的组合,现在把这些喂给 DeepSeek,要求以“相机运动轨迹”方式描写,如“相机向上飞升至上空轨道视角,拍摄站在泳池旁的女子”。
2025-03-03
用deepseek写论文指令
以下是关于用 DeepSeek 写论文的相关指令和方法: 1. 高级调试策略: 模糊指令优化:对于宽泛需求,可添加维度约束;对于主观表述,可量化标准。例如,将“写小说”修正为“创作以 AI 觉醒为背景的悬疑短篇,采用多视角叙事结构”,将“写得专业些”修正为“符合 IEEE 论文格式,包含 5 项以上行业数据引用”。 迭代优化法:包括首轮生成获取基础内容、特征强化、风格调整和最终校验等步骤。如加强第三段的技术细节描述,改用学术会议报告语气,添加结论部分,检查时间逻辑一致性,列出可能的事实性错误。 2. 高阶能力调用: 文风转换矩阵:如作家风格移植、文体杂交、学术口语化等指令结构和效果示例。 领域穿透技术:如行业黑话破解,例如“解释 Web3 领域的'胖协议瘦应用'理论”。 3. 场景化实战策略:包括商业决策支持、创意内容生成、技术方案论证等。 4. 效能增强技巧: 对话记忆管理:如上下文锚定、信息回溯、焦点重置。 输出质量控制:针对过度抽象、信息过载、风格偏移等问题类型的修正指令。 5. 特殊场景解决方案: 长文本创作:可采用分段接力法和逻辑粘合剂。如“先完成故事大纲→逐章扩展→最后进行伏笔校验”,“确保新章节与前文的三处细节呼应”。 敏感内容处理:如概念脱敏法和场景移植法。 此外,在使用 DeepSeek 写论文时,还需注意以下几点: 示例是一种隐性的需求说明书,添加示例可让大模型更懂需求,但 few short 可能影响模型性能。 自用和他用的提示词在稳定性、经济性、可维护性等方面有较大区别,工业化提示词需稳定、经济且易维护。 将 R1 的思维链给 cloud 回答,结果可能大大改进。 同时,不同的模型有其特点,如 Cloud 3.5 模型多样性差,Deepseek R1 有缺陷但也不错,可根据需求选择合适的模型,如街悦新城的文学大师版等。
2025-03-03
如何高效使用“deepseek+”?
以下是一些关于高效使用“DeepSeek+”的信息: 各地举办了相关活动,如在郑州场展示了搭建的工作流,深圳场分享了出海的落地方案,北京场玩起了 AR+机械汪,广州场探讨了如何辅助速通吃“霸王餐”,福州场有最年轻的分享者展示玩转示例。 可以结合飞书多维表格来发挥其强大之处。 向阳乔木介绍了通过结合 VS Code、Cline 插件和 Deepseek API 等工具提升应用能力,实现自动发送邮件、查找重复文件、网页抓取翻译等功能。 伊登展示了最新 Deepseek+coze 实现新闻播报自动化工作流,具有全自动化处理、40 秒快速出片、成本低廉、输出质量稳定专业等优势,还能进行一系列改进,如加入配套 BGM、增加画面内容和转场效果、使用免费节点替代付费插件、优化模板样式、增加自动化程度支持批量处理等。您可以在扣子商店体验,也可以自己搭建。 您可以参考以上内容,根据您的具体需求来高效使用“DeepSeek+”。
2025-03-03
用deepseek写法学本科论文 有哪些指令
DeepSeek 可用于法学本科论文写作,以下是一些相关指令和方法: 1. 文风转换矩阵: 作家风格移植:例如“用鲁迅杂文风格写职场 PUA 现象”。 文体杂交:比如“将产品说明书改写成《史记》列传格式”。 学术口语化:“把这篇论文摘要翻译成菜市场大妈能听懂的话”。 2. 领域穿透技术:行业黑话破解,如“解释 Web3 领域的'胖协议瘦应用'理论”。 3. 效能增强技巧: 对话记忆管理:包括上下文锚定(“记住当前讨论的芯片型号是麒麟 9010”)、信息回溯(“请复述之前确认的三个设计原则”)、焦点重置(“回到最初讨论的供应链问题”)。 输出质量控制:针对不同问题类型进行修正,如过度抽象(“请具体说明第三步操作中的温度控制参数”)、信息过载(“用电梯演讲格式重新组织结论”)、风格偏移(“回归商务报告语气,删除比喻修辞”)。 4. 特殊场景解决方案: 长文本创作:采用分段接力法(“先完成故事大纲→逐章扩展→最后进行伏笔校验”)和逻辑粘合剂(“确保新章节与前文的三处细节呼应”)。 需要注意的是,使用 DeepSeek 辅助写作时,仍需您自身对法学知识的深入理解和研究,以确保论文的学术性和专业性。
2025-03-03
我在一周前的文章[1]里说对 DeepSeek-R1 只需要说大白话,但在三天前的文章[2]里又用了看起来还挺复杂的结构化提示词。有伙伴问我到底咋回事。这就来解释下喽。
以下是关于 DeepSeekR1 提示词的相关信息: 历史更新: 字节跳动推出新技术 OmniHuman,利用单张图片和音频生成生动视频。 DeepSeek 的出现标志着算力效率拐点显现,其优化算法架构提升算力利用效率,AI 基础大模型参数量迎来拐点,2025 年是算法变革元年,其训练过程聚焦强化学习提升推理能力。 提示词方法论: 核心原理认知:包括多模态理解、动态上下文、任务适应性等 AI 特性定位,以及采用意图识别+内容生成双通道处理等系统响应机制。 基础指令框架:包括四要素模板、格式控制语法等。 进阶控制技巧:如思维链引导、知识库调用、多模态输出。 高级调试策略:包括模糊指令优化、迭代优化法。 行业应用案例:涵盖技术开发场景、商业分析场景。 异常处理方案:如处理信息幻觉、格式偏离、深度不足等情况。 效能监测指标:包括首次响应准确率、多轮对话效率、复杂任务分解等。 在 R1 时代,使用 AI 提示词关键在于提供足够背景信息,简单大白话有效但信息量不足难达理想结果,示例和框架可助理清思路,最终影响在于思考和表达,利用乔哈里视窗分析信息需求,避免过度指令化,让 AI 自由思考以激发更高创意和效果。
2025-02-07
到底什么是大家说的AI
AI 分为 ANI 和 AGI 。ANI 即 artificial narrow intelligence 弱人工智能,它只能做一件事,比如智能音箱、网站搜索、自动驾驶、工厂与农场的应用等。AGI 即 artificial general intelligence ,能做任何人类可以做的事。 简单地说,AI 是让计算机或机器能像人类一样思考和学习的技术。比如在小学课堂上,会以学生能理解的语言来解释,先和学生互动,听听他们口中的 AI ,再引出概念。 从专业术语角度,机械学习是学习输入输出,从 A 到 B 的映射,是让电脑在不被编程的情况下自己学习的研究领域。数据科学是分析数据集,从数据中获取结论与提示,输出结果往往是幻灯片、结论、PPT 、项目结果等。神经网络/深度学习则有输入层、输出层、中间层(隐藏层)。 数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。通常以表格形式出现,每一列代表一个特定变量,每一行对应于某一成员的数据集的问题。数据分为结构化数据与非结构化数据,结构化数据可以放在巨大的表格中,非结构化数据如图片、视频、文本,机器处理起来更难。获取数据的方法有手动标注、观察行为、网络下载。使用数据时,如果开始搜集数据,可以马上将数据展示或者喂给某个 AI 团队。但数据不一定多就有用,有时数据中会出现不正确、缺少的数据,这就需要有效处理数据。
2025-02-01
到底有多强大
以下是关于不同 AI 相关内容强大之处的介绍: Sora:当不复制旧的,而是把新的、不可能的想法变成现实时,Sora 最为强大。它能帮助创意人员将想法变为现实,不仅擅长创造看起来真实的东西,创造完全超现实的东西的能力也令人兴奋。 LORA:在画风、人物、物品、动作姿态的固定方面表现强大,其文件承载的信息量远大于 Embedding,在还原真人物品时细节精度更高。使用时需注意搭配相应大模型和特定触发词。 Hypernetworks:主要针对画风训练,可像 LORA 一样加载使用。 Google 的 Gemini:是 Google DeepMind 团队开发的多模态模型,支持多种提示类型,能理解和处理几乎任何输入,结合不同类型信息并生成几乎任何输出,被称为 Google 迄今为止最强大、最全面的模型,是原生多模态大模型,从设计之初就支持多模态,能处理多种形式的数据。
2025-01-26
ai到底是什么
AI(人工智能)是一门令人兴奋的科学,它是指某种模仿人类思维,可以理解自然语言并输出自然语言的东西。 对于没有理工科背景的人来说,将 AI 当成一个黑箱来理解是一种可行的方式,即只需要知道它能通过特定的文字、仪轨程式来引用已有资源,驱使某种可以一定方式/程度理解人类文字的异类达成预设效果,且其生态位是一种似人而非人的存在。 从历史角度看,最初计算机由查尔斯·巴贝奇发明,用于按照明确的程序进行数字运算。现代计算机虽更先进,但仍遵循相同的受控计算理念。然而,对于像根据照片判断一个人的年龄这类任务,由于无法明确具体步骤,所以是人工智能感兴趣的领域。 在应用方面,AI 健身是利用人工智能技术辅助或改善健身训练和健康管理的方法,能为用户提供个性化的指导。例如 Keep、Fiture、Fitness AI、Planfit 等都是不错的 AI 健身工具。
2025-01-08
AI智能体在电商领域到底能做什么
AI 智能体在电商领域主要有以下应用: 1. 电商导购:以“什么值得买”智能体为例,当用户输入购买需求,如“我想买个笔记本电脑”,智能体会提取关键词,通过相关 API 检索商品信息,与内置提示词组装成上下文,请求大模型回答,提供更精准的商品推荐。 2. 工作流协作:通过多个智能体的组装,解决复杂场景的搜索问题。例如给新产品取名,定义多个智能体分别负责不同功能,如给出建议名字、检索是否同名等,同时需要调度中枢协调工作,决定是继续下一步还是回溯。 3. 决策支持:如在理赔提交审核中,将付款方规则转换为有向无环图,智能体遍历决策树,利用语言模型评估相关文件是否符合规则,并在复杂任务中选择最佳方法。 4. 品牌卖点提炼:实际搭建中,遵循营销管理流程保证输出合理性,根据电商业态调整单独智能体的提示词提升信息准确度,为营销团队提供更广阔思路和灵感。
2024-12-19
AI到底是什么
AI 是一门令人兴奋的科学,它是指某种模仿人类思维,可以理解自然语言并输出自然语言的东西。 对于没有理工科背景的人来说,可以将其当成一个黑箱。AI 就像传统道教中的驱神役鬼拘灵遣将,通过特定的文字、仪轨程式来引用已有资源,驱使某种可以一定方式/程度理解人类文字的异类达成预设效果,且存在突破界限的可能。 AI 技术再怎么发展,其生态位仍是一种似人而非人的存在。 从任务角度看,最初计算机遵循明确的程序和算法进行数字运算。但对于像“根据照片判断一个人的年龄”这类无法明确编程的任务,因为我们不清楚大脑完成此任务的具体步骤,所以无法编写明确程序让计算机完成,而这类任务正是 AI 所感兴趣的。 在健身领域,AI 健身是利用人工智能技术辅助或改善健身训练和健康管理的方法,能根据用户情况提供定制化训练计划和建议。相关的 AI 工具如 Keep、Fiture、Fitness AI、Planfit 等。
2024-12-16