Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek论文

Answer

以下是关于 deepseek 论文的相关信息:

  1. GPT1 到 DeepSeek R1 所有公开论文:
  2. DeepSeek 不是“中国式创新”的产物:将 DeepSeek 比喻成“AI 界的拼多多”是偏颇的,认为 DeepSeek 的秘方就是多快好省也是不全面的。早在 2024 年 5 月 DeepSeek-V2 发布时,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。
  3. deepseek 论文解读:
    • 直播视频回放及相关论文下载:
    • 技巧分享:包括万能提示词的使用,以及提示词优化的步骤和方法。
    • 官网的搜索不能用,一直崩溃的解决办法:可以用火山的满血版,在视频的最后 10 分钟左右有手把手教程。
Content generated by AI large model, please carefully verify (powered by aily)

References

GPT1到Deepseek R1所有公开论文The 2025 AI Engineer Reading List

1.DeepSeek[V1](https://arxiv.org/html/2401.02954?_immersive_translate_auto_translate=1),[Coder](https://ar5iv.labs.arxiv.org/html/2401.14196?_immersive_translate_auto_translate=1),[MoE](https://arxiv.org/html/2401.06066?_immersive_translate_auto_translate=1),[V2](https://arxiv.org/html/2405.04434?_immersive_translate_auto_translate=1),[](https://github.com/deepseek-ai/DeepSeek-V3)[V3](https://arxiv.org/html/2412.19437?_immersive_translate_auto_translate=1),[R1](https://arxiv.org/html/2501.12948?_immersive_translate_auto_translate=1)papers.Leading(relatively)open model lab.DeepSeek V1,Coder,MoE,V2,V3论文。领先的(相对)开源模型实验室。[V1 DeepSeek LLM Scaling Open-Source Language Models with Longtermism.pdf](https://bytedance.feishu.cn/space/api/box/stream/download/all/MPd2bx4NPoynCuxSBN4cp3Rdnze?allow_redirect=1)

DeepSeek 的秘方是硅谷味儿的

将DeepSeek比喻成“AI界的拼多多”是偏颇的,认为DeepSeek的秘方就是多快好省也是不全面的。中国的大多数AI公司都缺卡,也都因为缺卡而拼命搞架构创新,这点没什么不同。要知道,DeepSeek在硅谷受到关注和追逐不是这两周刚发生的事。早在2024年5月DeepSeek-V2发布的时候,它就以多头潜在注意力机制(MLA)架构的创新,在硅谷引发了一场小范围的轰动。V2的论文就引发了AI研究界的广泛分享和讨论。当时,一个非常有意思的现象是:X和Reddit上AI从业者在讨论DeepSeek-V2,同时,DeepSeek在国内舆论场被描摹成了“大模型价格战的发起者”,有点平行时空的感觉。这也许能说明:DeepSeek跟硅谷更有对话和交流的密码,它的秘方应该是硅谷味儿的。

deepseek论文解读

下面是2篇论文,pc端鼠标移到文章上面,会有下载链接,手机端类似[deepseek v3.pdf](https://bytedance.feishu.cn/space/api/box/stream/download/all/SaMdbJDdlo72xwx6d4AcYNJWnZg?allow_redirect=1)[deepseek r1.pdf](https://bytedance.feishu.cn/space/api/box/stream/download/all/L77IbDDzGoJyCRxpcz5cDPl0nyf?allow_redirect=1)[heading1]技巧分享[heading2]万能提示词[content]这个是用DS小技巧用这个提示词来DeepSeek R1。基本可以算万能了。你是一名顶尖的提示词优化专家,请按以下步骤优化下方提示:1.分析原提示的模糊性、冗余项和潜在歧义2.基于[目标输出示例],重构提示结构(可参考CRISPE/BROKE框架)3.生成3个优化版本,并解释每版的改进逻辑原提示:[你的原始提示][heading2]官网的搜索不能用,一直崩溃怎么办[content]可以用火山的满血版,在视频的最后10分钟左右有手把手教程

Others are asking
deepseek
DeepSeek 是一家具有独特特点和影响力的公司: 1. 其秘方具有硅谷风格: 不是“中国式创新”的产物,不能简单地将其比喻成“AI 界的拼多多”或认为其秘方只是多快好省。 早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动。 是中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷风格。 2. V3 可能是 DeepSeek 的 GPT3 时刻,未来发展充满未知但值得期待。 3. 关于提示词 HiDeepSeek: 效果对比:可通过 Coze 做小测试并对比。 使用方法:包括搜索网站、点击“开始对话”、发送装有提示词的代码、阅读开场白后开始对话等步骤。 设计思路:将 Agent 封装成 Prompt 并储存在文件,实现多种功能,优化输出质量,设计阈值系统,用 XML 进行规范设定等。 完整提示词:v 1.3。 特别鸣谢:李继刚的【思考的七把武器】提供思考方向,Thinking Claude 是设计灵感来源,Claude 3.5 Sonnet 是得力助手。
2025-02-20
deepseek怎么用
以下是关于 DeepSeek 的使用方法: 1. 访问 www.deepseek.com ,点击“开始对话”。 2. 将装有提示词的代码发给 DeepSeek 。 3. 认真阅读开场白之后,正式开始对话。 此外,获取 DeepSeekR1 满血版密钥的步骤如下: 1. 注册并登录火山引擎,点击立即体验进入控制台。链接为:https://zjsms.com/iP5QRuGW/ (火山引擎是字节跳动旗下的云服务平台,在 AI 领域最为大众所熟知的应该是“豆包大模型”,这里就是源头) 2. 创建一个接入点,点击在线推理创建推理接入点。 3. 为接入点命名为 DeepSeekR1。然后可能会提示:“该模型未开通,开通后可创建推理接入点”。如果有提示,就点击“立即开通”,开通一下就可以了。如果无提示则直接到:第 5 步,点击确认接入。 4. 点击“立即开通”跳转到此页面,勾选全部模型和协议,一路点击开通即可。(这里是免费的) 5. 确认以下无误后,点击“确认接入”按钮。 6. 自动返回创建页面。发现多出一行接入点名是“DeepSeekR1”(我们刚才自己设置的命名)。重点来了:这个就是推理点的 ID,复制他放到您的微信里,发给自己保存一下。 7. 保存后再点击【API 调用】按钮,进入后点击【选择 API Key 并复制】。 8. 如果您已经有 API key 了,就直接查看并复制。如果没有,则点击【创建 API key】。 9. 把这个复制好之后,也放到您自己微信里,保存好。 DeepSeek 的设计思路包括: 1. 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 2. 通过提示词文件,让 DeepSeek 实现:同时使用联网功能和深度思考功能。 3. 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 4. 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 5. 用 XML 来进行更为规范的设定,而不是用 Lisp(对我来说有难度)和 Markdown(运行下来似乎不是很稳定)。 关于 DeepSeek 的使用分享: 1. DP 模型的功能:能进行自然语言理解与分析、编程、绘图,如 SVG、MA Max 图表、react 图表等。 2. 使用优势:可以用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容。 3. 存在问题:思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本。 4. 审核方法:可以用其他大模型来解读 DP 模型给出的内容。 5. 使用建议:使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。 6. 使用场景:包括阅读、育儿、写作、随意交流等方面。 7. 案例展示:通过与孩子共读时制作可视化互动游戏,以及左脚踩右脚式的模型交互来展示 DP 模型的应用。 另外,DeepSeek 文档可以在 3 群和 4 群分享中获取,也可在 v to a gi 的飞书知识库中搜索获取。未来活动预告:明天后天在摩纳社区提供免费算力资源带大家学习炼丹,周一晚上学习多维表格中接入 DeepSeek 。
2025-02-20
deepseek提示词
以下是关于 deepseek 提示词的相关内容: 生成单词方面:输入单词主题、图片风格、单词数量,如非洲动物、真实风格、2。选择 deepseekr1 模型,可生成指定数量的单词数组,以数组方式输出,包括单词、中文、美式音标及相关例句和翻译。提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,且输出必须为符合要求的数组形式。 时代关键诉求方面:在 deepseek 时代,完整的长提示词可能不如片段有效,甚至干扰模型思考流程,带来 Token 浪费和上下文污染。新一代 LLM 的正确打开方式是“关键诉求直通车”模式,如像对聪明助理打暗号:“主题:环保|要最新案例|结尾有力道”,让模型自主发挥。 生成相机运动轨迹方面:以往的提示词是场景、构图、尺寸、位置、形态、半身全身、环境的组合,现在把这些提示词喂给 DeepSeek,要求以“相机运动轨迹”的方式来描写,可得到新提示词,如“相机向上飞升至上空轨道视角,拍摄站在泳池旁的女子”,海螺 AI 能对空间理解和遵循语义,自然生成相关内容,甚至为主角匹配相应物品。
2025-02-20
deepseek经常服务器繁忙的解决方案?
以下是一些解决 DeepSeek 服务器繁忙的方案: 1. 尝试以下搜索网站: 秘塔搜索:https://metaso.cn 360 纳米 AI 搜索:https://www.n.cn/ 硅基流动:https://siliconflow.cn/zhcn/ 字节跳动火山擎:https://console.partner.volcengine.com/auth/login?redirectURI=%2Fpartner%2F 百度云千帆:https://login.bce.baidu.com/ 英伟达:https://build.nvidia.com/deepseekai/deepseekr1 Groq:https://groq.com/ Chutes:https://chutes.ai/app 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 Github:https://github.com/marketplace/models/azuremldeepseek/DeepSeekR1/playground POE:https://poe.com/DeepSeekR1 Cursor:https://cursor.sh/ Monica:https://monica.im/invitation?c=ACZ7WJJ9 Lambda:https://lambdalabscom/6 Cerebras:https://cerebras.ai Perplexity:https://www.perplexity.ai 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 2. 可以通过以下步骤使用网页聊天解决: 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 配置“DeepSeekR1”模型的 API key:基础 URL:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 添加“DeepSeekR1”模型。 3. 还可以使用以下网站(部分需要魔法,不做教学支持): 秘塔搜索:https://metaso.cn 360 纳米 AI 搜索:https://www.n.cn/(bot.n.cn) 硅基流动:https://cloud.siliconflow.cn/i/RjJgQqae AskManyAI:https://dazi.co/login?i=7db38e6e 字节跳动火山引擎:https://console.volcengine.com/ark/region:ark+cnbeijing/experience 百度云千帆:https://console.bce.baidu.com/qian3an/modelcenter/model/buildIn/list 英伟达 NIM Groq:https://groq.com/ Fireworks:https://fireworks.ai/models/fireworks/deepseekr1 Chutes:https://chutes.ai/app/chute/ Github:https://github.com/marketplace/models/azuremldeepseek/DeepSeekR1/playground POE:https://poe.com/DeepSeekR1 Cursor:https://cursor.sh/ Monica:https://monica.im/invitation?c=ACZ7WJJ9 Lambda:https://lambdalabs.com/ Cerebras:https://cerebras.ai Perplexity:https://www.perplexity.ai 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1
2025-02-20
如何正确的向deepseek提问来辅助我写一篇文献
以下是向 DeepSeek 提问来辅助写文献的正确方法: 1. 借助 AI 分析好的文章: 找出您最喜欢的文章,投喂给 DeepSeek R1(适合大多数有推理模型的 AI)。 第一次询问:请从写作角度分析这篇文章。 第二次询问:请再从读者角度分析这篇文章。 第三次询问:这篇文章还存在什么缺点和不足,有什么改善和提升的空间。 对作者进行侧写,分析成长背景、个人经历和知识结构对文章的影响。 2. 让 AI 对您写的文章进行点评: 表述为“现在我希望你是一名资深中文写作教师/小学语文老师/中学语文老师/公文写作培训师,拥有 30 年教育经验,是一名传授写作技巧的专家。请先阅读我提供给你的文章,然后对文章进行分析,然后教我如何提升写作水平。请给出详细的优缺点分析,指出问题所在,并且给出具体的指导和建议。为了方便我能理解,请尽量多举例子而非理论陈述。” 3. 根据文章内容对作者进行心理侧写: 表述为“我希望你扮演一个从业 20 多年,临床诊治过两千多例心理分析案例的人性洞察和意识分析方面的专家,精通心理学、人类学、文史、文化比较。先阅读后附文章全文,然后对作者进行人格侧写。要尖锐深刻,不要吹捧包装,不要提出一些只能充当心理安慰的肤浅的见解。包括作者的基本画像、核心性格特质、认知与价值观、潜在心理动机、行为模式推测、矛盾与盲点、文化符号映射。” 此外,还有用 DeepSeek 扮演一本书的作者辅助阅读书籍的案例,比如在读项飚的《跨越边界的社区》时,让 DeepSeek 解释作者为什么这么写,它会从时代背景的张力、浙江村的实践智慧、方法论上的颠覆等层面进行剖析。
2025-02-20
DeepSeek提示词
以下是关于 DeepSeek 提示词的相关内容: 生成小红书爆款单词视频: 开始:输入单词主题、图片风格、单词数量。 生成单词数组:选择 deepseekr1 模型,输入单词主题、单词数量,为用户输出指定数量的单词,并以数组方式输出,包括单词、中文、美式音标、英文句子及其中文翻译。提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,且输出必须为符合要求的数组形式。 Deepseek 时代提示词之关键诉求: 观察发现完整的提示词可能不如片段有效,甚至干扰模型思考流程,过长提示会带来 Token 浪费和上下文污染,在多轮对话中,用户只需在关键点进行引导,让模型自主发挥,“关键诉求直通车”模式是新一代 LLM 的正确打开方式。新旧提示法对比,传统方法像唠叨家长,新型技巧像对聪明助理打暗号。 集合·DeepSeek 提示词方法论: 核心原理认知:包括 AI 特性定位(多模态理解、动态上下文、任务适应性)和系统响应机制(采用意图识别+内容生成双通道,自动检测 prompt 中的任务类型、输出格式、知识范围,对位置权重、符号强调敏感)。 基础指令框架:如果不知道如何表达,可套用框架指令,包括四要素模板、格式控制语法(强制结构、占位符标记、优先级符号)。 进阶控制技巧:包括思维链引导(分步标记法、苏格拉底式追问)、知识库调用(领域限定指令、文献引用模式)、多模态输出。
2025-02-20
deepseek的论文里面讲的混合专家模型怎么理解
混合专家(MoE)模型是一种在深度学习中提升计算效率的架构。以 DeepSeek 为例,其最新模型 V3 与 R1 采用了这种架构。 在 DeepSeek 的 V3 模型中,引入了多头潜注意力(MLA),将 KV 缓存压缩至新低,从而提升了计算性能。R1 模型则通过强化学习激活推理能力,首次验证无需监督微调即可实现推理。 DeepSeek 的 2360 亿参数的 DeepSeekV2 是 60 位专家混合开源模型,在数学、编码和推理方面表现出色,具有 236B 参数,21B 在生成过程中被激活,在 MTBench 上表现优异,中文能力强且性价比高。 您可以通过以下链接获取更详细的介绍:https://xiaohu.ai/p/7468 、https://zhuanlan.zhihu.com/p/21208287743 。
2025-02-19
deepseek论文
以下是关于 deepseek 论文的相关信息: 1. GPT1 到 DeepSeek R1 所有公开论文: DeepSeek 领先的(相对)开源模型实验室。 2. DeepSeek 的秘方是硅谷味儿的: 将 DeepSeek 比喻成“AI 界的拼多多”是偏颇的,认为其秘方是多快好省也不全面。 早在 2024 年 5 月 DeepSeekV2 发布时,因其多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,V2 的论文引发了 AI 研究界的广泛分享和讨论。 3. deepseek 论文解读: 直播视频回放及相关论文下载: 技巧分享:万能提示词,可用此提示词来 DeepSeek R1。 官网的搜索不能用,一直崩溃的解决办法:可以用火山的满血版,在视频的最后 10 分钟左右有手把手教程。
2025-02-19
deepseek论文
以下是关于 deepseek 论文的相关信息: 1. GPT1 到 DeepSeek R1 所有公开论文: DeepSeek 领先的(相对)开源模型实验室。 2. DeepSeek 的秘方是硅谷味儿的: 将 DeepSeek 比喻成“AI 界的拼多多”是偏颇的,认为其秘方是多快好省也不全面。 早在 2024 年 5 月 DeepSeekV2 发布时,因其多头潜在注意力机制(MLA)架构的创新在硅谷引发小范围轰动,V2 论文引发 AI 研究界广泛分享和讨论。 当时 DeepSeek 在国内外舆论场的形象有所不同。 3. deepseek 论文解读: 直播视频回放及相关论文下载: 技巧分享:万能提示词,可用此提示词来 DeepSeek R1,基本算万能。 官网的搜索不能用,一直崩溃的解决办法:可以用火山的满血版,在视频的最后 10 分钟左右有手把手教程。
2025-02-18
我的毕业论文是AIGC的陶寺遗址空间可视分析技术研究,请问有何思路
对于您的毕业论文主题“AIGC 的陶寺遗址空间可视分析技术研究”,以下是一些可能的思路供您参考: 首先,深入了解陶寺遗址的相关背景和特点,包括其历史、文化、地理等方面的信息,这将为后续的分析提供基础。 其次,研究 AIGC 技术在空间可视分析方面的应用现状和前沿成果,了解相关的算法、模型和工具。 然后,考虑如何收集和整理陶寺遗址的空间数据,例如通过实地测量、卫星图像、考古记录等方式获取数据,并对数据进行预处理和清洗。 接着,运用合适的 AIGC 技术和算法,对陶寺遗址的空间数据进行可视化呈现,例如创建三维模型、绘制地图、生成动态图像等,以直观展示遗址的空间特征和关系。 在可视化的基础上,进行深入的分析,例如探究遗址的布局规律、空间结构、功能分区等,挖掘潜在的历史和文化信息。 最后,对研究结果进行评估和验证,确保其准确性和可靠性,并提出进一步的改进和优化方向。 希望这些思路能对您有所帮助,祝您顺利完成毕业论文!
2025-02-18
我想了解diffusion技术相关的重要论文
以下是一些与 diffusion 技术相关的重要论文: 《HighResolution Image Synthesis with Latent Diffusion Models》:https://arxiv.org/abs/2112.10752 《Denoising Diffusion Probabilistic Models》:作者为 Ho、Jain、Abbeel,出自 Berkeley (2020)
2025-02-16
我现在想根据我的博士论文,想出一个国家社科基金的选题。但是我的博士论文感觉核心不是特别突出,我希望找到一个AI助手,让AI帮我读论文的PDF格式然后总结出一个最合适的选题,有没有推荐的AI工具?
以下是一些关于利用 AI 辅助完成您需求的建议: 1. 先拆解您的博士论文工作流程,搞清楚每个步骤的输入输出和相互关系。 2. 思考论文中的哪些环节可以引入 AI 工具来提效,一切要从业务逻辑出发,AI 是锦上添花,不能本末倒置。 3. 搭建选题库,明确论文的定位(可用 AI 辅助分析),找相关的对标论文和优秀研究。 4. 在写作环节,可用 AI 辅助拆解对标论文,提炼写作技巧,然后根据借鉴的技巧结合自身特色列出写作大纲,并使用 AI 优化大纲、查找资料、润色文章,但核心内容要自己完成,不能过度依赖 AI。 5. 起标题与配图方面,用 AI 辅助批量生成标题,再自己修改优化,评估标题是否足够吸引眼球,让 AI 分析论文提供配图建议,去免费图库搜索配图。 6. 养成习惯与总结,做每件事前都思考 AI 能提供什么帮助,把整套流程实践几次,形成肌肉记忆,不断打磨完善属于自己的 AI 辅助流程,同时警惕过度依赖,AI 只是辅助,核心能力要靠自己。 目前常见的可用于辅助您的 AI 工具如 ChatGPT 等,但具体的选择还需根据您的实际需求和使用体验来决定。
2025-02-16