Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

你与deepseek比谁厉害

Answer

以下是关于 DeepSeek 的相关信息:

  • DeepSeek 训练成本远高于传闻,总计约 13 亿美元,定价低于实际成本导致高额亏损。其采用 Mixture-of-Expert 方法降低计算需求,但大规模内存使用可能增加总成本。
  • Mistral AI 曾被中国 DeepSeek 迅速赶超,DeepSeek 的“极简算力”模式可能削弱 Mistral 的竞争优势。
  • DeepSeek v3 预览版已发布,参数量为 685B,磁盘占用 687.9 GB,采用混合专家模型(MoE),有 256 个专家,每个 token 使用 8 个专家。其竞争对手为 Meta AI 的 Llama 3.1。DeepSeek v3 理解能力提升,知识更新至 2023 年,多语言支持和个性化服务增强,数据安全和隐私保护加强,在 BigCodeBench-Hard 排名第一。Aider Polyglot 排行榜预览得分 48.4%,排名第二。可通过相关链接获取详细信息、进行模型下载和在线体验。
  • Google 外包人员通过多项指标对 Gemini 和 Claude 进行输出对比,Claude 安全策略严格,拒绝不安全提示,Gemini 部分回答被标记为“严重安全违规”。

但关于我与 DeepSeek 谁更厉害,无法直接简单对比得出结论,因为这取决于多个因素和具体的应用场景。

Content generated by AI large model, please carefully verify (powered by aily)

References

宝玉 日报

🫧宝玉日报「1月31日」✨✨✨✨✨✨✨✨1⃣️💰DeepSeek训练成本:训练成本远高于传闻的600万美元,总计约13亿美元。定价低于实际成本,导致高额亏损。Mixture-of-Expert方法降低计算需求,但大规模内存使用可能反而增加总成本。🥜总结:DeepSeek展示了AI领域的持续创新,但并未如传言般“颠覆”。🔗[https://x.com/dotey/status/1885368473364103402](https://x.com/dotey/status/1885368473364103402)🔗来源:[https://www.linkedin.com/posts/gillesbackhus_i-want-to-share-a-few-condensed-things-about-activity-7291076837080723457-JSVH/](https://www.linkedin.com/posts/gillesbackhus_i-want-to-share-a-few-condensed-things-about-activity-7291076837080723457-JSVH/)2⃣️🇫🇷Mistral AI面临挑战:以低成本开发顶级AI模型,但被中国DeepSeek迅速赶超。曾获法国政府、英伟达、a16z等支持,估值达20亿美元。DeepSeek的“极简算力”模式可能削弱Mistral的竞争优势。🔮未来:或被科技巨头收购,或需要重新定位。🔗[https://x.com/dotey/status/1885226709152092573](https://x.com/dotey/status/1885226709152092573)3⃣️⚡扎克伯格:AI变革在即!

XiaoHu.AI日报

🔔Xiaohu.AI日报「12月27」✨✨✨✨✨✨✨✨1⃣️🚀Deepseek v3预览版发布参数量:685B,磁盘占用:687.9 GB架构:混合专家模型(MoE),256个专家,每个token使用8个专家竞争对手:Meta AI的Llama 3.1(405B参数)✨亮点:理解能力提升:准确理解复杂和nuanced查询知识更新至2023年,提供更及时、更相关的信息多语言支持和个性化服务增强数据安全和隐私保护加强在BigCodeBench-Hard排名第一🔗评分情况:Aider Polyglot排行榜预览得分48.4%,排名第二,仅次于o1-2024-12-17(high)。领先于Claude 3.5 Sonnet-20241022和Gemini Exp-1206。🔗详细信息:[https://x.com/imxiaohu/status/1872182632584561056](https://x.com/imxiaohu/status/1872182632584561056)🔗模型下载:[https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main](https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main)🔗在线体验:[https://chat.deepseek.com/sign_in](https://chat.deepseek.com/sign_in)2⃣️🔍Google使用Claude对比测试GeminiGoogle外包人员通过多项指标对Gemini和Claude进行输出对比Claude安全策略最严格:拒绝不安全提示,例如角色扮演或特定不合规请求Gemini的部分回答被标记为“严重安全违规”

XiaoHu.AI日报

🔔Xiaohu.AI日报「12月27」✨✨✨✨✨✨✨✨1⃣️🚀Deepseek v3预览版发布参数量:685B,磁盘占用:687.9 GB架构:混合专家模型(MoE),256个专家,每个token使用8个专家竞争对手:Meta AI的Llama 3.1(405B参数)✨亮点:理解能力提升:准确理解复杂和nuanced查询知识更新至2023年,提供更及时、更相关的信息多语言支持和个性化服务增强数据安全和隐私保护加强在BigCodeBench-Hard排名第一🔗评分情况:Aider Polyglot排行榜预览得分48.4%,排名第二,仅次于o1-2024-12-17(high)。领先于Claude 3.5 Sonnet-20241022和Gemini Exp-1206。🔗详细信息:[https://x.com/imxiaohu/status/1872182632584561056](https://x.com/imxiaohu/status/1872182632584561056)🔗模型下载:[https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main](https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main)🔗在线体验:[https://chat.deepseek.com/sign_in](https://chat.deepseek.com/sign_in)2⃣️🔍Google使用Claude对比测试GeminiGoogle外包人员通过多项指标对Gemini和Claude进行输出对比Claude安全策略最严格:拒绝不安全提示,例如角色扮演或特定不合规请求Gemini的部分回答被标记为“严重安全违规”

Others are asking
deepseek怎么用
以下是关于 DeepSeek 的使用方法: 1. 访问 www.deepseek.com ,点击“开始对话”。 2. 将装有提示词的代码发给 DeepSeek 。 3. 认真阅读开场白之后,正式开始对话。 此外,获取 DeepSeekR1 满血版密钥的步骤如下: 1. 注册并登录火山引擎,点击立即体验进入控制台。链接为:https://zjsms.com/iP5QRuGW/ (火山引擎是字节跳动旗下的云服务平台,在 AI 领域最为大众所熟知的应该是“豆包大模型”,这里就是源头) 2. 创建一个接入点,点击在线推理创建推理接入点。 3. 为接入点命名为 DeepSeekR1。然后可能会提示:“该模型未开通,开通后可创建推理接入点”。如果有提示,就点击“立即开通”,开通一下就可以了。如果无提示则直接到:第 5 步,点击确认接入。 4. 点击“立即开通”跳转到此页面,勾选全部模型和协议,一路点击开通即可。(这里是免费的) 5. 确认以下无误后,点击“确认接入”按钮。 6. 自动返回创建页面。发现多出一行接入点名是“DeepSeekR1”(我们刚才自己设置的命名)。重点来了:这个就是推理点的 ID,复制他放到您的微信里,发给自己保存一下。 7. 保存后再点击【API 调用】按钮,进入后点击【选择 API Key 并复制】。 8. 如果您已经有 API key 了,就直接查看并复制。如果没有,则点击【创建 API key】。 9. 把这个复制好之后,也放到您自己微信里,保存好。 DeepSeek 的设计思路包括: 1. 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 2. 通过提示词文件,让 DeepSeek 实现:同时使用联网功能和深度思考功能。 3. 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 4. 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 5. 用 XML 来进行更为规范的设定,而不是用 Lisp(对我来说有难度)和 Markdown(运行下来似乎不是很稳定)。 关于 DeepSeek 的使用分享: 1. DP 模型的功能:能进行自然语言理解与分析、编程、绘图,如 SVG、MA Max 图表、react 图表等。 2. 使用优势:可以用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容。 3. 存在问题:思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本。 4. 审核方法:可以用其他大模型来解读 DP 模型给出的内容。 5. 使用建议:使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。 6. 使用场景:包括阅读、育儿、写作、随意交流等方面。 7. 案例展示:通过与孩子共读时制作可视化互动游戏,以及左脚踩右脚式的模型交互来展示 DP 模型的应用。 另外,DeepSeek 文档可以在 3 群和 4 群分享中获取,也可在 v to a gi 的飞书知识库中搜索获取。未来活动预告:明天后天在摩纳社区提供免费算力资源带大家学习炼丹,周一晚上学习多维表格中接入 DeepSeek 。
2025-02-20
deepseek提示词
以下是关于 deepseek 提示词的相关内容: 生成单词方面:输入单词主题、图片风格、单词数量,如非洲动物、真实风格、2。选择 deepseekr1 模型,可生成指定数量的单词数组,以数组方式输出,包括单词、中文、美式音标及相关例句和翻译。提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,且输出必须为符合要求的数组形式。 时代关键诉求方面:在 deepseek 时代,完整的长提示词可能不如片段有效,甚至干扰模型思考流程,带来 Token 浪费和上下文污染。新一代 LLM 的正确打开方式是“关键诉求直通车”模式,如像对聪明助理打暗号:“主题:环保|要最新案例|结尾有力道”,让模型自主发挥。 生成相机运动轨迹方面:以往的提示词是场景、构图、尺寸、位置、形态、半身全身、环境的组合,现在把这些提示词喂给 DeepSeek,要求以“相机运动轨迹”的方式来描写,可得到新提示词,如“相机向上飞升至上空轨道视角,拍摄站在泳池旁的女子”,海螺 AI 能对空间理解和遵循语义,自然生成相关内容,甚至为主角匹配相应物品。
2025-02-20
deepseek经常服务器繁忙的解决方案?
以下是一些解决 DeepSeek 服务器繁忙的方案: 1. 尝试以下搜索网站: 秘塔搜索:https://metaso.cn 360 纳米 AI 搜索:https://www.n.cn/ 硅基流动:https://siliconflow.cn/zhcn/ 字节跳动火山擎:https://console.partner.volcengine.com/auth/login?redirectURI=%2Fpartner%2F 百度云千帆:https://login.bce.baidu.com/ 英伟达:https://build.nvidia.com/deepseekai/deepseekr1 Groq:https://groq.com/ Chutes:https://chutes.ai/app 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 Github:https://github.com/marketplace/models/azuremldeepseek/DeepSeekR1/playground POE:https://poe.com/DeepSeekR1 Cursor:https://cursor.sh/ Monica:https://monica.im/invitation?c=ACZ7WJJ9 Lambda:https://lambdalabscom/6 Cerebras:https://cerebras.ai Perplexity:https://www.perplexity.ai 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1 2. 可以通过以下步骤使用网页聊天解决: 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 配置“DeepSeekR1”模型的 API key:基础 URL:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 添加“DeepSeekR1”模型。 3. 还可以使用以下网站(部分需要魔法,不做教学支持): 秘塔搜索:https://metaso.cn 360 纳米 AI 搜索:https://www.n.cn/(bot.n.cn) 硅基流动:https://cloud.siliconflow.cn/i/RjJgQqae AskManyAI:https://dazi.co/login?i=7db38e6e 字节跳动火山引擎:https://console.volcengine.com/ark/region:ark+cnbeijing/experience 百度云千帆:https://console.bce.baidu.com/qian3an/modelcenter/model/buildIn/list 英伟达 NIM Groq:https://groq.com/ Fireworks:https://fireworks.ai/models/fireworks/deepseekr1 Chutes:https://chutes.ai/app/chute/ Github:https://github.com/marketplace/models/azuremldeepseek/DeepSeekR1/playground POE:https://poe.com/DeepSeekR1 Cursor:https://cursor.sh/ Monica:https://monica.im/invitation?c=ACZ7WJJ9 Lambda:https://lambdalabs.com/ Cerebras:https://cerebras.ai Perplexity:https://www.perplexity.ai 阿里云百炼:https://api.together.ai/playground/chat/deepseekai/DeepSeekR1
2025-02-20
如何正确的向deepseek提问来辅助我写一篇文献
以下是向 DeepSeek 提问来辅助写文献的正确方法: 1. 借助 AI 分析好的文章: 找出您最喜欢的文章,投喂给 DeepSeek R1(适合大多数有推理模型的 AI)。 第一次询问:请从写作角度分析这篇文章。 第二次询问:请再从读者角度分析这篇文章。 第三次询问:这篇文章还存在什么缺点和不足,有什么改善和提升的空间。 对作者进行侧写,分析成长背景、个人经历和知识结构对文章的影响。 2. 让 AI 对您写的文章进行点评: 表述为“现在我希望你是一名资深中文写作教师/小学语文老师/中学语文老师/公文写作培训师,拥有 30 年教育经验,是一名传授写作技巧的专家。请先阅读我提供给你的文章,然后对文章进行分析,然后教我如何提升写作水平。请给出详细的优缺点分析,指出问题所在,并且给出具体的指导和建议。为了方便我能理解,请尽量多举例子而非理论陈述。” 3. 根据文章内容对作者进行心理侧写: 表述为“我希望你扮演一个从业 20 多年,临床诊治过两千多例心理分析案例的人性洞察和意识分析方面的专家,精通心理学、人类学、文史、文化比较。先阅读后附文章全文,然后对作者进行人格侧写。要尖锐深刻,不要吹捧包装,不要提出一些只能充当心理安慰的肤浅的见解。包括作者的基本画像、核心性格特质、认知与价值观、潜在心理动机、行为模式推测、矛盾与盲点、文化符号映射。” 此外,还有用 DeepSeek 扮演一本书的作者辅助阅读书籍的案例,比如在读项飚的《跨越边界的社区》时,让 DeepSeek 解释作者为什么这么写,它会从时代背景的张力、浙江村的实践智慧、方法论上的颠覆等层面进行剖析。
2025-02-20
DeepSeek提示词
以下是关于 DeepSeek 提示词的相关内容: 生成小红书爆款单词视频: 开始:输入单词主题、图片风格、单词数量。 生成单词数组:选择 deepseekr1 模型,输入单词主题、单词数量,为用户输出指定数量的单词,并以数组方式输出,包括单词、中文、美式音标、英文句子及其中文翻译。提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,且输出必须为符合要求的数组形式。 Deepseek 时代提示词之关键诉求: 观察发现完整的提示词可能不如片段有效,甚至干扰模型思考流程,过长提示会带来 Token 浪费和上下文污染,在多轮对话中,用户只需在关键点进行引导,让模型自主发挥,“关键诉求直通车”模式是新一代 LLM 的正确打开方式。新旧提示法对比,传统方法像唠叨家长,新型技巧像对聪明助理打暗号。 集合·DeepSeek 提示词方法论: 核心原理认知:包括 AI 特性定位(多模态理解、动态上下文、任务适应性)和系统响应机制(采用意图识别+内容生成双通道,自动检测 prompt 中的任务类型、输出格式、知识范围,对位置权重、符号强调敏感)。 基础指令框架:如果不知道如何表达,可套用框架指令,包括四要素模板、格式控制语法(强制结构、占位符标记、优先级符号)。 进阶控制技巧:包括思维链引导(分步标记法、苏格拉底式追问)、知识库调用(领域限定指令、文献引用模式)、多模态输出。
2025-02-20
deepseek外接
以下是关于 DeepSeek 外接的相关内容: 一个提示词,让 DeepSeek 的能力更上一层楼: 效果对比:用 Coze 做了小测试,可对比查看相关视频。 如何使用: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 Deepseek。 认真阅读开场白后正式开始对话。 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用,减轻调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力基础上优化输出质量,减轻 AI 味,增加可读性。 设计阈值系统,可能形式大于实质,之后根据反馈可能修改。 用 XML 进行更为规范的设定,而非 Lisp 和 Markdown。 完整提示词:v 1.3 特别鸣谢:李继刚提供思考方向,Thinking Claude 是设计灵感来源,Claude 3.5 Sonnet 是得力助手。 韦恩:被困在离线孤岛?DeepSeek 联网版我已经用扣子实现了!!不卡顿!! 核心路径:通过工作流+DeepSeek R1 大模型,实现联网版的 R1 大模型。 拥有扣子专业版账号:若为普通账号,请自行升级或注册专业号后使用。 开通 DeepSeek R1 大模型:访问地址 https://console.volcengine.com/cozepro/overview?scenario=coze,在火山方舟中找到开通管理,开通服务,添加在线推理模型,添加后在扣子开发平台才能使用。 创建智能体:点击创建,先完成一个智能体的创建。 AI 编程与炼金术:Build on Trae 使用 DeepSeek R1 给老外起中文名: 第二步:开发网页,接入 DeepSeek R1。在本地新建文件夹,用 Trae 打开,粘贴 API Key 和调用代码示例。若报错,截图给 Trae 处理。 作业:可尝试更多创新,如优化网页样式,增加不同选项和属性,增加等待时的样式等。
2025-02-20
目前国内有哪些AI工具,他们分别在哪方面比较厉害
目前国内有以下一些比较出色的 AI 工具: 1. 图像类: 可灵:由快手团队开发,主要用于生成高质量的图像和视频,图像质量高,但价格相对较高,重度用户年费可达几千元,轻度用户有每日免费点数和较便宜的包月选项。 通义万相:在中文理解和处理方面表现出色,可选择多种艺术和图像风格,生成图像质量高、细节丰富,操作界面简洁直观,用户友好度高,且目前免费,每天签到获取灵感值即可使用。但某些类型的图像因国内监管要求无法生成,处理非中文语言或国际化内容可能存在不足。 2. 编程类: GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能快速提供代码建议。 通义灵码:阿里巴巴团队推出,提供多种编程辅助能力。 CodeWhisperer:亚马逊 AWS 团队推出,可为开发人员实时提供代码建议。 CodeGeeX:智谱 AI 推出的开源免费工具,基于 130 亿参数的预训练大模型,能快速生成代码。 Cody:Sourcegraph 推出,借助强大的代码语义索引和分析能力,了解开发者的整个代码库。 CodeFuse:蚂蚁集团支付宝团队推出的免费 AI 代码助手,基于自研基础大模型微调。 Codeium:通过提供代码建议、重构提示和代码解释帮助软件开发人员提高效率和准确性。 更多辅助编程 AI 产品,还可以查看:https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同,您可以根据自身需求选择。
2024-12-26
AI绘画这么厉害了,那儿童还有必要学习素描课吗
即便 AI 绘画很厉害,儿童仍有必要学习素描课。手绘素描笔记有助于建立突触连接,将信息从短期记忆转化为长期记忆,让人成为更好的概念思考者。例如,在科学观察中,学生通过手绘能更好地学会观察,这个过程不可被替代。就学习而言,掌握新技能时应先进行动手、动脑、技术最小化的学习,不应一开始就依赖 AI。比如在记笔记时,手写比打字能让学生记住更多信息。此外,在一些课程设计中,如离谱村的 AI 课,通过巧妙的环节设置和老师的引导,能让孩子更好地学习和发挥想象。
2024-12-20
国内哪个AI工具写党政文件最厉害
目前没有特定的 AI 工具被明确认定为在写党政文件方面表现最为出色。党政文件的撰写需要严格遵循相关的政策、法规和规范,其内容具有高度的政治性、权威性和严肃性。AI 工具可以提供一定的辅助和参考,但不能完全替代人工的思考、判断和审核。
2024-12-04
为什么AI那么厉害
AI 之所以厉害,原因主要包括以下几点: 1. 具有非凡的潜力,能够在众多领域得到应用,如改善社会和经济,其影响力可与电力和互联网相媲美,能推动增长并创造就业机会。 2. 可支持人们完成现有工作,提高劳动力效率和工作场所安全性。 3. 是人类研究世界的有力工具,能帮助解决基础科学面临的瓶颈,例如在生物领域能快速计算蛋白质的折叠结构。 4. 不断发展和创新,如 GPT4 的升级,能为用户提供更多帮助。但同时也存在耗能等问题。
2024-11-12
ai真的有那么厉害吗
AI 的能力具有两面性。一方面,2023 年大众对 AI 的看法经历了从好奇到认为没那么厉害再到觉得与自身关系不大的过程,但目前尚未发现阻止 AGI 出现的硬性限制,且距离 AGI 可能仅有几年之遥。大模型的“想象力”和“取悦能力”比“逻辑能力”更早成熟,多模态大爆发也证明了 AGI 相对“窄 AI”的代际优越性,深度压缩是大模型的核心能力,端上智能越来越近,中美 AI 生态各自发展,2023 年技术差距未缩小。 在应用方面,AI 可以用于写东西,如草拟初稿,包括博客文章、论文等,还能改进写作内容、提供不同风格的草稿、帮助完成任务等。例如,像实习生一样写邮件、创建销售模板等。 然而,尽管 GPT4 能在美国医学执照考试中超过及格分数 20 分,但 AI 仍存在不足,如在各方面表现优秀但未在特定方面极其出色。
2024-11-03
现在最厉害的ai是什么
目前在 AI 领域,很难确切地指出哪一个是最厉害的。例如,ChatGPT 是一款能进行流畅对话的生成式 AI 模型,GPT4 在美国医学执照考试中超过及格分数 20 分;英伟达推出了新核弹 B200,是世界上最强大的 AI 芯片,能为训练更大、更复杂的模型提供强大支持。此外,AI 在很多领域都有出色的表现,如聊天机器人可以像朋友一样与人交流,还有一些 AI 能根据文字描述创造图片和视频等。不同的 AI 在不同的应用场景和任务中各有优势。
2024-10-11