Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek v3

Answer

DeepSeek V3 相关信息如下:

  • 如果 V-3 是 DeepSeek 的 GPT-3 时刻,接下来的发展充满未知,但有趣的事还在后头,DeepSeek 应会为全人类的人工智能事业做更大贡献,其秘方是硅谷味儿的。
  • 作为中国杭州的人工智能创业公司,DeepSeek 在 2024 年 12 月发布的大语言模型 DeepSeek-V3 实现了诸多不可能,以 550 万美元和 2000 块英伟达 H800 GPU 训练出的开源模型,多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等顶级开源模型,与 GPT-4o 和 Claude 3.5-Sonnet 等世界顶级闭源模型不相上下。尽管 OpenAI CEO Sam Altman 发疑似影射其抄袭的推文,但 DeepSeek 收获广泛真诚赞誉,尤其在开源社区。
  • 12 月 27 日发布预览版,参数量 685B,磁盘占用 687.9GB,架构为混合专家模型(MoE),256 个专家,每个 token 使用 8 个专家,竞争对手为 Meta AI 的 Llama 3.1(405B 参数)。亮点包括准确理解复杂和细微查询、知识更新至 2023 年、多语言支持和个性化服务增强、数据安全和隐私保护加强,在 BigCodeBench-Hard 排名第一。Aider Polyglot 排行榜预览得分 48.4%,排名第二。相关链接包括详细信息:https://x.com/imxiaohu/status/1872182632584561056 ,模型下载:https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main ,在线体验:https://chat.deepseek.com/sign_in 。
  • Google 外包人员通过多项指标对 Gemini 和 Claude 进行输出对比,Claude 安全策略最严格,拒绝不安全提示,Gemini 部分回答被标记为“严重安全违规”。
Content generated by AI large model, please carefully verify (powered by aily)

References

DeepSeek 的秘方是硅谷味儿的

如果V-3真的是DeepSeek的GPT-3时刻,那接下来将发生什么?是DeepSeek的GPT-3.5——也就是ChatGPT时刻,或是其它?没人知道,但有意思的事儿应该还在后头。DeepSeek应该不会永远是一个“计算机系Pro”的存在,它也理应为全人类的人工智能事业做出更大的贡献。无论如何,DeepSeek已经是中国最全球化的AI公司之一,它赢得来自全球同行甚至对手的尊重的秘方,也是硅谷味儿的。

DeepSeek 的秘方是硅谷味儿的

中国杭州的人工智能创业公司DeepSeek是近一段时间硅谷的AI研究者和开发者的心魔。它在2024年12月发布的大语言模型DeepSeek-V3被认为实现了诸多的不可能:550万美元和2000块英伟达H800 GPU(针对中国市场的低配版GPU)训练出的开源模型,多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等顶级开源模型,亦与GPT-4o和Claude 3.5-Sonnet这样世界顶级的闭源模型不相上下——而训练后者的成本保守估计也要数亿美元和几十万块最强劲的英伟达H100。可以想象它在人工智能界引发的震撼——尤其是在AI领域的研究人员、创业者、资金、算力和资源最扎堆的硅谷。不少硅谷AI领域的重要人士都不吝惜对DeepSeek的称赞,比如OpenAI联合创始人Andrej Kaparthy和Scale.ai的创始人Alexandr Wang。尽管OpenAI CEO Sam Altman发了一条疑似影射DeepSeek抄袭借鉴其它先进成果的推文(很快就被人回怼“是指把Google发明的Transformer架构拿过来用么?),但DeepSeek收获的赞誉确实是广泛而真诚的,尤其是在开源社区,开发者用脚投票。

XiaoHu.AI日报

🔔Xiaohu.AI日报「12月27」✨✨✨✨✨✨✨✨1⃣️🚀Deepseek v3预览版发布参数量:685B,磁盘占用:687.9 GB架构:混合专家模型(MoE),256个专家,每个token使用8个专家竞争对手:Meta AI的Llama 3.1(405B参数)✨亮点:理解能力提升:准确理解复杂和nuanced查询知识更新至2023年,提供更及时、更相关的信息多语言支持和个性化服务增强数据安全和隐私保护加强在BigCodeBench-Hard排名第一🔗评分情况:Aider Polyglot排行榜预览得分48.4%,排名第二,仅次于o1-2024-12-17(high)。领先于Claude 3.5 Sonnet-20241022和Gemini Exp-1206。🔗详细信息:[https://x.com/imxiaohu/status/1872182632584561056](https://x.com/imxiaohu/status/1872182632584561056)🔗模型下载:[https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main](https://huggingface.co/deepseek-ai/DeepSeek-V3-Base/tree/main)🔗在线体验:[https://chat.deepseek.com/sign_in](https://chat.deepseek.com/sign_in)2⃣️🔍Google使用Claude对比测试GeminiGoogle外包人员通过多项指标对Gemini和Claude进行输出对比Claude安全策略最严格:拒绝不安全提示,例如角色扮演或特定不合规请求Gemini的部分回答被标记为“严重安全违规”

Others are asking
飞书多维表格如何 批量用DeepSeek提效
以下是关于飞书多维表格与 DeepSeek 结合提效的相关信息: 《喂饭级教程:飞书多维表格+DeepSeek=10 倍速用 AI》介绍了两者的结合方式,可实现批量处理信息、提升工作效率。用户能批量转换文风、快速回复消息、利用 AI 生成文案,操作简便,且无需编程知识。 《雪梅 May 的 AI 学习日记》中提到飞书多维表格插上 DeepSeek 的翅膀起飞,作为重度用户强推加了 AI 功能及 DeepSeek 的飞书多维表格。指出对于 AI agent,扣子只能做单次任务,而飞书多维表格的 agent 能做批量任务。使用 AI agent 可能是个人的事,但用飞书多维表格后可成为团队协作的事,能让团队小伙伴一起提交内容给 AI 批量处理并返回。 相关链接: 《最好的致敬是学习:DeepSeekR1 赏析》:https://mp.weixin.qq.com/s/_XGBipbywCOtcKu13QDW5Q 《DeepSeek 创新源于芯片封锁,Anthropic 或成最大输家;美国不是通过创新竞争,而是通过封锁竞争》:https://mp.weixin.qq.com/s/WiWTriENGR229S08BRFlSA 《喂饭级教程:飞书多维表格+DeepSeek=10 倍速用 AI》:https://mp.weixin.qq.com/s/aIi4tIy0CCINyQE_3AfF_Q 大仙课|当飞书遇上 DeepSeek 们:https://waytoagi.feishu.cn/wiki/QNOOwPTlRiziWikxPU2cqmUZnad 回放链接:https://www.feishu.cn/community/course/content?course_id=7469623322680999964&class_id=7469623322716717084&lesson_id=7469623696753360900&content_id=7469623696782770180
2025-02-22
DeepSeek的V3版本适合那些配置的电脑使用
DeepSeek 的 V3 版本在以下云计算厂商中的使用情况如下: 腾讯云(调用 API):API 调用 DeepSeek 系列模型限时免费,包括 DeepSeekV3。即日至北京时间 2025 年 2 月 25 日 23:59:59,所有腾讯云用户均可享受 DeepSeekV3 模型限时免费服务,单账号限制接口并发上限为 5。在此之后,模型价格将恢复至原价。 京东云:未提及 DeepSeekV3 版本的相关配置和使用情况。 Gitee AI:未提及 DeepSeekV3 版本的相关配置和使用情况。 需要注意的是,不同云计算厂商的配置和价格可能会有所变化,建议您在实际使用时进一步了解和确认。
2025-02-22
deepseek 写小说
以下是关于使用 DeepSeek 写小说的相关信息: 比赛要求: 主题:反转 字数:1000 字内 考量点:反差强烈、出乎意料、前文有铺垫且反转合理 制作工具:DeepSeek 使用地址:https://www.deepseek.com/ 推荐使用深度思考 R1 模型 允许人为轻微调整 不建议出现:鲜血、武器、鬼怪骷髅、知名人物、18X 等不符合国家政策的内容,可能导致落选 投稿方式:通往 AGI 之路腾讯频道【deepseek 专区】点击投稿,链接直达:https://pd.qq.com/s/p9z7r8c0?businessType=9 ,提交内容:小说名+具体正文(建议:用 AI 生成小说封面,同时上传封面更有吸引力) 社区直播 AI 评选: 时间:2 月 16 日晚 8 点 地址:通往 AGI 之路视频号现场直播看如何用 AI 评选出最佳小说家 须知:参与该挑战视作同意将作品的使用权授予本号用于社群运营、展览、展示等用途。主办方拥有最终解释权。 比赛周期: 开启时间:2025 年 2 月 9 日 截止时间:2025 年 2 月 16 日晚 8 点 评选时间:2025 年 2 月 16 日晚 8 点社区直播 AI 评选 社区共学:时间为 2 月 9 日晚 8 点,地址:通往 AGI 之路视频号解锁 DeepSeek 写小说。 此外,还有关于 DeepSeek 写小说的智能纪要,包括从 Deepseek R1 提示词过渡到小说写作的探讨,模型应用和创作的讨论,以及 AI 创作交流与线下活动分享等内容。
2025-02-22
deepseek
DeepSeek 是一家具有独特特点和影响力的公司: 1. 其秘方具有硅谷特色: 不是“中国式创新”的产物,不能简单地将其比喻成“AI 界的拼多多”或认为其秘方就是多快好省。 早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动。 是中国最全球化的 AI 公司之一,赢得全球同行甚至对手尊重的秘方也是硅谷味儿的。 2. V3 可能是 DeepSeek 的 GPT3 时刻,未来发展充满未知但值得期待。 3. 关于提升 DeepSeek 能力的提示词 HiDeepSeek: 效果对比:可通过 Coze 做小测试进行对比。 使用方法:包括搜索网站、点击“开始对话”、发送装有提示词的代码、阅读开场白后正式开始对话等步骤。 设计思路:将 Agent 封装成 Prompt 并储存于文件以减轻调试负担,实现联网和深度思考功能,优化输出质量,设计阈值系统,用 XML 进行规范设定等。 完整提示词:v 1.3。 特别鸣谢:李继刚的【思考的七把武器】提供思考方向,Thinking Claude 是设计灵感来源,Claude 3.5 Sonnet 是得力助手。
2025-02-22
Deepseek 从入门到精通
以下是关于 DeepSeek 从入门到精通的相关资源: 《》 ,由清华大学新闻与传播学院、新媒体研究中心、元宇宙文化实验室提供,类型为 PPT 课件。
2025-02-21
如何私有化部署deepseek
私有化部署 DeepSeek 的步骤如下: 1. 注册并登录火山引擎,点击立即体验进入控制台。 网址:https://zjsms.com/iP5QRuGW/ 火山引擎是字节跳动旗下的云服务平台。 2. 创建一个接入点: 点击在线推理创建推理接入点。 为接入点命名为 DeepSeekR1。 若提示“该模型未开通,开通后可创建推理接入点”,点击“立即开通”,勾选全部模型和协议,一路点击开通(免费)。 确认以下无误后,点击“确认接入”按钮。 自动返回创建页面,复制多出的接入点名为“DeepSeekR1”的推理点 ID 保存。 点击【API 调用】按钮,进入后点击【选择 API Key 并复制】,若没有则点击【创建 API key】,复制并保存。 3. 前往 DeepSeek 官网(https://www.deepseek.com/),进入右上角的 API 开放平台。 早期 DeepSeek 有赠送额度,若没有赠送余额可选择充值,支持美元和人民币两种结算方式及各种个性化充值方式。 创建一个 API key,注意 API key 只会出现一次请及时保存。 4. 下载代码编辑器,如 cursor(https://www.cursor.com/)或 vscode(https://code.visualstudio.com/)。 以 cursor 为例,下载安装后,在插件页面搜索并安装 Roocline。 安装完后,打开三角箭头,选中 RooCline 并点击齿轮,进入设置。 配置基本参数: API Provider:选择 DeepSeek。 API Key:填入已创建的 key。 模型:选择 DeepSeekreasoner。 语言偏好设置。 小贴士:记得把 HighRisk 选项都打开,最后点击 Done 保存修改。 在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。
2025-02-21
配置“DeepSeek-R1”模型的 API key:基础 URL 为 https://ark.cn-beijing.volces.com/api/v3,填好之后点击保存,关掉提醒弹窗。请对于这一步进行细节说明
以下是配置“DeepSeekR1”模型的 API key 的详细步骤: 1. 注册并登录火山引擎,点击立即体验进入控制台:https://zjsms.com/iP5QRuGW/ (火山引擎是字节跳动旗下的云服务平台)。 2. 创建一个接入点:点击在线推理创建推理接入点。 3. 为接入点命名为“DeepSeekR1”。如果出现“该模型未开通,开通后可创建推理接入点”的提示,点击“立即开通”,勾选全部模型和协议,一路点击开通(免费)。如果无提示则直接到第 5 步,点击确认接入。 4. 确认以下无误后,点击“确认接入”按钮。 5. 自动返回创建页面。发现多出一行接入点名是“DeepSeekR1”,复制这个推理点的 ID 放到微信里保存。 6. 保存后再点击【API 调用】按钮,进入后点击【选择 API Key 并复制】。如果已经有 API key 了,就直接查看并复制。如果没有,则点击【创建 API key】,复制好之后,放到微信里保存。 7. 也可以使用其他插件,下面为举例示意使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 。 8. 打开聊天页面,点击右上角的插件列表,找到 Page Assist 插件,点击打开。 9. 基础 URL 填写:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 10. 配置完成。
2025-02-15
deepseek V3
DeepSeek 是基于 AI 模型的产品,DeepSeek V3 是其品牌下的具体模型之一(类 GPT4o)。DeepSeek 不是“中国式创新”的产物,它是中国杭州的人工智能创业公司,其在 2024 年 12 月发布的大语言模型 DeepSeekV3 引发了震撼,多项评测成绩优秀,以相对较低的成本和硬件实现了出色的成果,收获了广泛的赞誉,尤其是在开源社区。同时,DeepSeek 应该为全人类的人工智能事业做出更大贡献,且已成为中国最全球化的 AI 公司之一,其成功的秘方具有硅谷风格。
2025-02-06
查看deepseek v3 技术报告
以下是关于 DeepSeek V3 的相关信息: Andrej Kaparthy 赞扬 Deepseek 的技术报告值得一读。 很多中国人将 DeepSeekV3 视作“国货之光”,它对高性能算力的依赖小,将训练和推理当作一个系统,给出诸多新的技术思路,注重用工程思维高效解决算法和技术问题。 DeepSeek 的创始人梁文锋出生于 1980 年代,来自广东省的一个五线城市,毕业于浙江大学,主修软件工程,本硕,人工智能方向,非常低调。 阅读 DeepSeek V3 的技术报告列出的研发人员名单近 200 人,均为本土 CS,很多核心是清北及大学应届的 CS 硕博,即便核心人员也是毕业 3 5 年 CS 博士,研发人员充分信任不断自我选择,这是中国最像 OpenAI 研发组织分工和氛围的 AI 研究机构。 您可以通过以下链接获取相关技术报告:
2025-01-31