Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

DeepSeek的价值是什么

Answer

DeepSeek 的价值主要体现在以下几个方面:

  1. 在全球 AI 社区具有重要意义,包括在技术突破和资源分配策略方面。它具有长上下文能力、量化商业模式,对 AI 生态系统产生深远影响,同时重点分析了其创新路径及中国在 AI 追赶中的潜力与挑战。
  2. 在架构和工程上有创新,如 MoE、MLA、MTP 和 FP8 混合精度训练,在工程和应用平衡中达成高效优化,对开源与闭源竞争进行深刻反思,并指出 AI 生态未来发展方向。
  3. 展示出媲美领先 AI 产品性能的模型,成本却仅为一小部分,并在全球主要市场的 App Store 登顶。
  4. 文字能力突出,尤其在中文场景中符合日常写作习惯,数学能力经过优化表现不错,但在专业论文总结方面稍弱,编程能力略逊于 GPT。GRPO 算法替代传统 PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。
Content generated by AI large model, please carefully verify (powered by aily)

References

宝玉 日报

🫧宝玉日报「1月27日」✨✨✨✨✨✨✨✨1⃣️📝拾象:DeepSeek r1闭门学习讨论|Best Ideas Vol 3讨论了DeepSeek在全球AI社区的意义,包括技术突破与资源分配策略。突出了DeepSeek长上下文能力、量化商业模式、以及其对AI生态系统的深远影响。重点分析了DeepSeek的创新路径及中国在AI追赶中的潜力与挑战。🔗[https://x.com/dotey/status/1883889358383571440](https://x.com/dotey/status/1883889358383571440)2⃣️🔍转:关于DeepSeek的研究和思考(Archerman Capital)深入解析DeepSeek在架构和工程上的创新,例如MoE、MLA、MTP和FP8混合精度训练。强调DeepSeek不是简单模仿,而是在工程和应用平衡中达成了高效优化。对开源与闭源竞争进行了深刻反思,并指出AI生态未来发展方向。🔗[https://x.com/dotey/status/1883801546934083944](https://x.com/dotey/status/1883801546934083944)3⃣️📖7B Model and 8K Examples:如何用8000个示例炼出自我反思AI?

XiaoHu.AI日报

🔔Xiaohu.AI日报「1月27日」✨✨✨✨✨✨✨✨1⃣️💹华尔街分析师对DeepSeek的反应:DeepSeek展示出媲美领先AI产品性能的模型,但成本仅为其一小部分,在全球主要市场的App Store登顶。Jefferies警告其技术可能打破资本开支狂热,Citi对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局,降低AI行业进入门槛。🔗[https://www.xiaohu.ai/c/xiaohu-ai/deepseek](https://www.xiaohu.ai/c/xiaohu-ai/deepseek)2⃣️📝DeepSeek的实际使用体验:在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。数学能力经过优化,表现不错;编程能力略逊于GPT,据用户反馈。GRPO算法替代传统PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。🔗[https://x.com/imxiaohu/status/1883843200756170873](https://x.com/imxiaohu/status/1883843200756170873)🔗[https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43](https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43)3⃣️🎙️复旦大学OpenMOSS发布实时语音交互模型:

XiaoHu.AI日报

🔔Xiaohu.AI日报「1月27日」✨✨✨✨✨✨✨✨1⃣️💹华尔街分析师对DeepSeek的反应:DeepSeek展示出媲美领先AI产品性能的模型,但成本仅为其一小部分,在全球主要市场的App Store登顶。Jefferies警告其技术可能打破资本开支狂热,Citi对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局,降低AI行业进入门槛。🔗[https://www.xiaohu.ai/c/xiaohu-ai/deepseek](https://www.xiaohu.ai/c/xiaohu-ai/deepseek)2⃣️📝DeepSeek的实际使用体验:在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。数学能力经过优化,表现不错;编程能力略逊于GPT,据用户反馈。GRPO算法替代传统PPO,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。🔗[https://x.com/imxiaohu/status/1883843200756170873](https://x.com/imxiaohu/status/1883843200756170873)🔗[https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43](https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43)3⃣️🎙️复旦大学OpenMOSS发布实时语音交互模型:

Others are asking
Deepseek 从入门到精通
以下是关于 DeepSeek 从入门到精通的相关资源: 《》 ,由清华大学新闻与传播学院、新媒体研究中心、元宇宙文化实验室提供,类型为 PPT 课件。
2025-02-21
如何私有化部署deepseek
私有化部署 DeepSeek 的步骤如下: 1. 注册并登录火山引擎,点击立即体验进入控制台。 网址:https://zjsms.com/iP5QRuGW/ 火山引擎是字节跳动旗下的云服务平台。 2. 创建一个接入点: 点击在线推理创建推理接入点。 为接入点命名为 DeepSeekR1。 若提示“该模型未开通,开通后可创建推理接入点”,点击“立即开通”,勾选全部模型和协议,一路点击开通(免费)。 确认以下无误后,点击“确认接入”按钮。 自动返回创建页面,复制多出的接入点名为“DeepSeekR1”的推理点 ID 保存。 点击【API 调用】按钮,进入后点击【选择 API Key 并复制】,若没有则点击【创建 API key】,复制并保存。 3. 前往 DeepSeek 官网(https://www.deepseek.com/),进入右上角的 API 开放平台。 早期 DeepSeek 有赠送额度,若没有赠送余额可选择充值,支持美元和人民币两种结算方式及各种个性化充值方式。 创建一个 API key,注意 API key 只会出现一次请及时保存。 4. 下载代码编辑器,如 cursor(https://www.cursor.com/)或 vscode(https://code.visualstudio.com/)。 以 cursor 为例,下载安装后,在插件页面搜索并安装 Roocline。 安装完后,打开三角箭头,选中 RooCline 并点击齿轮,进入设置。 配置基本参数: API Provider:选择 DeepSeek。 API Key:填入已创建的 key。 模型:选择 DeepSeekreasoner。 语言偏好设置。 小贴士:记得把 HighRisk 选项都打开,最后点击 Done 保存修改。 在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。
2025-02-21
deepseek与飞书多维表格联用
以下是关于 deepseek 与飞书多维表格联用的相关信息: 火山方舟 DeepSeek 提供了申请免费额度的教程,有多种 API 使用方式,包括飞书多维表格调用、Coze 智能体调用、浏览器插件调用。 可以使用邀请码 D3H5G9QA 并通过邀请链接获取 3000 万 tokens,畅享 671B DeepSeek R1。 操作指引包括点击邀请、复制邀请链接、分享邀请码或海报。 有相关的社区动态,如《喂饭级教程:飞书多维表格+DeepSeek=10 倍速用 AI》介绍了两者结合提升工作效率的方法。 在飞书多维表格上调用 DeepSeek 的自定义 AI(DeepSeek 版)链接为:https://bytedance.larkoffice.com/base/extensiono/replit_3f6c0f185eac23fb ,支持 DeepSeek R1、V3 模型以及 DeepSeek 官方、火山方舟、硅基流动三个服务商。
2025-02-21
deepseek与多维表格
以下是关于 DeepSeek 与多维表格的相关信息: 火山方舟 DeepSeek 申请免费额度教程及 API 使用方式:包括飞书多维表格调用、Coze 智能体调用、浏览器插件调用。邀请可拿 3000 万 tokens,邀请码为 D3H5G9QA,邀请链接为 https://www.volcengine.com/activity/deepseek?utm_term=202502dsinvite&ac=DSASUQY5&rc=D3H5G9QA 。即日起至北京时间 20250218 23:59:59,所有用户均可在方舟享受 DeepSeek 模型服务的价格优惠,DeepSeekR1、V3 模型分别提供了 50 万免费额度和 API 半价活动。 DeepSeek 模型的功能和使用情况:能进行自然语言理解与分析、编程、绘图等,使用优势是可以用更少的词让模型做更多事、思维发散、能给出创意思路和高级内容,但存在思维链长不易控制、可能输出看不懂或胡编乱造的内容、增加纠错成本等问题。审核方法可以用其他大模型来解读其给出的内容,使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。使用场景包括阅读、育儿、写作、随意交流等方面。 关于 DeepSeek 的介绍与活动预告:在 3 群和 4 群分享了 DeepSeek 的相关文档,也可在 v to a gi 的飞书知识库中搜索获取。未来活动预告包括明天后天在摩纳社区提供免费算力资源带大家学习炼丹,周一晚上学习多维表格中接入 DeepSeek 。 多维表格与 AI 应用经验分享及人机共生挑战探讨:彭骋介绍多维表格中 data think 的使用,演示不同服务商及模型的调用效果,提及新 R1 版本。徐雁斐讲述人机共生挑战,介绍用 DeepSeek 解决家庭问题的方法,包括找灵感、设计游戏的方法论,称其能成为解决家庭问题的好帮手。
2025-02-21
deepseek本地部署知识库
以下是关于 DeepSeek 本地部署知识库的相关信息: 您可以参考以下链接获取更多详细内容: DeepSeek 资料库:照着做可直接上手🔗 需要注意的是,日报中提到本地部署并不适合普通用户,纳米 AI 搜索是目前较为稳定的第三方替代方案,其满血版推理能力接近官方但速度较慢,高速版速度快、体验流畅但推理能力稍弱。体验地址:🔗或下载纳米 AI 搜索 APP 。
2025-02-21
deepseek 多维表格
以下是关于 deepseek 多维表格的相关信息: 2025 年 2 月 6 日的智能纪要中,介绍了 DP 模型的功能(能进行自然语言理解与分析、编程、绘图等)、使用优势(用更少的词做更多事,思维发散,能给出创意思路和高级内容)、存在问题(思维链长不易控制,可能输出错误内容,增加纠错成本)、审核方法(可用其他大模型解读其内容)、使用建议(使用时要有自己的思维雏形,多看思考过程)、使用场景(包括阅读、育儿、写作、随意交流等),并进行了案例展示,还分享了关于音系学和与大模型互动的内容。 2025 年 2 月 16 日,May 在《雪梅 May 的 AI 学习日记》中提到,飞书多维表格插上 deepseek 的翅膀起飞。作为飞书多维表格重度用户,强推加了 AI 功能和 deepseek 后的飞书多维表格,指出对于 AI agent 来说,扣子只能做单次任务,飞书多维表格的 agent 可以做批量任务,使用 AI agent 可能是个人的事情,用飞书多维表格之后可以成为团队协作的事情。 有获取字节火山 DeepSeek 系列 API 完整教程及使用方法的内容,包含火山方舟 DeepSeek 申请免费额度教程,API 使用方式有飞书多维表格调用、Coze 智能体调用、浏览器插件调用,可使用邀请码 D3H5G9QA 拿 3000 万 tokens,且火山引擎活动有最新升级,上线 DeepSeek 系列模型,DeepSeekR1、V3 模型分别提供 50 万免费额度和 API 半价活动,即日起至 2025 年 2 月 18 日 23:59:59 所有用户均可享受 DeepSeek 模型服务的价格优惠。
2025-02-21
怎么可以变现赚钱创造价值
以下是关于变现赚钱创造价值的一些方式: 1. GPTs 模型变现: 直接盈利:开发者可为使用其 GPT 模型设定费用,通过直接销售获得收益,例如提供封装自媒体行业的 GPTs 辅助写爆文、出标题等产品绑定方式售卖。 间接盈利:即使模型免费使用,也可通过广告收入等方式获利,如放入商家广告、公众号信息、联系方式等,还可在封装 GPTs 时带上个人介绍、微信号、公众号名称等完成引流。 品牌收益:构建品牌影响力和个人 IP,获得声誉上的收益,例如提示词领域的知名人士通过封装的 GPTs 帮助他人解决问题或提供创意娱乐,获取口碑和影响力。 2. Coze 变现: 上节课分享了用 Zion 把 Coze bot 打造成赚钱工具,包括前端页面设计和用户支付链路搭建。 针对常见难题,如开发多个 Coze Bot 的整合及无企业支付宝和营业执照的收款账户对接,有“Coze 变现模板(多智能体版)”,个人用户无需企业支付宝账号也能轻松变现和收款。 可参考完整的,内含变现案例实操分享。 3. 扣子“AI 应用”变现: 在公司给自己贴 AI 大神标签。 在社交网络进行分享,扩大影响力。 承接项目开发。 二创方向包括增加画板节点,结合公司 Logo 生成一系列公司主题的产品邮票,承接类似需求扩充工作流,修改提示词调整生图内容方向。 总之,技术很关键,创意更重要,好技术加上好创意才能成就好产品,祝您在 AI 应用之路增加自己的收入。
2025-01-20
通往AGI之路网站有什么功能?能帮我获得什么价值?
通往 AGI 之路网站具有以下功能和价值: 1. 和 AI 知识库对话:您可以在此询问任何关于 AI 的问题。 2. AI 网站:集合了精选的 AI 网站,方便您按需求找到适合的工具。 3. AI 提示词:集合了精选的提示词,可复制到 AI 对话网站使用。 4. 知识库精选:每天将知识库的精华内容呈现给大家。 此外,该网站和知识库相互关联,希望成为您学习 AI 路上的好助手。同时,网站还涉及以下方面: 1. 智能纪要:包括关于 AI 社区活动及未来规划的介绍,如举办多轮比赛并发放高额奖金,与小红书合作及流量扶持,北京线下场地活动,规划酒吧相关事宜,社区搭建及成员互动等。 2. 关于 AE 软件及相关活动的介绍:如活动初衷、软件功能、底层逻辑、硬件要求、基本界面和使用逻辑等。 3. 作业放置位置、会议交流方式、AI 绘画工具、社区活动及大赛信息、百炼拉机器人比赛、社区共建及小红书合作、线下场地及酒吧规划等相关事宜。
2025-01-17
模型微调对模型的影响和价值
模型微调对模型具有重要的影响和价值,主要体现在以下几个方面: 1. 提高结果质量:能够获得比即时设计更高质量的结果。 2. 增加训练示例:可以训练比提示中更多的例子,从而改进小样本学习,在大量任务中取得更好的效果。 3. 节省 Token 和成本:由于更短的提示而节省了 Token,对模型进行微调后,不再需要在提示中提供示例,能够节省成本并实现更低延迟的请求。 4. 提高模型效率:通过专门化模型,可以使用更小的模型,并且由于只对输入输出对进行训练,舍弃示例或指令,进一步改善延迟和成本。 5. 适应特定领域:针对特定领域进行微调,优化所有层的参数,提高模型在该领域的专业性。 目前,微调适用于以下基础模型:davinci、curie、babbage 和 ada。参数规模角度,大模型的微调分成全量微调 FFT(Full Fine Tuning)和 PEFT(ParameterEfficient Fine Tuning)两条技术路线,从成本和效果综合考虑,PEFT 是目前业界较流行的微调方案。 通用大模型如 GPT4.0、GPT3.5 等具有广泛的自然语言理解能力,但在特定领域表现可能不理想。而通过微调,可以在现有模型基础上,更经济、高效地适应新的应用领域,节省成本并加快模型部署和应用速度。
2025-01-06
模型微调对模型的影响和价值
模型微调对模型具有重要的影响和价值,主要体现在以下几个方面: 1. 提高结果质量:能够获得比即时设计更高质量的结果。 2. 增加训练示例:可以训练比提示中更多的例子,从而改进小样本学习,在大量任务中取得更好的效果。 3. 节省 Token 和成本:由于更短的提示而节省了 Token,对模型进行微调后,不再需要在提示中提供示例,能够节省成本并实现更低延迟的请求。 4. 提高模型效率:通过专门化模型,可以使用更小的模型,并且由于只对输入输出对进行训练,能够舍弃示例或指令,进一步改善延迟和成本。 5. 适应特定领域:针对特定领域进行微调,优化所有层的参数,提高模型在该领域的专业性,例如在法律或医学等领域表现更佳。 目前,微调适用于以下基础模型:davinci、curie、babbage 和 ada。从参数规模的角度,大模型的微调分成两条技术路线:全量微调 FFT(Full Fine Tuning)和 PEFT(ParameterEfficient Fine Tuning),从成本和效果综合考虑,PEFT 是目前业界较流行的微调方案。 微调是在较小的、特定领域的数据集上继续 LLM 的训练过程,把通用工具打磨成精密仪器。微调有两大好处:一是提高模型在特定任务中的性能,能够输入更多示例;二是提高模型效率,实现更低的延迟和更低的成本。 通用大模型如 GPT4.0、GPT3.5 等具有广泛的自然语言理解能力,但在特定领域表现可能不理想。而微调可以在现有模型基础上,更经济、高效地适应新的应用领域,节省成本并加快模型部署和应用速度。
2025-01-06
AI直播的技术价值
AI 直播具有以下技术价值: 1. 盈利方式: 直接销售数字人工具软件,包括实时驱动和非实时驱动两类。实时驱动价格较高,一年 4 6 万往上;非实时驱动一个月 600 元,效果差,市场价格混乱。 提供数字人运营服务,按直播间成交额抽佣。 2. 适用品类和场景: 适用于不需要强展示的商品,如品牌食品饮料;不适用于服装,因过品快且衣服建模成本高。 适用于虚拟商品,如门票、优惠券等。 适用于店播,效果较好,数据基本能保持跟真人一样;不适用于促销场景,涉及主播话术、套路和调动氛围能力等。 3. 壁垒和未来市场格局: 长期来看技术上没壁垒,但目前仍有技术门槛,如更真实的对口型、更低的响应延迟等。 不会一家独大,可能 4 5 家一线效果,大多二三线效果公司,因其只是工具,迁移成本低。 能把客户服务好、能规模化扩张的公司更有价值,疯狂扩代理割韭菜、不考虑客户效果的公司售后问题麻烦。 有资源、有业务的大平台下场可能会带来降维打击,如提供数字人、货品供应链、数据复盘分析等全环节打通会绑定商家。 此外,还有相关的直播回顾,如 INDIGO LIVE/AI 撞墙与美国大选后的世界 月末直播回顾 2024.11,会用 AI 把全部的回放视频转录文本,配合直播用的完整 Keynote,重新创作成回顾文章。同时,还有 AI 春晚阶段性纪实,建立了 5000 人的飞书大群,欢迎加入或围观,也可通过填写问卷申请转播自媒体账号。
2024-12-25
人脸识别技术价值
人脸识别技术具有一定的价值。过去,AI 在人脸识别等分类判断任务上取得了成果,方便了我们的生活。然而,其使用过程中会让人感受到明显的机器感。相比之下,生成式 AI 在写文章、画画、写歌等方面展现出类似人类的智慧和能力。在 AI 研究中,搜索和学习是利用大量计算的两个重要技术类别。在计算机围棋、国际象棋、语音识别和计算机视觉等领域,都经历了从依赖人类知识到依靠统计方法和大量计算的转变。在 AI 相关的监管方面,对于像人脸识别这样的特定技术或应用,不采用僵化的法律定义,而是基于功能能力来设计应对挑战的方法,以适应 AI 的快速发展。
2024-12-25