Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek 进展

Answer

DeepSeek 在 AI 领域有以下进展:

  • 在编码任务中已成为社区的最爱,推出了组合速度、轻便性和准确性的 deepseek-coder-v2。
  • 发布了 2360 亿参数的 DeepSeek-V2,该模型由 60 位专家混合开源,在数学、编码和推理方面表现出色,具有 236B 参数,21B 在生成过程中被激活,在 MT-Bench 上表现优异,中文能力强且性价比高。
Content generated by AI large model, please carefully verify (powered by aily)

References

2024人工智能报告|一文迅速了解今年的AI界都发生了什么?

**中国开源项目在今年赢得全球粉丝,并且已经成为积极开源贡献者。**其中几个模型在个别子领域中脱颖而出,成为强有力的竞争者。DeepSeek在编码任务中已成为社区的最爱,其组合了速度、轻便性和准确性而推出的deepseek-coder-v2。阿里巴巴最近发布了Qwen-2系列,社区对其视觉能力印象深刻,从具有挑战性的OCR任务到分析复杂的艺术作品,都完成的非常好。在较小的一端,清华大学的自然语言处理实验室资助了OpenBMB项目,该项目催生了MiniCPM项目。这些是可以在设备上运行的小型<2.5B参数模型。它们的2.8B视觉模型在某些指标上仅略低于GPT-4V。2024年是AI图像视频迅速发展的一年,这个赛道竞争异常激烈国外Stability AI发布的Stable Video Diffusion,是第一个能够从文本提示生成高质量、真实视频的模型之一,并且在定制化方面取得了显著的进步。并且在今年3月,他们推出了Stable Video 3D,该模型经过第三个对象数据集的微调,可以预测三维轨道。OpenAI的Sora能够生成长达一分钟的视频,同时保持三维一致性、物体持久性和高分辨率。它使用时空补丁,类似于在变压器模型中使用的令牌,但用于视觉内容,以高效地从大量视频数据集中学习。除此之外,Sora还使用了其原始大小和纵横比的视觉数据进行训练,从而消除了通常会降低质量的裁剪和缩放。Google DeepMind的Veo将文本和可选图像提示与嘈杂压缩视频输入相结合,通过编码器和潜在扩散模型处理它们,以创建独特的压缩视频表示。然后系统将此表示解码为最终的高分辨率视频。

XiaoHu.AI日报

-提供4K分辨率的人类自由视角视频。-利用该技术将虚拟角色放入场景,实现沉浸式互动。🔗项目地址:http://vcai.mpi-inf.mpg.de/projects/holochar/🔗详细介绍:https://xiaohu.ai/p/74845️⃣🌌DeepSeek发布2360亿参数的DeepSeek-V2:-60位专家混合开源模型,数学、编码和推理表现出色。-236B参数,21B在生成过程中被激活。-在MT-Bench上表现优异,中文能力强且性价比高。🔗详细介绍:https://xiaohu.ai/p/74686️⃣🔍Google Gemini网络安全产品:-检测并防御网络钓鱼攻击。-结合广泛的用户和网络监控发现威胁。-利用AI分析功能生成情报报告。🔗详细:https://xiaohu.ai/p/74607️⃣🚗Wayve获超10亿美元C轮融资:-开发“驾驶GPT”基础模型,实现具身体智能自动驾驶。-使车辆在各种环境中操作,几乎无需人为干预。-使车辆与人类互动、学习并理解人类行为。🔗详细内容:https://xiaohu.ai/p/74538️⃣🩺CURE模型预测治疗结果:-利用300万患者数据进行预训练并针对特定健康状况微调。

XiaoHu.AI日报

-提供4K分辨率的人类自由视角视频。-利用该技术将虚拟角色放入场景,实现沉浸式互动。🔗项目地址:http://vcai.mpi-inf.mpg.de/projects/holochar/🔗详细介绍:https://xiaohu.ai/p/74845️⃣🌌DeepSeek发布2360亿参数的DeepSeek-V2:-60位专家混合开源模型,数学、编码和推理表现出色。-236B参数,21B在生成过程中被激活。-在MT-Bench上表现优异,中文能力强且性价比高。🔗详细介绍:https://xiaohu.ai/p/74686️⃣🔍Google Gemini网络安全产品:-检测并防御网络钓鱼攻击。-结合广泛的用户和网络监控发现威胁。-利用AI分析功能生成情报报告。🔗详细:https://xiaohu.ai/p/74607️⃣🚗Wayve获超10亿美元C轮融资:-开发“驾驶GPT”基础模型,实现具身体智能自动驾驶。-使车辆在各种环境中操作,几乎无需人为干预。-使车辆与人类互动、学习并理解人类行为。🔗详细内容:https://xiaohu.ai/p/74538️⃣🩺CURE模型预测治疗结果:-利用300万患者数据进行预训练并针对特定健康状况微调。

Others are asking
deepseek
DeepSeek 是一家具有独特特点和影响力的公司: 1. 秘方特点:DeepSeek 不是“中国式创新”的产物,其秘方是硅谷味儿的。早在 2024 年 5 月 DeepSeekV2 发布时,就以多头潜在注意力机制(MLA)架构的创新在硅谷引发轰动。同时,它在国内舆论场被描摹成“大模型价格战的发起者”,形成了一种平行时空的感觉。 2. V3 时刻:如果 V3 是 DeepSeek 的 GPT3 时刻,接下来的发展充满未知,但 DeepSeek 应会为全人类的人工智能事业做出更大贡献,且它已是中国最全球化的 AI 公司之一,赢得尊重的秘方也是硅谷味儿的。 3. 提示词相关:一个提示词“HiDeepSeek”能让 DeepSeek 的能力更上一层楼。通过 Coze 做了效果对比测试,使用方法为:搜索 www.deepseek.com 点击“开始对话”,将装有提示词的代码发给 Deepseek,认真阅读开场白后正式开始对话。其设计思路包括将 Agent 封装成 Prompt 并储存、实现联网和深度思考功能、优化输出质量等,采用 XML 进行规范设定。完整提示词版本为 v1.3,特别鸣谢李继刚和 Thinking Claude 等。
2025-01-23
DeepSeek R1和ChatGPT相比有什么优势?
DeepSeek R1 与 ChatGPT 的优势比较如下: 在数字乘法任务中,ChatGPT 和精简版的隐式 CoT 模型无法达到 100%的准确率,而从头开始训练的 DeepSeek R1 在将扩散采样步骤设置为 1 的情况下,能够保持显著的吞吐量同时达到 100%的准确率。 在数学问题求解常用基准测试中,GPT4 相对于 ChatGPT 表现出显著的改进,GPT4 在许多复杂问题中展示了更深入的理解,并能够应用适当的推理。而 ChatGPT 通常会采用低级启发式方法,提到与问题仅是表面相关的公式和概念,表明缺乏实际理解。
2025-01-22
deepseek免费吗
DeepSeek 目前完全免费。其网址为:https://www.deepseek.com/zh 。国内能访问,网页登录很方便。
2025-01-20
deepseek v3
DeepSeek V3 相关信息如下: 如果 V3 是 DeepSeek 的 GPT3 时刻,接下来的发展充满未知,但有趣的事还在后头,DeepSeek 应会为全人类的人工智能事业做更大贡献,其秘方是硅谷味儿的。 作为中国杭州的人工智能创业公司,DeepSeek 在 2024 年 12 月发布的大语言模型 DeepSeekV3 实现了诸多不可能,以 550 万美元和 2000 块英伟达 H800 GPU 训练出的开源模型,多项评测成绩超越了 Qwen2.572B 和 Llama3.1405B 等顶级开源模型,与 GPT4o 和 Claude 3.5Sonnet 等世界顶级闭源模型不相上下。尽管 OpenAI CEO Sam Altman 发疑似影射其抄袭的推文,但 DeepSeek 收获广泛真诚赞誉,尤其在开源社区。 12 月 27 日发布预览版,参数量 685B,磁盘占用 687.9GB,架构为混合专家模型(MoE),256 个专家,每个 token 使用 8 个专家,竞争对手为 Meta AI 的 Llama 3.1(405B 参数)。亮点包括准确理解复杂和细微查询、知识更新至 2023 年、多语言支持和个性化服务增强、数据安全和隐私保护加强,在 BigCodeBenchHard 排名第一。Aider Polyglot 排行榜预览得分 48.4%,排名第二。相关链接包括详细信息:https://x.com/imxiaohu/status/1872182632584561056 ,模型下载:https://huggingface.co/deepseekai/DeepSeekV3Base/tree/main ,在线体验:https://chat.deepseek.com/sign_in 。 Google 外包人员通过多项指标对 Gemini 和 Claude 进行输出对比,Claude 安全策略最严格,拒绝不安全提示,Gemini 部分回答被标记为“严重安全违规”。
2025-01-20
请介绍一下DeepSeek
DeepSeek 是一家来自中国杭州的人工智能创业公司。 其在 2024 年 12 月发布的大语言模型 DeepSeekV3 引起了广泛关注。该模型以相对较低的成本和较少的硬件资源,在多项评测中取得了优异成绩,与顶级开源和闭源模型不相上下。 HiDeepSeek 是为解决 AI 回答过程不透明问题而设计的工具。它能让 AI 在给出答案时展示思考过程,如先说“让我想想...”再逐步展开分析,最终给出结论。在技术层面,通过特别规则要求 AI 像人类自然思考,可提出疑问、修正错误等。 例如老师使用时,AI 会先分析教学目标、思考学生可能遇到的困难,再设计教学步骤,过程清晰展示。总的来说,HiDeepSeek 让 AI 思维过程透明,虽为模拟,但有助于更好理解和使用 AI。 此外,用 Coze 做了效果对比测试,使用 HiDeepSeek 可通过以下步骤: 1. 搜索 www.deepseek.com,点击“开始对话”。 2. 将装有提示词的代码发给 Deepseek。 3. 认真阅读开场白后正式开始对话。 其设计思路包括: 1. 将 Agent 封装成 Prompt 并储存在文件,保证低成本人人可用,减轻调试负担。 2. 通过提示词文件让 DeepSeek 实现联网和深度思考功能。 3. 在模型默认能力基础上优化输出质量,减轻 AI 味,增加可读性。 4. 设计了阈值系统,可能形式大于实质,后续根据反馈修改。 5. 用 XML 进行规范设定,而非 Lisp 和 Markdown。 完整提示词版本为 v1.3,特别鸣谢了李继刚的【思考的七把武器】提供思考方向,以及 Thinking Claude 和 Claude 3.5 Sonnet。
2025-01-18
你是基于千问还是deepseek的AI?
我不是基于千问也不是基于 deepseek 的 AI ,我是由字节跳动公司独立开发训练的,旨在为您提供全面、专业的 AI 服务和帮助。
2025-01-17
总结一下24年国产AI大模型的主要进展
2024 年国产 AI 大模型的主要进展包括: 9 月: 12 日:李继刚再现神级 Prompt,玩法持续翻新;Mistral 发布首个多模态模型 Pixtral 12B。 13 日:商汤 Vimi 相机开放微博小程序;元象开源中国最大 MoE 大模型 XVERSEMoEA36B;OpenAI 发布 o1 模型。 14 日:人工智能生成合成内容标识办法(征求意见稿);Jina AI 发布 ReaderLM 和 Jina Embeddings V3。 18 日:DeepSeek 发文庆祝登上 LMSYS 榜单国产第一,几小时后 Qwen 新模型表示不服。 19 日:云栖大会;通义万相 AI 生视频上线;快手可灵 1.5 模型新增运动笔刷能力。 20 日:腾讯元器智能体对外发布;秘塔科技产品经理 JD 走红 AI 圈;阶跃跃问接入 Step2 万亿参数 MoE 语言大模型。 21 日:大模型测试基准研究组正式成立。 23 日:钉钉 365 会员上线。 24 日:讯飞星火 API 全新升级;豆包大模型全系列发布&更新。 25 日:Vidu API 正式开放,加速企业级视频创作;OpenAI 发布高级语音功能;西湖心辰开源 WestlakeOmni。 国内大模型落地情况: 2024 年被称为国内大模型落地元年,1 至 11 月,大模型中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。 厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。在金融行业,百度以 14 个中标数量、3734.4 万元中标金额排名第一;科大讯飞居第二。 在智能终端行业,中国超半数手机厂商都在使用文心大模型,包括三星、荣耀、vivo、OPPO、小米等主流手机品牌;上汽大众、吉利汽车、蔚来汽车、长安汽车等十余家车企已接入百度文心大模型。 百度表现突出,截至 11 月,其文心大模型日均调用量超过 15 亿次,千帆平台帮助客户精调了 3.3 万个模型、开发了 77 万个企业应用。今年三季度财报披露,百度智能云营收达 49 亿元,同比增长 11%。 大模型进入产业落地后,除了大模型本身能力质量要过硬外,落地应用所需要的全栈技术能力、工程化配套工具等对落地效果有直接影响。企业想要真正将大模型在自身场景落地,需要具备构建算力、数据治理、模型训练、场景落实、应用搭建、持续运营、安全合规等整套能力。大模型的竞争,正在加速成为体系化之战。
2025-01-09
国产AI大模型的最新进展
以下是国产 AI 大模型的最新进展: 通义千问的 Qwen 系列表现出色:Qwen 是国内唯一出现在 OpenAI 视野里、能参与国际竞争的国产大模型。Qwen 多次冲进相关榜单,得分不断提高,其开源模型累计下载量突破 1600 万,国内外有大量开发者基于 Qwen 开发模型和应用,尤其在企业级领域。通义大模型证明了开源开放的力量。 国内大模型落地情况:2024 年被称为国内大模型落地元年,1 至 11 月,大模型中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。 其他进展:智谱一年间推出了 4 代 GLM,一直是国内能力较好的模型之一。MiniMax 推出了 MoE 架构的新模型和“星野”这个目前国内较成功的 AI 陪聊 APP。月之暗面专注长 Token 能力,在记忆力和长 Token 能力上有一定优势。但硬件层上的卡脖子问题仍未缓解,国内目前仍无胜任大模型训练的芯片,在推理上虽有 Nvidia 的替代产品逐渐出现,但华为昇腾在单卡指标上距离不远,因稳定性不足和缺乏 Cuda 生态,仍需时间打磨。
2025-01-09
端到端语音技术现在进展到什么程度了
端到端语音技术目前取得了显著进展。 在语音合成方面: 语音合成将文本转换为可听的声音信息,是人机交互的重要接口,一般包括 TTS、歌唱合成等领域。 当代工业界主流语音合成系统包括文本前端和声学后端两个部分。文本前端将输入文本转换为层次化的语音学表征,声学后端基于此生成语音,主要技术路线包括单元挑选波形拼接、统计参数和端到端语音合成方法,当代主要采用端到端声学后端。 端到端声学后端一般包括声学模型和声码器两部分,也出现了直接从音素映射为波形的完全端到端语音合成系统。 在全模态智能体方面: OpenAI 发布的 GPT4o 是新模型通过端到端的神经网络,把视觉、语音和文本数据混合训练,对音频输入的平均反应时间为 300 毫秒,与人类对话的反应时间相似。 直接拿音频数据来训练的好处是模型能从数据中感悟到人类表达的情绪、语调、风格等,能听到几乎真实的人类的声音。 OpenAI 未公开 GPT4o 的技术细节,唯一线索来自内部模型炼丹师的一篇博客,项目名是 AudioLM,目标是用端到端的方式扩大语音模型的能力。
2025-01-03
AI在电商直播带货有什么新进展吗
AI 在电商直播带货领域有以下新进展: 1. “全真 AI 颜值网红”出现,可以稳定输出视频,并能够进行直播带货。 2. 数字人工具软件方面,有实时驱动和非实时驱动两类,实时驱动在直播时能改音频话术,真人可接管,标准零售价一年 4 6 万往上;非实时驱动一个月 600 元,效果差,市场价格混乱。 3. 数字人运营服务可按直播间成交额抽佣。 4. 适用于不需要强展示的商品,如品牌食品饮料,以及虚拟商品如门票、优惠券等,店播效果较好,数据基本能保持跟真人一样。不适用于促销场景。 5. 目前技术仍显稚嫩,如更真实的对口型、更低的响应延迟等方面有待提高。 6. 不会一家独大,可能 4 5 家一线效果,大多二三线效果公司。 7. 有资源、有业务的大平台下场可能会带来降维打击,例如剪映若全环节打通会绑定商家。 8. 欧莱雅、YSL、兰蔻、李宁、北面等品牌会选择使用 AI 驱动的虚拟主播进行自播,但通常只在午夜时段排期。 9. 阿里云提供的品牌智能直播间基础版售价为 99000 元/(年×路),提供多种功能。 10. 虚拟形象有 3D 卡通风格和 2D 拟真人风格,预设动作库和真实语音表现,商品展示以图片为主,直播互动流程相对固定。但虚拟主播无法与产品接触,测评结果缺乏真实性,目前更像是花瓶,负责基础性介绍和互动问答。
2024-12-07
AI在机械制图方面有什么进展吗
AI 在机械制图方面的进展相对有限。然而,在艺术创作领域,特别是 AI 绘画方面有显著的发展。从早期的机械臂机器人到当前的大语言模型,技术的进步使得 AI 绘画在创作质量和速度上取得了新的突破。 AI 绘画不仅改变了艺术作品的创作方式,还对艺术的审美观念和市场需求产生了影响。但同时也引发了一系列讨论和争议。一方面,人们对于由 AI 驱动的机器人创作的艺术品和人类创作的艺术品的接受程度大致相同,但不太愿意将机器人视为艺术家,因为 AI 在表达情感和创造性意图方面存在局限性。另一方面,艺术家对 AI 生成艺术的态度复杂,既有对创新潜力的期待,也有对版权、原创性和伦理问题的担忧。 此外,AI 绘画技术的发展带来了对文化创意领域从业者职业安全的焦虑,以及对其“侵权”嫌疑的反对之声。不过,AI 绘画也为艺术创作提供了新的可能性,能帮助艺术家探索新的创意表达方式,提高制作效率,降低制作成本,促进艺术与观众之间的互动,提供更加个性化和互动的艺术体验。 总的来说,AI 绘画对艺术界的影响是复杂且双面的,既提供了新的创作工具和可能性,也引发了关于艺术本质、创造性、版权和伦理的重要讨论。但目前在机械制图领域,相关进展尚不明显。
2024-12-07
AI方面有什么最新进展
以下是 AI 方面的一些最新进展: 1. 2024 人工智能现状报告:由剑桥大学和 AI 风险投资公司 Air Street Capital 的相关人员共同发表,围绕人工智能领域的最新进展、政治动态、安全挑战及未来预测几大方面进行说明。 2. AI 绘画:从生成艺术作品到辅助艺术创作,逐渐改变传统艺术面貌。技术进步使创作质量和速度取得突破,为艺术家提供新工具和可能性,但也引发了关于艺术本质、创造性、版权和伦理的讨论,带来对从业者职业安全的焦虑和“侵权”嫌疑的反对之声。 3. 技术历史和发展方向: 发展历程:包括早期阶段的专家系统、博弈论、机器学习初步理论;知识驱动时期的专家系统、知识表示、自动推理;统计学习时期的机器学习算法;深度学习时期的深度神经网络等。 前沿技术点:大模型(如 GPT、PaLM 等)、多模态 AI(视觉语言模型、多模态融合)、自监督学习、小样本学习、可解释 AI、机器人学、量子 AI、AI 芯片和硬件加速。
2024-12-05