Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

deepseek最新消息

Answer

以下是关于 DeepSeek 的最新消息:

  • DeepSeek 深夜发布大一统模型 Janus-Pro,将图像理解和生成统一在一个模型中。模型(7B):https://huggingface.co/deepseek-ai/Janus-Pro-7B ;模型(1B):https://huggingface.co/deepseek-ai/Janus-Pro-1B 。Janus-Pro 是一种新型的自回归框架,通过将视觉编码解耦为独立的路径来解决先前方法的局限性,同时利用单一的统一变压器架构进行处理,超越了之前的统一模型,并匹配或超过了特定任务模型的性能。
  • DeepSeek 以小成本实现媲美领先 AI 产品的性能,并在全球主要市场 App Store 登顶。高盛认为 DeepSeek 或改变科技格局,降低 AI 行业的进入门槛。
  • DeepSeek 在中文场景表现优秀,日常写作和表达习惯贴近人类,但专业论文总结略弱。数学能力不错,编程能力逊于 GPT。采用 GRPO 算法替代传统 PPO,提升语言评价灵活性与训练速度。
  • 1 月 28 日(除夕)有一场关于 DeepSeek 的高质量闭门会,其创始人梁文锋强调团队文化与长远智能探索。DeepSeek 在技术上虽有优势,但资源有限,需聚焦核心;其推理模型推动效率提升,挑战传统 SFT 方法,标志着新的模型训练范式。
  • DeepSeek 近日开源了多模态模型 Janus-Pro,寓意古罗马双面神雅努斯,既能进行视觉理解,也能生成图像。与 DALL-E 3 相比,Janus-Pro 在参数上领先,并具备图像识别、地标识别等多种能力。该模型通过更优化的训练策略、更海量的数据和更大规模的参数(70 亿)实现了更强的智能表现。全面开源,支持商用,MIT 协议,部署使用便捷,Benchmark 表现优异,能力更全面。
Content generated by AI large model, please carefully verify (powered by aily)

References

详解:DeepSeek深度推理+联网搜索 目前断档第一

本篇内容可编辑,欢迎大家补充自己的观点最新消息:[DeepSeek深夜发布大一统模型Janus-Pro将图像理解和生成统一在一个模型中](https://waytoagi.feishu.cn/wiki/SneLwRmsYiUaI6kvxltcEBPPnhb)deepseek刚刚发布了新模型-一个强大的框架,它将图像理解和生成统一在一个模型中!!!上一个是智源开源的Emu3模型(7B):https://huggingface.co/deepseek-ai/Janus-Pro-7B模型(1B):https://huggingface.co/deepseek-ai/Janus-Pro-1BJanus-Pro是一种新型的自回归框架,它统一了多模态理解和生成。它通过将视觉编码解耦为独立的路径来解决先前方法的局限性,同时仍然利用单一的统一变压器架构进行处理。解耦不仅缓解了视觉编码器在理解和生成中的角色冲突,还增强了框架的灵活性。Janus-Pro超越了之前的统一模型,并匹配或超过了特定任务模型的性能。Janus-Pro的简单性、高灵活性和有效性使其成为下一代统一多模态模型的有力候选者。DeepSeek爆火,价格亲民却实力超群,智慧开源领航者,实时联网深度推理双冠王,用技术普惠重新定义AI边界!便宜+开源+能联网,东方神秘力量Appstore排行第一,导致算力股大跌

1月28日 社区动态速览

1⃣️💹华尔街分析师对DeepSeek的反应DeepSeek以小成本实现媲美领先AI产品的性能,并在全球主要市场App Store登顶。高盛认为DeepSeek或改变科技格局,降低AI行业的进入门槛。[🔗详情](https://www.xiaohu.ai/c/xiaohu-ai/deepseek)2⃣️📝DeepSeek的实际使用体验中文场景表现优秀,日常写作和表达习惯贴近人类,但专业论文总结略弱。数学能力不错,编程能力逊于GPT。采用GRPO算法替代传统PPO,提升语言评价灵活性与训练速度。[🔗更多信息](https://x.com/imxiaohu/status/1883843200756170873)|🔗[GRPO详情](https://www.xiaohu.ai/c/ai/grpo-deepseek-r1-8c6cff0c-deb8-4937-a419-7066af987e43)3⃣️🎙️复旦大学OpenMOSS发布实时语音交互模型中文语音体验近似GPT-4o高级语音,响应时间低于200毫秒,支持打断和自然互动。可生成多情感、多风格语音,包含方言、戏剧化台词等;多语言适配,嘈杂环境下仍具备强逻辑推理能力。[🔗相关推文](https://x.com/imxiaohu/status/1883739294315274331)|🔗[项目主页](https://github.com/OpenMOSS/SpeechGPT-2.0-preview)|🔗[在线体验](https://sp2.open-moss.com)4⃣️📚阿里巴巴推出Qwen2.5-1M模型

1月29日 社区动态速览

《[一场关于DeepSeek的高质量闭门会:“比技术更重要的是愿景”](https://mp.weixin.qq.com/s/cXafYIotJUGUmWasXrJvcw)》DeepSeek以“比技术更重要的是愿景”引发全球AI热潮,其创始人梁文锋强调团队文化与长远智能探索。讨论会上指出,DeepSeek在技术上虽有优势,但资源有限,需聚焦核心;其推理模型推动效率提升,挑战传统SFT方法,标志着新的模型训练范式。DeepSeek不仅是低成本的开源项目,更是推动AI进步的力量。正如Marc Andreessen所言:“作为开源项目,这是对世界的一份深远馈赠。”《[DeepSeek再度开源:用Janus-Pro撕开算力铁幕](https://mp.weixin.qq.com/s/Sy9zG7nL7S8eSDzxH5LqSg)》DeepSeek近日开源了多模态模型Janus-Pro,寓意古罗马双面神雅努斯,既能进行视觉理解,也能生成图像。与DALL-E 3相比,Janus-Pro在参数上领先,并具备图像识别、地标识别等多种能力。该模型通过更优化的训练策略、更海量的数据和更大规模的参数(70亿)实现了更强的智能表现。正如文章所言:“以开源筑长阶,邀世界共赴星辰。”《[DeepSeek深夜发布大一统模型Janus-Pro将图像理解和生成统一在一个模型中](https://waytoagi.feishu.cn/wiki/SneLwRmsYiUaI6kvxltcEBPPnhb)》1.统一Transformer架构,使用同一个模型就能完成图片理解,图片生成2.提供1B和7B两种规模,适配多元应用场景3.全面开源,支持商用,MIT协议,部署使用便捷4.Benchmark表现优异,能力更全面

Others are asking
Deepseek有多少版本?
DeepSeek 有多个版本,如 DeepSeek V3(类 GPT4o)、DeepSeek R1(类 OpenAI o1)、DeepSeekV2 等。其中 DeepSeek R1 有不能联网、本地部署等不同情况,DeepSeekV2 具有 2360 亿参数等特点。
2025-03-07
Deepseek为什么这么火热?
DeepSeek 之所以如此火热,原因主要有以下几点: 1. 价格亲民但实力超群,是智慧开源的领航者,在实时联网深度推理方面表现出色,堪称双冠王,以技术普惠重新定义了 AI 边界。 2. 具备“便宜+开源+能联网”的优势,在 Appstore 排行第一,甚至导致算力股大跌。 3. 其使用地址为:https://chat.deepseek.com/(有手机客户端:扫描下面二维码)。 4. 模型下载地址为:https://github.com/deepseekai/DeepSeekLLM?tab=readmeovfile 。 5. 关于 API 文档地址也有相关介绍。 6. 提示词使用方法单独列了一篇 。 7. 存在魔改版本,如:https://huggingface.co/ValueFX9507/TifaDeepsex14bCoTGGUFQ4 、https://huggingface.co/mradermacher/DeepSeekR1DistillQwen7BabliteratedGGUF 。 此外,DeepSeek 还在文学创作方面有所应用,例如“全新 AI 整活第六期”中以其为工具进行小说创作,相关比赛于 2025 年 2 月 9 日开启,2 月 16 日晚 8 点截止并进行评选,期间还有社区共学等活动,详情可关注相关链接。
2025-03-07
如何使用deepseek写论文
使用 DeepSeek 写论文可以参考以下几点: 1. 给予 DeepSeek 更多自由发挥的空间:旧模型在文学创作时存在一些弊端,如过度道德说教和正面描述趋势,导致结果生硬死板。使用 DeepSeek 时要在控制和自由间平衡。 2. 利用其文风优势:DeepSeek 文风优秀,有哲学思考,能触动人情感,文创能力顶尖。 3. 注意模型的特点:DeepSeek 在写文方面全面领先,但长文可能会太发散,文风用力过猛,可能导致审美疲劳,且模型多样性不够,相同 prompt 提问多次答案雷同。 4. 控制创作字数:可以用 O1 模型对 AI 创作的字数进行控制,也可通过多轮对话让 AI 增删改查来调整字数。 同时,还可以参考其他人使用 DeepSeek 的经验,如让 Deepseek 模仿特定小说家的文学方式创作,在提示词中描述文风特征等。
2025-03-07
飞书多维表格中使用deepseek有100万tokens总量的限制?
飞书多维表格中使用 DeepSeek 有一定的 token 总量限制。DeepSeekR1、V3 模型分别提供了 50 万免费额度和 API 半价活动(算下来 5 元有 100 万)。即日起至北京时间 20250218 23:59:59,所有用户均可在方舟享受 DeepSeek 模型服务的价格优惠。 不同模型的 token 限制有所不同,例如 Claude2100 k 模型的上下文上限是 100k Tokens,即 100000 个 token;ChatGPT16 k 模型的上下文上限是 16k Tokens,即 16000 个 token;ChatGPT432 k 模型的上下文上限是 32k Tokens,即 32000 个 token。 Token 限制同时对一次性输入和一次对话的总体上下文长度生效,不是达到上限就停止对话,而是会遗忘最前面的对话。 如果想直观查看 GPT 如何切分 token,可以打开,在其中可以看到实时生成的 tokens 消耗和对应字符数量。需要注意的是,英文的 Token 占用相对于中文较少,这也是很多中文长 Prompt 会被建议翻译成英文设定然后要求中文输出的原因。
2025-03-07
deepseek加什么软件能生成图片
DeepSeek 本身可能不具备直接生成图片的能力,但可以通过以下方式结合其他软件来生成图片: 开发浏览器插件:先开发基础版本,包括选择文字,可以自定义生成图片,图片底部包含文章标题和链接二维码。在开发过程中,可能需要使用 Trae 运行并在 Chrome 浏览器内加载扩展程序进行调试。 使用其他 AI 生成图片的软件来生成图标,例如多模态模型 JanusPro ,它既能进行视觉理解,也能生成图像。
2025-03-07
哪个平台可以教我如何给deepseek发指令?
以下是关于如何给 DeepSeek 发指令的相关信息: 访问网址:www.deepseek.com,点击“开始对话”。 操作步骤: 第一步:搜索 www.deepseek.com,点击“开始对话”。 第二步:将装有提示词的代码发给 DeepSeek。 第三步:认真阅读开场白之后,正式开始对话。 此外,还为您提供了一些关于 DeepSeek 的其他知识: 设计思路: 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 用 XML 来进行更为规范的设定,而不是用 Lisp(对作者来说有难度)和 Markdown(运行下来似乎不是很稳定)。 完整提示词:v 1.3 特别鸣谢:李继刚的【思考的七把武器】在前期为作者提供了很多思考方向;Thinking Claude 这个项目是作者现在最喜欢使用的 Claude 提示词,也是设计 HiDeepSeek 的灵感来源。 同时,为您介绍一些其他相关内容: 集合·DeepSeek 提示词方法论: 核心原理认知:包括 AI 特性定位(多模态理解、动态上下文、任务适应性)和系统响应机制(采用意图识别+内容生成双通道、自动检测 prompt 中的任务类型/输出格式/知识范围、反馈敏感度)。 基础指令框架:如果不知道如何表达,还是可以套用框架指令,如四要素模板、格式控制语法(强制结构、占位符标记、优先级符号)。 进阶控制技巧:包括思维链引导(分步标记法、苏格拉底式追问)、知识库调用(领域限定指令、文献引用模式)、多模态输出。
2025-03-07
chatgpt5最新消息
以下是关于 ChatGPT 的最新消息: 有一位狂热的书友在 Reddit 的 ChatGPT 子区分享了借助 ChatGPT 在 5 分钟内阅读并理解任何书籍的方法,并给出了详细的 Prompt,包括“Please summarize ”。评论区的几百条回帖也是干货满满,书友们积极留言分享尝试用 ChatGPT 辅助阅读的经验。 评论区有人指出这种方式可能因 ChatGPT 的“幻觉”而得到错误信息,对于“幻觉”有处理经验的人提出在提问时注意三点:明确告诉它想要准确答案且无幻觉;改变 temperature 参数(如改到 0)或控制创造力水平;得到答案后,要求它为每个引用产生精确的引用和页面以便交叉检查。
2025-02-13
ai最新消息
以下是 AI 领域的一些最新消息: 10 月: Gartner 发布 2025 年十大战略技术趋势。 开源多模态 LLM 框架 Janus。 开源大模型能力评估模型 CompassJudger。 Anthropic 发布新功能 computer use 以及 Claude 3.5 Haiku,更新 Claude 3.5 Sonnet。 Stability AI 发布 Stable Diffusion 3.5。 x.AI 正式推出 API。 ComfyUI V1 官方桌面版开放内测。 华为发布纯血操作系统鸿蒙 OS NEXT。 Jina AI 推出高性能分类器 Classifier API。 OpenAI 发布图像生成模型 sCM。 Midjourney 上线外部图片编辑器。 Runway 发布动画视频功能 ActOne。 Ideogram 推出 AI 画板工具 Canvas。 Genmo 开源视频生成模型 Mochi 1。 荣耀发布操作系统 MagicOS 9.0。 美国 14 岁少年与 C.AI 聊天后离世。 新华社发文表示警惕「AI 污染」乱象。 港中文&趣丸推出 TTS 模型 MaskGCT。 科大讯飞发布讯飞星火 4.0 Turbo。 阿里通义代码模式开始内测。 Anthropic Claude 新增数据分析功能。 北京市大中小学推广 AI 学伴和 AI 导学应用。 稚晖君开源「灵犀 X1」全套资料。 OpenAI 高管 Miles Brundage 离职。 3 月: 有 23 个 AI 新产品,包括来自大公司和成熟创业公司的新产品、有用的、有趣的以及华人开发者所搭建的小产品。 有关于呼吁暂停/禁止大模型训练以及研究 AI 技术发展、垂直领域应用、商业落地形态和人机共生问题的不同立场。 2024 年: 来自剑桥大学、AI 风险投资公司 Air Street Capital 创始人兼 CEO Nathan Benaich 和来自牛津大学、Air Street Capital 平台负责人 Alex Chalmers 共同发表《State of AI Report》2024 人工智能现状报告,主要围绕人工智能(AI)领域的最新进展、政治动态、安全挑战及未来预测几大方面进行说明。
2024-12-16
chatpgt有什么最新消息
以下是关于 ChatGPT 的一些最新消息: Gradio 发布了 Gradio Discord Bot,允许在 Discord 服务器中使用 Spaces 中的演示进行语言翻译、文字转语音、文字生成图像等。 Hugging Face 现在可以使用 Docker Spaces。 OpenAI 预测到 2024 年收入将达到 10 亿美元。 ChatGPT 推出了更新,现在可以查看以前的历史对话。 2024 年 1 月 27 日,ChatGPT 又更新了,推出了新的 Mention 功能,可以在聊天窗口中通过@直接召唤任何 GPTS。 2024 年 4 月 26 日,ChatGPT 更新,正式推出个性化新功能,可以记住用户过去提到的内容,用户可自行决定要记住什么。
2024-09-26
24小时内中国AI医美最新消息
以下是为您找到的关于中国 AI 医美的相关消息: 有一个将 AI 和中医结合的项目,其先是用摄像头观察患者的口腔和舌苔,再用指尖传感器号脉,然后根据观测的数据生成选择题让患者作答,最后 AI 会生成药方。该项目目前应用在辅助看诊,能够提高诊疗效率,创始人的愿景是在未来实现 24 小时独立问诊开药。 但目前没有关于 24 小时内中国 AI 医美最新消息的准确和详尽内容。要获取最新的信息,您可以查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台。
2024-09-17
24小时内中国AI前沿科技最新消息
以下是 24 小时内中国 AI 前沿科技的最新消息: 阿里 CEO 吴泳铭表示将开源国内最大 720 亿参数模型。 京东 CEO 称正在测试 AI 自动生成营销内容。 此外,还有一些国际上的 AI 相关消息: 苹果新专利:CGR 技术生成虚拟形象,展示穿戴效果。 微软 AI 专利:充当治疗师,疏导心理问题。 苹果改造 Siri:明年或用大语言模型。 谷歌 Open Se Cura:为 Pixel 带来低功耗 AI。 微软计划:AI 助手 Copilot 将进入 Windows 10。 亚马逊成立 AI 训练团队,投资数百万美金。 ChatGPT 持续宕机,CEO 道歉。 GitHub Universe 2023 新功能:新的 Copilot 聊天功能,Copilot 支持手机应用,GitHub Copilot Workspace,产问题查询 GitHub Copilot 企业版:每月 39 美元的高级服务。GitHub Copilot 合作伙伴计划,GitHub 高级安全功能。
2024-09-17
AI 数字人最新消息
以下是关于 AI 数字人的最新消息: 目前业界对于数字人的定义尚未统一,一般可根据技术栈分为真人驱动和算法驱动两类。算法驱动数字人的相关开源代码有很多,如 ASR 语音识别方面的 openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition,这是一个语音识别的接口集合,包含不同实现的语音识别接口)。AI Agent 大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可使用 LangChain 的模块进行自定义(https://www.langchain.com/)。TTS 方面,有微软的 edgetts(https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费)、VITS(https://github.com/jaywalnut310/vits)以及专注于唱歌的 sovitssvc(https://github.com/svcdevelopteam/sovitssvc,前段时间很火的 AI 孙燕姿就与其相关)。 4 月 25 日的消息: Synthesia 推出新型虚拟数字人 Expressive1,能通过脚本预测表情,数字人可自动解析和理解文本情绪,实现表情和声音同步。链接:https://x.com/imxiaohu/status/1783505405488054433 360 AI 浏览器新版增加了视频总结、提问、转录和翻译功能,支持本地和网络视频的内容分析,但无法提取无对白视频摘要。链接:http://browser.360.cn/ai https://x.com/imxiaohu/status/1783495437422649719 全球最大 AI 知识库“通往 AGI 之路”网站访问量突破 1000 万,网站内容丰富,旨在推动 AI 知识的普及。链接:http://WaytoAGI.com https://x.com/imxiaohu/status/1783475002815471669 日本横须贺市使用 AI 技术克隆市长,用于发布英语信息,技术应用广泛,包括灾难信息传播和旅游信息发布。
2024-09-12