Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

DeepSeek-V2是谁开发的

Answer

DeepSeek-V2 是由 60 位专家混合开发的开源模型。它具有 2360 亿参数,其中 21B 在生成过程中被激活。在 MT-Bench 上表现优异,中文能力强且性价比高。详细介绍可参考:https://xiaohu.ai/p/7468

Content generated by AI large model, please carefully verify (powered by aily)

References

2024人工智能报告|一文迅速了解今年的AI界都发生了什么?

**中国开源项目在今年赢得全球粉丝,并且已经成为积极开源贡献者。**其中几个模型在个别子领域中脱颖而出,成为强有力的竞争者。DeepSeek在编码任务中已成为社区的最爱,其组合了速度、轻便性和准确性而推出的deepseek-coder-v2。阿里巴巴最近发布了Qwen-2系列,社区对其视觉能力印象深刻,从具有挑战性的OCR任务到分析复杂的艺术作品,都完成的非常好。在较小的一端,清华大学的自然语言处理实验室资助了OpenBMB项目,该项目催生了MiniCPM项目。这些是可以在设备上运行的小型<2.5B参数模型。它们的2.8B视觉模型在某些指标上仅略低于GPT-4V。2024年是AI图像视频迅速发展的一年,这个赛道竞争异常激烈国外Stability AI发布的Stable Video Diffusion,是第一个能够从文本提示生成高质量、真实视频的模型之一,并且在定制化方面取得了显著的进步。并且在今年3月,他们推出了Stable Video 3D,该模型经过第三个对象数据集的微调,可以预测三维轨道。OpenAI的Sora能够生成长达一分钟的视频,同时保持三维一致性、物体持久性和高分辨率。它使用时空补丁,类似于在变压器模型中使用的令牌,但用于视觉内容,以高效地从大量视频数据集中学习。除此之外,Sora还使用了其原始大小和纵横比的视觉数据进行训练,从而消除了通常会降低质量的裁剪和缩放。Google DeepMind的Veo将文本和可选图像提示与嘈杂压缩视频输入相结合,通过编码器和潜在扩散模型处理它们,以创建独特的压缩视频表示。然后系统将此表示解码为最终的高分辨率视频。

XiaoHu.AI日报

-提供4K分辨率的人类自由视角视频。-利用该技术将虚拟角色放入场景,实现沉浸式互动。🔗项目地址:http://vcai.mpi-inf.mpg.de/projects/holochar/🔗详细介绍:https://xiaohu.ai/p/74845️⃣🌌DeepSeek发布2360亿参数的DeepSeek-V2:-60位专家混合开源模型,数学、编码和推理表现出色。-236B参数,21B在生成过程中被激活。-在MT-Bench上表现优异,中文能力强且性价比高。🔗详细介绍:https://xiaohu.ai/p/74686️⃣🔍Google Gemini网络安全产品:-检测并防御网络钓鱼攻击。-结合广泛的用户和网络监控发现威胁。-利用AI分析功能生成情报报告。🔗详细:https://xiaohu.ai/p/74607️⃣🚗Wayve获超10亿美元C轮融资:-开发“驾驶GPT”基础模型,实现具身体智能自动驾驶。-使车辆在各种环境中操作,几乎无需人为干预。-使车辆与人类互动、学习并理解人类行为。🔗详细内容:https://xiaohu.ai/p/74538️⃣🩺CURE模型预测治疗结果:-利用300万患者数据进行预训练并针对特定健康状况微调。

XiaoHu.AI日报

-提供4K分辨率的人类自由视角视频。-利用该技术将虚拟角色放入场景,实现沉浸式互动。🔗项目地址:http://vcai.mpi-inf.mpg.de/projects/holochar/🔗详细介绍:https://xiaohu.ai/p/74845️⃣🌌DeepSeek发布2360亿参数的DeepSeek-V2:-60位专家混合开源模型,数学、编码和推理表现出色。-236B参数,21B在生成过程中被激活。-在MT-Bench上表现优异,中文能力强且性价比高。🔗详细介绍:https://xiaohu.ai/p/74686️⃣🔍Google Gemini网络安全产品:-检测并防御网络钓鱼攻击。-结合广泛的用户和网络监控发现威胁。-利用AI分析功能生成情报报告。🔗详细:https://xiaohu.ai/p/74607️⃣🚗Wayve获超10亿美元C轮融资:-开发“驾驶GPT”基础模型,实现具身体智能自动驾驶。-使车辆在各种环境中操作,几乎无需人为干预。-使车辆与人类互动、学习并理解人类行为。🔗详细内容:https://xiaohu.ai/p/74538️⃣🩺CURE模型预测治疗结果:-利用300万患者数据进行预训练并针对特定健康状况微调。

Others are asking
你什么时候接入deepseek
以下是关于 DeepSeek 的相关信息: 学而思表示将接入 DeepSeek“深度思考模式”,预计在 2 月内陆续于相关机型上线,全面升级用户的 AI 学习体验。 钉钉已经全面接入 DeepSeek 系列模型。 扣子现已支持满血版 Deepseek 全家桶,R1 模型现支持所有用户免费体验,每个用户每日限 20 条对话。 微信接入 DeepSeek 确认为满血 R1,腾讯将有更多 APP 持续接入,微信推出 AI 搜索功能,提供“快速回答”和“深度思考”选项,用户可获取高质量答案并一键分享。 百度官宣全面接入 DeepSeek,文心大模型最新上线的深度搜索功能已集成到百度搜索当中。 关于 DeepSeek 的使用分享: DP 模型的功能:能进行自然语言理解与分析、编程、绘图,如 SVG、MA Max 图表、react 图表等。 使用优势:可以用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容。 存在问题:思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本。 审核方法:可以用其他大模型来解读 DP 模型给出的内容。 使用建议:使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。 使用场景:包括阅读、育儿、写作、随意交流等方面。 此外,还有关于音系学和与大模型互动的分享,以及 DeepSeek 文档分享和未来活动预告等内容。
2025-03-11
我需要deepseek或chatgpt辅助完成中文硕士 论文综述的指令
很抱歉,目前没有关于使用 DeepSeek 或 ChatGPT 辅助完成中文硕士论文综述的具体指令。但一般来说,您可以利用这些工具来获取相关主题的信息和观点,为您的综述提供参考。不过需要注意的是,使用这些工具生成的内容不能直接作为您论文的一部分,您仍需要对获取的信息进行筛选、整理、分析和引用,并确保符合学术规范和道德标准。
2025-03-11
deepseek 提示词怎么写
以下是关于 DeepSeek 提示词的一些写法和示例: 生成相机运动轨迹的提示词:可以将以往关于场景、构图、尺寸、位置、形态、半身全身、环境等的提示词,以“相机运动轨迹”的方式来描写,例如“相机向上飞升至上空轨道视角,拍摄站在泳池旁的女子”。 生成单词的提示词:输入单词主题、图片风格、单词数量等,如“非洲动物、真实风格、2”。选择 deepseekr1 模型,输入单词主题和数量,可输出指定数量的单词,并以数组方式呈现,包括单词、中文、美式音标、英文句子及其中文翻译。 在小说创作方面,写提示词时要给 AI 足够的背景信息,例如运用问题空间理论等。结构化提示词有帮助,同时要注意有用的是思考和表达,而非单纯的提示词技巧。
2025-03-11
DeepSeek是什么
DeepSeek 是一款爆火的产品,具有以下特点: 1. 价格亲民但实力超群,是智慧开源的领航者,在实时联网深度推理方面表现出色,被称为双冠王,用技术普惠重新定义了 AI 边界。 2. 具有便宜、开源、能联网的优势,在 Appstore 排行第一,甚至导致算力股大跌。 3. 使用地址为:https://chat.deepseek.com/(有手机客户端:扫描下面二维码) 4. 模型下载地址为:https://github.com/deepseekai/DeepSeekLLM?tab=readmeovfile 5. API 文档地址未提及。 6. 提示词使用方法比较长,单独列了一篇 7. 魔改版本有:https://huggingface.co/ValueFX9507/TifaDeepsex14bCoTGGUFQ4 、https://huggingface.co/mradermacher/DeepSeekR1DistillQwen7BabliteratedGGUF 此外,DeepSeek 与 Deep Research 有所区别,Deep Research 是基于 GPT4o 和 o3 的产品,具备 UI 交互、搜索等功能。DeepSeek 只是品牌名称,需要加上具体模型名,如 DeepSeek V3(类似 GPT4o)或 DeepSeek R1(类似 OpenAI o1)。Deep Research 更擅长生成专业报告,而 DeepSeek Chat 虽然集成搜索,但效果仍有差距。
2025-03-11
DeepSeek是什么
DeepSeek 是一款爆火的产品,具有以下特点: 1. 价格亲民但实力超群,是智慧开源的领航者,在实时联网深度推理方面表现出色,被称为双冠王,用技术普惠重新定义了 AI 边界。 2. 具有便宜、开源、能联网的优势,在 Appstore 排行第一,甚至导致算力股大跌。 3. 使用地址为:https://chat.deepseek.com/(有手机客户端:扫描下面二维码) 4. 模型下载地址为:https://github.com/deepseekai/DeepSeekLLM?tab=readmeovfile 5. API 文档地址未提及。 6. 提示词使用方法比较长,单独列了一篇 7. 魔改版本有:https://huggingface.co/ValueFX9507/TifaDeepsex14bCoTGGUFQ4 、https://huggingface.co/mradermacher/DeepSeekR1DistillQwen7BabliteratedGGUF 此外,DeepSeek 与 Deep Research 有所区别,Deep Research 是基于 GPT4o 和 o3 的产品,具备 UI 交互、搜索等功能。DeepSeek 只是品牌名称,需要加上具体模型名,如 DeepSeek V3(类似 GPT4o)或 DeepSeek R1(类似 OpenAI o1)。Deep Research 更擅长生成专业报告,而 DeepSeek Chat 虽然集成搜索,但效果仍有差距。
2025-03-11
deepseek提示词
以下是关于 deepseek 提示词的相关内容: 1. 生成小红书爆款单词视频: 开始时输入单词主题、图片风格、单词数量。 选择 deepseekr1 模型生成单词数组,以数组方式输出,包括单词、中文、美式音标、英文句子及其中文翻译。 提示词中角色设定为专业的单词生成助手,技能是输出关联英语单词,限制为仅围绕用户输入主题输出相关内容,且以特定数组形式呈现。 2. Deepseek 时代提示词的关键诉求: 观察发现完整的提示词可能不如片段有效,甚至可能干扰模型思考流程,过长提示会带来 Token 浪费和上下文污染。 新一代 LLM 的正确打开方式是“关键诉求直通车”模式,如像对聪明助理打暗号,让模型自主发挥。 3. 让 DeepSeek 生成相机运动轨迹的提示词: 以往的提示词是场景、构图、尺寸等的组合,现在要求以“相机运动轨迹”的方式描写。 例如“相机向上飞升至上空轨道视角,拍摄站在泳池旁的女子”,海螺 AI 能对空间理解和遵循语义,生成相关内容。
2025-03-11
PixVerse V2怎么打开
要打开 PixVerse V2,您可以在 Home 页面或直接点击 PixVerse V2。 PixVerse V2 的使用包括以下方面: 单个视频生成(8s):8 秒的视频生成需要花费 30Credits,5 秒的视频生成需要花费 15Credits,且只能使用 PixVerse V2 模型,生成时请注意模型选择。目前仅支持 16:9 画面比例的视频生成。 文生视频:点击“Text to Video”,在“Model”选择“PixVerse V2”,视频时长。PixVerse V2 支持多风格的视频生成,您可以通过在提示词中加入“Anime”,“Realistic”等词语做到这点。 图生视频:点击“Image to Video”,在“Model”选择“PixVerse V2”,视频时长。图生视频暂不支持“Magic Brush”、“Camera Motion”、“Motion Strength”等功能,如需要使用上述功能,请将模型切换至“PixVerse V1”。 输入提示词和上传图片:PixVerse V2 支持文生和图生视频,如无图片上传,可忽略此步骤。 选择视频时长:PixVerse V2 支持 5 秒和 8 秒的视频生成,选择后,每个 Scene 的时长都会保持这个长度。 添加新片段: 添加 Scene 2:点击“Scene 1”旁边的“+”,为视频添加第二个片段。 编辑 Scene 2:在 Scene 2 中,您可以为 Scene2 输入不同于 Scene 1 的提示词,其它操作与之前相同。 编辑其它 Scene:重复以上步骤,您可以为视频添加多个 Scene,最多支持 5 个 Scene 的同时生成。 生成视频:点击图标,生成视频。该模式下,每次生成需要花费 30Credits,且默认将所有片段拼接在一起,不支持单片段下载。 编辑生成的视频:点击视频进入编辑页面。 编辑视频:视频下方分别为:角色,环境,动作。如生成的视频不满意,您可从相应的下拉选项中选择想要的效果。 编辑多个 Scene:上方为进度条,通过点击切换 Scene,可一次性对多个 Scene 进行编辑后一起生成。 生成视频:对所有 Scene 编辑完成后,点击“Create”,可重新生成视频。未修改的 Scene,再次生成时也会改变,不会与之前生成的视频保持一致。
2025-02-22
PixVerse V2打开这个
PixVerse V2 是一款强大的视频生成工具,具有以下特点和使用方法: 特点: 革命性更新,赋予普通用户创作惊艳视频内容的能力。 支持生成时长 8 秒的视频,提供更多展示空间。 显著提升视频的分辨率、细节和动作幅度。 在 1 至 5 个视频片段之间保持风格、主体和场景的一致性,提升连贯性和内容一致性。 使用方法: 1. 进入:在 Home 页面或点击 PixVerse V2 进入。 2. 输入提示词:支持文生视频。 3. 上传图片:支持图生视频,如无图片上传可忽略。 4. 选择视频时长:支持 5 秒和 8 秒的视频生成,每个 Scene 的时长都会保持所选长度。 5. 添加新片段: 点击“Scene 1”旁边的“+”添加第二个片段。 所有 Scene 画面风格会与 Scene 1 保持一致,如 Scene 1 有图片,则会参考其图片风格。 6. 生成视频:点击图标生成视频,每次生成需花费 30 Credits,默认将所有片段拼接在一起,不支持单片段下载。 7. 编辑生成的视频: 点击视频进入编辑页面。 视频下方分别为角色、环境、动作,可从相应下拉选项中选择想要的效果。 上方为进度条,通过点击切换 Scene,可一次性对多个 Scene 进行编辑后一起生成。 对所有 Scene 编辑完成后,点击“Create”重新生成视频。未修改的 Scene 再次生成时也会改变,不会与之前生成的视频保持一致。
2025-02-22
AI+小游戏开发
以下是关于 AI+小游戏开发的相关信息: AI 在游戏开发中的应用具有悠久历史,且不断发展。如今,大模型等关键技术的进步使 AI 能够生成更复杂的游戏内容,如动态场景、智能 NPC 行为等。AI 在游戏行业的渗透有诸多优势,包括游戏开发者乐于使用 AI 技术、游戏数据降低了筛选和清洗成本以及游戏成为 AI 模型能力的最佳试验场。 AI 对游戏创作的革新是工业级的,可从美术与风格、剧情与叙事、音效与音乐、玩法与机制、测试与优化这 5 个方面简化游戏创作的工作流。 例如,一款名为 Proxima 的 5 人独立游戏工作室开发的 AI 冒险独立游戏 Suck Up! 就引入了名为 Nemo 的 AI NPC,基于 LLM 驱动,能够根据用户命令或线索执行游戏行动。该游戏上线三周在油管播放超千万,其核心玩法与世界观设计得到了一定的市场验证,玩家还共创了许多富有创意的支线玩法和模式。 此外,AI 技术在游戏开发中的应用逐渐落地,为游戏行业提供了新的增长空间。2023 年我国游戏市场实际销售收入为 3029.6 亿人民币,同比增长 13.95%;截至 2024 年 11 月,累计收入已达 2681.16 亿元,市场回暖力度加强。同时,中国游戏用户规模也有所增长。
2025-03-11
角色:你是一名软件开发公司的运营经理 背景:现在要准备入局AI导航网站市场,通过AI导航网站实现布局产品流量入口,来获取AI风口的流量。 任务:请你完成AI导航网站的国内外市场调研 要求:调研内容包括AI网站导航的市场、竞品、用户分析以及产品规划、团队人员需求及资源需求、有哪些风险点
以下是对您需求的调研分析: 一、市场分析 目前,AI 领域发展迅速,AI 导航网站作为获取相关信息和资源的入口,具有较大的市场潜力。随着人们对 AI 技术的关注度不断提高,对于便捷、高效的 AI 资源导航需求也在增加。 二、竞品分析 暂未获取到直接关于 AI 导航网站的竞品详细信息。 三、用户分析 用户可能包括对 AI 技术感兴趣的个人、开发者、研究人员、企业等。他们希望通过导航网站快速找到所需的 AI 工具、资源、案例等。 四、产品规划 1. 提供全面、准确的 AI 网站分类和链接,涵盖工具、研究成果、应用案例等。 2. 设立用户评价和推荐系统,帮助用户筛选优质资源。 3. 提供个性化推荐功能,根据用户的浏览历史和偏好推送相关内容。 五、团队人员需求 1. 技术人员:负责网站的开发和维护,如前端开发、后端开发等。 2. 内容编辑:收集、整理和更新 AI 网站信息。 3. 运营人员:负责推广、用户互动和数据分析。 六、资源需求 1. 服务器和带宽资源,以保证网站的稳定运行和快速响应。 2. 数据采集和更新的工具和技术。 七、风险点 1. 市场竞争激烈,可能面临已有成熟竞品的压力。 2. AI 技术发展迅速,需要及时更新网站内容,以保持竞争力。 3. 可能存在版权和法律合规方面的风险。 4. 用户获取和留存的挑战,需要提供优质的服务和用户体验。
2025-03-11
trae与cursor有什么区别,用它开发微信小程序需要注意些什么?
Trae 与 Cursor 的区别主要体现在以下方面: 1. 在处理自然语言提出的非常具体的需求时,Trae 可能会在查找文件的步骤中出错,而 Cursor 在某些复杂任务中的表现可能更好。 2. Trae 中很多功能是免费的,而 Cursor 可能并非如此。 3. Trae 从底层架构开始就围绕着 AI 能力构建,比传统在 IDE 里集成 AI 的逻辑更具优势,使用起来更流畅、准确和优质。在插件式的使用方式下,用户使用 Cursor 仍需要具备一定的编程知识,而完全零编程知识也可以用 Trae 开发出应用,降低了编程门槛。 用 Trae 开发微信小程序需要注意以下几点: 1. 打开 Trae 并打开创建的文件夹,使用 Chat 模式明确需求,然后切换到 Builder 模式进行开发。 2. Trae 会在本地文件夹内生成代码,微信开发者工具从同一本地文件夹读取代码,且有实时预览功能。 3. 开发过程中若有报错需修改错误,直至在微信开发者工具内调试正常。 4. 上传时需在微信开发者工具右上角点击“上传”,在弹出的弹窗里选择“确定”,接着在弹出的选项里填写版本号和项目备注。 5. 上传完毕后,可在微信小程序后台的版本管理里查看开发版本的信息,可选择点击体验版进行线上体验或提交审核。
2025-03-10
手游开发的AI软件有哪些?
以下是一些手游开发中常用的 AI 软件: 语音生成: Coqui Studio:https://coqui.ai Bark:https://github.com/sunoai/bark Replica Studios:https://replicastudios.com 语音识别: OpenAI Whisper:https://huggingface.co/openai/whisperbase Facebook Wav2Vec2:https://huggingface.co/facebook/wav2vec2largexlsr53 对话模型: ChatGPT:https://chat.openai.com HuggingChat:https://huggingface.co/chat 故事讲述模型: MPT7BStoryWriter65k+:https://huggingface.co/mosaicml/mpt7bstorywriter Claude 100k:https://www.anthropic.com/index/100kcontextwindows GTP4 32k:https://platform.openai.com/docs/models/overview 游戏设计: Ludo.ai:https://ludo.ai 搜索引擎: Haddock:https://www.haddock.ai AI NPC: Inworld:https://inworld.ai Python 库 此外,网易推出的首款 AI 手游《逆水寒》在美术开发、NPC 与玩家的交互等方面应用了 AI 技术,如内嵌的全自动“AI 作词机”。还有一些 AI 应用如 AI 游戏道具推荐系统、AI 天气预报分时服务、AI 医疗病历分析平台、AI 会议发言总结工具、AI 书法作品临摹辅助工具等,也在不同方面为手游开发或相关领域提供了支持和帮助。
2025-03-09
企业级rag系统开发框架
企业级 RAG 系统开发框架如下: 首先,通过数据预处理引擎(如 Unstructured)将企业无结构文件(如 PDF、幻灯片、文本文件)从数据孤岛(如 Google Drive 和 Notion)加载、转换为 LLM 可查询格式,并将这些文件“分块”成更小的文本块,以实现更精确的检索,然后作为向量嵌入和存储在数据库(如 Pinecone)中。 当用户提出问题时,系统会检索语义上最相关的上下文块,并将其折叠到“元提示”中,与检索到的信息一起馈送给 LLM。LLM 会从检索到的上下文中合成答复返回给用户。 在实际生产中,AI 应用程序具有更复杂的流程,包含多个检索步骤和“提示链”,不同类型的任务并行执行多个“提示链”,然后将结果综合在一起生成最终输出。 RAG 是检索增强生成(Retrieval Augmented Generation)的简称,概括起来是知识检索+内容生成,主要组成包括数据提取、embedding(向量化)、创建索引、检索、自动排序(Rerank)、LLM 归纳生成。其核心在于能否将内容检索得又快又准。 RAG 的优势在于: 大语言模型技术存在输出结果不可预测、知识有截止日期、无法满足实际业务需求等问题,而 RAG 可以让大模型从权威的、预先确定的知识来源中检索、组织相关信息,更好地控制大模型生成的文本输出,并且用户可以深入了解 LLM 如何生成最终的结果。 RAG 可以和微调结合使用,两者并不冲突。微调适用于模型需要复制特定的结构、样式或格式时,RAG 适用于模型需要回答特定的询问或解决特定的信息检索任务。但 RAG 不适合教模型来理解广泛的领域或学习新的语言、格式或样式。 同时,通用的基础大模型无法满足实际业务需求的原因包括: 知识的局限性:模型自身的知识源于训练数据,对于实时性、非公开或离线的数据无法获取。 幻觉问题:大模型基于数学概率的文字预测,存在提供虚假、过时、通用或低可信度信息的情况。 数据安全性:企业重视数据安全,不愿承担数据泄露风险将私域数据上传第三方平台训练。
2025-03-08
开发角色在使用AI的时候会涉及哪些AI工具,帮我分别具体列举出来
开发角色在使用 AI 时可能涉及以下工具: 1. 个性(LLM 的文本):一些开源模型如 Vicuna 和 Pygmalion 经过微调,可在特定个性到无审查的角色扮演等场景中表现出色。 2. 记忆(向量存储):像 Pinecone 这样的向量存储系统,用于存储长期记忆、背景故事等独特信息。 3. 语音(语音合成):ElevenLabs 产品可赋予声音,并控制年龄、性别和口音。 4. 外表(SD 模型作图):LoRAs 可精细控制图像风格、细节和设置。 5. 动画(视频动画):DID 和 HeyGen 等工具能使图像“说话”。 6. 平台:多数开发者在 GCP 和 AWS 上部署运行,Steamship 等解决方案也受关注。 7. UI 层:SillyTavern、Agnaistic 和 KoboldAI 等是受欢迎的前端界面选择。 在游戏开发方面: 1. Unity 提供了新 Copliot 工具,可通过与 Muse Chat 聊天快速启动创建游戏项目,协助编码,创建 3D 材质、动画等内容。 2. Unity Sentis 工具允许在 Unity 运行时为游戏或应用程序嵌入 AI 模型,增强玩法和功能,是跨平台解决方案。
2025-03-07