Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何在手机上部署deepseek R1

Answer

以下是在手机上部署 deepseek R1 的步骤:

  1. 访问 deepseek 的官网(https://www.deepseek.com/)。
    • 进入右上角的 API 开放平台。
    • 早期 deepseek 有赠送额度,若没有赠送余额,可选择充值,支持美元和人民币两种结算方式以及各种个性化充值方式。
    • 创建一个 API key,注意 API key 只会出现一次,请及时保存。
  2. 设置代码编辑器:
    • 下载 cursor(https://www.cursor.com/)或 vscode(https://code.visualstudio.com/),只要代码编辑器可以下载插件即可。
    • 以 cursor 作为代码编辑器为例,下载安装后,在插件页面搜索并安装 Roo-cline。
    • 安装完后,打开三角箭头,可看到 Roo-Cline。
    • 选中 Roo-Cline,并点击齿轮,进入设置,依次设置:
      • 配置基本参数:
        • API Provider:选择 DeepSeek。
        • API Key:填入已创建的 key。
        • 模型:选择 DeepSeek-reasoner。
      • 语言偏好设置。
      • 小贴士:记得把 High-Risk 选项都打开,这样 AI 才能帮您自动生成文件。
    • 最后做完所有不要忘记点击 Done 保存修改。
  3. 在聊天框输入产品需求,输入需求后点击这个 blingbling 的星星,优化提示词,最终得到想要的结果,在 deepseek-r1 的加持下基本上是一遍过,各种特效效果交互逻辑也都正确。画面也算优雅,交互效果也不错。
Content generated by AI large model, please carefully verify (powered by aily)

References

Yeadon:cursor杀手!?超强性价比开发方案曝光!DeepSeek-R1+Roo-Cline

首先到deepseek的官网(https://www.deepseek.com/)进入右上角的API开放平台早期deepseek是有赠送额度,如果像我一样没有赠送的余额,可以选择去充值支持美元和人民币两种结算方式,以及各种个性化的充值方式创建一个API key注意,API key只会出现一次请及时保存下来[heading3]设置代码编辑器[content]接下来,下载cursor(https://www.cursor.com/),或者vscode(https://code.visualstudio.com/),都没问题,只要代码编辑器可以下载插件即可接下来,以cursor作为代码编辑器为例,下载安装后,在插件页面搜索并安装Roo-cline安装完后,我们打开这个三角箭头,就可以看到Roo-Cline选中Roo-Cline,并点击齿轮,进入设置,依次设置配置基本参数:API Provider:选择DeepSeekAPI Key:填入已创建的key模型:选择DeepSeek-reasoner语言偏好设置小贴士:记得把High-Risk选项都打开,这样AI才能帮你自动生成文件哦!✨最后做完所有不要忘记点击Done保存修改在聊天框输入产品需求tips:输入需求后点击这个blingbling的星星,优化提示词最终,得到想要的结果,deepseek-r1的加持下基本上是一遍过,各种特效效果交互逻辑也都正确。画面也算优雅,交互效果也不错,是我想要的。

Others are asking
DeepSeek R1和DeepSeek(联网版)有什么区别
DeepSeek R1 和 DeepSeek(联网版)的区别主要在于以下方面: 1. DeepSeek 只是品牌名称,需要加上具体模型名,如 DeepSeek V3 (类似 GPT4o)或 DeepSeek R1 (类似 OpenAI o1)。 2. DeepSeek R1 是原生通过强化学习训练出的模型,而 DeepSeek 联网版的具体特点未明确提及,但可能在功能和性能上与 R1 存在差异。 3. Deep Research 更擅长生成专业报告,而 DeepSeek Chat 虽然集成搜索,但效果仍有差距。
2025-03-05
claude 3.7和deepseek r1比,能力怎么样
Claude 3.7 在多个方面表现出色。相较于 DeepSeek R1,除了数学方面,带有扩展思考模式的 Claude 3.7 在任务指令跟随、通用推理、多模态能力和自主编程方面表现出色,拿下最高分。在多项基准测试中,“扩展思考”模式加持下的 Claude 3.7 在数学、物理、指令执行、编程等方面刷新了 SOTA,编码能力暴涨 10%以上,几乎完全碾压 o3mini 和 DeepSeek R1,与 Grok 3 不相上下。宾夕法尼亚大学沃顿商学院的教授 Ethan Mollick 对 Claude 3.7 进行了测试,对其能力既惊叹不已又感到一丝不安。例如,Claude 3.7 能通过自然对话或文档获得可运行的程序,还能对需求进行预判和采用新方法思考,生成超出要求的成果。参考资料:https://www.anthropic.com/news/claude37sonnet https://x.com/alexalbert__/status/1894093648121532546 https://x.com/AnthropicAI/status/1894092430560965029 https://www.oneusefulthing.org/p/anewgenerationofaisclaude37
2025-03-04
第三方满血deepseek R1
以下是关于第三方满血 DeepSeek R1 的相关信息: 云计算厂商提供的版本及价格特点: PPIO 派欧云:提供满血版全版本 DeepSeekR1,输入价格为¥4/百万 tokens,输出价格为¥16/百万 tokens。开发者福利包括新注册立得 500 万 tokens(关注 PPIO 公众号回“deepseek”再领 1 亿),初创企业认证+10 万算力补贴。产品服务特点为服务稳定性 99.9%,保持 0 故障,与 DeepSeek 官方同价,客户支持通道 10 分钟响应。 百度智能云:DeepSeekR1 限时免费,配额 1000RPM/10000TPM,无调用 tokens 上限。本模型将于 2025 年 2 月 19 日 00:00 起正式商用计费,输入价格 0.002 元/千 tokens,输出价格 0.008 元/千 tokens,有在线体验。 硅基流动:DeepSeekR1 输入价格为¥4/M Tokens,输出价格为¥16/M Tokens,有在线体验。2025 年 2 月 6 日起,未实名用户每日最多请求此模型 100 次。 社区动态: 微信接入 DeepSeek 确认为满血 R1,腾讯将有更多 APP 持续接入。微信推出 AI 搜索功能,提供“快速回答”和“深度思考”选项,用户可获取高质量答案并一键分享。 百度官宣全面接入 DeepSeek,7 亿用户光速进入 AI 搜索时代。2 月 16 日晚,百度文心大模型最新上线的深度搜索功能,也集成到百度搜索当中。 有文章《DeepSeek 的爱情观,远比人类轰轰烈烈》,提出爱情需在工程与诗篇之间找到平衡,保持适度距离,并重新理解承诺为动态过程。行动建议包括分享温暖时刻、表达感激与设定暂停机制。
2025-03-03
飞书多维表格xDeepSeek R1实用提示词
以下是关于飞书多维表格 x DeepSeek R1 实用提示词的相关信息: 《雪梅 May 的 AI 学习日记》中,在专题“飞书多维表格 + deepseek R1”的 DAY107 练习中,提到可在相关链接中找到与短视频相关的模板,使用如【视频脚本生成】【企业家 IP 视频脚本生成】等提示词制作多维表格,还可模仿,感受是制作体验丝滑流畅,仅用提示词就能编排多维表格实现强大功能。 同样在该专题的 DAY108 练习中,针对直播场景,可参考的直播相关多维表格,作者将小红书、短视频制作、直播等场景都做了一套放入同一个飞书多维表格,形成媒体内容生产与管理系统。 此外,还有 deepseek 论文解读的相关内容,包括直播视频回放、相关论文下载以及万能提示词的技巧分享等。若官网搜索不能用一直崩溃,可使用火山的满血版,其在视频最后 10 分钟左右有手把手教程。
2025-02-28
豆包如何切换deepseekR1大模型
要切换到 DeepseekR1 大模型,您可以参考以下步骤: 1. 对于新闻播报自动化工作流: 首先,输入新闻链接,系统会自动提取核心内容。添加网页图片链接提取插件,获取网页里的图片。 接着,利用调整图片的节点,将 url 属性的图片内容转化为 image 属性的图片。 然后,使用链接读取节点提取文字内容,并在提取链接后面接上一个大模型节点,使用 DeepseekR1 模型生成有吸引力的口播内容。 注意,DeepseekR1 基础版本限额使用,可在专业版手动接入。手动接入时,先点击 https://www.volcengine.com/experience/ark?utm_term=202502dsinvite&ac=DSASUQY5&rc=A6NPZ83H 领取 375 万 R1 模型的 tokens(手机用户可扫描二维码),再到 https://www.volcengine.com/,根据相关截图自行接入推理点。为了后续批处理,需将输出格式设置为 Array<String>格式。 2. 对于飞书多维表格相关操作: 可参考教程“”。 例如,在制作【AI 书单】时,可把图书的封面图复制到多维表格里,AI 能自动识别【书名和作者】;用字段捷径【AI 搜索】找到豆瓣评分;用字段捷径【自定义 AI 自动填充】识别图书的内容概述、适用人群、推荐理由;用【信息提取】分别把主题、核心观点、故事梗概、适用人群、推荐理由提取出来。
2025-02-27
如何获取DeepSeek R1 满血版且能联网
获取 DeepSeek R1 满血版且能联网的方法如下: 1. 拥有扣子专业版账号:如果您还是普通账号,请自行升级或注册专业号后使用。 2. 开通 DeepSeek R1 大模型: 访问地址:https://console.volcengine.com/cozepro/overview?scenario=coze 打开火山方舟,找到开通管理,找到 DeepSeek R1 模型,点击开通服务。 添加在线推理模型,添加后在扣子开发平台才能使用。添加过程包括添加模型和完成接入。 3. 创建智能体:点击创建,先完成一个智能体的创建。 此外,您还可以参考以下教程获取更多信息: 教程地址:
2025-02-26
deepseek相关的文档
以下是与 DeepSeek 相关的文档和信息: 在 2025 年 2 月 6 日的“【今晚 8 点】聊聊你怎么使用 DeepSeek!”中,提到了以下内容: DP 模型的功能:能进行自然语言理解与分析、编程、绘图,如 SVG、MA Max 图表、react 图表等。 使用优势:可以用更少的词让模型做更多事,思维发散,能给出创意思路和高级内容。 存在问题:思维链长不易控制,可能输出看不懂或胡编乱造的内容,增加纠错成本。 审核方法:可以用其他大模型来解读 DP 模型给出的内容。 使用建议:使用时要有自己的思维雏形,多看思考过程,避免被模型冲刷原有认知。 使用场景:包括阅读、育儿、写作、随意交流等方面。 案例展示:通过与孩子共读时制作可视化互动游戏,以及左脚踩右脚式的模型交互来展示 DP 模型的应用。 音系学研究:对音系学感兴趣,通过对比不同模型的回答来深入理解,如 bug 和 DIFF SIG,探讨语言概念在音系学下的心理印象等。 大模型取队名:与大模型进行多轮对话来取队名,通过不断约束和披露喜好,最终得到满意的队名及相关内容。 此外,2 月 6 日的宝玉日报中提到: Dario Amodei 认为 DeepSeek 进入前沿 AI 竞赛,但美国应保持领先优势。 强调“没有民族主义敌意”,依旧欢迎华裔科学家加入 Anthropic。 批评 DeepSeek 安全性差,称其“测试过的模型里最糟糕”。相关文稿:
2025-03-05
Deepseek具体如何应用
DeepSeek 的应用方式如下: 1. 访问 www.deepseek.com ,点击“开始对话”。 2. 将装有提示词的代码发给 DeepSeek 。 3. 认真阅读开场白之后,正式开始对话。 DeepSeek 的设计思路包括: 1. 将 Agent 封装成 Prompt ,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻自己的调试负担。 2. 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 3. 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 4. 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 5. 用 XML 来进行更为规范的设定,而不是用 Lisp(对开发者来说有难度)和 Markdown(运行下来似乎不是很稳定)。 关于 DeepSeek 的相关反馈: 1. 华尔街分析师对 DeepSeek 的反应:DeepSeek 展示出媲美领先 AI 产品性能的模型,但成本仅为其一小部分,在全球主要市场的 App Store 登顶。Jefferies 警告其技术可能打破资本开支狂热,Citi 对其技术突破提出质疑。高盛预测其可能改变科技巨头与初创公司的竞争格局,降低 AI 行业进入门槛。 2. DeepSeek 的实际使用体验:在文字能力上表现突出,尤其在中文场景中高度符合日常、写作习惯,但在专业论文总结方面稍弱。数学能力经过优化,表现不错;编程能力略逊于 GPT ,据用户反馈。GRPO 算法替代传统 PPO ,降低价值函数估计难度,提高语言评价场景的灵活性与训练速度。
2025-03-05
如何将deepseek部署到小爱音箱
以下是将 deepseek 部署到小爱音箱的步骤: 1. 本地部署教学(vscode) 第七步:安装依赖并运行 在下方终端窗口,单击终端,输入 cd migpt。 安装依赖,输入 pnpm install。安装完成后,界面会有所显示。 如果安装过程报错,出现特定情况,请在命令栏输入:npm cache cleanforce 清除缓存后重新运行 pnpm install。 构建项目,输入 pnpm build。出现特定界面即安装完成。 如果出现报错,找到 migpt 中 package.json 文件,将第 28 行 build 进行修改,注意不要删除引号,修改完成后保存。保存后运行 pnpm build,即可正常安装完成。 运行项目,输入 pnpm run dev。 运行成功时,进入特定页面,每次对话都会在终端中显示。 每次需要打开服务时,按照特定方式进入终端,先输入 cd migpt,再运行 pnpm run dev 即可打开服务。如果出现错误,可能是网络问题,请重新运行 pnpm run dev。 2. 注意事项:每次对话时,记得给大模型思考的时间,说话太快可能会出问题。
2025-03-05
华为云部署Deepseek
以下是关于 DeepSeek 在不同云计算厂商部署的相关信息: 华为昇腾社区:全版本。部署 DeepSeekR1 模型,用 BF16 权重进行推理至少需要 4 台 Atlas 800I A2(864G)服务器,用 W8A8 量化权重进行推理则至少需要 2 台 Atlas 800I A2。服务器调用 Docker 下载部署权重资源,非 API 调用模式。 阿里云(人工智能平台 PAI):全版本。以 R1 为例,所需计算资源价格 316.25/小时。模型部署成在线服务,在人工智能平台 PAI 下的模型部署下的模型在线服务 EAS。 阿里云(阿里云百炼):全版本。免费额度:10000000/10000000。通过 API 调用。 此外,DeepSeek 相关的月度榜单信息: A10+1:DeepSeekR1 上线华为云和腾讯云。 如需了解更完整的榜单信息,欢迎访问 。
2025-03-05
deepseek对接进微信
微信已接入 DeepSeek。微信“搜一搜”正在灰度测试接入 DeepSeekR1 模型,部分用户可在对话框顶部搜索“AI 搜索”进入体验。若未显示入口,则表示测试暂未覆盖,可等待后续开放。相关链接: 此外,这两天微信和百度相继宣布接入 DeepSeek,微信推出 AI 搜索功能,提供“快速回答”和“深度思考”选项,用户可获取高质量答案并一键分享。
2025-03-05
deepseek 私有化训练
以下是关于 DeepSeek 私有化训练的相关信息: 模型测试、问题探讨与新模型部署过程: 探讨了模型存在幻觉、答案有概率性等问题,并对比了加提示词前后的情况。 准备从 32B 蒸馏新模型,提及该模型的资源需求及阿里云拍卖机制。 介绍了启动 DSW 获取廉价 CPU 资源,以及部署模型时因库存不足不断加价的过程。 派平台大模型训练与微调实操讲解: 许键分享了抢硬件资源的方法,演示了通过提问蒸馏标注数据。 讲解了在派平台训练模型的流程,包括参数设置、数据集上传等,并展示了训练效果和日志查看。 说明了训练好的模型部署方法,强调训出满意模型需要大量基础知识学习。 模型蒸馏微调演示、平台介绍与问题解答: 许键展示了模型微调后的效果,如幻觉下降等。 介绍了阿里云解决方案,对比了百炼和派平台的差异。 进行了 Q&A,回答了无监督学习微调、训练数据资源、多模态训练标注、Python 代码报错等问题,提及派平台有公用数据集,还举例说明了多模态标注方式。 总结: 本地部署介绍:讲解了如果拥有云服务器如何进行本地部署,以及满血版本地部署的实际情况。 免费额度说明:在 freely.aliyun.com 可领取 500 元免费额度,但有使用限制,不能部署满血版和较大的增流模型。 平台服务差异:介绍了 DLC、DSW 和 EAS 等模型部署平台服务的差别。 模型蒸馏微调:会带着大家复现模型的蒸馏和微调,并讲解相关知识。 Deepseek R1 模型的制作及相关模型比较: R1 模型的强化学习:通过强化学习,在训练过程中给予模型反馈,对正确路线增强权重,使做对的概率变高,导致思考逻辑变长。 R1 模型的蒸馏与微调:用 Deepseek RE Zero 蒸馏出带思考的数据,基于 Deepseek V3 微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成 R1。 R1 与其他模型的差别:R1 是原生通过强化学习训练出的模型,蒸馏模型是基于数据微调出来的,基础模型能力强,蒸馏微调模型能力也会强。 模型的相互帮助:Deepseek R1 反过来蒸馏数据微调 V3,形成互相帮助的局面,使两个模型都更强。 智能章节: 许键介绍今日课程重点是云服务器上如何使用 Deepseek R1 及本地部署相关内容,提及派平台免费额度及适用模型。还介绍了自己和社区情况。接着讲解 Deepseek R1 制作过程,包括强化学习概念及示例,阐述其从 Deepseek r e Zero 到 M2 等模型的演变及原理。 主要介绍了 Deepseek R1 模型的构建过程,包括多轮强化学习和微调,还提及蒸馏模型的情况。探讨了不同模型部署所需的显存、内存及成本,对比了各模型在专业领域的能力表现。 介绍了以云基础设施和 GPU 算力资源为底层的派平台。该平台搭建 AI 框架并做优化,提供一键式快捷部署工具等。与百炼不同,它开放更多自由度,租户数据隔离。很多大模型在此训练,支持多机分布式部署等,既面向企业,也适合个人创业者,不同应用定价有差异。
2025-03-05
小公司, 想部署一个本地ai系统,希望它能够, 对运维, 运营, 客服, 美术, 策划, 程序都能够有很大的帮助, 目前市面上那款 ai 模型比较合适
对于小公司想要部署一个能对运维、运营、客服、美术、策划、程序都有帮助的本地 AI 系统,以下是一些相关信息: 线上和线下本地部署的 AI 特点: 线上部署的优势在于出图速度快,不依赖本地显卡配置,无需下载大型模型,还能参考其他创作者的作品,但出图尺寸受限。线下部署的优势是可添加插件,出图质量高,但使用时电脑可能宕机,配置不高可能爆显存导致出图失败。建议线上用于找参考、测试模型,线下作为主要出图工具。 Ollama: 支持多种大型语言模型,包括通义千问、Llama 2、Mistral 和 Gemma 等,适用于不同场景。 易于使用,适用于 macOS、Windows 和 Linux 系统,支持 CPU 和 GPU。 提供模型库,用户可从中下载不同模型,满足不同需求和硬件条件。 支持自定义模型,可调整参数。 提供 REST API 用于运行和管理模型,以及与其他应用集成。 社区贡献丰富,有多种集成插件和界面。 Google Gemma: 是 Google 发布的家用版小模型,有 2b(20 亿参数)和 7b(70 亿参数)版本。小模型可能不适合复杂任务,但适合提升基础操作效率。部署环境友好,可通过 ollama 方便部署,支持热加载模型文件。2b 反应速度快但互动话题有限,7b 输出质量高但可能卡顿,对非英文语种反馈不稳定。 综合考虑,如果您的公司对出图质量要求较高,且有较好的硬件配置,可以选择线下部署结合线上测试的方式。在语言模型方面,Ollama 具有较多优势,可根据具体需求选择合适的模型进行部署。
2025-03-04
小游戏公司, 想部署一个本地ai系统,希望它能够, 对运维, 运营, 客服, 策划, 程序都能够有很大的帮助, 目前市面上那款 ai 模型比较合适
对于小游戏公司部署本地 AI 系统以帮助运维、运营、客服、策划和程序等方面,以下是一些建议和相关信息: 目前市面上的 AI 模型各有特点。线上 AI 具有出图速度快、不依赖本地显卡配置、无需下载大型模型以及能参考其他创作者作品等优势,但出图尺寸受限。线下部署的 AI 可以添加插件、出图质量高,但可能导致电脑宕机且对配置要求高。 在游戏领域,AI 大模型带来了诸多变化,如游戏内容辅助生成(包括文、图、3D 和音乐),可应用于游戏策划人和美术设计师。文生图和图生图能提高创作效率,动画辅助渲染可改变角色风格,游戏智能运营涵盖智能 NPC 互动、客服、攻略问答和代码脚本生成等,适用于产品经理、运营经理和社区运营经理。 Google 刚刚发布的家用版小模型 Gemma 有 2b(20 亿参数)和 7b(70 亿参数)版本。相对千亿参数的大模型,这类小模型可能不太适合处理复杂任务,但代表了模型本地化提升基础操作效率的趋势。Ollama 是一个开源的大型语言模型服务,方便部署最新版本的 GPT 模型并通过接口使用,支持热加载模型文件,且像小型的 llama 也支持本地部署。部署时,需进入 ollama.com 下载程序并安装,通过命令提示符进行操作和切换模型。2b 反应速度快但互动话题有限,7b 输出质量高但可能卡顿,且对非英文语种反馈不太稳定。 综合考虑,小游戏公司可以根据自身需求和硬件配置选择合适的 AI 模型。如果对出图质量要求高且有较好的硬件配置,可尝试线下部署;若更注重效率和便捷性,线上模型可能更适合。同时,也可以考虑像 Gemma 这样的小模型进行本地化部署以提升基础操作效率。
2025-03-04
小游戏公司, 想部署一个本地ai系统,希望它能够, 对运维, 运营, 客服, 美术, 策划, 程序都能够有很大的帮助, 目前市面上那款 ai 模型比较合适
对于小游戏公司部署本地 AI 系统以帮助运维、运营、客服、美术、策划、程序等方面,以下是一些建议和目前市面上合适的 AI 模型分析: 线上 AI 平台的优势在于出图速度快,对本地显卡配置要求低,无需下载大型模型,还能参考其他创作者的作品,但出图分辨率有限制。 线下部署的优势是可以添加插件,出图质量高,但使用时电脑可能宕机,配置不高还可能爆显存导致出图失败。 综合考虑,建议充分发挥线上和线下平台的优势。线上可用于找参考、测试模型,线下作为主要出图工具。 在图像生成方面,2022 年主流生成式图像应用如 DALLE 2.0、Stable Diffusion 和 Midjourney 使图像生成精细化程度提升,提示对图像生成结果的控制能力增强。 在 3D 模型生成中,AI 能完成 3D 模型生成流程的“一步到位”,大大提升效率。 在游戏开发中,AI 可用于游戏内容辅助生成(如文、图、3D、音乐)、动画辅助渲染、游戏智能运营(包括智能 NPC 互动、客服、攻略问答、代码和脚本生成)等。 对于小游戏公司,Stable Diffusion 可能是一个较为合适的选择,它在 2D 美术素材辅助生成方面能够提高创作效率、降低成本,并且有多种应用场景,如文生图、图生图等。同时,也可以考虑结合线上平台进行参考和测试。
2025-03-04
我想完全本地化部署deepseek,然后,将我的文档,文本,图片等内容丢给它训练,微调。我要完全本地化,因为我的文档设计隐私。我要免费开源流程。如何实现,
要完全本地化部署 DeepSeek 并使用您的文档、文本、图片等内容进行训练和微调,以下是一些相关的信息和步骤: 1. 模型训练与平台服务: 模型复现与微调:1:1 复现通常没问题,但理解细节并自行制作需要基础知识。有手把手教程、数据集等可帮助 1:1 复现,微调在特定领域可降低幻觉,参数量不变但权重变化。 训练模型的学习方法:先会用再学会训,从训的过程中倒推学习参数调整,这是以用导学的学习方法。 模型回答效果对比:微调后的模型在回答排列组合等问题时,思考前几乎无反馈,答案多为英文且格式稳定,但仍可能答错。 2. 平台服务介绍: 阿里云提供多种解决方案。 百炼是提供多种模型服务的 Maas 平台。 派平台是提供云服务的 PaaS 平台,二者在定位、服务内容和核心差异上有所不同。 3. 关于模型训练与数据集相关问题: 数据资源情况:默认提供公共数据训练集,百派平台能匹配模型和数据,通义开源了不少数据集。 多模态训练:多模态有自身标注方式,如视频拉框标注。 参数量变化:通常训练模型参数量固定,若想改变需改模型层,但可能要从头调。 本地微调框架:可使用 llama factory 等框架,需搭建并部署。 开源数据下载:可在 GitHub、hugging face、Mo Model Scope 等平台获取。 数据集转化:将文档资料转成数据集可先手动形成 SOP,再逐步自动化,初期需大量人力。 4. 本地部署介绍:讲解了如果拥有云服务器如何进行本地部署,以及满血版本地部署的实际情况。 5. 免费额度说明:在 freely.aliyun.com 可领取 500 元免费额度,但有使用限制,不能部署满血版和较大的增流模型。 6. 平台服务差异:介绍了 DLC、DSW 和 EAS 等模型部署平台服务的差别。 7. 模型蒸馏微调:会带着大家复现模型的蒸馏和微调,并讲解相关知识。 R1 模型的强化学习:通过强化学习,在训练过程中给予模型反馈,如路线规划是否成功到达终点、输出格式是否符合期望等,对正确路线增强权重,使做对的概率变高,导致思考逻辑变长。 R1 模型的蒸馏与微调:用 Deepseek RE Zero 蒸馏出带思考的数据,基于 Deepseek V3 微调,进行冷启动,再做强化学习,还从非公布模型提取微调数据,加上人类偏好,最终形成 R1。 R1 与其他模型的差别:R1 是原生通过强化学习训练出的模型,蒸馏模型是基于数据微调出来的,基础模型能力强,蒸馏微调模型能力也会强。 模型的相互帮助:Deepseek R1 反过来蒸馏数据微调 V3,形成互相帮助的局面,使两个模型都更强。 请注意,在进行本地化部署和训练微调时,需要具备一定的技术知识和经验,并且要遵循相关的法律法规和道德规范。
2025-03-04
想在手机上通过宠物照片给宠物建模,是宠物可以有一些动态性,需要怎么做?利用 AIGC 能快速的实现吗?
在手机上通过宠物照片给宠物建模并实现一定的动态性,可以考虑以下几种方式: 1. 利用 3D 引擎:目前有一些公司提供通过手机摄像头快速创建虚拟人身体的服务,例如 NextHuman。不过,3D 引擎在拟真程度高的同时,定制化成本也较高。 2. 借助 AIGC:虽然 AIGC 省去了建模流程,能直接生成数字人的展示图片,但可能存在数字人难以保持 ID 一致性、帧与帧连贯性不佳等问题。典型的相关项目有 wav2lip等。但需要注意的是,如果对模型真实度要求较高,AIGC 方式可能不太理想,因为算法发展很快,未来可能会有更好的连贯度生成方式。 目前利用 AIGC 来快速实现可能存在一些挑战,但随着技术的发展,未来有可能更便捷高效地达成您的需求。
2025-02-13
手机微信怎么接入DeepSeek
目前微信尚未直接接入 DeepSeek。但学而思已表示将接入 DeepSeek“深度思考模式”,预计在 2 月内陆续于相关机型上线;钉钉已经全面接入 DeepSeek 系列模型;扣子现已支持满血版 Deepseek 全家桶,R1 模型现支持所有用户免费体验,每个用户每日限 20 条对话。 如果您想使用 DeepSeek,可按以下步骤操作: 1. 搜索 www.deepseek.com,点击“开始对话”。 2. 将装有提示词的代码发给 Deepseek。 3. 认真阅读开场白之后,正式开始对话。 关于 DeepSeek 提示词的设计思路: 1. 将 Agent 封装成 Prompt,将 Prompt 储存在文件,保证最低成本的人人可用的同时,减轻调试负担。 2. 通过提示词文件,让 DeepSeek 实现同时使用联网功能和深度思考功能。 3. 在模型默认能力的基础上优化输出质量,并通过思考减轻 AI 味,增加可读性。 4. 照猫画虎参考大模型的 temperature 设计了阈值系统,但是可能形式大于实质,之后根据反馈可能会修改。 5. 用 XML 来进行更为规范的设定,而不是用 Lisp(有难度)和 Markdown(运行不稳定)。 完整提示词版本为 v 1.3,特别鸣谢李继刚的【思考的七把武器】在前期为其提供了很多思考方向,以及 Thinking Claude(这个项目是现在最喜欢使用的 Claude 提示词,也是设计 HiDeepSeek 的灵感来源)和 Claude 3.5 Sonnet(最得力的助手)。 如有任何问题请联系后台,电子邮箱:alolg@163.com
2025-02-12
手机上好用的 人工智能Ai 软件
以下是一些手机上好用的人工智能软件: 一些模仿 ChatGPT 的移动端应用被曝光为“骗钱软件”,它们通过类似标题和标志误导用户收费。但也有其他针对手机特有功能专门设计的受欢迎应用,如用于打造个性化虚拟形象的七款应用,以及为移动设备量身定制的键盘应用,让用户能在 AI 辅助下发送文本信息。 教育科技类也是移动端应用的热门类别,如用户可以利用手机扫描并解决作业问题的。 以下是一些工具: AI 助手平台,如传音智库(仅内网可访问,可用 kimi 替代),kimi 网址:https://kimi.moonshot.cn/ 。 秘塔 AI ,网址:https://metaso.cn/ 。 以下是一些特定领域的 AI 应用: AI 摄影参数调整助手,一些摄影 APP 利用 AI 分析拍摄场景,自动调整相机参数,如曝光、对焦、感光度等。 AI 音乐情感分析平台,利用 AI 分析音乐的旋律、节奏、歌词等,判断音乐的情感倾向。 AI 家居智能照明系统,如小米智能照明系统利用 AI 和物联网技术,根据用户习惯和环境变化自动调整灯光亮度和颜色。 AI 金融风险预警平台,利用 AI 分析金融市场数据,提前预警可能出现的风险。 AI 旅游路线优化平台,如马蜂窝根据用户的时间、预算、兴趣等因素,利用 AI 优化旅游路线,提高旅行体验。
2025-02-09
有什么可以在手机端使用ai工具api的聚合聊天aiapp吗
以下是一些在手机端可以使用 AI 工具 API 的聚合聊天 App 相关信息: OpenAI 与 Apple 合作在 iPhone 端实现了 ChatGPT 功能集成,包括 Siri 智能化升级、写作助手、相机 AI 视觉和跨应用使用等功能。例如,Siri 面对复杂或创意性请求会交由 ChatGPT 处理,iPhone 的文本编辑功能提供文本润色、语法检查、内容生成等,长按相机控制键可启动视觉智能功能,所有功能界面都内置了快捷入口直达 ChatGPT 应用。 此外,移动应用榜单中有一些相关应用,如在移动领域月活跃用户数排名榜首的 ChatGPT,还有微软基于 AI 技术全新打造的搜索引擎 Bing、照片美化和虚拟形象制作工具 Remini 等。有五家 AI 公司实现了“双线作战”,它们的网页端、移动端应用双双跻身前 50 强榜单,如 ChatGPT、Character.AI、chatbot 平台 Poe,以及图片编辑应用 Photoroom、Pixelcut。
2025-02-05
好用的手机翻译ai
以下为您推荐一些好用的手机翻译 AI 应用: 1. Hand Talk:能自动将文本或语音转换成美国手语。被联合国评为“世界上最佳的社交应用”,已翻译近 20 亿个单词。既是翻译工具,也是学习平台。相关链接:https://xiaohu.ai/p/5688 、https://x.com/imxiaohu/status/1777201503142601143
2025-01-31
AI手机端和网页端的应用场景有什么区别?
AI 手机端和网页端的应用场景存在以下区别: 网页端产品更倾向于支持涉及内容创作和编辑的复杂、多步骤工作流程,例如 AI 语音工具包 ElevenLabs、AI 艺术创作器 Leonardo 以及 AI 演示文稿构建器 Gamma 等。 移动端应用更倾向于通用型助手,不少在功能上模仿了 ChatGPT。 在移动设备上,图片和视频的内容编辑是最常见的用途。例如,美图秀秀、SNOW 和 Adobe Express 等传统创意工具转型为生成式 AI 优先,并在移动排名中表现出色。 ChatGPT 以巨大优势成为网络和移动端排名第一的产品,而争夺最佳消费者助手的竞争正在升温。Perplexity 在网络上排名第三,专注于提供简明、实时和准确的查询答案,且用户参与度很高,还首次进入移动端前 50 名榜单。Anthropic 的 Claude 是 ChatGPT 的直接竞争对手,在网页排名中进入前五。
2025-01-16