Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

GRU+CNN模型如何操作

Answer

GRU+CNN 模型的操作主要包括以下步骤:

  1. 编码器部分:使用预训练的卷积神经网络(CNN),如 Inception Resnet V2,将输入图像转换为一组特征向量。在这种情况下,大部分 CNN 部分被冻结,保留预训练的权重。
  2. 解码器部分:结构较为复杂,涉及到注意力机制、嵌入层、GRU 层、添加层归一化层和最终的密集层等。可以找到很多关于注意力层和解码器步骤的说明。
  3. 组合模型:将编码器和解码器组合在一起,形成一个完整的图像字幕生成模型。
  4. 自定义损失函数:由于任务是生成文本序列且序列长度可能不同,使用稀疏分类交叉熵作为损失函数,并屏蔽填充的部分。
  5. 编译模型:编译模型,为开始训练做准备。
  6. 训练模型:可以根据需求进行更多训练以获得更好结果。
  7. 推理与生成字幕:训练完成后,为新的图像生成字幕。在推理阶段,需要重构解码器模型,使其可以接收额外的 GRU 状态输入,并编写自定义推理循环,一次产生一个单词,直到生成完整句子。
Content generated by AI large model, please carefully verify (powered by aily)

References

8. 创建图像描述模型

09:00和不。所以我们用零值填充移位的部分看起来不错。所以下一部分是模型。大部分模型代码已经在之前的视频中解释过了,所以我将快速过一遍。09:17但是,如果您对此不是很熟悉并且对此很有信心,那么您可以返回到上一张幻灯片并检查编码器和解码器内部发生了什么。09:28所以在这段视频中。所以让我们快速运行这些东西。所以这是编码器,正如你所看到的,我们只是将inception resnet V2应用于图像数据。09:43请注意,在这种情况下,我们冻结了这个cnn的大部分部分,因为我们不需要接受培训。这个模型,基本上这种骨干是预训练的09:56通过在这种情况下使用庞大的数据集图像网络数据集。所以当然,如果你想训练,再次微调,这是可能的,但在这种情况下,我们希望你只保留权重10:10预训练。那么接下来让我们继续解码器。正如我们讨论的那样它有点复杂,在这里你可以找到很多关于注意力层的说明10:25以及解码器的步骤,我们在之前的视频中讨论过。在这里我们可以找到一个定义,这样你就可以找到嵌入层来创建嵌入和第一个GRU层10:41注意力层添加层归一化层和最终的密集层。所以让我们这样定义。所以模型看起来像这个嵌入层GRU attention add layer normalization,然后这个。11:01在定义解码器和编码器之后它有这么多参数,我们可以创建最终模型TF Keras模型并定义输入和输出。正如你所看到的,它有两个输入,11:23图像输入进入编码器,文字输入进入解码器,输出应该是解码器输出。现在模型已准备就绪,但在运行训练之前,我们需要像往常一样定义丢失的功能。11:45因此,就损失而言,我们的模型基本上是一个分类模型,因为解码器为每个类、每个词类、每个词汇生成了很多概率。

8. 创建图像描述模型

在这一部分,我们将详细讨论如何实现我们的图像字幕生成模型。这个模型主要由两部分组成:编码器和解码器。[heading3]编码器[content]编码器的作用是将输入图像转换为一组特征向量,这些特征向量包含了图像的重要信息。在我们的模型中,编码器是一个预训练的卷积神经网络(CNN)。[heading3]解码器[content]解码器部分的任务是根据编码器提供的图像特征生成描述图像内容的文本。这部分模型的结构稍微复杂一些,因为它涉及到序列生成,并且在这个过程中使用了注意力机制。[heading3]组合模型[content]现在我们有了单独的编码器和解码器,我们需要将它们组合在一起,形成一个完整的图像字幕生成模型。[heading2]自定义损失函数[content]由于我们的任务是生成文本序列,并且这些序列可能具有不同的长度,我们需要特殊处理损失函数。我们使用稀疏分类交叉熵作为损失函数,但是需要屏蔽填充的部分。[heading2]编译模型[content]最后,我们需要编译我们的模型,这样我们就可以开始训练它了。[heading2]训练模型[content]一旦我们的模型被编译,我们就可以开始训练它了。在本教程中,我使用了一个单一的GPU来进行训练。每个epoch大约需要15至20分钟的时间。当然,你可以根据自己的需求进行更多的训练,这可能会得到更好的结果。[heading2]推理与生成字幕[content]训练完成后,我们可以使用我们的模型为新的图像生成字幕。在这一步,我们需要稍微修改解码器的结构,以便我们可以手动控制GRU的状态。[heading3]重构解码器[content]在推理阶段,我们需要更细粒度地控制解码器的行为。因此,我们重构解码器模型,使其可以接收额外的GRU状态输入,并返回新的GRU状态。[heading3]自定义推理循环[content]为了生成字幕,我们编写一个自定义推理循环,它会一次产生一个单词,直到生成一个完整的句子。

机器学习-Transformer的基本工作原理

在Transformer出现之前,序列到序列的模型主要依赖于循环神经网络(RNN)或其变种,如长短时记忆网络(LSTM)和门控循环单元(GRU)。由于这种方法必须按顺序处理序列,这些模型在处理长序列时面临梯度消失或梯度爆炸的问题,而且计算效率不高。而transformer摒弃了这种循环计算模式,用并行模式提升了计算效率(比如我们举例中的“我””喜欢“”什么“”?“),每个元素的计算结果并不依赖于其他元素的计算,自注意力机制允许模型在处理序列的每个元素时考虑到序列中的所有其他元素,这种全局性的信息整合能力极大地提高了模型处理长距离依赖的能力。因此,"Attention is all you need"不仅强调了自注意力机制在Transformer模型中的核心作用,也标志着自然语言处理领域在模型架构上的一次重大转变。此后,基于Transformer的模型如BERT、GPT等在多项自然语言处理任务上都取得成功,也充分证明了这个架构的有效性和通用性。

Others are asking
CNN的主要应用是什么?
CNN(卷积神经网络)主要应用于以下领域: 1. 模式识别任务,在计算上比大多数其他架构更有效、更快速。 2. 自然语言处理,已被用来击败大多数其他算法。 3. 图像识别,用于图像特征提取。 4. 推荐系统,将用户行为或物品属性映射到低维空间以进行协同过滤或基于内容的推荐。 5. 视觉分析,在 CV(计算机视觉)中发挥核心作用,经历了从零开始的深度学习、有监督、无监督和自监督等阶段。
2024-07-29
判别式CNN到生成式大模型的发展
判别式 CNN 到生成式大模型的发展经历了以下几个阶段: 1. 早期发展(2014 年以前):最初的文生图尝试集中在将简单文本描述转化为图像。这些早期方法依赖于基本的图像处理技术和简单的模型,效果有限,生成的图像质量通常不高。 2. 深度学习的崛起(2014 年2018 年):随着深度学习的发展,尤其是卷积神经网络(CNN)的成功应用,文生图模型开始采用神经网络来改进图像生成的质量和多样性。在这一时期,如 GAN(生成对抗网络)及其变体层出不穷,开始被用于文生图任务,展示了生成更逼真图像的潜力。 3. 引入 Transformer(2019 年2021 年):Transformer 架构,原本在 NLP 领域取得巨大成功,开始被应用于文生图模型,提高模型处理复杂文本和生成高质量图像的能力。如 OpenAI 的 DALLE 模型,采用了 Transformer 结构来生成与文本描述匹配的图像,成为这一时期的标志性进展。与此同时,以 DDPM 为代表的工作,为 Diffusion Model 奠定了理论基础,众多基于 Transformer 和 Diffusion Model 的研究成果从 2021 下半年开始如雨后春笋般涌现。
2024-04-16
GRU模型
GRU(门控循环单元)是 RNN(递归神经网络)的一种变体。 在创建图像描述模型中,解码器部分包含了 GRU 层。GRU 层接受输入,更新其内部状态,并生成输出。通过传递像文本这样的顺序数据,它可以保持与先前输入(例如先前的单词)的顺序依赖关系。 在 Transformer 出现之前,序列到序列的模型主要依赖于循环神经网络(RNN)或其变种,如长短时记忆网络(LSTM)和 GRU。由于传统方法必须按顺序处理序列,在处理长序列时面临梯度消失或梯度爆炸的问题,而且计算效率不高。 在创建图像描述模型的解码器中,GRU 的输出会进入注意力层,该层混合了来自编码器(图像)和解码器(文本)的信息。解码器本身是一个迭代操作,通过自回归地多次调用,最终可以生成完整的文本。 在代码方面,注意力层有两个输入:gru_output 和 encoder_output。在内部,gru_output 用作注意力的查询和键,而 encoder_output 用作值。
2025-03-05
UI交互设计大模型
以下是关于 UI 交互设计大模型的相关内容: ComfyUI ollama 本地大模型部署: 1. 先下载 ollama 安装。安装好后不会有任何界面弹出,可以在电脑桌面右下角或者隐藏图标里面找到。 2. 之后再去下载对应的模型,选择模型,复制对应的命令。 3. 打开命令行界面,输入对应的模型获取命令,等待下载完成。 4. 下载的模型会保存到 D:\\ollama\\blobs 。 5. Docker 安装时会下载一些文件,安装后改下目录,不要放在 C 盘。 6. Open webui 安装,输入相关命令。安装成功后,回到 docker 点击,会自动打开网页。第一次使用,需要注册一个账号,选择一个下载好的模型就可以开始使用。 7. 若出现端口占用的错误,运行下面两条命令可以解决。 8. 相关链接: ComfyUI ollama:https://github.com/stavsap/comfyuiollama?tab=readmeovfile Ollama:https://ollama.com/ Docker:https://www.docker.com/ Open webui:https://openwebui.com/ 通过 Open WebUI 使用大模型: 在默认情况下,与大模型的交互在终端中进行,但这种方式较古老。大模型有交互客户端 Open WebUI。Open WebUI 是 github 上的开源项目,参考其官方文档 https://docs.openwebui.com/gettingstarted/ 进行下载和安装。 1. 安装之前先安装 Docker,Win 或 Mac 系统参考文档:,注意下载适配电脑系统的版本。Linux 系统请自行上网找教程。 2. 官方文档中有两种安装 Open WebUI 的方式:ollama 和 open webui 一起安装、仅仅安装 open webui。若已安装 ollama,只需要安装 open webui 即可,复制相关命令。安装下载完成后即可使用。 大模型时代的产品特点: 大模型的交互方式是 NUI(自然用户界面),通过自然语言文本、语音、输入输出图片等直接交互,与现在熟悉的 GUI(图形用户界面)差异很大。现在习惯在 GUI 界面通过点击按钮与机器交互,需要一定学习成本。而 NUI 更符合人的直觉,用户几乎无需特别学习,通过对话操作,但大模型产品对普通用户使用门槛较高,用户留存率和粘性不如主流 App。若未来大模型产品都是 NUI 的,可能对整个信息产业带来深远影响。
2025-03-05
截止今天最强的模型是哪个
目前很难确切地指出截止今天最强的模型是哪一个。以下是一些表现出色的模型: Gemini Ultra:在报告的 32 个基准测试中,在 30 个基准测试中取得了 SOTA,包括多个领域的测试。它是第一个在 MMLU 上实现人类专家水平表现的模型,在多模态推理任务方面也有显著进展。 o3 模型:在 ARCAGI 测试中达到了 87.5%的准确率,几乎与人类水平相当。OpenAI 表示下一代 o3mini 模型的推理能力很强。 Gemini 2.0 Flash:Google 发布的该模型在重要的基准能力上,直接追平甚至部分超越了 Gemini 1.5 Pro,且模型速度有极大提升。 Llama 3.1:是迄今为止最大版本,其在推理、数学、多语言和长上下文任务中能够与 GPT4 相抗衡。 需要注意的是,模型的性能评估会因不同的基准测试和应用场景而有所差异,而且技术在不断发展,最强模型的定义也可能随之变化。
2025-03-05
Deepseek 怎么训练模型 到达写作的水准
要将 DeepSeek 训练模型达到写作的水准,可以参考以下方法: 1. 借助 AI 分析好的文章:找出您最喜欢的文章,投喂给 DeepSeek R1。然后进行多次询问,如从写作角度、读者角度分析文章,询问文章的缺点和不足以及改善和提升的空间,对作者进行侧写,分析其成长背景、个人经历和知识结构对文章的影响。 2. 让 AI 对您写的文章进行点评:使用类似“现在我希望你是一名资深中文写作教师/小学语文老师/中学语文老师/公文写作培训师,拥有 30 年教育经验,是一名传授写作技巧的专家。请先阅读我提供给你的文章,然后对文章进行分析,然后教我如何提升写作水平。请给出详细的优缺点分析,指出问题所在,并且给出具体的指导和建议。为了方便我能理解,请尽量多举例子而非理论陈述。”的提示词。 3. 根据文章内容对作者进行心理侧写:使用如“我希望你扮演一个从业 20 多年,临床诊治过两千多例心理分析案例的人性洞察和意识分析方面的专家,精通心理学、人类学、文史、文化比较。先阅读后附文章全文,然后对作者进行人格侧写。要尖锐深刻,不要吹捧包装,不要提出一些只能充当心理安慰的肤浅的见解。包括作者的基本画像、核心性格特质、认知与价值观、潜在心理动机、行为模式推测、矛盾与盲点、文化符号映射”的提示词。 此外,DeepSeek 模型具有文风出色、善用大词、发散能力强等特点,但也较难收敛,有时会出现幻觉。从创作角度看,其在文学创作上表现出色,能给予更多自由发挥空间。
2025-03-05
深度学习模型图
以下是为您提供的关于深度学习模型图的相关内容: 腾讯研究院的 AI 年度关键词报告: 基于全年研究积累的三十余万字 AI 进展数据库,精选 50 个年度关键词,覆盖大模型技术的八大领域,包括图像处理、视频生成、3D 生成、编程助手、Agent、端侧智能、具身智能和基础模型。通过“快思考”与“慢思考”两种维度进行分析,“快思考”采用人机协同方式完成印象卡片,“慢思考”深入分析技术发展的底层逻辑。 DiT 架构: 结合扩散模型和 Transformer 的架构,用于高质量图像生成的深度学习模型。其核心观察包括 Transformer 从文本扩展至其它、DiT 架构带来图像生成质的飞跃、Scaling Law 在图像领域开始生效。 深度学习模型原理的通俗解释: 将深度学习要处理的信息比作水流,处理数据的深度学习网络是由管道和阀门组成的庞大水管网络。网络入口和出口有许多管道开口,且有多层,每层有调节阀。根据不同任务,层数和调节阀数量可变化。如识别汉字,将图片数字组成的水流灌入网络,根据出口水流情况调节调节阀,直至符合预期要求,训练好的模型可识别新的图片。 AI 技术原理与框架的小白学习笔记: 1. 概念:生成式 AI 生成的内容叫 AIGC。 2. 相关技术名词及关系: AI 即人工智能。 机器学习包括监督学习、无监督学习、强化学习,监督学习有标签,无监督学习无标签,强化学习从反馈学习。 深度学习参照人脑有神经网络和神经元,神经网络可用于多种学习方式。 生成式 AI 可生成多种内容形式,LLM 是大语言模型。 3. 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,提出 Transformer 模型,基于自注意力机制处理序列数据,无需依赖 RNN 或 CNN。
2025-03-05
深度学习模型图
以下是为您提供的关于深度学习模型图的相关内容: 腾讯研究院的相关报告: 基于全年研究积累的三十余万字 AI 进展数据库,精选 50 个年度关键词,覆盖大模型技术的八大领域,包括图像处理、视频生成、3D 生成、编程助手、Agent、端侧智能、具身智能和基础模型。通过“快思考”与“慢思考”两种维度进行分析,“快思考”采用人机协同方式完成印象卡片,“慢思考”深入分析技术发展的底层逻辑。 DiT 架构: 结合扩散模型和 Transformer 的架构,用于高质量图像生成的深度学习模型。其核心观察包括 Transformer 从文本扩展至其它、DiT 架构带来图像生成质的飞跃、Scaling Law 在图像领域开始生效。 深度学习模型原理的通俗解释: 将深度学习要处理的信息比作水流,处理数据的深度学习网络是由管道和阀门组成的庞大水管网络。网络有多层,每层有调节阀,根据不同任务,层数和调节阀数量有不同组合。比如识别汉字,将图片的数字组成水流灌入网络,根据出口水流情况调节调节阀,直到符合预期要求,训练好的模型可识别新的图片。 AI 相关技术概念与关系: 1. 生成式 AI 生成的内容叫 AIGC。 2. 相关技术名词: AI 即人工智能。 机器学习包括监督学习、无监督学习、强化学习,监督学习有标签,无监督学习无标签,强化学习从反馈学习。 深度学习参照人脑有神经网络和神经元,神经网络可用于多种学习方式。 生成式 AI 可生成多种内容形式,LLM 是大语言模型,大语言模型的任务不止生成。 3. 技术里程碑:2017 年 6 月,谷歌团队发表论文《Attention is All You Need》,提出 Transformer 模型,基于自注意力机制处理序列数据。
2025-03-05
介绍AI进阶操作
以下是关于 AI 进阶操作的介绍: 在 Obsidian 中使用 AI 工具的进阶配置方法包括: 1. 笔记仓库嵌入大模型(Copilot) 2. 笔记内容作为 RAG 嵌入大模型(Smart Conections) 3. 笔记内使用大模型编写内容 在 Liblibai 中,有以下进阶概念和功能: 1. 迭代步数:调整图片内容的次数,并非越多越好,效果提升非线性。 2. 尺寸:影响图片生成的大小,需适中选择,高清图可设置中等尺寸并用高分辨率修复。 3. 生成批次:用本次设置重复生成的图批次数。 4. 每批数量:每批次同时生成的图片数量。 5. 提示词引导系数:影响图像与 prompt 的匹配程度,过高会使图像质量下降。 6. 随机数种子:固定后可对图片进行“控制变量”操作。 7. ADetailer:面部修复插件,高阶技能。 8. ControlNet:控制图片中特定图像,高阶技能。 9. 重绘幅度:图生图时,幅度越大,输出图与输入图差别越大。 此外,杭州站的 AI 活动聚焦在动手操作上,共分为 5 天进行,被定义为带领大家进阶玩转 AI 的实操落地活动,从学习写 prompt 到生成图片再到分组成立项目,活动形式丰富多样,难度和节奏层层递进。
2025-03-04
换臉 Ai推薦及操作
以下为您推荐的换脸 AI 及操作方法: 吴珂在 0 绘画基础下用 AI 为儿子做蜘蛛侠生日海报的实操步骤中,关于换脸部分:原本以为有 cref 和 insight face swap 就能轻松完成换脸,但实际并非如此。由于蜘蛛侠是 3D 动漫风格,直接导入真实人像畸变概率高。所以先将人像 3D 化,再换脸到蜘蛛侠下,效果显著,还收获了一堆可爱的 3D 头像。相关内容可参考:https://bytedance.larkoffice.com/docx/EC79ddneToZLItxEoBocTXwRnvepartX25hd8Peso0vCfxosqecYel5nNd 、https://bytedance.larkoffice.com/docx/EC79ddneToZLItxEoBocTXwRnvepartTpXKdyfv9oPmUixWta7cNDvln0b 海螺的新功能主体一致:不推崇给已有视频主角“换脸”,建议发挥创造力用好主体一致带来的角色特征稳定性。操作步骤为:点击海外(https://alpha.hailuoai.video/ )或国内(https://alpha.hailuoai.com/video )任意链接进入海螺 AI 官网,点击左边生成按钮,选择主体参考模式,上传一张主体照片(目前只能支持单一主体),输入对应的 prompt,耐心等待 2 3 分钟看效果。生成一次需 45 积分。关于海螺 AI 其他介绍可参考:
2025-03-02
换險 AI推薦及操作
以下是关于换脸 AI 的推荐及操作的相关内容: 一、AI 编程与炼金术:Build on Trae 1. 开发接入 DeepSeek R1 的 Life Coach 网站 在本地新建一个文件夹,用 Trae 打开。 在 Trae 里新建一个文件“AI Rules”,将相关代码复制进去并保存(Mac 可用 Command+S 快捷键,或点“文件”》“保存”)。 在和 AI 沟通需求时引入保存的 AI Rules。 2. 修改 bug 终端处出现命令执行失败,可点击错误代码区域,在弹出的“添加到对话”中操作,或在测试网页功能时按“F12”,点击 Console 查看调试台的报错信息并截图发给 Trae。 二、IDE 设置 1. 进入 Trae AI 设置部分 在界面右上角点击头像,在快捷菜单中选择设置,打开设置窗口。 从左侧导航栏中选择 Trae AI 进入 AI 设置部分。 2. 设置 AI 对话语言 在 AI 会话语言处,可选择“Auto 自动”(按用户提问时所用语言回答,若无法判断则根据用户历史对话或 Trae 的语言)、“中文”(若用户未指定语言则使用中文回答)、“English”(若用户未指定语言则使用英语回答)。 三、AI 带你穿越时空,去拥抱儿时的自己 1. 快影(可灵)处理图片 打开快影(需先通过内测申请),选择 AI 创作。 选择 AI 生成视频。 选择图生视频。 上传处理好的图片,填写想要的互动动作和效果,点击生成视频,排队等待生成结束后点击下载。 2. 效果展示 由于图片本身效果较差,转换为视频后效果不太理想。 还可参考 GitHub 上的 Fooocus https://github.com/lllyasviel/Fooocus?tab=readmeovfile 等项目。
2025-03-02
我是一名港口行业国有企业职工培训专员,想结合当前AI技术应用,出一份既涵盖管理人员序列、职能人员序列,又包括技能操作序列职工的,可直接执行的年度培训计划文案,字数不超过1000字。
以下是为您提供的一份结合当前 AI 技术应用的港口行业国有企业职工年度培训计划文案,希望对您有所帮助: 一、培训目标 提升管理人员、职能人员和技能操作序列职工在 AI 技术应用方面的知识和技能,增强企业整体竞争力。 二、培训对象 管理人员序列、职能人员序列、技能操作序列职工。 三、培训内容 1. 管理人员序列 AI 技术在企业管理中的应用趋势与案例分析。 基于 AI 的决策支持系统的使用与解读。 2. 职能人员序列 AI 办公软件的应用技巧,如自动化流程处理。 利用 AI 进行数据分析与报告生成。 3. 技能操作序列职工 港口智能化设备中 AI 技术的原理与操作维护。 基于 AI 的安全监控系统的操作与应急处理。 四、培训方式 1. 线上课程:利用网络平台提供相关课程,方便职工自主学习。 2. 线下讲座:邀请专家进行现场讲解和互动交流。 3. 实践操作:在实际工作场景中进行模拟训练和实际操作。 五、培训时间安排 1. 每月安排一次线上课程。 2. 每季度组织一次线下讲座。 3. 不定期进行实践操作培训,根据实际工作需求灵活安排。 六、培训效果评估 通过考试、实际操作考核、项目成果评估等方式,检验职工的学习成果,并将其与绩效考核挂钩,激励职工积极参与培训。
2025-02-28
我想学习制作机器人 机器狗等的原理及方法,给我一份理论指导和操作指南吧。
以下是关于制作机器人和机器狗的理论指导和操作指南: 具身智能是将机器学习算法适配至物理实体,与物理世界交互的人工智能范式。以 ChatGPT 为代表的“软件智能体”通过网页端、手机 APP 与用户交互,能接受多种模态指令实现复杂任务。具身智能体则将大模型嵌入物理实体,通过传感器与人类交流,强调与物理环境交互。人形机器人是具身智能的代表产品。 具身智能有三要素: 1. 本体:即硬件载体,不同环境有不同形态的硬件本体适应,如室内平地适用轮式机器人,崎岖地面适用四足机器人(机器狗)。 2. 智能:包括大模型、语音、图像、控制、导航等算法。 3. 环境:本体所交互的物理世界,本体、智能、环境高度耦合是高级智能基础。 具身智能还有四个模块:感知决策行动反馈。一个具身智能体的行动分为这四个步骤,分别由四个模块完成并形成闭环。在具身智能体与环境的交互中,智能算法通过本体传感器感知环境,做出决策操控本体执行动作任务影响环境,还可通过“交互学习”和拟人化思维学习适应环境实现智能增长。
2025-02-26
配置“DeepSeek-R1”模型的 API key:基础 URL:https://ark.cn-beijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。添加“DeepSeek-R1”模型。这个行为在Macbook中怎么操作,请进行指导,通过图片、文字、数据、网址等形式
在 Macbook 中配置“DeepSeekR1”模型的 API key 及添加模型的操作步骤如下: 1. 获取 DeepSeekR1 满血版密钥: 注册并登录火山引擎,点击立即体验进入控制台:https://zjsms.com/iP5QRuGW/ 。 创建一个接入点,点击在线推理创建推理接入点。 为接入点命名为 DeepSeekR1。若提示“该模型未开通,开通后可创建推理接入点”,点击“立即开通”,勾选全部模型和协议一路开通(免费)。 确认无误后,点击“确认接入”按钮。 自动返回创建页面,复制多出的接入点名称“DeepSeekR1”。 点击【API 调用】按钮,进入后点击【选择 API Key 并复制】,若没有则点击【创建 API key】,复制并保存。 2. 配置“DeepSeekR1”模型的 API key: 安装插件:使用 Chrome 或 Microsoft Edge 浏览器,点击此链接,安装浏览器插件,添加到拓展程序:https://chromewebstore.google.com/detail/pageassist%E6%9C%AC%E5%9C%B0ai%E6%A8%A1%E5%9E%8B%E7%9A%84web/jfgfiigpkhlkbnfnbobbkinehhfdhndo 。 打开聊天页面:点击右上角的插件列表,找到 Page Assist 插件,点击打开。 配置 API key:基础 URL:https://ark.cnbeijing.volces.com/api/v3 ,填好之后,点击保存,关掉提醒弹窗。 添加“DeepSeekR1”模型。 3. 环境配置指南: 首先到 deepseek 的官网(https://www.deepseek.com/),进入右上角的 API 开放平台。若没有赠送余额,可选择充值,支持美元和人民币两种结算方式及各种个性化充值方式,并创建一个 API key(注意及时保存,只会出现一次)。 以 cursor 作为代码编辑器为例,下载安装后,在插件页面搜索并安装 Roocline 。安装完后,打开三角箭头,选中 RooCline 并点击齿轮,进入设置,依次设置: API Provider:选择 DeepSeek 。 API Key:填入已创建的 key 。 模型:选择 DeepSeekreasoner 。 语言偏好设置。 记得把 HighRisk 选项都打开,最后点击 Done 保存修改。 在聊天框输入产品需求,输入需求后点击星星优化提示词,最终得到想要的结果。
2025-02-26