直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

我要用Sd做图片细化,要怎么做?给出具体方法

回答

以下是使用 SD 做图片细化的具体方法:

  1. 对于更精确的蒙版,如人物的眼睛或配饰等,可使用 Segment Anything 中的 GroundingDINO。启用 GroundingDINO 后,AI 会自动下载模型,若没有魔法,可去云盘下载并放到指定文件目录下。在检测提示词中输入相关内容,如“eye”,AI 可自动检测并设置蒙版,还可通过预览箱体得到编号来选择调整单一部分。选择要修改的蒙版上传到重绘蒙版中,并添加提示词,如“闭眼”,点击生成即可完成修改。
  2. 给人物换背景时,加载生成的背景蒙版。大模型选择 revAnimated_v122,正向提示词可设为“简单背景、花、国画、工笔”,蒙版模式选择“重绘非蒙版内容”。若头发部分没抠好,可将其放入图生图中,使用 tile 模型做整体细化,还能给人物衣服添加国风元素。
  3. SD 扩图时,若原本图片尺寸为 1152x1152 需增高高度,可设置为(1152x1526)。ControlNet 设置方面,若无法识别处理,可采取以下措施:提高 ControlNet 的权重(增加预处理权重,降低引导介入时机直到为 0,增加引导终止时机直到为 1);降低重绘幅度(高清修复大图时使用);把原始的黑白二维码叠加在二维码上方(正片叠底,保留 4 个定位点,擦去其他地方),调节透明度;使劲抽卡。
  4. SD 放大通常重绘幅度设置在 0.3 以下,使用 tile 模型时可提高重绘幅度,如保持重绘幅度为 1 放大 1.5 倍绘图,能加强画面细节且不崩坏。对于草图,可将其导入 ControlNet 中,添加提示词进行细化,还可通过改变控制模式和增加关键词来优化效果,如实现随机提示词转换,用提示词对参考图做出调整。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

【SD】商业换装如此简单,Segment Anything保姆级教学

但有的时候,我们需要更精确一点的蒙版,比如人物的眼睛,或者是身上的配饰等等。单靠SAM模型就很难得到想要的蒙版了,这个时候我们就需要使用到segment anything中的GroundingDINO了。启用GroundingDINO,AI会自动下载模型,此时会需要用魔法,没有魔法的同学可以去我的云盘直接下载。放到这个文件目录下“……sd-webui-aki-v4.2\extensions\sd-webui-segment-anything\models\grounding-dino”点击启用,在检测提示词中输入“eye”,AI就可以根据语义分割帮我们自动检测出眼睛的部分,并设置好蒙版。我们还可以通过预览箱体,来得到两只眼睛的编号,通过编号可以选择调整单一的眼睛。比如,我只想调整左边那只眼睛,我就只需要勾选1就可以了。和刚才一样,选择我们想要修改的蒙版,上传到重绘蒙版当中。添加提示词“闭眼”。点击生成,可以看到图片就修改好了。我们再来给人物换个背景试试,加载刚才生成的背景蒙版。大模型选择revAnimated_v122,正向提示词:简单背景、花、国画、工笔。蒙版模式选择“重绘非蒙版内容”。得到这张图片,头发的部分没有抠太好。我们将它再次放入图生图中,使用tile模型做一次整体细化,除了融合人物之外,还能给人物的衣服也添加上国风元素。生成,人物好像变得高级了一些。来到PS,使用创成式填充修复一下头发。完成啦。

教程:详细二维码

和第二步一样的关键词和模型发送过来,按照下面的参数设置我原本的图片尺寸是1152x1152我需要增高高度这里设置为(1152x1526)ControlNet设置[heading3]4、无法识别处理[content]能扫码不能长按识别1、提高ControlNet的权重(增加预处理权重,降低引导介入时机直到为0,增加引导终止时机直到为1)2、或降低重绘幅度(高清修复大图的时候才用的上)3、把原始的黑白二维码叠加在二维码上方(正片叠底,保留4个定位点,擦去其他地方),调节下透明度。4、使劲的抽卡!!!

【SD】最强控制插件ControlNet(4)细节狂魔tile

SD放大的原理就是利用分区的方式将图片切成多块,然后每一块分开渲染,最终合并成一张图。但是这样渲染有一个缺点,就是重绘幅度不能开得太大,开得太大的后果就是每一块分区里面都有可能生成新的人物。当我将重绘幅度调到1,放大刚才那张图片,结果就变成了这样,每一个分区之中都产生了新的绘画。通常情况下,使用SD放大,重绘幅度都设置在0.3以下。这时,我们使用tile模型,还是保持重绘幅度为1,放大1.5倍,进行绘图。由于重绘幅度的提高,画面的细节得到了非常大的加强,但是可以看到,在tile模型的加持下,如此高的重绘幅度并没有导致画面崩坏。当然在一般情况下,也不需要将重绘幅度刻意调这么高,因为太多的细节也会影响图片的观感。放大之后,拿来做手机壁纸也非常漂亮了。补齐草稿当我们有一张这样的草图的时候,我们可以利用Tile模型对它进一步细化。将图片导入到ControlNet中,提示词为“一间木屋,两棵树”。这是细化之后的结果,tile的这个功能可以帮助我们对简单的色块草稿做细化,提供一些设计灵感。我们再增加一点关键词——“一间长满鲜花的木屋”,并将下面的控制模式改为“更注重提示词”。生成一下,是不是更惊艳了,这个用法就是我们最后要讲的一个tile的功能,也是它的最强功能——随机提示词转换。随机提示词转换这个用法的主要效果,就是可以用提示词对我们的参考图做出调整。比如我这里找到一张钢铁侠的图片,我想要用这个动作来绘制一个美国队长的形象。

其他人在问
SD软件使用
以下是关于 SD 软件使用的相关内容: 1. 软件安装: 系统要求:Win10 或 Win11。 Win 系统查看配置: 查看电脑系统:在桌面上找到“我的电脑”,鼠标右键点击,点击“属性”,查看 Windows 规格。 查看电脑配置:需要满足 3 个要求(推荐),电脑运行内存 8GB 以上,是英伟达(NVIDA)的显卡,显卡内存 4GB 以上。打开任务管理器(同时按下 ctrl+shift+esc),可查看电脑运行内存和显卡内存(显存)。8GB 运行内存可勉强运行 SD,推荐 16GB 以上运行内存;4GB 显存可运行 SD,推荐 8GB 以上显存。 安装方式:配置达标可跳转至对应安装教程页。 2. 制作二维码: 使用进行安装。如果使用的是 Colab Notebook,只需在启动时选择 ControlNet。 生成二维码:首先需要一个二维码。为增加成功机会,请使用符合以下条件的二维码。使用高容错设置或草料二维码。具体步骤为:第一步选择文字类型,输入二维码的文字;第 2 步将容错设置为 30%;第 3 步按生成;第 4 步将二维码下载为 PNG 文件。 3. 软件原理理解: 模型下载与放置:不会科学上网时,可在启动器界面直接下载模型,将下载的大模型放在根目录的【……\\models\\Stablediffusion】文件夹下,在左上角的模型列表中选择(看不到就点旁边的蓝色按钮刷新)。 VAE:相当于给模型增加提高饱和度的滤镜和局部细节微调,有的大模型自带 VAE,可在启动器里面下载,下载的 VAE 放在根目录的【……\\models\\VAE】文件夹。 Embedding:功能相当于提示词打包,可在 C 站通过右上角的筛选 Textual Inversion 找到,放在根目录下的 embeddings 文件夹里。 LORA:可以将人物或者物品接近完美地复刻进图像中,具有极大商用价值,但使用时需注意版权和法律问题。
2024-11-13
SD大模型无法加载
SD 大模型无法加载可能有以下原因及解决方法: 1. LORA 方面: LORA 可以提炼图片特征,文件通常有几十上百兆,承载信息量远大于 Embedding。下载的 LORA 放在根目录的【……\\models\\Lora】文件夹下,使用时点击红色小书,找到 LORA 选项卡加载。 使用 LORA 时要注意看作者使用的大模型,一般需配套使用,还可能需要加入特定触发词,如盲盒 LORA 需加入“full body, chibi”等提示词。 2. Hypernetworks 方面: Hypernetworks 主要针对画风训练,文件下载后放在根目录的【…\\models\\hypernetworks】,使用时点击红色小书,找到 Hypernetworks 选项卡加载。 3. 模型下载与安装方面: 常用的模型下载网站有:。 下载模型后需放置在指定目录,大模型(Ckpt)放入【models\\Stablediffusion】,VAE 模型放入【models\\Stablediffusion】或【models\\VAE】目录(有的大模型自带 VAE 则无需再加),Lora/LoHA/LoCon 模型放入【extensions\\sdwebuiadditionalnetworks\\models\\lora】或【models/Lora】目录,Embedding 模型放入【embeddings】目录。模型类型可通过检测。 不会科学上网时,可在启动器界面直接下载模型,将下载的大模型放在根目录的【……\\models\\Stablediffusion】,在左上角模型列表中选择(看不到就点旁边蓝色按钮刷新)。 旁边的 VAE 相当于给模型增加提高饱和度的滤镜和局部细节微调,可在启动器里下载,放在根目录的【……\\models\\VAE】。 Embedding 功能相当于提示词打包,下载 Embedding 可在 C 站通过右上角筛选 Textual Inversion 找到,放在根目录下的【embeddings】文件夹里。 由于无法确定您大模型无法加载的具体原因,您可以根据上述内容逐一排查。
2024-11-12
SD安装包
以下是关于 SD 安装包的详细步骤: 1. SD 云端部署 部署流程 安装和配置基础环境 在浏览器上按照腾讯云>控制台>云服务器的路径找到购买的实例,点击启动,会新开一个远程访问的窗口,输入购买时设置的密码进入,这样就有了一个远程的 Windows 系统环境,接下来安装显卡驱动、配置环境变量。 安装显卡驱动:用内置的 IE 或下载 Chrome,打开英伟达的网站,找到驱动下载,选择购买机器时选定的显卡型号、Windows 版本号,下载对应的驱动并安装。 配置环境变量:驱动安装完成后,先找到驱动所在的目录(一般是在「C:\\Program Files\\NCIDIA Corporation」),复制这个路径。找到环境变量配置入口(控制面板>系统和安全>系统),选择「高级系统设置」,弹窗设置环境变量。找到「系统变量」里的 Path 环境变量,点击「编辑...」,然后「新建」,粘贴刚才复制的 nvidia 驱动安装地址,保存即可。 下载安装 SD 整合包 整合包也就是打包了 SD 和 Web UI 方便大家更好的使用的集合,以秋叶的 SD 整合包举例讲解。 下载 SD 整合包:秋叶 SD 整合包下载地址:https://pan.baidu.com/s/1uavAJJdYYWhpnfjwQQDviQ?pwd=a123 ,提取码:a123 。建议在服务器上装个百度网盘或者其他能够提高下载速度的工具,有百度会员则无所谓。 安装 SD 整合包:安装之后,打开安装包一级目录,双击启动器运行依赖(安装一些 SD 运行所必要的基础环境,比如 Microsoft Desktop Runtime 等),安装完成后就可以启动 SD 了。 2. 补充说明 如果在以上使用过程中发生错误,那么可能需要部署一下使用环境,再次开启最傻瓜安装教学模式。 安装 cuda_11.8.0_522.06_windows.exe。 安装 VisualStudioSetup.exe,选择 C++的桌面开发安装。(如果安装过 roop 的可以跳过) 拷贝 ninja,打开 ninja 文件包,把里面的内容拷贝到秋叶包根目录。 拷贝 python,打开 python 文件包,把里面的内容拷贝到秋叶包根目录替换。 拷贝模型,SAM 和 GroundingDINO 的模型都在这了,放到对应的文件夹即可。 重启,装好了,重启电脑,即可运行。 请注意,如果想要获取插件安装包,可以添加公众号【白马与少年】,回复【SD】即可。
2024-11-11
如何安装SD
安装 SD 的步骤如下: 1. 系统要求:系统需为 Win10 或 Win11。 2. Win 系统查看配置: 查看电脑系统:在桌面上找到“我的电脑”,鼠标右键点击,点击“属性”,查看 Windows 规格。 查看电脑配置:检查自己的电脑配置能否带动 SD的显卡;显卡内存 4GB 以上。 打开任务管理器:同时按下 ctrl+shift+esc。 查看电脑运行内存,8GB 运行内存可以勉强运行 SD,推荐 16GB 以上运行内存。 查看电脑显卡内存(显存),4GB 显存可运行 SD,推荐 8GB 以上显存。 3. 配置达标跳转至对应安装教程页: 4. 配置不够可选择云端部署(Mac 也推荐云端部署): 5. 备选:SD 好难,先试试简单的无界 AI: 此外,还有以下相关插件的安装: 1. 【SD】无需 Lora,一键换脸插件 Roop: 安装时间比较长,要耐心等待。 安装好之后,打开 SD 文件目录下的这个文件夹。 在地址栏输入“cmd”,然后回车。 在打开的 dos 界面里面,将“python m pip install insightface==0.7.3 user”粘贴进来,就会自动开始安装 insightface。 如果这个阶段出现错误,建议去下载使用最新的秋叶 4.2 整合包(6 月 23 号更新),下载包已更新到云盘,后台回复【SD】即可下载。 安装完成后,重新打开启动器,后台会继续下载一些模型,此时一定要保证全程科学上网。 完成这些后,Roop 插件就可以正常使用。 2. 【SD】商业换装如此简单,Segment Anything 保姆级教学: 补充说明:如果在使用过程中发生错误,可能需要部署使用环境。 安装 cuda_11.8.0_522.06_windows.exe。 安装 VisualStudioSetup.exe,选择 C++的桌面开发安装(安装过 Roop 的可跳过)。 拷贝 ninja,打开 ninja 文件包,把里面的内容拷贝到秋叶包根目录。 拷贝 python,打开 python 文件包,把里面的内容拷贝到秋叶包根目录替换。 拷贝模型,SAM 和 GroundingDINO 的模型都在这了,放到对应的文件夹即可。 最后:重启电脑,即可运行。 特别提醒:相关插件使用需谨慎,切勿触犯法律。获取插件安装包,可添加公众号【白马与少年】,回复【SD】。
2024-11-10
sd中的采样是什么意思
在 Stable Diffusion 中,采样(Sampling)指的是去噪过程。稳定扩散从随机高斯噪声起步,通过一步步降噪逐渐接近符合提示的图像。每一步都会产生一个新的样本图像,这种方法被称为采样器(Sampler)或采样(Sampling)。 不同的采样器具有不同的特点和效果,例如: Euler a 可以以较少的步数产生很大的多样性,不同的步数可能有不同的结果。 Euler 是最简单、最快的。 DDIM 收敛快,但效率相对较低,需要很多 step 才能获得好的结果,适合在重绘时候使用。 LMS 是 Euler 的衍生,使用一种相关但稍有不同的方法,大概 30 step 可以得到稳定结果。 PLMS 是 Euler 的衍生,可以更好地处理神经网络结构中的奇异性。 DPM2 旨在改进 DDIM,减少步骤以获得良好的结果,但速度较慢。 UniPC 效果较好且速度非常快,对平面、卡通的表现较好,推荐使用。 采样步数(Sampling Steps)也很重要,随着步数增多,可以得到对目标更小、更精确的图像,但增加步数会增加生成图像所需的时间,且增加步数的边际收益递减,一般开到 20 30 步。在实际应用中,如何选择采样器和设置采样步数可以按照模型作者的推荐进行。
2024-11-09
对比sdk 用什么工具推荐
以下是关于对比相关内容的介绍: Midjourney v6.0 与 v6.1 版本对比: 在 Discord 上输入/settings 打开,或者描述词后面输入v 6.1 即可;网页端默认选择 v6.1 版本,直接使用即可。 对比的前提包括文字的摆放是否更完整,实物物体能否从 v6.0 版本复杂化到简单化,人物面部细节处理,肢体和图画比例是否协调,以及插画类在这次版本中的表现。 文字测试结果:v6.0 版本文字方面已不错,但 v6.1 版本表现更好。 实物测试结果:左侧细节过于复杂,右侧简洁合理,此次版本更新情况较诡异。 不同大型语言模型的性能对比: 需考虑多个维度,如理解能力(对语法、语义、上下文和隐含意义的理解)、生成质量(文本的流畅性、相关性和准确性)、知识广度和深度(对广泛主题的知识掌握程度及特定领域的理解深度)、泛化能力(处理未见过的任务或数据的表现)、鲁棒性(对错误输入等的应对能力)、偏见和伦理(生成文本是否存在偏见及是否遵循伦理标准)、交互性和适应性(在交互环境中的表现)、计算效率和资源消耗(模型大小、训练和运行所需的计算资源)、易用性和集成性(是否易于集成到不同应用和服务中及提供的 API 和工具的易用性)。 为进行有效比较,可采用标准基准测试(如使用 GLUE、SuperGLUE、SQuAD 等)、自定义任务(根据特定需求设计)、人类评估(结合主观评价)、A/B 测试(在实际应用场景中比较)、性能指标(如准确率、召回率、F1 分数、BLEU 分数等)。
2024-11-08
我现在是一个AI小白,我想学习AI相关知识,我要怎么进阶学习?
对于 AI 小白的进阶学习,您可以参考以下步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能、机器学习、深度学习等主要分支及其之间的联系。 浏览入门文章,了解 AI 的历史、当前应用和未来发展趋势。 2. 开始 AI 学习之旅: 在「」中找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)按照自己的节奏学习,并争取获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,根据自身兴趣选择特定模块深入学习。 掌握提示词的技巧,因其上手容易且实用。 4. 实践和尝试: 理论学习后,通过实践巩固知识,尝试使用各种产品创作自己的作品。 分享实践后的经验和成果。 5. 体验 AI 产品: 与 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人互动,了解其工作原理和交互方式,获取实际应用中的体验,激发对 AI 潜力的认识。 同时,您还需要掌握以下基础知识: AI 背景知识: 基础理论:了解人工智能、机器学习、深度学习的定义及其之间的关系。 历史发展:简要回顾 AI 的发展历程和重要里程碑。 数学基础: 统计学基础:熟悉均值、中位数、方差等统计概念。 线性代数:了解向量、矩阵等线性代数基本概念。 概率论:基础的概率论知识,如条件概率、贝叶斯定理。 算法和模型: 监督学习:了解常用算法,如线性回归、决策树、支持向量机(SVM)。 无监督学习:熟悉聚类、降维等算法。 强化学习:简介强化学习的基本概念。 评估和调优: 性能评估:了解如何评估模型性能,包括交叉验证、精确度、召回率等。 模型调优:学习如何使用网格搜索等技术优化模型参数。 神经网络基础: 网络结构:理解神经网络的基本结构,包括前馈网络、卷积神经网络(CNN)、循环神经网络(RNN)。 激活函数:了解常用的激活函数,如 ReLU、Sigmoid、Tanh。
2024-11-14
我要按怎样的步骤学习AI
以下是学习 AI 的步骤: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据自己的兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库查看大家实践后的作品、文章分享,并分享自己的实践成果。 5. 体验 AI 产品: 与现有的 AI 产品(如 ChatGPT、Kimi Chat、智谱、文心一言等)进行互动,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术(如机器学习、深度学习等)。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 为了在医疗保健中让 AI 产生真正的改变,应投资创建一个模型生态系统,让“专家”AI 像优秀的医生和药物开发者那样学习。成为顶尖人才通常从多年的密集信息输入开始,通过正规学校教育和学徒实践,从该领域出色的实践者那里学习,获得有助于在复杂情况下确定最佳答案的直觉。对于 AI,应通过使用彼此堆叠的模型来训练,而不是仅依靠大量数据和期望一个生成模型解决所有问题。例如,先训练生物学的模型,再是化学的模型,然后添加特定于医疗保健或药物设计的数据点。预医学生的课程从化学和生物学基础开始,设计新疗法的科学家也需要经历多年相关学习和研究,这种学习方式有助于培养处理涉及细微差别决策的直觉。
2024-11-08
我要怎么用waytoAGI学东西
WaytoAGI 是一个由热爱 AI 的专家和爱好者共同建设的开源 AI 知识库,具有以下功能和特点: 1. 学习途径:参加如 AJ 组织的 wayto AGI 活动,可以认识很多小伙伴和前辈,从中学习到很多 AI 相关知识。 2. 网站功能: 和 AI 知识库对话,可询问任何关于 AI 的问题。 提供集合的精选 AI 网站,按需求找到适合的工具。 集合精选的提示词,可复制到 AI 对话网站使用。 呈现知识库的精华内容。 3. 离谱村:是由 WaytoAGI 孵化的千人共创项目,参与者不分年龄层,都可以通过 AI 工具创作出各种作品。离谱村是一个没有被定义的地方,是灵魂的避风港,激励着人们发挥想象力,创造独特生活方式。 您可以通过参与相关活动、使用网站的各项功能以及参与离谱村的共创等方式,在 WaytoAGI 学习到丰富的 AI 知识。
2024-11-08
我要学习prompt,给我指定一个学习计划
以下是为您制定的学习 prompt 的计划: 一、准备阶段 首先,您需要拥有一个大模型账号,并熟悉与它们对话的方式。推荐使用性能较强的 ChatGPT4 ,国产平替有 。 二、基础学习 1. 阅读 OpenAI 的官方文档,包括: 同时,也可以参考我和熊猫 Jay 在 AGI 分享的中文精读版官方 Cookbook: 三、深入学习与实践 1. 学习 Claude 官方提示词,中文版(含 API Prompt),包括为给定主题创建全面的课程计划,如: 明确课程目标,使其清晰、可衡量,并与教育标准一致。 提供详细大纲,分为介绍、主要活动和总结,描述教学方法、学习活动和资源。 采用差异化策略适应不同学习需求和风格。 确定评估方法以评估学生的理解和掌握程度。 2. 进行苏格拉底式对话,就给定话题通过反复询问激发更深层次的思考和反思。 3. 针对给定主题生成同音连绵的词语和句子。 4. 掌握 Prompt 句式,例如: 对于“我想了解xxxx,我应该向你问哪些问题?”等句式,明确哪些是您不知道而 GPT 知道的。 对于“我理解的 xxx 是这样的,你觉得我的理解对吗?”等句式,进行认知的检验。 对于“我在 xxx 问题上遇到困难,你能提供一些可能的解决方案或建议吗?”等句式,实现认知的扩充。 希望这个学习计划对您有所帮助,祝您学习顺利!
2024-11-07
目前国产AI对比国外AI,存在哪些不足和差距,我要实事求是的回答
目前国产 AI 对比国外 AI 存在以下不足和差距: 1. 在通用语言模型方面,如 ChatGPT 和 GPT4 出现后,国内与国外拉开了约 2 年的技术差距。国内最领先的模型水平大概在准 ChatGPT3.5 的水平,和 GPT4 还有不小差距,甚至还不如临时拼凑的 Mistral 团队的水平。 2. 国内部分企业可能存在骄傲自大的情况,也可能被之前 Google 主推的 T5 技术路线带偏,同时 AGI 影响巨大,可能存在国外相关机构与 OpenAI 有特殊沟通而国内未有的情况。 3. 2023 年上半年国内笃信靠资金和卡能实现突破,但下半年纷纷转向“垂直应用”“商业化”,不提 AGI,这种转向可能是短视和致命的。 4. 大厂虽具备冲击 AGI 的资源,但受内部短期考核压力影响,多数力量用于卷新产品圈地盘和向上汇报工作,实际效果未达预期,且背负较多其他业务和政治考量。 不过,在图像类 AI 产品方面,国内产品发展迅速,部分产品如通义万相在中文理解和处理方面表现出色,具有独特优势。在 AI 生成视频工具领域,国内涌现出一系列工具,其生成结果在某些方面甚至远超国外。
2024-11-03
我要创建一个工作流,需要怎么创建,用到什么工具,这些工具在哪可以找到
以下是在 Coze 上创建工作流的步骤和所需工具: 1. 进入 Coze 平台,点击「个人空间工作流创建工作流」,打开创建工作流的弹窗。 2. 根据弹窗要求,自定义工作流信息,点击确认完成工作流的新建。 3. 新建完成后,整个编辑视图与功能如下: 左侧「选择节点」模块中,根据子任务需要,实际用到的有: 插件:提供一系列能力工具,拓展 Agent 的能力边界。例如涉及思维导图、英文音频等无法通过 LLM 生成的内容,就需要依赖插件来实现。 大模型:调用 LLM,实现各项文本内容的生成。例如中文翻译、英文大纲、单词注释等都依赖大模型节点。 代码:支持编写简单的 Python、JS 脚本,对数据进行处理。 编辑面板中的开始节点、结束节点,分别对应分解子任务流程图中的原文输入和结果输出环节。 4. 接下来,按照流程图,在编辑面板中拖入对应的 LLM 大模型、插件、代码节点,即可完成工作流框架的搭建。 此外,在扣子平台上,插件就像一个工具箱,里面可以放一个或者多个工具,称为 API。目前扣子平台已有很多不同类型的插件,如看新闻、规划旅行、提高办公效率、理解图片内容的 API 等,还有一些能处理多种任务的模型。若现有的插件不符合需求,还可自己制作插件并加入所需的 API。工作流就像可视化的拼图游戏,可将插件、大语言模型、代码块等功能组合,由多个小块块(节点)组成,如大语言模型 LLM、自己写的代码、做判断的逻辑等,开始和结束都有特定的小块块,不同小块块可能需要不同信息才能工作,信息包括引用前面小块块给出的和自己设定的。
2024-10-29
某银行计划对外采购2024年分行内训师培训项目,现需要对采购内容做详细要求,培训内容以AI工具课程开发与设计,课程制作与实践,短视频制作,直播授课技巧等,我该如何对培训老师资质,授课经验,AI工具运用等技能做细化要求
以下是为您提供的关于银行采购 2024 年分行内训师培训项目中对培训老师资质、授课经验、AI 工具运用等技能的细化要求建议: 培训老师资质: 具备相关领域的专业教育背景,如计算机科学、人工智能等。 持有相关的行业认证或资格证书。 授课经验: 拥有丰富的企业内训经验,特别是在金融行业的培训经历。 成功完成过类似 AI 工具课程开发与设计、课程制作与实践等相关课程的授课。 AI 工具运用技能: 熟练掌握多种主流的 AI 工具,如常见的机器学习框架、自然语言处理工具等。 能够运用 AI 工具进行实际项目开发,并具有相关的案例成果。 熟悉短视频制作和直播授课中涉及的 AI 辅助技术,如智能剪辑工具、虚拟主播技术等。 希望以上建议对您有所帮助。
2024-09-13