Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

好用的智能扩图,改变图片比例

Answer

以下为您介绍一些关于智能扩图和改变图片比例的方法:

  1. 在 Midjourney 中:
    • 不同模型有不同侧重点,如 niji 针对动漫,--v 5 对摄影类质量高,可查看官网介绍https://docs.midjourney.com/docs/model-versions
    • 设置图片比例可使用--ar 1:1,也可改成其他支持的比例。
    • 还有一些不常用设置,如--creative 更适合脑暴和创意设计,--chaos 100 或--c 100 指生成图的视觉风格,取值范围 0-100 之间,默认值 0,--stylize 1000 或--s 1000 数字越大生成图片越有艺术感,v 5 版本取值范围不同。
  2. Coze “图像流”:
    • 适合用于构图不对想改变构图的图片。
    • 节点参数是往 4 个方向扩图,只能选择扩或者不扩,不能选择扩多少像素。
    • 试用效果方面,如文生图生成方图后向左扩图会有新构图的长图效果;左边和上面同时扩图效果也不错;实景照片扩图时,扩图部位尽可能简单,不容易出现崩坏,加提示词建议简单,不建议画人之类,崩坏结果可能惨不忍睹。
  3. 【SD】ControlNet:
    • 以某张图为例讲解,先导入图生图界面。
    • 根据情况选择大模型,卡通类一般选“revAnimated”,真实类选“Realistic Vision”,效果不好可尝试其他模型。
    • 图生图重要参数包括“缩放模式”选“缩放后填充空白”,尺寸根据扩充方向调整,单批数量按需填写,“重绘幅度”加大到“0.8”以上。
    • ControlNet 设置方面,升级到最新版本,导入图片,启用插件,“控制类型”选“局部重绘”,预处理器选“inpaint_only+lama”,控制模式选“更倾向 Controlnet”,缩放模式选“缩放后填充空白”,还可增加“reference_only”通道巩固扩图风格。
    • 可通过反推提示词增加文本控制,新生成部分和原图可能有色差,需调整参数修正。
    • 记住工作流,替换图片改尺寸即可快速扩图。
Content generated by AI large model, please carefully verify (powered by aily)

References

如何让生成的图片更加可控?

不是越高的版本就一定越好,其实每个不同模型的侧重点会有所不同,比如-- niji就是专门针对动漫的模型,--v 5生成的图对摄影类的质量很高。具体的详细内容,可以看看官网介绍[https://docs.midjourney.com/docs/model-versions](https://link.uisdc.com/?redirect=https%3A%2F%2Fdocs.midjourney.com%2Fdocs%2Fmodel-versions)6.设置图片比例--ar 1:1这样就设置了1:1的比例,你也可以改成其他支持的比例。7.还有一些不是很常用的设置--creative更适合做脑暴和创意设计,做出来的图脑洞更大,更有创意性--chaos 100或--c 100指的是生成图的视觉风格,数值越大,这一组的风格差异就越大。取值范围在0-100之间,默认值是0。--stylize 1000或--s 1000,数字越大,生成的图片就越有艺术感。取值范围不同版本也不同,v 5版本的范围是0-1000

基础教程: Coze “图像流” 抢先体验

这个节点适合用于构图不太对想改变构图的图片。[heading3]节点参数[content]参数分别是往4个方向扩图,只能选择扩或者不扩,不能选择扩多少像素。[heading3]试用效果[content]我们先来文生图,生成一个方图,然后向左扩图,效果如下,变成了一个新构图的长图,效果不错。再来左边和上面同时扩图,效果也不错。来个实景照片试试,比如下图虽然很美,方形构图可能不讨喜,我们来把它变成长图。实景图扩图效果粗看,尤其是天上的云很震撼,细看有些复杂的画面,完全经不起推敲💡小技巧:扩图的部位尽可能的简单,不容易出现崩坏。要加提示词的话也一样,建议加些简单的,不建议画人之类的,崩坏结果惨不忍睹举个例子,以下这个图,最简单的部位就是路面,扩图就扩路面,对于构图也加深了道路的引导线,效果还行。向下扩图后的效果,还行。

【SD】最强控制插件ControlNet(8)创成式填充

我们用这张图作为例子来讲解一下,首先将它导入到图生图界面。根据情况选择大模型,一般卡通类的选择“revAnimated”,真实类的选择“Realistic Vision”,但是也不一定,如果效果不好,可以尝试一下其他的模型。图生图中比较重要的参数,一个是“缩放模式”,选择“缩放后填充空白”;然后是尺寸,如果是横向扩充就增加宽度,如果是纵向扩充就增加高度;单批数量可以根据需求填写,增加抽卡概率;最后尽量将“重绘幅度”加大到“0.8”以上,让AI充分发挥想象。接下来是controlnet的设置,升级到最新的controlnet版本,将图片导入进来。启用插件,“控制类型”选择“局部重绘”,也就是我们之前讲到过的inpaint预处理器,然后在预处理器的下拉菜单中选择“inpaint_only+lama”,这是一个新增的预处理器,专门用于扩图。另外,控制模式选择“更倾向Controlnet”,缩放模式选择“缩放后填充空白”。为了让出图更加统一,甚至还可以再增加一个reference _only的通道,来进一步巩固扩图的风格。设置好之后,点击生成,等待结果,选择一张满意的即可。我们再试验一张图,将这张图放进图生图中。有时为了更好地控制出图,我们还可以通过反推提示词的方式,增加一些文本进行控制。这样生成的图也会受到提示词的影响,可以看出图形部分的衔接还是很自然的,但是不是每一次效果都能非常好,新生成的部分和原图可能会存在色差,需要通过调整各项参数来修正。从网上找一张建筑图,使用真实系模型来扩展一下,其他参数不变,仅需要调整尺寸,并将图片分别放入“图生图”和“controlnet”中。点击生成图片就扩展好了,只要记住这个工作流,扩图还是很快的,只要替换图片改尺寸就可以了。

Others are asking
AI扩图用什么app
以下是一些可用于 AI 扩图的应用或工具: 1. 星流一站式 AI 设计工具: 智能扩图:自动提取原图信息,智能生成新的图像内容以填充扩展区域。使用时,选中图像进入扩展功能界面,拖动选区边框进行扩充区域选择,在提示词框输入生成区域的描述,选择重绘风格,其余参数默认即可。 2. FLUX: FLUX.1 Fill 局部重绘和扩图模型:引入了先进的修复功能,支持无缝编辑和 outpainting,能将图像扩展到原始边界之外。 3. 辅助工具: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/
2025-02-09
有什么软件可以基于原图扩图?除了adobe
以下为您介绍两款除 Adobe 外可以基于原图扩图的软件: 1. 【SD】超清无损放大器 StableSR: 作者:白马少年。 之前讲过在 Stable Diffusion 中绘制高清大图的方式,包括“脚本”和“后期处理”。脚本以“Ultimate SD upscale”为主,会改变原图细节;“后期处理”是 Stable Diffusion 自带的扩图功能,适用于所有图片包括野图,但无法还原原图不清晰的地方。 今天介绍的 StableSR 可以算作“后期处理”的上位替代品,能在尽可能保留原图的情况下更精致地还原原图。安装方式是在扩展面板中搜索 StableSR 直接安装,或者将下载好的插件放在“……\\sdwebuiakiv4\\extensions”路径文件夹下,安装完成后重启 webUI 即可在脚本中找到。 2. 【SD】脸部修复插件 After Detailer: 图片扩充好后,PS 的这个功能又快又好。将 PS 中调整好的图再次导入到 Stable Diffusion 的“图生图”中,使用 controlnet 的 tile 模型进行细化,再使用“Ultimate SD upscale”放大脚本将原图扩充到 2 倍大小。 如果想要这个插件,可以添加公众号【白马与少年】,回复【SD】获取。
2024-12-30
好用的ai扩图工具
以下是一些好用的 AI 扩图工具: 软件架构设计视图绘制工具: Lucidchart:流行的在线绘图工具,支持多种图表创建,包括逻辑视图、功能视图和部署视图,可通过拖放界面轻松创建架构图。 Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能。 ArchiMate:开源建模语言,与 Archi 工具配合可创建逻辑视图。 Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图创建。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板。 draw.io(现在称为 diagrams.net):免费在线图表软件,支持多种类型图表创建。 PlantUML:文本到 UML 转换工具,可通过描述性文本生成相关视图。 Gliffy:基于云的绘图工具,提供创建架构图功能。 Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型。 Rational Rose:IBM 的 UML 工具,支持多种视图创建。 图片放大工具: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可增加更多细节 开源工作流: 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/
2024-12-30
有什么好用的扩图工具嘛
以下是一些好用的扩图工具: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片: https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ Bigjpg:http://bigjpg.com/ Bigjpg 是一个强大的图像分辨率增强工具,使用神经网络算法加大图像尺寸,并极大地提高图像的质量。它的处理速度很快,几秒钟内即可完成放大操作。 Topaz Gigapixel AI:https://www.topazlabs.com/gigapixelai discord:https://discord.gg/m5wPDgkaWP GIGAGAN:https://mingukkang.github.io/GigaGAN/ Topaz Photo AI:https://www.topazlabs.com/ 【SD】超清无损放大器 StableSR: 作者:白马少年 介绍:SD 实践派,出品精细教程 发布时间:20230610 20:01 原文网址:https://mp.weixin.qq.com/s/J0HIF2U1siAen6FWNA67A 安装方式:在扩展面板中搜索 StableSR,可以直接安装。或者是将下载好的插件,放在这个路径文件夹下“……\\sdwebuiakiv4\\extensions”。安装完成后,重启 webUI,就可以在这个脚本里面找到这个放大器了。
2024-12-30
AI扩图
以下是关于 AI 扩图的相关信息: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可以增加更多细节 开源工作流: stability.ai 的:https://clipdrop.co/tools 画质增强: https://magnific.ai/ Krea https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ 在 AI 图像生成中,“diffusion”(扩散)通常指的是一类生成模型,称为扩散模型(Diffusion Models)。这类模型通过逐步引入噪声到数据中,并训练网络学习逆向过程来生成数据。扩散模型在图像生成领域中应用广泛,特别是在文本到图像的生成任务中表现出色。其工作原理包括正向扩散过程、潜空间表示、学习逆向过程、文本到图像的生成等步骤。扩散模型的关键优势在于其生成高质量图像的能力,以及相比其他生成模型在计算效率和稳定性上的优势。Stable Diffusion 等模型就是基于扩散模型的文本到图像生成工具,能够根据文本提示生成逼真的图像。 AI 绘画常用的画面构图提示词有: 曼茶罗构图 超广角 极端特写 微距拍摄 广阔的视野 半身像 侧面 对称的身体 对称的脸 广角 鸟瞰/俯视 俯视图 正视图 对称 居中构图 对称构图 三分法构图 S 型构图 对角线构图 水平构图 乌瞰图 顶视图 倾斜移位 卫星视图
2024-11-19
有哪些好用的SD扩图
以下是一些关于 SD 扩图的好用方法和相关信息: 1. 高清修复: 原理是命令 AI 按照原来的内容重新画一幅,新生成的绘图和原来的绘图在细节上会有所不同。 适当降低重绘幅度可以更接近之前的绘图,如 0.2 0.3 能保留较多原有细节,但可能出现如手部等部分的问题,可通过反复抽卡、图生图局部重绘或生成多张图片后 PS 合成等办法解决。 由于渲染耗时较长,建议先采用低分辨率抽卡刷图,抽到喜欢的图后用随机种子固定再进行高清修复。 2. 图生图脚本功能: 文生图画好图后发送到图生图,点击下面的脚本,选择使用 SD 放大。 重绘幅度设置 0.3,放大倍率为 2,图块重叠的像素设置为 64。 这种方式需保持重绘幅度较低,否则可能出现新人物。 3. 超清无损放大器 StableSR: 可以算作“后期处理”的上位替代品,能在尽可能保留原图的情况下更精致地还原原图。 安装方式:在扩展面板中搜索 StableSR 直接安装,或将下载好的插件放在“……\\sdwebuiakiv4\\extensions”路径文件夹下,安装完成后重启 webUI 即可在脚本中找到。 4. 二维码相关的 SD 扩图: 与第二步相同的关键词和模型,按照特定参数设置,如原本图片尺寸为 1152x1152 ,需要增高高度可设置为(1152x1526)。 对于无法识别处理的情况,可采取提高 ControlNet 的权重、降低重绘幅度、将原始黑白二维码叠加并调节透明度、使劲抽卡等方法。
2024-11-15
现在有什么好用的AI
以下是为您整理的关于好用的 AI 及相关技巧的内容: 好用的图生图产品: 1. Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,能将上传的照片转换为芭比风格,效果佳。 但这些模型存在一些局限,如偶尔性能不稳定、生成内容不当等。 与 AI 交流的技巧: 1. 设定角色:给 AI 设定一个角色,如“你是一个XXXX 角色”,蕴含角色背景和输出要求,让 AI 更明确如何应对问题。 2. 举例子:通过实际例子能使 AI 更准确了解您的要求。 3. 连续提问:对于一个问题可连续提问,根据回复不断细化要求,AI 能处理多轮对话。 4. 不知如何提问时,可先问 AI 如何提问,再用其产生的问题问它。 AI 的能力: 1. 文本生成:涵盖写文章、对话聊天、编程写代码、翻译、阅读理解、推理等领域。 2. 图像和视频理解:能理解真实世界图像、网页截图和文字数据的图片,甚至能看懂抽象表达并推理作答,包括医学等专业图像,还能理解人类“笑点”。 3. 图像生成:能生成多种风格的图像,如写实、油画、超现实、写意中国水墨画等,应用广泛,可帮助做设计,电商平台上很多商品图片已由 AI 生成。
2025-02-17
国内有什么免费好用的文字转图片AI吗?
目前国内免费好用的文字转图片 AI 工具包括: 1. DALL·E:由 OpenAI 推出,可根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源的文生图工具,能生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量的图像生成效果和友好的用户界面而受欢迎,在创意设计人群中流行。 您还可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104 )查看更多相关工具。但需注意,内容由 AI 大模型生成,请仔细甄别。
2025-02-17
你认为最好用的AI工具有哪些
以下是一些被认为好用的 AI 工具: 聊天工具:ChatGPT ,在 2022 年 9 月至 2023 年 8 月期间拥有 146 亿次访问量,在美国使用率最高,其次是印度和巴西,多数受众通过移动设备访问,男性用户占比较高。 聊天工具:Character AI 。 写作辅助工具:QuillBot 。 绘画工具:Midjourney 。 开源社区:Hugging Face 。 聊天工具:Google Bard 。 写作工具:NovelAI 。 视频工具:CapCut 。 未知类型工具:JanitorAI 。 模型分享平台:Civitai 。 需要注意的是,虽然底层都是大模型,但 AI 工具各有侧重,不同公司也会进行各自的优化。关于每一种工具的详细入门、讲解和应用,WayToAIG 已经分好了类目。此外,为了让普通人更直观地马上上手,还可以选择聊天工具、绘画工具、视频工具、音乐工具等进行体验。
2025-02-15
好用的数字人
以下为您推荐一些好用的数字人工具及相关信息: HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 1. 点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。 2. 上传后效果如图所示,My Avatar处显示上传的照片。 3. 点开大图后,点击Create with AI Studio,进入数字人制作。 4. 写上视频文案并选择配音音色,也可以自行上传音频。 5. 最后点击Submit,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 1. 点击上面的网址,点击右上角的Create vedio。 2. 选择人物形象,可以点击ADD添加照片,或者使用DID给出的人物形象。 3. 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 4. 最后,点击Generate vedio就可以生成一段视频。 5. 打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法: 1. 点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能。 2. 点击开始创作,选择自定义照片。 3. 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 4. 打开绿幕按钮,点击背景,可以添加背景图。 5. 最后,点击生成视频。 此外,还有一些其他的AI视频工具: SVD:https://stablevideo.com/ ,对于景观更好用。 Morph Studio:https://app.morphstudio.com/ ,还在内测。 Kaiber:https://kaiber.ai/ 。 Moonvalley:https://moonvalley.ai/ 。 Mootion:https://discord.gg/AapmuVJqxx ,3d人物动作转视频。 美图旗下:https://www.miraclevision.com/ 。 Neverends:https://neverends.life/create ,操作傻瓜。 SD:Animatediff SVD deforum ,需要自己部署。 Leiapix:https://www.leiapix.com/ ,可以把一张照片转动态。 Krea:https://www.krea.ai/ 。 Opusclip:https://www.opus.pro/ ,利用长视频剪成短视频。 Raskai:https://zh.rask.ai/ ,短视频素材直接翻译至多语种。 invideoAI:https://invideo.io/make/aivideogenerator/ ,输入想法>自动生成脚本和分镜描述>生成视频>人工二编>合成长视频。 descript:https://www.descript.com/?ref=feizhuke.com 。 veed.io:https://www.veed.io/ ,自动翻译自动字幕。 clipchamp:https://app.clipchamp.com/ 。 typeframes:https://www.revid.ai/?ref=aibot.cn 。 另外,12 月 29 日的 Xiaohu.AI 日报还推荐了以下内容: 开源且适合小白用户的数字人工具,特点是一键安装包,无需配置环境,简单易用。功能包括生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。系统兼容 Windows、Linux、macOS。模型支持 MuseTalk(文本到语音)、CosyVoice(语音克隆)。下载地址:GitHub: 。 Google Veo 2:AI生成逼真的 Vlog 视频,生成的视频接近真实,几乎难以分辨,适合创作和内容制作。
2025-02-15
比较好用的音乐生成软件
以下是一些比较好用的音乐生成软件: 1. Udio:由前 Google DeepMind 工程师开发,通过文本提示可快速生成符合用户音乐风格喜好的高质量音乐作品。网址:https://www.udio.com/ 2. Suno AI:是一款革命性的人工智能音乐生成工具,通过先进的深度学习技术,能将用户输入转化为富有情感且高质量的音乐作品。网址:https://suno.com/ 3. Studio One:由 PreSonus 公司开发的一款专业 DAW 软件,功能全面,适合编曲、录音、混音和母带处理等音乐制作流程。 4. Waves XNoise:由 Waves 公司出品的一款降噪 VST 插件,用于降低音频中的噪声,操作简单,易于使用。 5. iZotope RX 11:专业的音频修复和降噪软件,具备多种音频修复和编辑工具。 6. iZotope Ozone 11:一款专业的母带处理软件,提供全面的母带处理工具,帮助提升音频的整体质量。 7. Ripx Daw Pro:由 Hit'n'Mix 公司出品的独特 DAW 软件,能够对混合音频进行分轨并进行钢琴卷帘形式的修改操作,同时可以导出独立的乐器和人声轨道,进行精细编辑。 8. Adobe Audition:由 Adobe 出品的数字音频编辑软件,操作直观,具备剪辑、降噪等音频处理功能,支持加载 VST 插件。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-14
AI自动生成室内装修效果图最好用的是哪个
以下是一些可用于生成室内装修效果图的工具: 1. 字节旗下的 Coze AI 的图像工作流,体验地址为:https://www.coze.cn/store/bot/7374039392832405554?panel=1&bid=6cq1cccs00017 。 2. 目前没有明确指出生成室内装修效果图最好用的工具,但您可以参考上述提到的 Coze AI 进行尝试。
2025-02-14
我怎样用低代码工具去构建我的AI智能体?LLM应用?
以下是关于如何用低代码工具构建 AI 智能体和 LLM 应用的一些建议: 在构建基于 LLM 的应用时,Anthropic 建议先寻找最简单的解决方案,只在必要时增加复杂度。智能系统通常会以延迟和成本为代价来换取更好的任务表现,开发者需要考虑这种权衡是否合理。当需要更复杂的解决方案时,工作流适合需要可预测性和一致性的明确任务,而智能体则更适合需要灵活性和模型驱动决策的大规模场景。不过,对于许多应用来说,优化单个 LLM 调用(配合检索和上下文示例)通常就足够了。 目前有许多框架可以简化智能系统的实现,例如: 1. LangChain 的 LangGraph。 2. 亚马逊 Bedrock 的 AI Agent 框架。 3. Rivet(一个拖放式 GUI 的 LLM 工作流构建器)。 4. Vellum(另一个用于构建和测试复杂工作流的 GUI 工具)。 这些框架通过简化标准的底层任务(如调用 LLM、定义和解析工具、链接调用等)使入门变得容易,但它们往往会创建额外的抽象层,可能会使底层提示词和响应变得难以调试,也可能诱使开发者在简单设置就足够的情况下增加不必要的复杂性。建议开发者先直接使用 LLM API,许多模式只需要几行代码就能实现。如果确实要使用框架,请确保理解底层代码。 此外,还有以下相关工具和应用: 1. VectorShift:能在几分钟内构建和部署生成式人工智能应用程序,利用大型语言模型(例如 ChatGPT)构建聊天机器人、文档搜索引擎和文档创建工作流程,无需编码。 2. Unriddle:帮助更快阅读、写作和学习的工具,能简化复杂的主题,找到信息,提问并立即获得答案。 工具使用或函数调用通常被视为从 RAG 到主动行为的第一个半步,为现代人工智能栈增加了一个新的层。一些流行的原语如网页浏览(Browserbase、Tiny Fish)、代码解释(E2B)和授权+认证(Anon)已经出现,它们使 LLM 能够导航网络、与外部软件(如 CRM、ERP)交互并运行自定义代码。Omni 的计算 AI 功能体现了这种方法,它利用 LLM 直接输出适当的 Excel 函数到电子表格中,然后执行计算并自动生成复杂查询供用户使用。 详细示例请参考:https://github.com/anthropics/anthropiccookbook/tree/main/patterns/agents
2025-02-17
即梦ai里,关于智能画布中的参考图的具体作用
在即梦 AI 中,智能画布中的参考图具有以下重要作用: 1. 实现多种商业创意设计:只需上传一张参考图,就能快速生成多种创意设计,例如模特图的变装、换发型、换脸、换发色和调整人物姿势;产品图的材质和背景改变;电商海报的背景、元素更改等。 2. 提升设计的灵活性和可塑性:在奶茶宣传图的制作中,参考图在制作步骤中发挥了关键作用,如在第 1 步找参考图,为后续的生成和融合等操作提供基础。 基础操作包括: 1. 打开即梦官网 https://jimeng.jianying.com/ 。 2. 选择图片生成。 3. 选择导入参考图(上传一张参考图,点击智能参考)。 相关案例: 1. 模特图自由定制:通过智能参考,轻松实现模特图的多种变化。 2. 产品图随心变化:可以改变产品材质和画面背景。 3. 电商海报一键搞定:支持随意更改背景、元素,适应不同营销主题。 原文链接:https://mp.weixin.qq.com/s/sD0RFMqnFZ6Bj9ZcyFuZNA
2025-02-17
即梦ai里,关于智能画布中的参考图的具体作用
在即梦 AI 中,智能画布中的参考图具有以下重要作用: 1. 实现多种商业创意设计:只需上传一张参考图,就能快速生成多种创意设计,例如模特图的变装、换发型、换脸、换发色和调整人物姿势;产品图的材质和背景改变;电商海报的背景、元素更改等。 2. 提升设计的灵活性和可塑性:在奶茶宣传图的制作中,参考图在制作步骤中发挥了关键作用,如在第 1 步找参考图,为后续的生成和融合等操作提供基础。 基础操作包括: 1. 打开即梦官网 https://jimeng.jianying.com/ 。 2. 选择图片生成。 3. 选择导入参考图(上传一张参考图,点击智能参考)。 相关案例: 1. 模特图自由定制:通过智能参考,轻松实现模特图的多种变化。 2. 产品图随心变化:可以改变产品材质和画面背景。 3. 电商海报一键搞定:支持随意更改背景、元素,适应不同营销主题。 原文链接:https://mp.weixin.qq.com/s/sD0RFMqnFZ6Bj9ZcyFuZNA
2025-02-17
人工智能简史
人工智能作为一个领域始于二十世纪中叶。最初,符号推理流行,带来了如专家系统等重要进展,但因从专家提取知识并以计算机可读形式表现及保持知识库准确的复杂性和高成本,20 世纪 70 年代出现“人工智能寒冬”。 随着时间推移,计算资源便宜、数据增多,神经网络方法在计算机视觉、语音理解等领域展现卓越性能,过去十年中“人工智能”常被视为“神经网络”的同义词。 在国际象棋对弈程序方面,早期以搜索为基础,发展出阿尔法贝塔剪枝搜索算法,后来采用基于案例的推理,如今能战胜人类棋手的程序基于神经网络和强化学习。 在创建“会说话的程序”方面,早期如 Eliza 基于简单语法规则,现代助手如 Cortana、Siri 或谷歌助手是混合系统,未来有望出现完整基于神经网络的模型处理对话,如 GPT 和 TuringNLG 系列神经网络已取得巨大成功。 最初,查尔斯·巴贝奇发明计算机用于按明确程序运算,现代计算机仍遵循相同理念。但有些任务如根据照片判断人的年龄无法明确编程,这正是人工智能感兴趣的。 译者:Miranda,原文见 https://microsoft.github.io/AIForBeginners/lessons/1Intro/README.md
2025-02-17
数据分析产品的智能体有哪些
以下是一些常见的数据分析产品的智能体类型: 1. 简单反应型智能体:根据当前的感知输入直接采取行动,不维护内部状态和考虑历史信息。例如温控器,根据温度传感器的输入直接控制加热器。 2. 基于模型的智能体:维护内部状态,对当前和历史感知输入进行建模,能推理未来的状态变化并据此行动。比如自动驾驶汽车,不仅感知当前环境,还维护和更新周围环境的模型。 3. 目标导向型智能体:具有明确的目标,能根据目标评估不同的行动方案并选择最优行动。像机器人导航系统,有明确目的地并规划路线以避开障碍。 4. 效用型智能体:不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动,评估行动的优劣并权衡利弊。例如金融交易智能体,根据市场条件选择最优交易策略。 5. 学习型智能体:能够通过与环境的交互不断改进其性能,学习模型、行为策略以及目标函数。比如强化学习智能体,通过与环境互动不断学习最优策略。 此外,还有一些具体的数据分析产品智能体,如颖子团队的“市场分析报告”生成智能体,它能根据输入的行业/类目关键词自动检索关联信息并生成报告,数据化呈现且附带信息来源网址便于校正,适用于企业管理层、投资者、创业者、营销人员等,可减少信息收集时间,聚焦决策判断。 在智谱 BigModel 开放平台工作流搭建中,也有相关的智能体节点,如具有自主规划任务、使用工具、记忆的 Agent 节点。
2025-02-17
智能体
智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 智能体的定义: 智能体是自主系统,通过感知环境(通常通过传感器)并采取行动(通常通过执行器)来达到目标。在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并辅以规划、子目标和分解、反思和完善、记忆、工具使用等关键组成部分。 智能体的类型: 1. 简单反应型智能体(Reactive Agents):根据当前感知输入直接采取行动,不维护内部状态,不考虑历史信息。例如温控器。 2. 基于模型的智能体(Modelbased Agents):维护内部状态,对当前和历史感知输入进行建模,能推理未来状态变化并据此行动。例如自动驾驶汽车。 3. 目标导向型智能体(Goalbased Agents):具有明确目标,能根据目标评估不同行动方案并选择最优行动。例如机器人导航系统。 4. 效用型智能体(Utilitybased Agents):不仅有目标,还能量化不同状态的效用值,选择效用最大化的行动。例如金融交易智能体。 5. 学习型智能体(Learning Agents):能通过与环境交互不断改进其性能,学习模型、行为策略以及目标函数。例如强化学习智能体。 智能体功能实现: 本智能体主要通过一个工作流实现,采用单 Agent(工作流模式)。工作流全景图按照市场分析报告内容划分,分成 7 个分支处理,每个分支调研并生成报告中的一部分,以发挥并行处理的效率。工作流主要节点包括文本处理节点、必应搜索节点、LinkerReader 节点、代码节点、大模型节点和结束节点。文本处理节点将用户输入与报告主题拼装形成关键词句;必应搜索节点根据关键词句搜索相关网络内容;LinkerReader 节点获取网页详细内容;代码节点对搜索到的网页链接信息进行过滤;大模型节点生成报告内容并添加引用链接;结束节点将 7 部分内容拼接并流式输出。
2025-02-17
你是一名电商专家,有没有哪个AI大模型或者智能体可以完成以下功能:输入材质图片,得到经过设计后的成品衣服
目前尚未有成熟的 AI 大模型或智能体能够直接实现输入材质图片就得到经过设计后的成品衣服的功能。但在 AI 领域的不断发展中,可能会有相关的技术和模型在未来出现。
2025-02-16
你是一名电商专家,有没有哪个AI大模型或者智能体可以完成以下功能:输入衣服材质图片,得到经过设计后的材质成品衣服
目前尚未有专门的 AI 大模型或智能体能够直接实现您所描述的输入衣服材质图片就得到经过设计后的材质成品衣服的功能。但随着 AI 技术的不断发展,未来可能会出现相关的应用。
2025-02-16
有没有把文字生成图片,并配图的ai软件
以下是一些可以将文字生成图片并配图的 AI 软件: 1. Stable Diffusion:可以根据文本指令生成与文本信息匹配的图片,生成的图片样式取决于使用者输入的提示词,难以出现完全相同的两张输出图片。 2. 无界 AI:可用于快速制作海报底图,在操作步骤上与其他同类软件有相似之处,大致流程包括确定主题与文案、选择风格与布局、生成与筛选、配文与排版。 3. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 4. MidJourney:因高质量的图像生成效果和用户友好的界面设计受到广泛欢迎,在创意设计人群中尤其流行。 您可以根据自己的需求选择使用。在 WaytoAGI 网站(https://www.waytoagi.com/category/104 ),可以查看更多文生图工具。需要注意的是,内容由 AI 大模型生成,请仔细甄别。
2025-02-16
我想生成图片来做PPT用什么AI 软件好
以下为您推荐几款可用于生成图片制作 PPT 的 AI 软件及相关操作方法: 1. MJ(Midjourney): 稍微高级一点的薅:首先复制图片的网址,然后打开 discord,在聊天栏输入“/imagine prompt”。之后再回到官网,把图像的提示词也复制下来,再回 discord 粘贴到刚才拷贝的网址后面,注意空个格。都搞好以后输入命令,稍等一会儿就会得到一个内容和画风都和原图比较接近的图。如果效果不理想多反复生成几次。之后放大觉得还不错的一张,在放大的图里可以进行改变比例和镜头拉远等操作。选一张比较好的放大一下,就可以放进 PPT 调整构图。 2. 即梦 AI: 提示词:皮克斯风格,三宫格漫画:一只小狗,坐在办公桌前,文字“KPI 达标了吗?”。一只小狗,拿着一个写满计划的大本子,微微皱着眉头,文字“OKR 写好了吗?”。一只小狗坐在电脑前,文字“PPT 做好了吗?”。 操作步骤: 打开即梦 AI:https://jimeng.jianying.com/aitool/home 。 点击 AI 作图中的图片生成。 填写绘图提示词,选择生图模型 2.1,点击立刻生成。 3. 无界 AI: 网址:https://www.wujieai.cc/ 。 做图逻辑类似于 SD,其作为出图工具的优势在于:国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。 使用模型:皮克斯卡通。本案例提供的应用场景为朋友圈 po 图,因此画幅比例选择 1:1。无界 AI 的皮克斯卡通模型位置,根据指引找到:二次元模型》模型主题》皮克斯卡通。 关键词类别:场景(向日葵花田、面包店等)、氛围(温馨、温暖等)、人物(父亲和女儿、父亲和儿子)、造型(发型、发色、服饰、配饰等)、情绪(笑得很开心、大笑、对视等)、道具(童话书等)、构图(半身、中景等)、画面(色彩明艳)、特殊等。
2025-02-15
图片转视频
以下是关于图片转视频的相关内容: 一、用 AI 做 3d 新年表情包 1. 生成场景 可直接生成 1:1 的新年场景,或先将角色抠出合成绿幕,再生成无人物的场景图,方便后期控制。 背景是重要元素,输入“新年、中国新年、喜庆热闹、恭喜发财”等关键词获得合适背景。 在即梦图片生成界面中,选项为智能参考,导入参考图,模型选择图片 2.0 Pro,输入提示词生成图片后选择高清放大。 提示词示例:“戴着醒狮帽,双手抱拳,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆”“拿着‘福’字,新年气氛,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆” 2. 图转视频 使用可灵 AI 1.6 图生视频工具,抽卡性价比不错,简单效果一般抽两三次即可。 提示词:可爱的拟人小鹿拿着红包对你说谢谢老板,非常开心忍不住跳舞,背后下着红包雨 二、Joey 的创作思路分享 1. 让想象来到现实 制定分镜,定画面风格和人物是相对难的环节,需与团队达成共识。 定下风格和人物后进行常规的 AI 出图。 2. 动画与代码共舞 图片转视频主要用到了 runway 的笔刷,即梦的前后帧,Pixverse、pika 等。 介绍了三个转场画面: 360 人物环绕:先用 MJ 做不同角度的人物站立图,通过 comfyui 的首尾帧进行视频制作。 母亲的影子:在 SDXL 工作流中加入两个 controlnet,先在 base 里控制构图,再在 refiner 里控制母亲在画面中的强度。 上帝之手:先出一张伸手的图,用 runway 跑相互接近,转视频序列帧后在 comfyui 里用 controlnet 控制构图,按顺序自动出图跑一晚上,最后剪辑序列帧。 三、离谱村的共创故事 1. 出图 图片用 Midjourney 生产,AI 离谱村黄社长业务水平高且高产,其他小伙伴辅助。 2. 图转视频 每张图片转视频进行了大量尝试,各种工具如 pika,runway,Pixverse 轮番上场。 中间找 ZHO 做技术指导,用 SVD1.1 做出精美的视频,甚至上了 stablevideo.com 的首页官方推荐。 3. 配音部分 配音用 Audiobox 捏出来,每个人物角色有专属声音,用 GPTsovits 对离谱熊的声音做专属训练。
2025-02-13