直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

怎么才能让FLUX生成的人物更像真人的照片

回答

以下是一些可能有助于让 FLUX 生成的人物更像真人照片的建议:

  1. 尝试使用特定的提示词,例如“abstract network out of glass made of holographic liquid crystal, dark background, blue light reflections, symmetrical composition, centered in the frame, highly detailed, hyper-realistic, cinematic lighting, in the style of Octane Rende --ar 16:9 --style raw --personalize --v 6.1”。
  2. 可以训练 FLUX Lora 模型,如褪色胶片风格,推荐权重 0.6 - 0.8,人像会偏向复古褪色的胶片风格。
  3. 对于生成人物,还可以参考 XLabs-AI 发布的不同 Lora,如 mjv6_lora(Midjourney 风格)、realism_lora(写实风格)等,并使用相应的示例进行参考和调整。
  4. 您还可以从以下地址下载相关的 Lora:https://hf-mirror.com/Kijai/flux-loras-comfyui/tree/main/xlabs
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AIGC Weekly #88

封面提示词:abstract network out of glass made of holographic liquid crystal,dark background,blue light reflections,symmetrical composition,centered in the frame,highly detailed,hyper-realistic,cinematic lighting,in the style of Octane Rende --ar 16:9 --style raw --personalize --v 6.1[💎查看更多风格和提示词](https://catjourney.life/)这周同样训练了一个FLUX Lora模型,褪色胶片风格,推荐权重0.6-0.8。非常适合生成毛茸茸的动物玩偶人像会偏向复古褪色的胶片风格涉及到玻璃制品产品展示摄影的表现很好整体景深模糊的也很好,过度自然柔和下载:https://www.liblib.art/modelinfo/4510bb8cd80142168dc42103d7c20f82?from=personal_page

Midjourney 人物一致性已上线

官方说明和操作:DavidH:Hey @everyone @here we're testing a new"Character Reference"feature today This is similar to the"Style Reference"feature,except instead of matching a reference style it tries to make the character match a"Character Reference"image.How it worksType --cref URL after your prompt with a URL to an image of a characterYou can use --cw to modify reference 'strength' from 100 to 0strength 100(--cw 100)is default and uses the face,hair,and clothesAt strength 0(--cw 0)it'll just focus on face(good for changing outfits / hair etc)What it's meant forThis feature works best when using characters made from Midjourney images.It's not designed for real people / photos(and will likely distort them as regular image prompts do)Cref works similarly to regular image prompts except it 'focuses' on the character traitsThe precision of this technique is limited,it won't copy exact dimples / freckles / or tshirt logos.Cref works for both Niji and normal MJ models and also can be combined with --sref Advanced FeaturesYou can use more than one URL to blend the information /characters from multiple images like this --cref URL1 URL2(this is similar to multiple image or style prompts)How does it work on the web alpha?Drag or paste an image into the imagine bar,it now has three icons.selecting these sets whether it is an image prompt,a style reference,or a character reference.Shift+select an option to use an image for multiple categories Remember,while MJ V6 is in alpha this and other features may change suddenly,but V6 official beta is coming soon.We'd love everyone's thoughts in ⁠ideas-and-features We hope you enjoy this early release and hope it helps you play with building stories and worlds

第十五期 生图新王FLUX.1

XLabs-AI发布了6个不同Lora:mjv6_lora - Midjourney风格示例:A full-profile portrait of a Chinese dancer poised on a moonlit stone bridge,surrounded by the delicate blooms of a cherry orchard.Her silk garments ripple with her movement,her eyes are focused and intense,with skin details on her face.She's part of a scene inspired by classical poetry,her fluid motions a dance of elegance.The luminance is delicate and dreamlike,bestowing a soft ambiencerealism_lora -写实风格示例:In a conference room setting,a beauty women dressed in business attire are attending a meeting,random expressions,postures,and physical characteristicsa RAW ultra-realistic photo,UHD,8kanime_lora -动漫风格示例1girldisney_lora -迪斯尼风格示例:1cat,catoon,disney,scenery_lora -风景风格示例:A breathtaking view of the Himalayas mountain range,showcasing its majestic and serene beauty.The mountains are covered in snow,with their peaks reaching towards the sky,creating a stunning contrast with the blue horizon.The range is vast and imposing,with numerous towering peaks,including Mount Everest,the highest point on Earth.The scene captures the grandeur and tranquility of the Himalayas,with sunlight casting a soft glow on the snow-covered slopes.The foreground shows the rugged terrain and lush greenery of the lower elevations,adding to the diverse and spectacular landscape.art_lora -艺术风格Cat,European street,exploration,cozy,mysterious,colorful buildings,sunlight through leaves,cobblestone path,high definition,watercolor painting,warm tones,bright lighting effects,paper textureLora下载地址:https://hf-mirror.com/Kijai/flux-loras-comfyui/tree/main/xlabs

其他人在问
comfyui flux相关的教程
以下是关于 ComfyUI Flux 的教程: 安装及使用: 模型放置: t5xxl_fp16.safetensors:放在 ComfyUI/models/clip/目录下。 clip_l.safetensors:放在 ComfyUI/models/clip/目录下。 ae.safetensors:放在 ComfyUI/models/vae/目录下。 flux1dev.safetensors:放在 ComfyUI/models/unet/目录下。 下载地址: 如果 GPU 性能不足、显存不够,底模可以使用 fp8 的量化版模型,速度会快很多,下载地址:https://huggingface.co/Kijai/fluxfp8/tree/main 工作流下载:上面提供的工作流复制即可,或者使用官方原版的图片链接 https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png ,将工作流或图片拖拽到 ComfyUI 里。 ComfyUI 共学相关: 插画提效成果显著,原本需要 200 人美术团队一年多完成的 1 万多张动画插画,最终不到 10 人用半年完成。 课程从零基础开始,从认识 config、UI 及行业概念讲起,逐步深入到环境部署、底层技术概念、提示词等内容。 介绍 config 牛角尖大王系列,包括 control net、IP Adapter、图像放大、mask 等部分,阐述了它们的作用和玩法。 具备搭建复杂工作流能力,学习相关知识后初步具备搭建复杂工作流能力,会拆解分析网上热门工作流。 解决 config UI 报错问题,报错问题可分为网络、模型、工作流搭建、环境等方面,安装新插件时可参考项目地址的 requirement 文档。 规划实战案例思路,目前想到了三个实战案例的思路。 关于 config UI 生态及相关技术的分享,郭佑萌介绍课程提纲,包括课程可能的扩充、回顾总结及重点讲解 Flux 模型,实际课程不严格按大纲走,会根据大家接受程度和安排进行共学。
2024-09-16
在COMFYUI中使用FLUX大模型时,怎么才能让多次生成的人物一致
在 ComfyUI 中使用 FLUX 大模型让多次生成的人物一致的方法如下: 控制人物在多场景、多个姿势下的一致性有很多方法,课程后期会介绍。 对于多张图输出的显示问题,一次产出多张图在预览窗口目前不能并排显示。 Lora 的刷新:将 Lora 丢到文件夹后,多点几次刷新即可,Web UI 中 Lora 库有刷新按钮。 另外,在 Midjourney 中,人物一致性已上线,其操作如下: DavidH 介绍:Hey @everyone @here we're testing a new "Character Reference" feature today This is similar to the "Style Reference" feature, except instead of matching a reference style it tries to make the character match a "Character Reference" image. 具体操作:Type cref URL after your prompt with a URL to an image of a character. You can use cw to modify reference 'strength' from 100 to 0. strength 100 . 适用范围:This feature works best when using characters made from Midjourney images. It's not designed for real people / photos . 网页端操作:How does it work on the web alpha? Drag or paste an image into the imagine bar, it now has three icons. Selecting these sets whether it is an image prompt, a style reference, or a character reference. Shift + select an option to use an image for multiple categories. 在 ComfyUI 中处理模型连接和提示词相关问题,如让两个模型同时起作用的操作: 加入一个新节点,右键点击 【新建节点】 【实用工具】 【Primitive 元节点】。 在文本节点上单击右键,选择【转换文本为输入】,此时文本节点上就多了一个文本的连接点。 将元节点与文本节点相连接,元节点就变成了正向提示词的输入框。同理,可以将负向提示词框也用元节点代替。 再复制出一套正负提示词节点,一套给 base 模型,一套给 refiner 模型。然后,base 模型的那一套输出给第一个采样器节点,refiner 模型的那一套输出给第二个采样器节点。
2024-09-13
Flux工作流
Flux 工作流相关内容如下: 安装及使用:如果 GPU 性能不足、显存不够,底模可以使用 fp8 的量化版模型,速度会快很多。ae.safetensors 和 flux1dev.safetensors 的下载地址为:https://huggingface.co/Kijai/fluxfp8/tree/main 。最后下载 dev 的工作流,可使用上面提供的工作流,或者下面官方原版的图片链接,图片导入 ComfyUI 就是工作流:https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png 。打开 ComfyUI,把工作流或图片拖拽到 ComfyUI 里。 随机提示词+FLux NF4 模型文生图工作流。 FLUX 的周边生态发展迅速,具体的 Lora 包括 mjv6_lora、动漫 Lora、写实 Lora、迪士尼 Lora、风景_lora、艺术 Lora 。Xlabs Lora 下载:https://huggingface.co/XLabsAI/fluxRealismLora 。另外社区也开始利用训练脚本训练 Lora 了,比如这个,支持 FLUX Lora、ControlNet 的加载,支持文生图、图生图。
2024-09-13
Flux 的lora模型训练教程,我想用用diffuser代码训练,而不是webui或comfyui
以下是关于 Flux 的 lora 模型训练的相关信息: Flux GGUF 模型:https://huggingface.co/city96/FLUX.1devgguf/tree/main GGUF 配套节点插件:https://github.com/city96/ComfyUIGGUF 在最新版本的 ComfyUI 中,GGUF 的节点插件可在 Manager 管理器中搜到下载安装,但 NF4 的配套节点插件搜不到。 注意使用精度优化的低配模型时,工作流和原版不同。把官方的 fp8 工作流中底模的节点换成 NF4 或者 GUFF 即可。 相关生态发展迅速,有 Lora、Controlnet、IPadpter 相关生态建设,字节最近发布的 Flux Hyper lora 可用于 8 步快速生图。下节将先讲讲 Flux 的 lora 训练。
2024-09-05
Flux 的lora模型训练教程
以下是 Flux 的 Lora 模型训练教程: 首先,您需要下载相关模型,如 t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors。 Flux GGUF 模型可从以下链接获取:https://huggingface.co/city96/FLUX.1devgguf/tree/main ,同时还有 GGUF 配套节点插件及 GGUF 节点包:https://github.com/city96/ComfyUIGGUF 。在最新版本的 ComfyUI 中,GGUF 的节点插件可在 Manager 管理器中搜到下载安装,但 NF4 的配套节点插件则搜不到。 如果您的显卡是 16G 的,右键 16G 那个 train_flux_16GLora 的文件;如果您的显卡是 24G 或更高的,右键 24G 那个 train_flux_24GLora 的文件。(DB 全参微调对硬件要求更高,内存 32G 不行)即使是 train_flux_24GLora 的方式,也建议内存尽量高于 32G 以避免意外。 右键用代码编辑器方式打开文件(图中右边红框的两种任意一种均可,没有可以下载一下)。开头的绿色部分不用动,理论上只改红色部分:底模路径、VAE 路径、数据集路径,还有下面的 clip 路径和 T5xxl 路径。如果相关模型在一个文件夹里,路径填写会更简单;如果不在,要准确找到并复制 flux1dev 底模的文件路径,注意检查双引号的使用,避免多双引号、漏双引号或路径错误。训练集的路径要注意是到 train 截止。在 SD3 训练相关参数那里,还有部分路径需要设置。
2024-09-05
flux模型有哪些
Flux 模型主要包括以下几种: 1. Lora 模型:训练时需要下载 t5xxl_fp16.safetensors、clip_l.safetensors、ae.safetensors、flux1dev.safetensors 等模型。 2. 主模型: FLUX.1模型:https://huggingface.co/blackforestlabs/FLUX.1dev FLUX.1模型:https://huggingface.co/blackforestlabs/FLUX.1schnell 3. VAE 模型:下载地址为 https://huggingface.co/blackforestlabs/FLUX.1schnell/blob/main/ae.sft,下载后放在 comfyui\\models\\vae 文件夹中。 4. CLIP 模型:官方提供了 clip_l.safetensors,还有 t5xxl 的 FP8 和 FP16 的两种精度的 clip 模型供选择,可根据电脑配置任选 FP8 或者 FP16 精度下载,下载地址为 https://huggingface.co/comfyanonymous/flux_text_encoders/tree/main,下载后放在 comfyui\\models\\clip 文件夹中。 此外,如果 GPU 性能不足、显存不够,底模可以使用 fp8 的量化版模型,下载地址为 https://huggingface.co/Kijai/fluxfp8/tree/main 。 GitHub 仓库:https://github.com/blackforestlabs/flux 。 百度网盘链接:https://pan.baidu.com/s/1VPQedispwtR29kDrhGR10A?pwd=4iwj 。 最后,还可以下载 dev 的工作流,如上面提到的链接或者官方原版的图片链接 https://comfyanonymous.github.io/ComfyUI_examples/flux/flux_dev_example.png ,将工作流或图片拖拽到 ComfyUI 里使用。
2024-09-04
我在寻找一个能够帮我录制教学微视频的AI工具,希望能够帮助我提供一些文字对应的影像,然后也录我的真人,你可以帮我推荐码
目前在 AI 领域,专门用于录制教学微视频、提供文字对应影像并录制真人的工具相对较少。但您可以考虑使用一些视频编辑软件结合 AI 元素来实现您的需求。例如,Adobe Premiere Pro 具有强大的视频编辑功能,您可以在其中添加一些通过 AI 生成的素材,如特效、动画等。另外,剪映也是一个不错的选择,它操作相对简单,有一些智能的特效和模板可以使用。 如果您希望更直接地利用 AI 生成部分影像内容,一些 AI 绘画工具如 DALL·E2、StableDiffusion 等,可以根据您的文字描述生成图像,然后您再将其整合到视频中。 不过需要注意的是,这些工具可能需要您具备一定的操作技能和创意,才能更好地制作出符合您需求的教学微视频。
2024-09-05
我想要一个机器人的人设和回复逻辑,这个机器人要像人类更接近真人的对话方式,能够更好地理解和回应各种日常对话场景,包括玩笑、调侃和口水话。这样可以大大提高对话的自然度和真实感。
以下是关于机器人人设和回复逻辑的相关内容: 首先,Bot 的提示(人设与回复逻辑)是一种自然语言指令,告诉大语言模型(LLM)执行任务。编写提示词是搭建 Bot 的第一步,为 Bot 设定身份和目标,提示编写得越清晰明确,Bot 的回复越符合预期。 例如,“Coze 直聘”中的职业助手 Bot 人设是一个专业的职业助手,能够根据用户输入信息为用户精准提供匹配的职位推荐。 “安仔”这个社群运营机器人,基于其作用,目前版本的人设是更专注于 AI 相关的知识回答和服务,以满足初学者的需求,尽量不回答其他无关问题。为提升用户体验,还可以加入一些功能,如长期记忆(总结聊天对话内容用于更好响应用户消息)和设计更加美观的 Bot 开场白。 总之,要让机器人像人类更接近真人的对话方式,能够更好地理解和回应各种日常对话场景,包括玩笑、调侃和口水话,以提高对话的自然度和真实感,需要清晰明确地设定人设和回复逻辑,并不断优化完善。
2024-08-25
如何将扣子搭建的agent接入微信,成为一个有微信号的真人
以下是将扣子搭建的 agent 接入微信的一般步骤: 1. 在 Dify 的官网,可找到手把手教您将 Dify 应用接入微信生态的教程: 创建聊天助手应用:在 Dify 平台创建基础编排聊天助手应用,获取 API 密钥和 API 服务器地址。 下载 Dify on WeChat 项目:下载并安装依赖。 填写配置文件:在项目根目录创建 config.json 文件,填写 API 密钥和服务器地址。 把基础编排聊天助手接入微信:快速启动测试,扫码登录,进行对话测试,可以选择源码部署或 Docker 部署。 把工作流编排聊天助手接入微信:创建知识库,导入知识库文件,创建工作流编排聊天助手应用,设置知识检索节点和 LLM 节点,发布更新并访问 API。 把 Agent 应用接入微信:创建 Agent 应用,设置对话模型和添加工具,生成 API 密钥,填写配置文件,启动程序并进行测试。更多内容请访问原文:https://docs.dify.ai/v/zhhans/learnmore/usecases/difyonwechat 2. 零成本、零代码搭建智能微信客服的实操步骤: 注意:目前需要企业认证,才可以进行接入微信客服。如果企业没有进行认证,则会在配置回调 URL 时报错:回调域名校验失败。另外,之前未进行企业认证就发布过微信客服的不受影响。 第一次设置成功后,后面再修改的页面操作: 到微信客服的客服账号,创建一个客服账号,复制客服账号名称,到 coze 的页面粘贴,点击保存。 保存后,在 coze 发布页面的发布平台的微信客服这里,显示“已配置”,剩下的就是勾选,点击发布。 发布成功后,接下来就是体验了,可以点击微信客服旁边的立即对话、复制 Bot 链接,会弹出来该微信客服的二维码,扫码即可立即体验。
2024-08-23
一个把真人视频转化成动漫视频的工具
以下为您介绍把真人视频转化成动漫视频的相关工具和信息: 利用图生图功能可以实现真人转二次元。此功能除了文本提词框,还有图片输入口,可通过图片给 AI 创作灵感。随便照一张照片拖入,文本输入框旁有两个反推提示词的按钮:CLIP 能通过图片反推出完整含义的句子;DeepBooru 能反推出关键词组。但两种方式生成的提示词可能有瑕疵,需手动补充信息,还可调整宽度和高度使红框匹配图片。 有爽文转简单动漫的视频上了 B 站热门,涨粉十万,如链接:https://www.bilibili.com/video/BV1Pc411Q77b/?spm_id_from=333.999.0.0&vd_source=4f7659a23dafc8b331c8f784bf762298 。这类视频可简单拆解为人物站位调度+DNF/LOL 特效(纯视觉特效不考虑),随机摆放 SD 生成图片的小说改视频也有一定传播力。有人想验证“人物站位的调度”这个步骤是否可以让 openai 的 GPT 来自动完成。
2024-08-22
AI数字人可以是不用真人照片创造出来么
AI 数字人可以不用真人照片创造出来。以下为您介绍两种常见的方法: 1. 在剪映中生成数字人: 打开剪映右侧窗口顶部的“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择后软件会播放其声音,可判断是否需要,然后点击右下角“添加数字人”,软件会根据之前提供的内容生成对应音视频并添加到当前视频文件的轨道中,左下角会提示渲染完成时间,之后可点击预览查看效果。 增加背景图片:删除先前导入的文本内容,通过点击左上角“媒体”菜单中的“导入”按钮选择本地图片上传,如一张书架图片,点击图片右下角的加号将其添加到视频轨道上(会覆盖数字人)。 增加字幕:点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。完成后点击右上角“导出”按钮导出视频备用。 2. 使用 HEYGEN 生成数字人: 点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片。 上传后效果在 My Avatar 处显示上传的照片,点开大图后,点击 Create with AI Studio 进入数字人制作。 写上视频文案并选择配音音色,也可以自行上传音频,最后点击 Submit 得到数字人视频。
2024-08-16
让照片说话 软件有哪些
以下是一些能让照片说话的软件及相关信息: SadTalker: 开源程序,可让照片说话唱歌,达到基本唇形同步。 独立使用或作为插件放入 StableDiffusion。 整合包:史上最炸裂版 AI 工具箱,包含 SDAI 绘画、VITS 文本转语音、wav2lip、sadTalker 唇型同步、视频修复,支持 A 卡。 相关链接: GitHub 地址:https://github.com/OpenTalker/SadTalker 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 夸克网盘整合包:https://pan.quark.cn/s/1d5ca9f57f5c 视频地址:https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.searchcard.all.click&vd_source=35e62d366d8173e12669705f7aedd122 具体步骤:点我启动,在启动界面中选择音频、图像口型同步的下载图标;下载完毕后启动应用,等待弹出独立窗口;选择 sadtalker 同步器,分别导入图片和声音。 图片预处理方式:crop 只截取图片头部,full 保留整张照片。 由于涉及视频推理和转换,输出时间较长,需做好等待准备。最终生成的视频长度与音频一致,制作长视频建议剪成小段分别推理后合并。完成后可打开输出目录或下载视频文件。 KreadoAI: 点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”功能。 使用方法:点击开始创作,选择自定义照片;配音时可选择提供文字选择音色或直接上传音频;打开绿幕按钮,点击背景可添加背景图;最后点击生成视频。
2024-09-14
上传一张照片,可以输出照片内容的文字说明吗?
上传一张照片是可以输出照片内容的文字说明的。以下为两种常见的实现方式: 1. 利用 Sadtalker 进行处理:在图片预处理方式中,crop 只截取图片的头部,full 就是保留整张照片,下面的勾选项有文字解释,可自行尝试几次。点击 generate 后,由于涉及到视频的推理和转换,输出时间会远远大于 AI 绘图和 sovits 的声音推理,需做好等待准备。例如导入一个 13 秒的音频,预计需要 3 5 分钟(3060 12g 显卡)。最终生成的视频长度与音频一致,若想制作长视频,最好剪成小段分别推理再合并。完成后,可打开输出目录或下载视频文件查看效果。 2. 借助 GPT 识图功能:我们可以借用 GPT 来对图片的内容进行细致描述,当然也可以自行描述。例如对一张人物照片的描述:图片中的人物是一位年轻的男性,年纪大约在 20 到 30 岁之间。他的头发黑亮,整齐地梳向后方,呈现出一种利落而正式的发型,发尾略有一些微卷,显得时尚而有型。他的肤色白皙,面部线条分明,五官端正。他的眉毛浓密而有形,眼睛大而有神,显得非常有精神。鼻梁高挺,鼻翼略窄,嘴唇薄而有弧度,整体面部表情略显严肃,但却不失英俊。下巴线条明显,脸部轮廓立体分明,整体给人一种非常帅气且有魅力的感觉。他穿着一套正式的黑色西装,内搭白色衬衫,并佩戴了一条黑色领结。西装的剪裁非常合身,显示出他的修长身材和优雅气质。他左手握着一只话筒,似乎正在参加某个正式场合或发表演讲。背景较为简约,以浅色为主,突出人物的主体地位,进一步增强了他正式而庄重的形象。总体来看,这位年轻男性看起来像是东亚人种,具有典型的亚洲男性特征,且散发出一种自信和专业的气质。
2024-09-14
照片修复
以下是关于照片修复的相关知识: 1. 【SD】无需 Lora,一键换脸插件 Roop:启用 ROOP 插件,选择要替换的人物照片,面部修复选“GFPGAN”。右边参数数值越低人物越像但图像模糊,数值越高人物不像但图像清晰,可按需设置,如 0.5。最下面有放大算法,相当于高清修复。设置好后点击生成,若人脸像素偏低模糊,可将图发送到“图生图”,开较小重绘幅度,使用 controlnet 中的 tile 模型重绘。如需此插件,可添加公众号【白马与少年】回复【SD】。推荐使用最新秋叶整合包,科学上网很重要,此插件需谨慎使用,切勿触犯法律。 2. 图像高清修复,无损放大 N 倍: 实现技术拆解:第二部分进行高清修复,把原本模糊的图片修复,并进行 2 倍放大。 Checkpoint 大模型使用 Iceclear/StableSR,搭配 Stable SR Upscaler 模型,推理图片噪点以还原图像。提示词部分应包含想要达到的目的内容,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)。全程采取两次高清修复。 3. 辅助工具:放大/扩图: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可增加更多细节 开源工作流: 相关工具和网站: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ ,能够提供图片的放大和降噪功能,通过使用深度学习技术提高图像质量,同时保留细节和纹理,简单易用且效果好。
2024-09-11
我想要找一款AI智能消除照片背景杂物的工具
以下为您推荐一些 AI 智能消除照片背景杂物的工具: 1. RMBG1.4 去除照片背景模型:高精度背景去除,适用于电商、广告等场景。支持视频背景批量去除,提供蒙版输出功能。云端处理速度快,性能卓越。链接:https://github.com/ZHOZHOZHO/ComfyUIBRIA_AIRMBG ,https://x.com/xiaohuggg/status/1755075272410538450?s=20 2. AVAide Watermark Remover:在线工具,使用 AI 技术从图片中去除水印。支持多种图片格式,如 JPG、JPEG、PNG、GIF 等。操作简单,上传图片,选择水印区域,保存并下载处理后的图片。还提供去除文本、对象、人物、日期和贴纸等功能。 3. Vmake:提供 AI 去除图片水印的功能。可上传最多 10 张图片,AI 自动检测并移除水印。处理完成后可选择保存生成的文件。适合需快速去除水印、在社交媒体分享图片的用户。 4. AI 改图神器:提供 AI 智能图片修复去水印功能,可一键去除图片中多余物体、人物或水印,不留痕迹。支持直接粘贴图像或上传手机图像,操作简便。 这些工具各有特点,您可以根据具体需求选择最适合您的工具。
2024-09-09
图片风格转换,现实照片转换成动漫风格,有哪些网站、Bot、
目前在将现实照片转换成动漫风格方面,以下为您推荐一些常见的网站和工具: 1. 美图秀秀:功能丰富,操作相对简单,有多种动漫风格转换效果可选。 2. 醒图:提供多种特效和滤镜,包括动漫风格的转换。 至于 Bot 方面,暂时没有特别突出和广泛使用的专门用于现实照片转动漫风格的 Bot。但您可以持续关注相关领域的发展,可能会有新的工具出现。
2024-09-06
把照片换去英文用哪个ai合适
目前在将照片进行转换相关的任务中,有一些 AI 工具可供选择,例如 Adobe Photoshop 的智能功能、Canva 等,但具体哪一个最适合将照片换成英文,可能需要根据您的具体需求和使用习惯来决定。
2024-09-04
有什么免费的AI图片生成工具
以下是一些免费的 AI 图片生成工具: 1. Canva(可画):https://www.canva.cn/ 是一个受欢迎的在线设计工具,提供大量模板和设计元素,用户通过简单拖放操作创建海报,其 AI 功能可协助选择颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ 简单易用的设计平台,提供大量设计模板和元素,用户可用 AI 工具创建个性化海报,智能建议功能帮助用户快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能。 以下是一些图片生成 3D 建模工具: 1. Tripo AI:VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型,基于数十亿参数级别的 3D 大模型,实现快速 2D 到 3D 转换,并提供 AI 驱动的精准度和细节。 2. Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成,用户上传图片并描述材质和风格可生成高质量 3D 模型。 3. CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象,再转换为 3D 模型。 4. Sudo AI:支持通过文本和图像生成 3D 模型,适用于游戏领域模型生成,用户上传图片或输入文本提示词生成 3D 模型。 5. VoxCraft:由生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供图像到 3D、文本到 3D 和文本到纹理等多种功能。 以下是一些文生图工具: 1. DALL·E:OpenAI 推出的文生图工具,可根据输入文本描述生成逼真图片。 2. StableDiffusion:开源的文生图工具,能生成高质量图片,支持多种模型和算法。 3. MidJourney:因其高质量图像生成效果和用户友好界面设计受到广泛欢迎,在创意设计人群中尤其流行。 您还可以在 WaytoAGI 网站查看更多文生图工具:https://www.waytoagi.com/category/104 请注意,内容由 AI 大模型生成,请仔细甄别。
2024-09-18
有什么根据文字生成图片的AI工具
以下是一些根据文字生成图片的 AI 工具: 1. DALL·E:由 OpenAI 推出,能根据输入的文本描述生成逼真的图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量的图像生成效果和用户友好的界面设计受到广泛欢迎,在创意设计人群中尤其流行。 您可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。 此外,从文本提示生成 2D 图像已经是生成性 AI 广泛应用的领域之一,像 Midjourney(https://www.midjourney.com/home/)、Stable Diffusion(https://stability.ai/blog/stablediffusionannouncement)和 DallE 2(https://openai.com/dalle2/)这样的工具可以从文本生成高质量的 2D 图像,并在游戏生命周期的多个阶段有应用。例如,在概念艺术方面,生成性 AI 工具能帮助非艺术家快速探索概念和想法,生成概念艺术作品,加速创作流程。
2024-09-18
有没有自动生成专利申请文件的平台
以下是一些可以自动生成专利申请文件的平台: 1. Specifio:利用 AI 技术自动生成专利申请文件,包括专利说明书和权利要求书,能提高专利申请的效率。 2. PatentPal:使用 AI 技术自动生成和编辑专利申请文件,可减少人工工作量。 在专利小助手中,还有以下插件可用于相关工作: 1. Kimi:可以用于自动生成专利申请文档的草稿、摘要或专利描述,提高文档撰写效率。 2. TreeMind 树图:可以用来创建专利结构的思维导图,帮助用户理解专利的组成部分和它们之间的关系。 3. ProcessOn 流程图:可以用于设计和展示专利申请和管理的详细流程,帮助用户理解每一步的操作和所需材料。 4. Word 文档:可以用来处理专利申请文件、专利描述、权利要求书等文档。 使用这些平台通常需要以下步骤: 1. 注册和登录:在对应的平台上注册账户并登录。 2. 上传专利文献:上传待审查的专利文献或输入检索关键词。 3. 选择分析功能:根据需要选择专利检索、分析、评估或生成功能。 4. 查看结果和报告:查看 AI 生成的检索结果、分析报告和评估结果。 5. 进一步处理:根据分析结果进行进一步的人工审查和处理,或者直接生成专利申请文件。
2024-09-18
我想通过AI快速生成专利
以下是关于通过 AI 快速生成专利的相关信息: 专利审查方面的 AI 使用步骤: 1. 注册和登录:在对应的平台上注册账户并登录。 2. 上传专利文献:上传待审查的专利文献或输入检索关键词。 3. 选择分析功能:根据需要选择专利检索、分析、评估或生成功能。 4. 查看结果和报告:查看 AI 生成的检索结果、分析报告和评估结果。 5. 进一步处理:根据分析结果进行进一步的人工审查和处理,或者直接生成专利申请文件。 自动化专利申请的示例平台: 1. Specifio:利用 AI 技术自动生成专利申请文件,包括专利说明书和权利要求书,提高专利申请的效率。 2. PatentPal:使用 AI 技术自动生成和编辑专利申请文件,减少人工工作量。 专利检索与分类:AI 可以帮助进行高效的专利检索和分类,通过自然语言处理(NLP)和机器学习算法,自动识别和分类专利文献。
2024-09-18
AI生成的图片是原创吗 有没有借鉴
在全国首例 AI 生成图片著作权案例中: 法官承认依靠使用者的输出设计生成的图片属于美术作品,具有独创性和智力投入,受著作权保护,能鼓励创作,为艺术创作提供支持和新思路,节省创作成本。 根据相关法律规定,我国著作权作者仅限于自然人、法人或非法人组织,人工智能软件本身不能成为作者。 Stable Diffusion 模型根据文本指令生成图片,不是调用现成图片或排列组合预设要素,生成的图片取决于使用者输入的提示词,难以出现完全相同的两张输出图片,类似于画笔,图画构造取决于使用者设计。 人工智能不具备自由意志,使用者根据自己的审美个性,通过增删提示词、修改参数得出不同图片并选定,体现使用者的智力和独创思想,如同使用相机拍摄时的调节。 软件设计者对模型设计投入智力成果,但后续生成内容与设计者关系不大。图片由创作者根据个人意愿得出,应成为作者并享有著作权。 尽管 AI 是工具,法院强调著作权仍属于人类创作者,保护人类在知识产权领域的权益,鼓励利用 AI 技术创作艺术作品。 在未显示作者身份信息的情况下使用图片构成侵权。
2024-09-18
文字生成PPT的AI工具是什么?免费的
以下是一些文字生成 PPT 的免费 AI 工具: 1. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,可能提供智能文本生成、语音输入、文档格式化等功能,旨在提高文档编辑效率。网址:https://zhiwen.xfyun.cn/ 2. 歌者 PPT:是一款永久免费的智能 PPT 生成工具(gezhe.com)。它完全免费,智能化程度高,能快速将各种资料转换成精美的 PPT,模板和案例库丰富,支持多语言,几乎无需学习成本就能上手使用。 目前市面上大多数 AI 生成 PPT 按照如下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》
2024-09-18