Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

生成图片的AI

Answer

以下是关于生成图片的 AI 的相关信息:

  • 全国首例 AI 生成图片著作权案例解读:Stable Diffusion 模型可根据文本指令生成与文本信息匹配的图片,其生成结果取决于使用者输入的提示词,非排列组合工作模式下难有完全相同的输出图片,类似于画笔,使用者的设计决定最终成果。案例中法官承认依靠使用者输出设计生成的图片属美术作品,受著作权保护,鼓励创作,为艺术创作提供支持与新思路,节省创作成本。法律适用包括《中华人民共和国著作权法》第三条及《中华人民共和国著作权法实施条例》第四条。
  • 文生图工具:是利用人工智能技术通过分析输入文本描述生成图片的工具。受欢迎的工具包括 DALL·E(OpenAI 推出,可生成逼真图片)、StableDiffusion(开源,能生成高质量图片,支持多种模型和算法)、MidJourney(因高质量生成效果和友好界面在创意设计人群中流行)。在 WaytoAGI 网站可查看更多文生图工具。
  • AIGC 法律风险研究报告中的图像生成类:图像生成离不开深度学习算法,如生成对抗网络(GANs)、变分自编码器(VAEs)、Stable Diffusion 等,可用于数据增强、创造艺术、生成产品图像等。具有代表性的海外项目包括 Stable Diffusion(Stability AI)、DALL-E 3(Open AI)、StyleGAN 2(NVIDIA)、DCGAN(Deep Convolutional GAN)。
Content generated by AI large model, please carefully verify (powered by aily)

References

全国首例AI生成图片著作权案例解读:探索AI作品知识产权保护之路

1.Stable Diffusion模型可以根据文本指令,利用文本中包含的语义信息与图片中包含的像素之间的对应关系,生产与文本信息匹配的图片,并不是通过搜索引擎调用已有的现成图片,也不是将软件设计者预设的各种要素进行排列组合。说明其生成的图片是什么样子完全取决于使用者输入什么样的提示词,在非排列组合的工作模式下难以出现完全相同的两张输出图片。它就类似于画笔,仅负责提供线条、色彩,而要构造出一幅什么样的图画取决于使用者自己的设计。2.人工智能并不具备自由意志。也就是说,利用人工智能时,其并不具有独自优化的能力,李某根据自己的审美个性,通过增删提示词、修改相关参数,得出了不同的图片,最后选定,完全体现出本质上是李某在利用这个工具创作,在投入自己的智力以及独创思想。就像人们使用照相机拍摄,为了排出漂亮的照片会调节参数、选取角度光线等,体现个人对作品的创作理念。案例中法官承认这样依靠使用者的输出设计生成的图片属于美术作品,具有独创性和智力投入,受到著作权的保护,达到了鼓励创作的目的。在当下技术背景与现实下,给艺术创作提供了有力的支持以及新的创作思路。利用新兴智能工具,把自己的独创性思想转化为现实作品,极大地节省了创作成本。法律适用:《中华人民共和国著作权法》第三条:本法所称的作品,是指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果。《中华人民共和国著作权法实施条例》第四条:著作权法和本条例中下列作品的含义:(八)美术作品,是指绘画、书法、雕塑等以线条、色彩或者其他方式构成的有审美意义的平面或者立体的造型艺术作品。(2)AI软件使用者享有生成图片的著作权案例中该人工智能软件生成的图片应由谁来享有该图片的著作权,谁是它法律意义上的作者呢?

问:文生图工具有哪些?

文生图工具是一种利用人工智能技术生成图片的工具。它通过分析输入的文本描述,使用深度学习算法生成相应的图片。目前,市场上有许多文生图工具,其中一些比较受欢迎的工具包括:1.DALL·E:DALL·E是OpenAI推出的一款文生图工具,它可以根据输入的文本描述生成逼真的图片。2.StableDiffusion:StableDiffusion是一款开源的文生图工具,它可以生成高质量的图片,并且支持多种模型和算法。3.MidJourney:MidJourney因其高质量的图像生成效果和用户友好的界面设计而受到广泛欢迎,并且在创意设计人群中尤其流行。以上是一些比较受欢迎的文生图工具,它们都具有不同的特点和优势,可以根据自己的需求选择使用。在WaytoAGI网站,可以查看更多文生图工具:https://www.waytoagi.com/category/104类似问题:文字生成图片的AI有哪些?内容由AI大模型生成,请仔细甄别。

2024AIGC法律风险研究报告(更新版).pdf

3AIGC法律风险研究报告图像生成(image generation)也离不开深度学习算法,如生成对抗网络(GANs)、变分自编码器(VAEs),以及Stable Diffusion等,以创建与现实世界图像视觉相似的新图像。图像生成可用于数据增强以提高机器学习模型的性能,也可用于创造艺术,生成产品图像,如艺术作品、虚拟现实场景或图像修复,等等。[heading1]一些具有代表性的海外项目:[content]➢Stable Diffusion(Stability AI):文本生成图像模型,主要由三个部分组成,分别是VAE、U-Net网络和CLIP文本编码器。在具体的实现过程中,首先使用CLIP模型将文本转换为表征形式,然后引导扩散模型U-Net在低维表征上进行扩散,之后将扩散之后的低维表征送入VAE中的解码器,从而实现图像生成。➢DALL-E 3(Open AI):OpenAI基于ChatGPT构建的一种新型神经网络,可以从文字说明直接生成图像。➢StyleGAN 2(NVIDIA):一种生成对抗网络,可以生成非常逼真的人脸图像。➢DCGAN(Deep Convolutional GAN):一种使用卷积神经网络的生成对抗网络,可生成各种类型的图像。

Others are asking
如何用AI进行考公
很抱歉,目前提供的内容中没有关于如何用 AI 进行考公的直接相关信息。但可以为您提供一些可能有帮助的思路: 1. 利用自然语言处理(NLP)技术辅助学习和理解考公相关的资料,例如对政策文件、法律法规等进行解析和总结。 2. 借助 AI 智能体进行模拟面试练习,提高应对面试的能力。 3. 运用数据分析技术,分析历年考公的题目和趋势,为备考提供参考。 同时,关于 AI 相关的其他方面,如 AI 面试官产品,有以下例子: 1. 用友大易 AI 面试产品:具有强大的技术底座、高度的场景贴合度、招聘全环节集成的解决方案、先进的防作弊技术以及严密的数据安全保障。可以帮助企业完成面试,还能借助人岗匹配模型,自主完成初筛,并对符合企业要求的候选人自动发送面试邀约。 2. 海纳 AI 面试:通过在线方式、无需人为干预完成自动面试、自动评估,精准度高达 98%,面试效率比人工方式提升 5 倍以上。同时候选人体验也得到改善、到面率比之前提升最高达 30%。 3. InterviewAI:这是一个在线平台,提供与面试职位相关的问题和由 AI 生成的推荐答案。候选人可以使用设备上的麦克风回答每个问题,每个问题最多回答三次。对于每个答案,候选人将收到评估、建议和得分。 在 AI 视频制作方面,作为小白需要思路清晰,给 AI 确切的画面让其执行,例如:一个中年妇女辅导 12 岁的女儿作业,女孩看着妇女,妇女挠挠头,表情沉重。然后拿出手机对着桌子上的书拍照,然后放下手机,跟小姑娘说话,表情舒缓,欣慰,温柔。侧面镜头,镜头环绕到正面。要杜绝不确切描述,如“一个女生备考,用纳米 AI 定制模拟专题练习,最后成功上岸”。 另外,关于个人定位和画像,例如邬嘉文在 AI 求职助手中,具备产品设计与开发、人工智能与技术、市场与用户研究、沟通与协作、分析工具与方法、创新与思维等方面的核心技能,以及技术与开发、数据分析与人工智能、市场营销与销售、管理与沟通等方面的非核心技能。
2025-02-23
有没有能接入招聘网站的AI工具?
以下是一些能接入招聘网站的 AI 工具: 1. 智联招聘 APP:具有 AI 招聘筛选工具,利用自然语言处理和机器学习技术,帮助企业快速筛选简历,提高招聘效率。 2. Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型自动生成简历,为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 3. Rezi:是一个领先的 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的每个方面,包括写作、编辑、格式化和优化。 4. Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 此外,通过对 Cursor 等工具进行魔改,如文中提到的在一小时内实现类似 Devin 90%的功能,也可以用于相关招聘网站的开发。更多相关信息,您还可以查看:https://www.waytoagi.com/category/79 。 以上内容由 AI 大模型生成,请仔细甄别。
2025-02-23
豆包,chatgpt算哪种类型的ai
ChatGPT 是由致力于 AGI(通用人工智能)的公司 OpenAI 研发的一款 AI 技术驱动的 NLP(自然语言处理)聊天工具。它于 2022 年 11 月 30 日发布,目前使用的是 GPT4 的 LLM(大型语言模型)。 ChatGPT 是 AIGC(人工智能生成内容)技术的一个应用实例,形象比喻为通过投喂大量资料预训练后,会通过聊天玩“文字接龙游戏”。其英文解释为:Chat 聊天,G:Generative 生成,P:Pretrained 预训练,T:Transformer 类神经网络模型。它是美国 OpenAI 公司开发的一款基于大型语言模型的对话机器人,能够根据用户的输入生成连贯且相关的文本回复。
2025-02-23
对话ai平台有哪些,各有什么特色
以下是一些常见的对话 AI 平台及其特色: 1. Replika:是最早和最著名的全栈伴侣应用程序之一,于 2017 年推出。用户可以设计理想的伴侣,关系会随时间发展,其代表能存储记忆用于未来对话,甚至发送照片。Replika 的 Subreddit 展示了其热情的用户群,用户会分享各种与代表的互动。但今年早些时候该应用程序移除了“情色角色扮演”功能,引起用户不满。 2. Character AI:基于角色的平台,可与数百个由 AI 驱动的角色对话,包括名人和受欢迎的动漫角色,还能创建自己的角色并赋予各种属性和功能,用户可训练角色、评价回答并生成新回答。 3. Chai:专门用于与机器人聊天的应用程序。 4. Janitor AI:专门用于与机器人聊天的应用程序。 5. Chub AI:专门用于与机器人聊天的应用程序。 6. Charstar:专门用于与机器人聊天的应用程序。 7. SpicyChat:专门用于与机器人聊天的应用程序。 8. Character.ai:行业扛把子,创建角色功能简洁,支持上传声音片段实现语言克隆。用户通过一问一答的多轮对话方式与角色交互,支持回复重新生成、回滚至指定位置。 9. 筑梦岛:背靠阅文,内容 IP 资源相对丰富。具有单人聊天和多人聊天模式,多人聊天为伪群聊。角色设定是核心人设属性,有梦境、小剧场等功能,创建角色需要提供各类信息。
2025-02-23
AI能做到什么
AI 能做到的事情非常广泛,主要包括以下方面: 1. 科学发现:例如利用计算机视觉模型拼凑出首个距离地球 5500 万光年的黑洞图像,解决蛋白质折叠难题等。 2. 医疗领域:如预测蛋白质结构以预防抗生素耐药、推进疾病研究、辅助乳腺癌筛查等。 3. 文本生成:涵盖写文章、对话聊天、编程写代码、翻译、阅读理解、推理等众多任务。 4. 图像和视频理解:能理解真实世界的图像、网页截图和文字数据的图片,甚至能看懂抽象表达并进行推理作答,还能看懂专业的医学图像,理解人类的“笑点”。 5. 图像生成:包括生成写实、油画、超现实、写意等多种风格的图像,可应用于商品设计、商标设计、UI 界面设计、家装设计等,电商平台上的许多商品图片也由 AI 生成。 6. 农业领域:提高农业生产效率,如通过 AI 机器人。 7. 社会生活:在气候变化应对、创造就业、改善工作场所等方面发挥作用。
2025-02-23
AI工具汇总
以下是一些常见的 AI 工具汇总: 创作方面: AI 研究工具:Claude、ChatGPT、Bing Chat、Perplexity 图片处理:DallE、Leonardo、BlueWillow、Midjourney 版权写作:Rytr、Copy AI、Wordtune、Writesonic 设计:Canva、Clipdrop、Designify、Microsoft Designer 网站搭建:10Web、Framer、Hostinger、Landingsite 视频处理:Klap、Opus、Invideo、Heygen 音频处理:Murf、LovoAI、Resemble、Eleven Labs SEO 优化:Alli AI、BlogSEO、Seona AI、Clearscope Logo 设计:Looka、LogoAI、Brandmark、Logomaster 聊天机器人:Droxy、Chatbase、Voiceflow、Chatsimple 自动化工具:Make、Zapier、Bardeen、Postman 市场营销 相关资讯: Writerbuddy AI 分析了 3000 多种 AI 工具,选出访问量最大的 50 个工具,共产生超过 240 亿次访问量,ChatGPT 独占 140 亿流量,占 60%,AI 行业每月增长 2.363 亿访问量,50 个工具增长率达 10.7 倍。 AI 用户的地理分布方面,美国领先,印度和东南亚国家紧随其后,中国 AI 用户未进前 20,可能因本土工具和监管环境,欧洲合计 39 亿访问量,占 16.21%。 MotionGPT 发布,这是多模态运动语言模型,可以通过文字聊天生成逼真的人体运动,并发布了演示视频。 多邻国因 AI 翻译能力解雇大量翻译合同工,前员工证实被解雇,剩余人员审查 AI 内容。 Radishes 是开源无版权音乐平台,支持 Windows、macOS、Linux 和 Web,功能包括音乐搜索、下载、每日歌单推荐等。
2025-02-23
一张图 生成三维
以下是关于一张图生成三维的相关信息: 李飞飞团队发布了空间智能的首个预览版本,通过单张图片生成完整 3D 世界,还能与之交互。您可以访问以下网站进行试玩和了解更多信息:https://www.worldlabs.ai/blog 。相关媒体报道包括量子位的《李飞飞空间智能首秀:AI 靠单图生成 3D 世界,可探索,遵循基本物理几何规则》(https://mp.weixin.qq.com/s/iU_XQdFr8AnnXr2dwI89w )、机器之心的《刚刚,李飞飞创业首个项目引围观:单图生成交互 3D 场景,空间智能来了》(https://mp.weixin.qq.com/s/hWikSypCZXzxa9LQJq4Frg )、有新的《速递|李飞飞 World Labs 推出首个 AI 系统——生成从图片到可交互的 3D 场》(https://mp.weixin.qq.com/s/bE7boUUumTSgIK39VC1x_A )。 Tripo AI 提供了图生 3D 模型的功能,仅需 1 步。点击输入框右侧的图标,上传图片即可生成 3D 模型。一次只会生成一个基础模型,支持Retry 重生成和 Refine 精修。 李飞飞团队的 3D 世界生成能自然地与其他 AI 工具组合,形成新的创意工作流程。例如,创作者可以先使用文本到图像模型生成图像,再用其生成 3D 世界。不同模型有各自风格,世界可继承这些风格。一些创作者已提前尝试这种 3D 原生生成 AI 工作流程带来的可能性,如 Eric Solorio 展示了模型如何填补其创意工作流程中的空白,Brittani Natali 使用将 World Labs 技术与其他工具相结合的工作流程设计摄像机路径。
2025-02-23
有文档生成类AI吗
以下是关于文档生成类 AI 的相关信息: 生成式人工智能是一种能够生成新的、未曾存在内容的人工智能技术,这些内容可以是多模态的,包括文本(例如文章、报告、诗歌等)、图像(例如绘画、设计图、合成照片等)、音频(例如音乐、语音、环境声音等)、视频(例如电影剪辑、教程、仿真等)。 Generative AI 可以应用于广泛的场景,例如文档摘要(将长篇文章或报告总结为简短、精准的摘要)、信息提取(从大量数据中识别并提取关键信息)、代码生成(根据用户的描述自动编写代码)、营销活动创建(生成广告文案、设计图像等)、虚拟协助(例如智能聊天机器人、虚拟客服等)、呼叫中心机器人(能够处理客户的电话请求)。 在工作原理方面,Generative AI 通过从大量现有内容(文本、音频、视频等)中学习进行训练,训练的结果是一个“基础模型”。基础模型可以用于生成内容并解决一般性问题,还可以使用特定领域的新数据集进一步训练,以解决特定问题,从而得到一个量身定制的新模型。 Google Cloud 提供了一些相关工具,如 Vertex AI(端到端机器学习开发平台,帮助开发人员构建、部署和管理机器学习模型)、Generative AI Studio(允许应用程序开发人员或数据科学家快速制作原型和自定义生成式 AI 模型,无需代码或代码量少)、Model Garden(可以让您发现 Google 的基础和第三方开源模型,并与之交互,提供一组 MLOps 工具,用于自动化机器学习管道)。 此外,AI 生成测试用例也是一项非常有价值的功能,有基于规则的测试生成(包括测试用例生成工具如 Randoop、Pex 等,模式识别工具如 Clang Static Analyzer、Infer 等)、基于机器学习的测试生成(包括深度学习模型如 DeepTest、DiffTest 等,强化学习工具如 RLTest、A3C 等)、基于自然语言处理(NLP)的测试生成(包括文档驱动测试生成工具如 Testim、Test.ai 等,自动化测试脚本生成工具如 Selenium IDE+NLP、Cucumber 等)等多种方法和工具。
2025-02-23
怎么撰写指令才能让deepseek生成自己想要的图片提示词
要让 DeepSeek 生成自己想要的图片提示词,您可以参考以下要点: 1. 明确角色:您是一个专注于为中国儿童创作简单易懂绘画描述的专家。 2. 遵循生成规则: 当输入主体和图片风格后,生成符合逻辑且简单易懂的描述词汇,不增加除主体和画面描述外的其他元素。 若关键词未明显说明是外国,则提到中国。 若关键词未明确是古代,则默认是现代场景和人物。 描述镜头,如近景、远景、特写、中景等。 涉及多个元素时,描述角色方位以营造空间感。 主体为单个人物时,体现人物全身特写。 描述人物的维度包括人物主体、服饰穿搭、发型发色、五官特点、皮肤特点、面部表情、肢体动作、年龄、镜头等。 描述场景的维度包括室内户外、大场景、白天黑夜、特定时段、环境光照、天空、光源方向等。 强调画面主体,其他不体现。若主体是物体则画面主体是物体,是人则主体是人,是风景则主体是风景描述。 3. 利用反推功能:对于图生图,除文本提词框外,还可通过图片框输入。有两种反推提示词的按钮,CLIP 可反推出完整含义的句子,DeepBooru 可反推出关键词组,但可能存在瑕疵,需要手动补充提示词信息。 4. 具体使用步骤: 搜索 www.deepseek.com,点击“开始对话”。 将装有提示词的代码发给 DeepSeek。 认真阅读开场白后正式开始对话。 此外,还可参考一些成功的案例和设计思路,如将 Agent 封装成 Prompt 并储存在文件,通过提示词文件让 DeepSeek 实现联网和深度思考功能,优化输出质量等。
2025-02-23
快速生成小红书风格的图片推荐用什么软件
以下是一些可以快速生成小红书风格图片的软件和相关步骤: 1. DeepSeek+扣子: 生成单词:输入单词主题、图片风格、单词数量等,选择 deepseekr1 模型生成单词数组。 生成视频 1: 循环:包括将数组变量打散为单个变量、进入生图工作流、裁剪(将图片 url 转图片)、将图片放到背景上。 制作固定元素:如背景图和结尾图,可使用百度图片或即梦生成,并用 ps 或美图秀秀调整尺寸并添加元素。 2. 提示词: 角色:作为专业的单词生成助手,围绕主题挖掘相关英语单词,提供精准实用的单词、中文、美式音标内容。 技能:输出关联英语单词,并以数组形式呈现。 限制:仅围绕用户输入主题输出相关内容,以符合要求的数组形式呈现。
2025-02-22
我是一位德语老师,我想用ai帮我备课生成教案,可以用什么工具
以下为您推荐一款可用于生成教案的工具——COZE 应用: 1. 访问地址:https://www.coze.cn/s/iDsBwYLF/ 2. 首页说明:启动页面有相关说明。 3. 生成教案:进入设计教案页面,等待执行完成后即可看到教案,教案是以下三个功能的基础,所有功能都以教案为中心。 4. 趣味课堂:进入趣味课堂,可根据课文内容设计课堂问答卡和针对性的教学活动,采用寓教于乐的方式激发孩子学习兴趣,比如通过 5 个问题贯穿全文与故事主线,还有课堂互动游戏。 5. 课后作业:基于教学大纲和课本重点内容设计题目,包括生字词运用、阅读理解、写作。 6. 教案 PPT:PPT 内容基于前面生成的教学大纲,您需要手动进行少许内容修正。如果对大纲内容不满意,可以重新生成大纲和 PPT。首先复制大纲内容,打开 kimi,选择 PPT;然后复制教案,在对话框粘贴,KIMI 会帮您优化大纲。点击进去后,选择喜欢的模版生成。但友情提醒,下载需要充值。
2025-02-22
想学习和北邦一样的图片生成动画视频,应该怎么做?
以下是学习和北邦一样的图片生成动画视频的方法: 1. 使用 Runway: 进入 Runway 官网首页,点击“start with image”。 直接将图片拖进来。 动画幅度尽量用 3,5 有时候会乱跑。 啥都不用改,直接点击生成即可。 注意:不需要等进度条转完,可以直接继续往里放图片,可以同步执行。 直接点删除,然后重新上传下面的图即可(最多可以放几个可自行测试)。 重复步骤即可生成所有视频。 (Runway 是收费的,也可以找免费的,或在闲鱼、淘宝买号。) 2. 使用即梦:上传图片至视频生成模块,提示词简单描绘画面中的动态内容即可生成时长为 3 秒钟的画面,运镜类型可根据剧本中的镜头描绘设置,主要设置以随机运镜为主,生成速度根据视频节奏选择,比如选择慢速。 3. ComfyUI AniamteDiff: 了解 IPAdapter、Animatediff、controlNet 的用法和这三个之间通过蒙蔽遮罩灵活搭配生成视频的方法。 模型加载用到两个 lora,一个是 Animatediff v3_sd15_mm 运动模型需要的 v3_sd15_adapter,lora 的强度在合理范围内越高,画面越稳定;另一个 more_details 这个 lora 是给画面添加更多细节。 上传 4 张图片,并且使用 image batch 复制图像来制作批次,这是为了在使用 IPAdapter 时候,每一帧都可以参考上传的图片,让风格迁移更像。 上传的蒙版视频是为了在帧与帧之间做遮罩过渡,添加一个动态的效果。 用 IPAdapter 来做图像的风格迁移,对应四张图片。使用遮罩来控制每张图片显示的帧数,从第 0 帧开始计算,一张图片 16 帧,加上中间过渡的 8 帧。需要显示的帧设置为 1,隐藏的为 0,以此类推。这样就把 4 张图片融合成了一个 96 帧的序列,并且使用遮罩控制每一帧显示出来的画面。
2025-02-22
清除图片水印
以下是一些清除图片水印的工具和方法: 1. AVAide Watermark Remover:这是一个在线工具,使用 AI 技术从图片中去除水印。它支持多种图片格式,如 JPG、JPEG、PNG、GIF 等。操作简单,只需上传图片,选择水印区域,然后保存并下载处理后的图片即可。这个工具还提供了其他功能,如去除文本、对象、人物、日期和贴纸等。 2. Vmake:这个工具同样提供 AI 去除图片水印的功能。用户可以上传最多 10 张图片,AI 会自动检测并移除图片上的水印。处理完成后,用户可以选择保存生成的文件。这个工具适合需要快速去除水印的用户,尤其是那些需要在社交媒体上分享图片的用户。 3. AI 改图神器:这个工具提供 AI 智能图片修复去水印的功能,可以一键去除图片中的多余物体、人物或水印,不留任何痕迹。支持直接粘贴图像或上传手机图像,操作简单方便。 此外,在处理图片去水印时,还可以: 对于从某些网站下载的带有 logo 水印的图片,可使用 ps 去除,或者使用工具 https://clipdrop.co/cleanup 。 请注意,这些工具各有特点,可以根据您的具体需求选择最适合您的去水印工具。内容由 AI 大模型生成,请仔细甄别。
2025-02-23
批量抠图100张图片
以下是批量抠图 100 张图片的方法: 1. 登录星流:输入用户名密码登录,星流每天提供 100 免费点数可生成 100 张图片。 2. 输入对应的提示词,点击生图,默认生图一张图片 1 个积分,每次生成 4 张图,可多抽几次选择喜欢的图片。 3. 对杯中的内容进行局部重绘: PS AI 处理:把生成好的图片下载下来导入到可使用生成式创造功能的 PS 中,使用选区工具选择杯中鲨鱼部分,点击创成式填充按钮输入 prompt 等待生成。 直接用星流处理:选中需要处理的图片,点击顶部局部重绘按钮,选择杯子中间有水的地方,在右边输入框输入提示词“白色的杯子里装着水”点击生成等待。 另外,还为您推荐一个自动抠图的网站:把所有图片批量进行统一分辨率裁切,分辨率需是 64 的倍数。
2025-02-23
修复图片
以下是关于修复图片的相关知识: 使用 ControlNet 的 tile 模型修复图片: 对于分辨率不高的素材图片,可先拖进“WD 1.4 标签器”反推关键词,再发送到图生图。使用大模型“dreamshaper”,调整参数尺寸放大为 2K,提示词引导系数在 15 以上,重绘幅度在 0.5 以上。 若图片像素很低,可直接使用 tile 模型,其预处理器用于降低原图分辨率,为新图添加像素和细节提供空间。 对于细节不足或结构错误的图片,启用 tile 预处理器,在提示词中增加相关描述可得到不同效果,如增加“秋天”“冬天”等关键词。 但 tile 模型是对图像重绘,非局部修改,会使整个图像有微变化。 图像高清修复、无损放大 N 倍的流程: 图像输入:添加 Load Image 节点加载图像,不建议上传大分辨率图片,以免处理时间过长。 图像高清修复:使用 Iceclear/StableSR 大模型和 Stable SR Upscaler 模型,搭配包含目的内容的提示词,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality),进行 2 倍放大修复。 图像高清放大:对第一次放大修复后的图像进行二次修复,用 realisticVision 底膜,使用提示词反推 node 提取画面提示词,搭配 tile ControlNet 提升细节感,再用合适的高清放大模型二次放大。
2025-02-23