Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

哪一个AI生成的图片更具有还原性

Answer

目前对于哪一个 AI 生成的图片更具有还原性,难以简单地给出一个确定的答案。

从相关资料来看,不同的 AI 出图工具具有各自的特点和优势。例如,MJ 稳定性最好,协作性最强,有很多成熟的经验可供参考,但不是所有人都能拥有此工具;SD 有一些其他产品无法替代的能力,如艺术字、线稿控制能力、可以训练自己的各种 lora 等,但需要本地部署,上手门槛更高;悠船对中文的支持最好,Prompt 可以用中文直出,交互友好、简单、易上手,但管控严格,很多敏感词不能使用。

在实际应用中,保持名胜古迹的原貌可能会遇到困难,比如用悠船出图时法华塔变得面目全非,最后用 SD 的线稿控制才将塔的样式大体保留下来。此外,在处理一些历史相关的内容时,绕过敏感词也是一个难点,需要绞尽脑汁地想办法,比如用替代词或其他方式。

同时,从艺术和语言学的角度来看,AI 艺术的发展仍在探索中,对于其本体形态和未来的发展方向还有待进一步研究和实践。

Content generated by AI large model, please carefully verify (powered by aily)

References

生成式人工智能艺术形态想象 | 精简版

自1826年,尼普埃斯(Joseph Nièpce)拍摄了世界第一张照片。当时的人们惊讶于这种对现实的复刻能力,开始在名胜古迹、日常生活中留下了大量的光影复制。1859年波德莱尔(Charles Baudelaire)称摄影是艺术的敌人。摄影只有“真”,没有“美”而摄影,却从两种方式,影响了美。一个表达方式除了自身的演化,还会影响其他的表达形式。摄影诞生之后,画家受到了摄影的影响以德加(Edgar Degas)的作品为例,无论是构图、视角的新颖,这还是模拟慢门摄影的效果创作绘画的观念!已经被摄影改变。立体主义(Cubism)野兽派(Fauvism)...后面开启了一个人类群星闪耀的时代。人类更关注于非记录的、抽象的表达方式。摄影自身发展的这条线则更为坎坷。无数将艺术思维带入摄影创作的摄影师前赴后继,最终在布勒松(Henri Cartier Bresson)斯特兰德(Paul Strand)斯蒂格里茨(Alfred Stieglitz)等一代创作者,思考者,推广者的手中。摄影成为了一种艺术。说回AI,当如今很多人还在讨论人工智能图像生成不具有架上绘画的仪式感的时候,2022年,阿纳多(Refk Anadol)的作品在纽约MoMA展出:作品基于MoMA数万幅艺术作品生成,没有人干预,因此被称为“无人监督”(Unsupervised)AI生成这些图像既不像原始资料,也不是人类主观创作而是机器“生成”的结果,艺术家只提供初始的观念。如同摄影将创作一刀劈开。抽离出复制和表现。那么AI把表现一刀劈开,剩下了什么。

爆肝 60 小时,一群小白用 AI 做了一个 MV——万字保姆级复盘攻略

我们用的出图工具以MJ、SD和悠船为主,就个人体验简单对比一下:|工具|优点|缺点||-|-|-||MJ|稳定性最好,协作性最强,有很多成熟的经验可供参考|不是所有老师都拥有此工具||SD|有一些其他产品无法替代的能力,比如艺术字、线稿控制能力、可以训练自己的各种lora等|需要本地部署<br>上手门槛更高||悠船|对中文的支持最好,Prompt可以用中文直出,效果通常都非常不错<br>交互上也比依托Discord的MJ更为友好、简单、易上手|管控上也最为严格,很多敏感词不能使用|[heading3]难点一:怎样保持名胜古迹的原貌[content]找到一张法华塔的旧照片,但用悠船出图,塔就变得面目全非法华塔老照片法华塔现代照片悠船出图尝试了多种垫图的办法未果,最后用SD的线稿控制才将塔的样式大体保留了下来(现在应可以用即梦的图生图功能来达成)[heading3]难点二:绕过敏感词[content]做历史的部分需要出一些战争场面,其中战士、士兵、五星红旗、外交官等等全都是敏感词😂,有的是干脆拦截掉不让出图,有的是出来的图里检测到敏感内容不可显示,常常需要绞尽脑汁地想办法绕过敏感词,比如:不说「五星红旗」,只说「红旗」不说「外交官」,只找一个顾维钧演讲的老照片来垫图,Prompt中只说是「男人在自信地演讲」

AI艺术的预言 | 菩萨把掌抵在了你的背上

可以从语言学(Linguistics)的角度来研究我们常说提示像“咒语”-高注册(Register)语言应用和自然语言有众多的差异性(Differentiation)比如强目的性(Intentionality),强精确性(Precision)强变异性(Variability),强符号性(Symbolism)探索本能(Exploratory Nature)肢体驱动的画笔,是物理材料之笔语言驱动的画笔,是概念的画笔概念的画笔,描绘观念的织体(Texture)我们掌握着这支笔的雏形创作AI绘画与AI影像但是,这只是握笔的练习,不是创作因为我们没有找到这支笔合适的画布架上绘画已死,电影已死观念,只是偶尔会寄生在它们的残躯上当然,很多人还在膜拜着它们的残躯那么,AI艺术的本体形态是什么AI生成式空间计算(Generative Al Spatial Computing)绘画是有缺损的复现电影是第三者的旁观影像始终是透过一扇窗在观察另一个世界而这扇窗,这面墙,即将被打破很快AI艺术的卢米埃尔(frères Lumière)时刻就会隆隆驶来生成式空间计算的使命是创造生命体验我无法用言语还原这种奇观,只能尽力神说,要有光,你便有了光要有鱼绕着我,你便被鱼围绕要有人类的历史如瀑布下坠般沐浴自己历史就会沐浴你

Others are asking
AI SFT 是什么
AI SFT 即监督微调(Supervised Finetuning)。它是一种在人工智能领域中的技术。例如在自然语言处理中,通过使用有监督的数据对预训练的模型进行微调,以使其更好地适应特定的任务和领域。在一些研究和应用中,如会话式医疗诊断人工智能应用 AMIE 中,SFT 被用于弥补真实世界数据样本的充分性、全面性、深刻性和洞察性。同时,在 Transformer 等模型的发展和应用中,SFT 也发挥着重要作用。
2025-02-05
AI生成PPT
以下是关于 AI 生成 PPT 的相关内容: 卓 sir 的经验: 流程:先让 GPT4 生成 PPT 大纲,导入 WPS 启用 WPS AI 一键生成 PPT,再让 chatPPT 添加动画,最后手动修改细节。 难点:让 GPT4 写出符合要求的大纲最花时间,因题目抽象难以理解,后借助 GPT4 明确主题为结合具体电商网站研究 5 种不同电商模式。 雪梅 May 的体验: 体验了 gamma、AIPPT、islide AI 等生成 PPT 的产品,认为 gamma 最好用,只要提供内容框架,生成的 PPT/网页审美水平最高。 熊猫 Jay 的思路和指南: 主要思路:以爱设计为例,基于 Markdown 语法的内容生成 PPT,其他工具操作方式大同小异。 优化:可按照公司要求自行优化字体、图片等元素,对下载后的 PPT 删改内容。
2025-02-05
比较好用的PPT制作AI
以下是一些比较好用的 PPT 制作 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 4. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 在体验方面,有人认为 gamma 最好用,只要提供了内容框架,生成的 PPT/网页审美水平最高。此外,WPS AI 也表现出色,能帮助生成 PPT 大纲并进行优化,还能根据用户要求修改主题配色和字体。
2025-02-05
请提供一个提供办公效率的AI及其网址和使用教学
以下为您提供一些能提高办公效率的 AI 及其网址和使用教学: 邮件写作 AI 工具: 1. Grammarly: 功能:提供语法检查、拼写纠正、风格建议和语气调整等功能。 优点:易于使用,支持多种平台(如浏览器扩展、桌面应用、手机应用),适用于多种语言。 网站:https://www.grammarly.com/ 2. Hemingway Editor: 功能:简化句子结构,提高可读性,标记复杂句和冗长句。 优点:界面简洁,重点突出,适用于改善写作风格和简洁性。 网站:http://www.hemingwayapp.com/ 3. ProWritingAid: 功能:全面的语法和风格检查,提供详细的写作报告和建议。 优点:功能强大,支持多种平台和集成,特别适合专业写作者。 网站:https://prowritingaid.com/ 4. Writesonic: 功能:基于 AI 生成各种类型的文本,包括电子邮件、博客文章、广告文案等。 优点:生成速度快,适合需要快速创作和灵感的用户。 网站:https://writesonic.com/ 5. Lavender: 功能:专注于邮件写作优化,提供个性化建议和模板,帮助用户提高邮件打开率和回复率。 优点:专注邮件领域,提供具体的改进建议和实时反馈。 AI 视频工具: 1. Runway: 网址:https://runwayml.com 优势:有网页有 app 方便 教程: 2. 即梦: 网址:https://dreamina.jianying.com/ 优势:剪映旗下,生成 3 秒,动作幅度有很大升级,最新 S 模型,P 模型 教程: 3. Minimax 海螺 AI: 网址:https://hailuoai.video/ 优势:非常听话,语义理解能力非常强 教程: 4. Kling: 网址:kling.kuaishou.com 优势:支持运动笔刷,1.5 模型可以直出 1080P30 帧视频 教程: 5. Vidu: 网址:https://www.vidu.studio/ 6. haiper: 网址:https://app.haiper.ai/ 7. Pika: 网址:https://pika.art/ 优势:可控性强,可以对嘴型,可配音 教程: 8. 智谱清影: 网址:https://chatglm.cn/video 优势:开源了,可以自己部署 cogvideo 教程: 9. PixVerse: 网址:https://pixverse.ai/ 优势:人少不怎么排队,还有换脸功能 教程: 10. 通义万相: 网址:https://tongyi.aliyun.com/wanxiang/ 优势:大幅度运动很强 教程: 11. luma: 网址:https://lumalabs.ai/ AI 办公设备管理系统: 联想设备管理平台: 网址:未提及 功能:借助 AI 和物联网技术,对企业的办公设备进行管理,包括设备状态监测、故障预警、软件更新等。例如当打印机墨盒快用完时,系统会自动提醒并安排更换,提高设备的使用效率。 AI 美容护肤机构推荐平台: 新氧 APP: 网址:未提及 功能:利用 AI 分析用户的需求和地理位置,为用户推荐附近的优质美容护肤机构。比如用户想做皮肤护理,APP 会根据用户的评价和机构的服务项目,推荐合适的机构。 AI 儿童教育机构推荐平台: 大众点评亲子频道: 网址:未提及 功能:通过 AI 技术根据家长的需求和孩子的年龄,为家长推荐合适的儿童教育机构。例如家长想为孩子找一家英语培训机构,APP 会根据机构的口碑和课程设置进行推荐。 AI 汽车销售平台: 汽车之家车商城: 网址:未提及 功能:利用 AI 分析用户的购车需求和预算,为用户推荐合适的汽车品牌和车型。例如用户想买一辆家用 SUV,平台会根据用户的需求推荐性价比高的车型,并提供购车优惠和金融服务。
2025-02-05
AI入门
以下是为您提供的 AI 入门的相关指导: 了解 AI 基本概念: 建议阅读「」部分,熟悉 AI 的术语和基础概念,包括人工智能的定义、主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时,浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 开始 AI 学习之旅: 在「」中,您可以找到一系列为初学者设计的课程,特别推荐李宏毅老师的课程。您还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有可能获得证书。 选择感兴趣的模块深入学习: AI 领域广泛,涵盖图像、音乐、视频等。您可以根据自身兴趣选择特定模块深入学习,同时一定要掌握提示词的技巧,它上手容易且很有用。 实践和尝试: 理论学习后,实践是巩固知识的关键。您可以尝试使用各种产品做出自己的作品,在知识库中有很多大家实践后的作品和文章分享,欢迎您在实践后也进行分享。 体验 AI 产品: 与现有的 AI 产品进行互动是学习 AI 的有效方式。尝试使用如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式,通过对话获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 另外,May 在其公众号文章「」中分享了自己疯狂向 AI 提问从而入门的经历。还有为不会代码的朋友准备的「写给不会代码的你:20 分钟上手 Python+AI」,能让您在 20 分钟内循序渐进地完成一个简单程序、一个爬虫应用(抓取公众号文章)和一个 AI 应用(为公众号文章生成概述)。
2025-02-05
抖音直播间ai自动回复
以下是关于抖音直播间 AI 自动回复的相关知识: 在当下的 AI 产品中,大都支持自定义 AI 的回复方式。例如在 ChatGPT/GPTs 里是“Instructions”,在 Coze 里是“人设与回复逻辑”。设定“人设与回复逻辑”时,这里的写法就是 Prompt,您可以足够相信 AI 的智商,无论怎么写,它一般都能理解,但以下仅供参考,您可以自由发挥。 目标是尝试输入某个 AI 产品的网址,如:https://www.anthropic.com/news/introducingclaude ,AI 会自动处理并返回这个产品的名称、简介等信息。 测试“人设与回复逻辑”时,尝试输入网址:https://www.anthropic.com/news/introducingclaude ,也就是 Claude 的介绍信息页,AI 就会按照预先设定的格式进行返回。但由于 AI 的特性,它并不总能返回合适的结果。处理这种情况的方法有很多,比如重试、优化 Prompt 或者使用 Workflow(这个后面讲)。 另外,在【AI+知识库】商业化问答场景中,大语言模型就像一个学习过无数本书、拥有无穷智慧的人,对公共知识、学识技能、日常聊天十分擅长。提示词则是告诉这个全知全能的人,他是一个什么样的角色、要专注于哪些技能,让他能够按照您的想法,变成一个您需要的“员工”。知识库相当于给这个“聪明”员工发放的一本工作手册,例如设定使用阿里千问模型,角色是“美嘉”,知识库放的是《爱情公寓》全季的剧情,这样当您提问时,AI 就能根据设定和知识库进行回复。
2025-02-05
flux lora调参数,我训练出来的人物模型和数据集的人物图片不像,出现这种情况的原因都有哪些,应该调整哪些参数,我需要我的flux模型训练出来的模型是一致性还原性,和泛化性比较不错的,按照这个方向给我指导
以下是关于 flux lora 调参数以获得一致性、还原性和泛化性较好的人物模型的指导: 打标环节: 选择基础大模型,如“麦橘写实”,并为 lora 命名。 将照片导入,选择合适分辨率,可勾选“脸部加强训练”,然后进行预处理。手动裁剪图片比自动裁剪更可靠。 预处理后会出现脸部和整体文件夹,且每张照片自动打好 tag 标签。 可为整体添加统一标签,也可单独修改每张图片的标签。标签有助于 AI 理解图片,描述越详细,人物变化可能越多,泛化性可能越好。仔细检查每张图片的标签,其质量会影响人物 lora 的泛化性。 参数调整环节: 大部分参数是固定的,主要的几个按照人物参数配置一遍。后期根据生成结果再调整。 炼丹环节: 例如 18 张脸部图片,20 张整体图片,各训练 50 步,循环训练 10 次,并行步数为 1。训练总步数和时长会有所不同,loss 值可作为参考,但最终效果仍需通过测试判断。 此外,在 Lora 串联方面,多个 Lora 串联时左右顺序不影响结果,可复制并点对点连接。CLIP 层 1 和 2 的效果不同,加 Lora 时某些 Lora 可能更适合 2。Lora 可用于生成底模无法画出的内容。在运行中点击取消可打断正在渲染跑的图。图像放大可通过 up scale image using model 节点,选择放大模型,用 resize 节点调整尺寸,再用编码器和采样器处理。放大模型直接放大的图像效果不佳,需再次采样增加细节。添加飞桨缺失节点可通过拖入工作流查看标红节点,从管理器安装或从 GitHub 获取节点包放入文件管理系统。采样器和调度器参数设置建议参考模型作者推荐,并结合自己调试。Web UI 中 Lora 库有刷新按钮,将 Lora 丢到文件夹后多点几次刷新即可。
2025-01-04
我想学习通过衣服图片生成模特视频
以下是关于通过衣服图片生成模特视频的相关内容: 如果您要通过衣服图片生成模特视频,有以下两种方法可供参考: 方法一:使用 Stable Diffusion 1. 真人穿衣服拍照,并拿到穿衣服的真实质感照片。如果身材方面有难处,可以借助美图秀秀或 PS 进行处理。 2. 选好底模,一定要是 realistic 的真人照片风格底模,例如 majicmixRealistic_v7。 3. 根据不同平台换头,比如面向海外市场换白女头,面向中老妇女换妈妈头。 4. 在图生图下的局部重绘选项卡下涂抹自己替换的部分,并设置好 prompts 和 parameters,例如 breathtaking cinematic photo, masterpiece, best quality, , blonde hair, silver necklace, carrying a white bag, standing, full body, detailed face, big eyes, detailed hands 等。 方法二:使用即梦的智能参考功能 1. 打开即梦官网 https://jimeng.jianying.com/ 。 2. 选择图片生成。 3. 选择导入参考图(上传一张参考图,点击智能参考)。 模特图自由定制:智能参考可以让模特图的变装、换发型、换脸、换发色和调整人物姿势变得轻而易举。 产品图随心变化:可以改变产品材质,调整画面背景。 电商海报一键搞定:支持随意更改背景、元素,适应不同的营销主题。 希望以上内容对您有所帮助。
2025-02-04
ai生成海报
以下是一些关于 AI 生成海报的相关信息: 设计海报的 AI 产品: Canva(可画):https://www.canva.cn/ ,是一个受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可协助选择颜色搭配和字体样式。 稿定设计:https://www.gaoding.com/ ,智能设计工具采用先进人工智能技术,自动分析和生成设计方案。 VistaCreate:https://create.vista.com/ ,简单易用的设计平台,提供大量设计模板和元素,可使用 AI 工具创建个性化海报,智能建议功能帮助用户快速找到合适设计元素。 Microsoft Designer:https://designer.microsoft.com/ ,通过简单拖放界面创建演示文稿、社交媒体帖子等视觉内容,集成丰富模板库和自动图像编辑功能。 海报设计思路: 鉴于近期热门的城市建筑风格,可尝试将老北京糖葫芦做成北京建筑,然后即时生成海报并挑选喜欢的。确定这种风格的海报后,替换同材质的北京建筑物即可延续风格设计一系列海报。继续复用上一张的关键词生成其他建筑,调整关键词继续生成单个建筑物,再用 PS 稍作处理,替换建筑物,就可得到一系列海报。 用 AI 快速做一张满意海报的方法: 需求场景:当想在社交平台发布内容时,网上找的图可能质量不佳或易撞图,自己相册中的照片可能不合适,此时可自己制作。 大致流程: 主题与文案:确定海报主题后,借助 ChatGPT 等文本类 AI 工具协助完成文案。 风格与布局:选择想要的风格意向,背景可根据文案和风格灵活调整画面布局。 生成与筛选:使用无界 AI,输入关键词,生成并挑选一张满意的海报底图。 配文与排版:将上述素材进行合理排版,得到成品。排版同样可以参考 AIGC 海报成果。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-04
生成简历
以下是一些关于生成简历的信息: 有许多 AI 工具可以帮助您编写简历,例如: Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型自动生成简历,能为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 Rezi:受到超过 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的每个方面,包括写作、编辑、格式化和优化。 Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79 。您可以根据自己的需要选择最适合的工具。 GitHubDaily 开源项目列表中的相关项目: :功能强大的开源简历生成器,拥有简洁美观的 UI 设计,并支持导入与解析 PDF 简历文件,实时更新简历数据。 智慧招聘中的相关功能: 基于岗位职责、候选人要求等信息,自动生成专业化的岗位描述(JD)。 生成高吸引力的招聘宣传内容,包括公司介绍、岗位亮点、职业发展机会等,并为不同招聘渠道优化语言风格与排版。 通过文档解析服务以及 GLM4 对候选人简历内容进行智能解析,将候选人的相关信息转化为结构化数据。 使用 GLM4 分析企业提供的岗位描述,将其解析为结构化的数据形式,并进行智能人岗匹配。 与候选人进行深入交流,核实其简历中的信息,了解其职业发展意向等,并从对话内容中提取关键信息实体。 动态生成专业问题与情境测试,结合语音、表情和语言分析评估候选人表现,并生成综合评分和能力评估报告。 根据面试过程中的对话记录,GLM4 自动生成面试总结报告,包含候选人适配度、能力评估和发展潜力等,为 HR 提供面试决策支持。
2025-02-04
生成数字人
以下是关于生成数字人的相关内容: 在剪映中生成数字人: 打开剪映右侧窗口顶部的“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择后软件会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,软件会生成对应音视频并添加到轨道中,左下角会提示渲染完成时间,可点击预览查看效果。 增加背景图片:删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”选择本地图片上传,将图片添加到视频轨道上(会覆盖数字人),拖动轨道最右侧竖线使其与视频对齐,选中背景图片轨道,拖动图片角放大到适合尺寸,并将数字人拖动到合适位置。 增加字幕:点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。完成后点击右上角“导出”按钮导出视频备用。 制作数字人的工具: HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关使用条款和隐私政策,注意生成内容的版权和伦理责任。
2025-02-02
请推荐一款,可以快速生成电商服装模特的ai工具
以下为您推荐几款可快速生成电商服装模特的 AI 工具: 1. Stable Diffusion:如果您要开淘宝网店,可借助它初步制作展示商品。比如卖绿色淑女裙,先真人穿衣服拍照,处理好照片,选好 realisitic 真人照片风格的底模,再根据不同平台换头,通过图生图下的局部重绘选项卡涂抹替换部分,并设置好 prompts&parameters。 2. ComfyUI:这个工作流适用于电商服饰行业的换装、虚拟试穿等场景。首先生成适合服装的模特,可抽卡抽到满意的模特,加入 Redux 模型,强度不用太高,让提示词生效。然后进行高精度的换装,先预处理拼出 mask,再重绘 mask 区域。 3. 达摩院:支持虚拟换装、姿态编辑,您可以直接在 https://damovision.com/?spm=5176.29779342.d_appmarket.6.62e929a4w3xGCR 进行测试。
2025-02-02
图片识别
以下是关于图片识别的相关内容: 神经网络在图片识别中的应用: 对于印刷体图片的识别,通常会先将图片变为黑白、调整大小为固定尺寸,然后与数据库中的内容进行对比以得出结论。但这种方法存在多种问题,如字体多样、拍摄角度不同会引入例外情况,且整体是基于不断添加规则,对于复杂情况如围棋难以应对。神经网络专门处理未知规则的情况,其发展得益于生物学研究和数学的支持,能够处理如手写体识别等未知情况。推荐阅读《这就是 ChatGPT》一书,了解更多相关知识。 判断图片是否为 AI 生成: 要培养判断图片是否为 AI 生成的技能,需要训练大脑模型。对于不善于此的朋友,可以借助一些网站,如 ILLUMINARTY(https://app.illuminarty.ai/),通过对大量图片数据的抓取和分析来给出画作属性的判断可能性。但在测试中可能存在误判,如结构严谨的真实摄影作品可能被识别为 AI 作图,这是因为鉴定 AI 自身的逻辑算法不能像人类一样综合考虑各种不符合逻辑的表现。同时,介绍了通过画面风格、物品 bug 等细节辨别图像是否为 AI 生成的方法,但需注意 AI 在不断学习,这些方法可能随时失效。
2025-02-03
适合处理亚马逊电商图片的ai工具
目前在处理亚马逊电商图片方面,常见的 AI 工具包括 Adobe Photoshop 的 AI 功能、Canva 等。Adobe Photoshop 的 AI 功能可以帮助您进行图像的优化、修复和创意处理。Canva 则提供了丰富的模板和设计元素,方便您快速制作吸引人的电商图片。但具体选择哪种工具,还需根据您的具体需求和使用习惯来决定。
2025-02-02
deepseek如何处理图片
DeepSeek 的 JanusPro 模型将图像理解和生成统一在一个模型中,具有以下特点和处理方式: 统一 Transformer 架构:使用同一个模型就能完成图片理解和生成。 规模和开源:提供 1B 和 7B 两种规模,全面开源,支持商用,采用 MIT 协议,部署使用便捷。 能力表现:Benchmark 表现优异,能力更全面,7B 版本在 GenEval 和 DPGBench 中击败 OpenAI 的 DALLE 3 和 Stable Diffusion。 处理方式: 理解模式:用“超级眼镜”仔细看最大 384x384 大小的图片,还能读文字。 画画模式:用“魔法画笔”自己创作同样大小的图片。 训练方法:先自己看很多图画书学习(预训练),然后老师手把手教(监督微调),最后用“精华浓缩法”保存最好的学习成果。 Transformer 大一统架构: 理解部分:输入包括一张“Clean Image”(干净图像)和“Und.Prompt”(理解提示),经过处理后由大语言模型输出,再通过“Text DeTokenizer”(文本去标记器)处理得到响应。 生成部分:输入包括“Gen.Prompt”(生成提示)和一张“Noisy Image”(含噪图像),经过处理后在“Gen.Decoder”(生成解码器)中不断更新,最终完成图像生成。 模型地址: 模型(7B):https://huggingface.co/deepseekai/JanusPro7B 模型(1B):https://huggingface.co/deepseekai/JanusPro1B 下载地址:https://github.com/deepseekai/Janus
2025-02-02
怎么替换视频或图片中的人脸
以下是替换视频或图片中人脸的几种方法: 方法一:使用 SD 中的 Roop 插件 1. 安装 Roop 插件,安装时间较长需耐心等待。安装好后打开 SD 文件目录下的特定文件夹,在地址栏输入“cmd”并回车。 2. 在打开的 dos 界面中粘贴“python m pip install insightface==0.7.3 user”代码自动安装 insightface。若此阶段出错,建议下载最新的秋叶 4.2 整合包(6 月 23 号更新),在云盘后台回复【SD】可下载。 3. 安装完成后重新打开启动器,后台会继续下载模型,全程需科学上网。 4. 选用真实系模型“realisticVisionV20”,得到照片。 5. 启用 ROOP 插件,选择要替换的人物照片,面部修复选择“GFPGAN”,根据需求设置右边的参数。 6. 点击生成,若人脸像素偏低模糊,可将图发送到“图生图”,开较小重绘幅度,使用 controlnet 中的 tile 模型进行重绘。 方法:使用 TecCreative 工具 1. 对于图片换脸,仅需上传原始图片和换脸图片,然后点击开始生成。注意图片大小上限 5M,支持 JPG、PNG 格式。 2. 对于视频换脸,上传原始视频和换脸图片后点击生成。 方法:使用快捷工具中的 facefusion 1. 点击快捷工具中顶部的“JupyterLab”打开工具,通过终端启动 facefusion。 2. 点击顶部的“+”号选项卡,新打开一个终端窗口。 3. 在终端区域启动终端选项卡,输入 3 条命令: 输入“ls”并按回车查看文件列表。 输入“cd facefusion”并按回车进入程序目录。 输入“python./run.py executionproviders cuda cpu”启动程序。 4. 当出现提示信息说明启动成功。 5. 打开 facefusion 软件,返回实例列表,点击自定义服务按钮,通过新的浏览器窗口访问 facefusion 的 UI 界面。 6. 在软件界面上传准备好的图片、视频,在右侧查看预览效果,点击开始按钮执行换脸处理。处理完成后在输出位置下载处理后的视频。 特别提醒,此类插件需谨慎使用,切勿触犯法律。如果想要 Roop 插件,可以添加公众号【白马与少年】,回复【SD】即可。推荐使用最新的秋叶整合包,出错概率最小,另外,科学上网很重要。
2025-02-01
怎么把视频或图片中的人脸进行替换,生产新的合成图片或视频
要把视频或图片中的人脸进行替换,生成新的合成图片或视频,可以参考以下方法: 1. 利用 TecCreative 创意工具箱: 图片换脸:仅需上传原始图片和换脸图片,即可一键实现素材换脸。操作指引为上传原始图片——上传换脸图片——点击开始生成。注意图片大小上限 5M,支持 JPG、PNG 格式。 视频换脸:自动识别视频中的人脸,并将其替换为选择的脸部。操作指引为上传原始视频——上传换脸图片——点击生成。 2. 实战方法: 点击快捷工具中顶部的 JupyterLab,打开这个工具。通过终端输入命令启动 facefusion: 点击顶部的 + 号选项卡,新打开一个终端窗口。 点击终端区域,启动一个终端的选项卡。 在打开的终端窗口中,输入 3 条命令做 3 件事情: 查看文件列表。输入 ls 并按回车,显示当前位置所在目录下的文件列表。 进入 facefusion 目录,输入 cd facefusion 并按回车,进入程序目录。 启动 facefusion。输入:python./run.py executionproviders cuda cpu 启动程序。注意后面的参数 executionproviders cuda cpu 非常重要,如果不加 cuda,则默认不使用 GPU 能力,推理将非常慢。 当出现提示信息时,说明启动成功。 打开 facefusion 软件,需要返回实例列表,点击自定义服务按钮,会打开一个新的浏览器窗口。 在 facefusion 软件界面上,上传准备好的图片、视频后,在右侧可以看到预览效果。点击下方的开始按钮,执行换脸处理。执行完成后,在输出的位置,会出现处理后的视频,输出窗口的右上角有一个下载按钮,点击它可以导出变量后的视频到本地。
2025-02-01