Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

我想用AI做高质量高清图片,我应该怎么做

Answer

如果您想用 AI 做高质量高清图片,可以参考以下方法:

  1. 了解默认分辨率:在 Stable Diffusion 中,AI 出图的默认分辨率为 512x512,用于商业通常不够。
  2. 注意初始分辨率:初始分辨率不宜过高,例如 1600x840 的分辨率可能导致出图时间长和构图问题。
  3. 运用高清修复:在文生图功能中有内置的高清修复(Hires-Fix)功能。将初始分辨率设置为 800x420 时,选择放大倍率为 2,可将分辨率放大至 1600x840。理论上放大倍率越高图片越清晰,但受电脑配置和显卡显存影响。放大算法如 R-ESRGAN 4x+Anime6B 常用于二次元绘图,写实类风格可选择 R-ESRGAN 4x+。
  4. 固定图片种子值:先以 800x420 画一张图,获取其种子值并填入随机数种子以固定图片。
  5. 底图制作:对于游戏截图升级为高质量图片,可在游戏内直接截图作为图生图的底层素材。为使底图清晰、拍摄自由,在 UE4 引擎游戏中可使用常用调整画质代码,如 r.ViewDistanceScale 10、r.ForceLOD 0、foliage.LODDistanceScale 10 等,并通过 ToggleDebugCamera 实现自由相机,使用 HighResShot 1920X1080(尺寸可调节)进行高品质截图。

通过这些技巧,您就可以得到足以商用的高清图片素材。

Content generated by AI large model, please carefully verify (powered by aily)

References

【SD】如何画出商用级别的高清大图

作者:白马少年介绍:SD实践派,出品精细教程发布时间:2023-05-04 21:00原文网址:https://mp.weixin.qq.com/s/zy0MyjCUxCF1C-WC6cUdBg在Stable Diffusion中,AI出图的默认分辨率为512x512,这也是大多数模型训练的尺寸。这个分辨率出的图运用到商业上显然是不够的,我们通常的做法是提高分辨率,增加提高精细度的关键词等等。但是,直接拉高分辨率的做法不仅会让我们的出图效率变低,也会使构图出现问题。这张图是在1600x840的分辨率下绘制的,不仅出图时间很长,而且在一个画面中出现了两个人物,所以,初始的分辨率不易过高。那么,我们用什么方法来提高最终的出图分辨率呢?一、高清修复在文生图功能中,有一个内置的高清修复(Hires-Fix)功能,可以看到当我们将初始分辨率设置为800x420时,选择放大倍率为2,高清修复可以将我们的分辨率放大至1600x840。理论上放大倍率越高,图片就会越清晰,这里的倍数最高可以到4倍,但是到底能不能画出来,就和你的电脑配置、显卡显存息息相关了。我们先用800x420画一张图,在生成图的下方可以看到这张图片的种子值。然后将数字填入随机数种子里,这样就能固定这张图片。接下来我们选择高清修复,放大两倍,放大算法选择R-ESRGAN 4x+Anime6B。这个算法通常是二次元绘图用的,如果是写实类的风格,可以选择R-ESRGAN 4x+。

【SD】如何画出商用级别的高清大图

它的操作非常简单,调整好放大倍率就可以直接放大了。它的原理和市面上的其他图片放大的原理一样,并不是重绘,只是单纯的变清晰,所以缺失掉的细节是不会补全的。如果原本就是一坨,那放大后也就是清晰的一坨。对比一下原图、SD放大和后期处理放大,从嘴唇上就可以看出它们的区别。虽然后期处理的放大,在细节上肯定不如重绘的效果好,但是它胜在简单、方便、速度快、可以处理任何图片,如果要求不高,也是很好用的一个功能。以上就是关于AI绘制高清图的四种方法,通过这些技巧我们就可以得到足以商用的高清图片素材啦。-END-白马与少年Stable Diffusion、Blender等学习心得分享139篇原创内容(持续更新中)公众号微信扫一扫关注该公众号

从游戏截图升级到KV品质,AI居然可以这样用!

1.游戏内直接截图要使AI出图和游戏调性匹配,使用游戏内截图作为图生图的底层素材自然是最优选择,使用游戏截图有以下优点1、创意来源快,只需要在游戏体验时将自己觉得有意思的玩法截图保存就好了,成为一名游戏摄影师拍拍拍例如以下方向2、出图光照氛围准确,无需加工直接喂给AI即可,即截即用。同时为了使底图更加清晰,拍摄更加自由,这里整理了一些UE4引擎游戏常用调整画质代码,如果在研发可以提供GM包体的情况下,或在引擎中,按~即可呼出控制台,启用这些功能常用的UE4游戏控制台代码:画质调整r.ViewDistanceScale 10r.ForceLOD 0foliage.LODDistanceScale 10自由相机ToggleDebugCamera高品质截图HighResShot 1920X1080(尺寸可调节)

Others are asking
如何学习AI
以下是新手学习 AI 的方法: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始学习,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-12-25
如何学习AI
以下是新手学习 AI 的方法: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始学习,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-12-25
有哪些常用的AI工具?他们分别的优点和弱点是什么?
以下是一些常用的 AI 工具及其优点和弱点: 邮件写作 AI 工具: Grammarly: 优点:易于使用,支持多种平台,适用于多种语言,提供语法检查、拼写纠正、风格建议和语气调整等功能。 网站:https://www.grammarly.com/ 弱点:暂未提及。 Hemingway Editor: 优点:界面简洁,重点突出,适用于改善写作风格和简洁性。 网站:http://www.hemingwayapp.com/ 弱点:暂未提及。 ProWritingAid: 优点:功能强大,支持多种平台和集成,特别适合专业写作者,提供全面的语法和风格检查,并提供详细的写作报告和建议。 网站:https://prowritingaid.com/ 弱点:暂未提及。 Writesonic: 优点:生成速度快,适合需要快速创作和灵感的用户,基于 AI 生成各种类型的文本,包括电子邮件、博客文章、广告文案等。 网站:https://writesonic.com/ 弱点:暂未提及。 Lavender: 优点:专注邮件领域,提供个性化建议和模板,帮助用户提高邮件打开率和回复率。 网站:暂未提及。 弱点:暂未提及。 生成 PPT 的 AI 工具: 爱设计: 优点:视觉效果更多,样式丰富,需付费,但有推广计划。 弱点:无明显劣势。 MindShow: 优点:免费模版多,操作方便。 弱点:视觉不够丰富。 闪击: 优点:相对简单。 弱点:语法复杂些,需付费。 Process ON: 优点:老用户多,除 PPT 外其他功能众多。 弱点:需付费。 WPS AI: 优点:不仅支持 PPT、还有 Word、Excel,视觉效果很好,暂时完全免费。 弱点:需要申请资格。 图生图 AI 产品: Artguru AI Art Generator: 优点:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 弱点:暂未提及。 Retrato: 优点:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 弱点:暂未提及。 Stable Diffusion Reimagine: 优点:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 弱点:暂未提及。 Barbie Selfie Generator: 优点:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果超级好。 弱点:暂未提及。 需要注意的是,这些 AI 工具在使用过程中可能会存在一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。
2024-12-25
案例:借助人工智能技术的诈骗 一、案例材料 1.背景资料 (1)近期全国范围内出现了一种新型电信诈骗——AI换脸诈骗,该诈骗利用AI人工智能,通过“换脸”和“拟声”技术模仿受害人的朋友或亲戚的声音和外貌,以此骗取受害者的信任,进行网络诈骗,近日包头警方就根据一起典型案例,向大家发出了防范AI换脸诈骗的警示。 财联社5月22日讯,据平安包头微信公众号消息,包头警方发布了一起利用人工智能(AI)实施电信诈骗的典型案例,一家福州市科技公司的法人代表郭先生竟在短短10分钟内被骗走了430万元人民币。
以下是关于 AI 的相关内容: 律师如何写好提示词用好 AI: 对于不具备理工科背景的文科生,可将 AI 视为黑箱,只需知道其能模仿人类思维理解和输出自然语言。AI 就像似人而非人的存在,与传统道教的驱神役鬼拘灵遣将有相似之处。提示词应是相对完善的“谈话方案”,成果在与 AI 的对话中产生,要接受其存在的“不稳定性”,并在对话中限缩自己思维的模糊地带。 AI 的应用场景: 医疗保健:包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:有产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:包含预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(未具体阐述)
2024-12-25
AI和教育的结合
AI 与教育的结合可以从以下几个方面来实现: 教育政策的改革建议: 重新审视教育目标,从传统知识灌输转向培养创新思维、问题解决能力和终身学习能力。 使政策更灵活,适应技术和市场变化。 设立教育科技发展基金,鼓励校企合作,开发适应未来需求的教学内容和技术。 建立多学科交叉课程,培养学生宽广视野。 AI 技术融入教育体系的路径: 打破传统教育和高科技的隔阂,教师在教学中运用 AI 制定个性化学习计划、追踪学习进度并提供辅导建议。 学生学会与 AI 互动,使用辅助工具探索学术概念。 学校与技术公司合作,更新硬件设施,保持软件平台与时俱进。 加大对教师的 AI 培训力度。 社会层面的应对措施: 激发社会对教育的关注和投资,通过公私合作模式吸引私人资本投入创新项目。 加强对失业人员和低技能工人的再教育与培训,减少职业结构转换的冲击。 利用在线平台提供免费或低成本职业培训课程。 确保 AI 技术的应用不加剧教育不平等,政府公平分配资源。 构建开放共享的教育资源平台,提高资源使用效率。 在具体的应用场景方面,包括但不限于以下内容: 提前收集教育领域的需求,针对性地提供产品和服务,如办公提效、家校沟通、个性化教育、心理疏导、备课体系、作业批改、出题建议、建立孩子的成长体系记录、分析学生行为并给出策略、教师模拟培训、公开课备课辅助等。 利用 AI 进行学科教育辅助,如朗读评判、文生图和文生视频辅助备课等。 企业可以提供具身智能、3D 眼镜、AI 绘本、AI 图书、学习机、飞书多维表格、蚂蚁智能体、Coze 智能体、Zeabur 云平台、0 编码平台、大模型(通义、智谱、kimi、deepseek 等)、编程辅助等相关产品和服务。 需要注意的是,在使用 AI 辅助教育时,由于其可能产生幻觉,对于关键数据应根据其他来源仔细检查。
2024-12-25
AI直播的优势
AI 直播具有以下优势: 1. 盈利方式多样: 直接销售数字人工具软件,包括实时驱动和非实时驱动两类,实时驱动价格较高,非实时价格较低但效果差,市场价格较混乱。 提供数字人运营服务,按直播间成交额抽佣。 2. 适用品类和场景特定: 适用于不需要强展示的商品,如品牌食品饮料;适用于虚拟商品,如门票、优惠券等。 电商直播中店播效果较好,数据能保持跟真人相近。 不适用于促销场景,因涉及主播话术、调动氛围等能力。 3. 技术和市场格局: 长期看技术上无壁垒,但目前仍有技术门槛,如更真实的对口型、更低的响应延迟等。 市场不会一家独大,可能有 4 5 家一线效果的公司,大多为二三线效果公司。 能把客户服务好、规模化扩张的公司更有价值,而疯狂扩代理割韭菜、不考虑客户效果的公司售后问题多。 有资源和业务的大平台下场可能带来降维打击,如提供全环节服务会绑定商家。 一些品牌如欧莱雅、YSL、兰蔻、李宁、北面等会使用 AI 驱动的虚拟主播进行自播,但由于技术尚未达到真人直播水平,通常只在午夜时段排期。虚拟形象有 3D 卡通风格和 2D 拟真人风格,预设动作库和真实语音表现,直播互动流程相对固定,商品展示以图片为主。但虚拟主播无法与产品接触,测评结果缺乏真实性,目前更像是花瓶,负责基础性介绍和互动问答。
2024-12-25
把图片变成高清的工具
以下是一些可以将图片变成高清的工具及相关介绍: 悠船: 进入对应的图片,常用的图片调整内容包括变化、高清、重塑、扩图等。 变化:能让生成的图片产生一定改变,细微表示改变幅度小,强烈则表示改变幅度大。 高清:放大图片,“直接”表示啥都不变直接出高清,“创意”表示在图片基础上进行微小的优化调整。 风格变化:基于生成的图片作为上传图片(垫图)再创作。 拓展:可对图片进行上下左右的拓展。 缩放:指的是镜头,如 2x 表示镜头拉远 2 倍。 局部重绘:可以选择一个区域进行修改,建议选择区域大一些,太小无法修改。 使用图片即垫图,使用风格即参考图片风格,使用提示词即复制图片的提示词。 清影: 输入一张图片和相应的提示词,清影大模型将根据提示把图片转变为视频画面。也可以只输入一张图片,模型将自行发挥想象力把图片扩展为一段有故事的视频。 技巧:选用尽可能清晰的图片,上传图片比例最好为 3:2(横版),支持上传 png 和 jpeg 图像。如果原图不够清晰,可采用分辨率提升工具将图片变清晰。提示词要简单清晰,可以选择不写 prompt 让模型自己操控图片动起来,或者明确想动起来的主体,并以“主体+主题运动+背景+背景运动”的方式撰写提示词。如果不明确模型如何理解图片,可将照片发送到清言对话框进行识图明确主体描述。
2024-12-07
我输入模糊的图片,可以生成一副相对高清的图片,请问用什么AI工具
以下是一些可以将模糊图片生成相对高清图片的 AI 工具: 1. Magnific:https://magnific.ai/ 2. ClipDrop:https://clipdrop.co/imageupscaler 3. Image Upscaler:https://imageupscaler.com/ 4. Krea:https://www.krea.ai/ 更多工具可以查看网站的图像放大工具库:https://www.waytoagi.com/category/17 这些 AI 画质增强工具都具有不同的特点和功能,可以根据您的具体需求选择合适的工具进行使用。 另外,如果您想从游戏截图升级到 KV 品质,可以参考以下 AI 工具使用方法: 目前市面上有线上和线下本地部署的两种 AI 。线上的优势为出图速度快,不吃本地显卡的配置,且无需自己下载动辄几个 G 的模型,还能看其他创作者的制作的图片,但为了节约算力成本他们只支持出最高 1024X1024 左右的图,制作横板、高清等图片就会受限。线下部署的优势为可以自己添加插件,不卡算力,出图质量高于线上平台,但是使用期间电脑基本处于宕机状态,如果配置不高的话还会出现生成半天之后爆显存的情况,导致出图失败。 所以我们这里充分发挥线上和线下平台的优势。线上用于找参考、测试模型,线下作为主要的出图工具。在线上绘图网站的绘图广场上发现自己想要的画风,点击创作,会自动匹配创作的使用的模型 lora 和 tag。截取一小张游戏人物作为底图,目的是将线上平台有限的算力全部堆在人物身上。多批次、多数量地尝试不同的画风,得出最符合游戏的一款模型+lora 组合。最后在 C 站(https://civitai.com/ )上下载对应模型到本地,加载部署后就可以开始正式生图了! 关于 AI 去水印的工具,目前市面上有一些不错的选项: 1. AVAide Watermark Remover:这是一个在线工具,使用 AI 技术从图片中去除水印。它支持多种图片格式,如 JPG、JPEG、PNG、GIF 等。操作简单,只需上传图片,选择水印区域,然后保存并下载处理后的图片即可。这个工具还提供了其他功能,如去除文本、对象、人物、日期和贴纸等。 2. Vmake:这个工具同样提供 AI 去除图片水印的功能。用户可以上传最多 10 张图片,AI 会自动检测并移除图片上的水印。处理完成后,用户可以选择保存生成的文件。这个工具适合需要快速去除水印的用户,尤其是那些需要在社交媒体上分享图片的用户。 3. AI 改图神器:这个工具提供 AI 智能图片修复去水印的功能,可以一键去除图片中的多余物体、人物或水印,不留任何痕迹。支持直接粘贴图像或上传手机图像,操作简单方便。 这些工具各有特点,可以根据您的具体需求选择最适合您的去水印工具。
2024-11-29
我输入模糊的图片,可以生成一副相对高清的图片,请问用什么工具
以下是一些可以将模糊图片生成相对高清图片的工具和方法: 1. 图像高清修复,无损放大 N 倍: 整个流程分为输入原始图像、修复图像、放大并重绘图像三部分。 图像输入:添加 Load Image 节点加载图像,不建议上传大分辨率图片,以免处理时间过长。 图像高清修复:使用 Checkpoint 大模型如 Iceclear/StableSR 搭配 Stable SR Upscaler 模型,并设置合适的提示词,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)(杰作),(最高品质),(逼真的),(非常清晰);3D,卡通,动漫,素描,(最差质量),(低质量)。 图像高清放大:使用 realisticVision 底膜,搭配提示词反推 node 和 tile ControlNet 提升画面细节感,再用合适的高清放大模型进行二次放大。 2. 星流一站式 AI 设计工具: 顶部图像编辑工具中的高清放大功能,支持最大尺寸为 4K(40964096)。 放大倍率:按照倍率进行放大。 放大参数:包括变化幅度、风格类型、细节丰富度、清晰度、相似度和提示词等。 3. 【SD】: 面部修复:可使用 GFPGAN 面部修复功能,将参数拉到 1 即可。 背景去除:需安装 REMBG 插件,模型选 u2net,可通过调整 Erode size、Foreground threshold、Background threshold 等参数去除黑边。还有专门的服装和动漫抠图模型。 您可以根据自己的需求和操作习惯选择适合的工具。
2024-11-29
好用的图片无损高清放大
以下是关于图片无损高清放大的相关内容: 图像修复放大的流程分为三部分: 1. 图像输入:添加 Load Image 节点加载图像,不建议上传大分辨率图片,因其处理时间长。 2. 图像高清修复:使用 Iceclear/StableSR 等模型进行高清修复并 2 倍放大,提示词应包含想要达到的目的内容,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)等。全程采取两次高清修复,第一次修复原始图像分辨率并放大。 3. 图像高清放大:针对第一次放大修复后的图像进行二次修复,用 realisticVision 底膜,使用提示词反推 node 对图像进行画面提示词提取,搭配 tile ControlNet 提升画面细节感,用合适的高清放大模型进行二次放大。 【SD】超清无损放大器 StableSR: 作者为白马少年,发布于 2023 年 6 月 10 日 20:01,原文网址:https://mp.weixin.qq.com/s/J0HIF2U1siAen6FWNA67A 。 之前讲过在 Stable Diffusion 中绘制高清大图的方式,主要用到“脚本”和“后期处理”,其中脚本以“Ultimate SD upscale”为主,会改变原图细节;“后期处理”是 Stable Diffusion 自带的扩图功能,适用于所有图片,可按原图内容扩图,但无法还原原图不清晰的地方。 今天讲的 StableSR 可算作“后期处理”的上位替代品,能在尽可能保留原图的情况下更精致地还原原图。安装方式:在扩展面板中搜索 StableSR 直接安装,或将下载好的插件放在“……\\sdwebuiakiv4\\extensions”文件夹下,安装完成后重启 webUI 即可在脚本中找到。 修复需使用 StabilityAI 官方的 Stable Diffusion V2.1 512 EMA 模型,放入 stablediffusionwebui/models/StableDiffusion/文件夹;StableSR 模块(约 400M 大小)放入 stablediffusionwebui/extensions/sdwebuistablesr/models/文件夹;VQVAE(约 750MB 大小)放在 stablediffusionwebui/models/VAE 中。 测试:用一张网上找的分辨率为 512x768 的神仙姐姐照片,“Ultimate SD upscale”脚本放大哪怕重绘幅度只开到 0.1,人物细节有变化但磨皮严重,重绘幅度开到 0.4 则变化很大;“后期处理”放大 3 倍,眼神变锐利但头发仍模糊;StableSR 放大时,先调整大模型和 VAE,打开脚本下拉选择“StableSR”,模型选择对应模型,放大倍数为 3,勾选“pure noise”。
2024-11-12
我想要个视频AI模糊变高清的工具
以下为您介绍两款可将视频 AI 模糊变高清的工具: 1. Topaz Video AI: 解压对应文件,推荐使用绿色版(安装包已在网盘,可直接下载)。 右键管理员运行 VideoAIportable.exe 文件。 导入处理好的视频。 主界面左边是原视频,右边是待处理视频,下面是对应的视频轨道。 右边部分是主要对视频处理的方式,预设部分主要有放大视频、提升画质、提升帧率等功能。 视频部分保持默认,稳定 AI 用于画面稳定和减少抖动,模式分为自动裁切和完整帧,强度在 60 左右,抖动需开启,次数一般选择 2。 消除运动模糊 AI 按字面意思操作,帧插值 AI 可识别帧之间进行修复替换,增强 AI 能选择不同模型对视频整体优化,包括面部、去噪、锐化提升等。 一般会选择稳定+运动模糊,若电脑配置不行,可一个一个操作,但速度较慢。 2. FMANet: 能将模糊低分辨率视频恢复为清晰高分辨率。 可解决快速移动物体或摄像机引起的视频模糊。 智能理解物体运动,改善画质,去除模糊。 相关网址:http://kaistviclab.github.io/fmanetsite/ 、https://x.com/xiaohuggg/status/1746160750610075689?s=20
2024-10-22
能介绍几个关于图片处理及高清背景图相关的AI吗
以下为您介绍一些关于图片处理及高清背景图相关的 AI: RMBG1.4 去除照片背景模型:高精度背景去除,适用于电商、广告等场景。支持视频背景批量去除,提供蒙版输出功能。云端处理速度快,性能卓越。链接:https://github.com/ZHOZHOZHO/ComfyUIBRIA_AIRMBG 、https://x.com/xiaohuggg/status/1755075272410538450?s=20 Medivis 的 SurgicalAR 手术应用:将 2D 医疗图像转化为 3D 互动视觉,提高手术精度。支持 3D 模型的放大、缩小、旋转,精确手术计划。链接:https://t.co/3tUvxB0L4I 、https://x.com/xiaohuggg/status/1755183564021473404?s=20 DALL·E 3 图像编辑器:即将推出的功能,增强图像生成一致性。链接:https://x.com/xiaohuggg/status/1755173835396239826?s=20 MiniCPM 端侧大模型:面壁智能与清华大学共同开发,支持手机端运行。优于现有模型,提供流式输出速度。 此外,以下人员在相关领域有所涉及: harry:兴趣学习,自媒体素材,自定义节点开发 古戈尔:视频,动画 二师兄:图像流制作,装修工程和建筑工程 fyu:生图 流云:ai 绘图视频产出 yangzec:学习多模态 AI 的使用和开发应用 凯叔 AI:插画设计 清墨.SALEX:日常工作 above:批量作图 ehhe:绘画,视频,人像,电商背景图 kone:AI 商业应用 xman:自媒体创作 Alan:绘画和视频处理 在野:视频创作 tang:照片处理等 阿鲁:生产
2024-09-28
AI提示词怎么写才能让AI的回答更高质量
以下是一些写 AI 提示词以获得更高质量回答的方法: 1. 明确具体的描述:使用更具体、细节的词语和短语,避免过于笼统。 2. 添加视觉参考:在提示词中插入相关图片参考,提高 AI 理解意图和细节要求的能力。 3. 注意语气和情感:根据需求,用合适的形容词、语气词等调整整体语气和情感色彩。 4. 优化关键词组合:尝试不同的关键词搭配和语序,找到最准确表达需求的描述方式。 5. 增加约束条件:添加限制性条件,如分辨率、比例等,避免意外输出。 6. 分步骤构建提示词:将复杂需求拆解为逐步的子提示词,引导 AI 先生成基本结构,再逐步完善。 7. 参考优秀案例:研究流行且有效的提示词范例,借鉴写作技巧和模式。 8. 反复试验、迭代优化:通过多次尝试不同写法,并根据输出效果反馈持续优化完善。 在商业化问答场景中,提示词的作用是告诉全知全能的大语言模型,它是一个什么样的角色、要专注于哪些技能,让其按照您的想法变成所需的“员工”。例如设定角色为“美嘉”,按照其人设、背景和对话风格做设定。 此外,还有一些优化提示词的技术和成果,如通过链式思维等技术自动改进提示词,提升回答质量,具有示例增强、标准化、提示重写、预填充内容等功能特点,能显著提高模型的易读性和准确性,测试显示多标签分类准确率提升 30%,摘要任务可完全遵循字数要求。若提示缺少示例,Claude 还会自动生成合成示例,简化提示构建过程。
2024-12-03
有没有可以根据我的需求,自动生成搜索高质量query的prompt
以下是为您整理的关于自动生成搜索高质量 query 的 prompt 的相关内容: 1. JackeyLiu (JK): 作为 ChatGPT 的深度用户,为节省每次构建 Prompt 的力气,打算写一个基于初始问题自动生成优质 Prompt 的 Prompt。其构建 Prompt 的方法论来自于。 2. 做调研: 生成调研报告的 prompt 构建过程艰难,经过多次尝试和迭代,包括试用 webpolit 和 web browsing 等,最终在群里大佬的建议下,通过在需要搜索网络信息的章节处打上标签让 GPT4 自主搜索信息来生成内容,并选择使用 webpolit 插件,放弃了 web browsing 模式,完成了调研报告的 prompt。且在解决问题前,用前几版 prompt 帮团队和同学完成了 3 篇调研报告。 3. 生成式 AI:下一个消费者平台: 这种根据特定需求生成策划过的选项列表的搜索方式在产品推荐方面有价值,例如为特定的宠物推荐狗粮或特定条件下推荐服装。在企业内部搜索应用中也有巨大潜力,如允许用户查询视频会议记录。
2024-08-09
做 video lip sync 的高质量项目有哪些?
以下为一些关于 video lip sync(视频唇形同步)的高质量项目介绍: 谷歌的“Generating audio for video”项目正在开展进一步研究。该项目具有以下特点: 1. 与现有视频音频解决方案相比,它能够理解原始像素,并且添加文字提示是可选的。 2. 系统无需手动调整生成的声音和视频,避免了对声音、视觉效果和时间等不同元素进行繁琐的调整。 3. 但仍存在一些限制因素需要解决,比如音频输出质量依赖于视频输入质量,视频中的假象或失真超出模型训练分布范围会导致音频质量明显下降。 4. 正在改进涉及语音的视频唇形同步。V2A 尝试从输入的文稿生成语音并与角色的唇形动作同步,但配对的视频生成模型可能不受文稿条件的限制,这会造成不匹配,导致唇形同步不自然。 需要注意的是,这一项目仍在不断完善和改进中。
2024-07-24
有哪些高质量 sft 多轮对话数据集
高质量的SFT(Supervised FineTuning)多轮对话数据集在训练对话系统时至关重要。以下是一些公认的高质量多轮对话数据集: 1. ConvAI2 Dataset ConvAI2数据集是基于PersonaChat数据集构建的,用于ConvAI2挑战赛。它包含了多轮对话,且每个对话都有明确的角色和背景信息,有助于训练更具个性化的对话系统。 链接: 2. DSTC系列数据集 DSTC(Dialogue State Tracking Challenge)系列数据集是多轮对话系统研究中的经典数据集,涵盖了多种任务和领域,如任务导向对话、对话状态跟踪等。 DSTC2: 专注于餐馆预订任务。 DSTC3: 扩展了DSTC2,增加了更多的任务和对话状态。 DSTC6: 涉及对话行为理解和对话状态跟踪。 链接: 3. MultiWOZ Dataset MultiWOZ(MultiDomain Wizard of Oz)是一个大规模、多领域任务导向对话数据集,涵盖了多个对话场景,如餐馆预订、酒店预订、出租车预订等。数据集中的对话是由实际用户和客服人员通过WizardofOz方法生成的,质量较高。 链接: 4. Ubuntu Dialogue Corpus Ubuntu Dialogue Corpus是一个大规模、多轮对话数据集,基于Ubuntu的IRC日志。数据集包含技术支持对话,适用于训练技术支持和问答系统。 链接: 5. CoQA Dataset CoQA(Conversational Question Answering)数据集用于对话式问答系统的训练。数据集中每个对话包含一个给定的文本和相关的问题回答对。 链接: 6. TopicalChat Dataset TopicalChat数据集是微软创建的,用于开发和评估开放领域对话系统。数据集包括不同主题的多轮对话,涉及科技、娱乐、体育等多个领域。 链接: 7. PersonaChat Dataset PersonaChat数据集包含多轮对话,每个对话参与者都有预定义的个人信息或“persona”,旨在开发更具个性化和情感的对话系统。 链接: 总结 这些数据集覆盖了多种对话场景和任务类型,是开发高质量对话系统的重要资源。在使用这些数据集进行训练时,可以结合具体的应用场景和需求,选择合适的数据集进行SFT。
2024-06-13
为什么说“当下的人工智能技术,只有高质量输入,才能得到高质量输出?”
之所以说"当下的人工智能技术,只有高质量输入,才能得到高质量输出",主要有以下几个原因: 1. 数据驱动的本质 现有的人工智能技术,尤其是深度学习技术,高度依赖于训练数据的质量。模型的学习能力、推理能力都来源于训练数据。如果输入的训练数据质量不佳(含噪声、偏差、覆盖面不全等),模型很难学习到有效的模式,自然也难以产出高质量的输出结果。 2. 无监督学习的局限性 目前主流的人工智能方法大多采用无监督学习的范式,通过自主发现数据中的模式和规律进行建模。这种方式对训练数据的质量要求更高,因为只有高质量数据才能真实反映潜在的知识模式。低质量数据往往会导致模型学习到错误规律。 3. 缺乏逻辑推理能力 现有人工智能系统缺乏对因果逻辑的深刻理解能力,无法对输入数据的合理性和正确性进行有效判断,从而依赖于训练数据的质量来保证输出质量。 4. 黑箱特性和可解释性不足 深度学习模型本质上是一个黑箱,我们难以判断其内在机制是否符合逻辑,也无法完全解释模型输出的依据和原因。因此只能最大程度地保证输入质量来期望获得理想输出。 5. 显式知识和常识缺失 大多数人工智能模型缺乏对现实世界的显式知识和常识理解能力,无法对输入数据中的明显错误或矛盾进行识别和纠正,从而也需要高质量的输入数据作为前提。 总的来说,当前人工智能技术在自主学习和逻辑推理能力上还有不足,更多依赖于训练数据的质量。只有保证高质量的输入,才能最大限度地利用人工智能系统的优势,获得令人满意的输出结果。这也是人工智能领域需要继续改进的重要方向之一。
2024-05-02
目前大部分的高质量的ai图片都是那些网站,是不是都要付费?
目前大部分的高质量的 AI 图片主要来自于例如 Midjourney、DALL·E 等。这些工具通常需要付费使用,但是,也有一些免费的 AI 绘画工具,但是它们的图片质量可能不如付费工具高。
2024-04-18
AI生成图片的app有哪些?
以下是一些 AI 生成图片的 APP 和工具: 1. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,能将上传的照片转换为芭比风格,效果很好。 此外,还有以下用于生成海报或图片的工具: 1. Canva(可画):https://www.canva.cn/ ,是受欢迎的在线设计工具,提供大量模板和设计元素,AI 功能可帮助选择合适颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ ,稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ ,简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,智能建议功能可帮助快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ ,通过简单拖放界面,可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,简化设计流程。 文生图工具方面: 1. DALL·E:OpenAI 推出的文生图工具,能根据输入文本描述生成逼真图片。 2. StableDiffusion:开源的文生图工具,可生成高质量图片,支持多种模型和算法。 3. MidJourney:因高质量图像生成效果和用户友好界面设计而受广泛欢迎,在创意设计人群中尤其流行。 您可在 WaytoAGI 网站(https://www.waytoagi.com/category/104 )查看更多文生图工具。但需要注意,这些工具可能存在一些局限,如偶尔性能不稳定、生成内容不当等问题。
2024-12-25
给我几个免费的图片转视频工具,主要针对于有人物的图片
以下为您推荐几个免费的图片转视频工具,主要针对有人物的图片: 1. Viggle: 网址:http://viggle.ai 有免费额度。 功能: /mix:将角色图像混合到动态视频中。 /animate:使用文本运动提示为静态角色设置动画。 /ideate:纯粹从文本创建角色视频。 /character:通过文本提示创建角色并将其动画化。 /stylize:使用文本提示符重新设计角色的样式并将其动画化。 操作步骤: 上传一张字符清晰的图片。 描述您希望角色执行的动作(或从https://viggle.ai/prompt中复制动作提示词)。 2. Dreamina: 网址:https://dreamina.jianying.com/aitool/home?subTab 优点:不需要🪜,每天有免费额度。 注册:抖音号或手机号。 时间:5min 3. Sora: 网址:https://openai.com/sora 优点:发布的成果好,集成在 openai 一套里可用。 限制:需要🪜,需要 gmail 注册,需要订阅后才能使用。 时间:30 60min 价格:GPT 4 20$一个月
2024-12-25
给你一张图片,在一个图库中找到相似度最高的几张图
以下是在图库中找到与给定图片相似度最高的几张图的方法: 1. 寻找两张图:使用童星吴磊的图片,最初尝试了哈利波特的扮演者,但因 InsightFaceSwap 规则限制未采用。 2. MJ 绘图:较为简单,加上简单相机参数、写实风格,使用 MJ v 6.0 绘图,可按需求调整 9:16 的比例。直接描述情况下,MJ 画图效果尚可,可根据需要增加参数。 3. 图片裁剪:直接使用 PS 进行裁剪,也可选用自己顺手的工具,所选照片尽量能一刀完整分割两个人。 4. 使用 InsightFaceSwap 处理图片: 输入“/saveid”,idname 可随意填写,如“child”,上传原图。 换脸操作输入“/swapid”,id=child,上传分割好的图。 选择觉得像的图,效果不好可循环操作,但注意插件每日免费使用次数。 5. 拼接:重新利用 PS 把两张图片拼接回来。但相似程度可能不太理想,插件对老外的脸识别度较好。
2024-12-25
我想做图片相似度比对,是否有解决方案
以下是关于图片相似度比对的一些解决方案: 在 Stable Diffusion 中,可以使用【X/Y/Z plot】脚本来做参数对比。将 X 轴设置为提示词相关性,取值范围是 1 30(每次增加 5);Y 轴设置为重绘幅度,取值范围是 0 1(每次增加 0.2)。通过生成多张图片进行对比,发现提示词相关性在 6 11 中间为最佳,重绘幅度的大小可控制生成图与原图的相似度,如 0.4 时与原图较接近。还可以利用绘图功能进行局部修改,如增加红色眼镜、去掉衣服图案、更换人物头部等。 对于 MJ 绘图,加上简单的相机参数和写实风格,使用 MJ v 6.0 绘图,可根据需求调整图片比例。 图片裁剪可使用 PS 等工具,选择能完整分割所需部分的图片。 使用 InsightFaceSwap 处理图片时,输入“/saveid”上传原图,换脸操作输入“/swapid”,选择效果较好的图片,但注意插件每日免费使用次数。 最后利用 PS 把处理好的图片拼接回来。
2024-12-25
从图片生成 prompts
从图片生成 prompts 的方法如下: 可以参考以下生成的提示词示例: 远景,三分法构图,俯视视角,数字绘画,云雾缭绕的山谷,群山连绵起伏,山谷间云雾缭绕,阳光透过云层洒在山间,形成光与影的对比,模拟观众的视线逐渐接近这片土地,新印象派风格特征,使用数字画笔和渐变工具ar 16:9v 6.1 远景,中心对称构图,俯视视角,摄影风格,云雾中的山谷,山峦在云雾中若隐若现,山谷中隐约可见的河流蜿蜒流淌,云雾的流动感和山的静态形成对比,现实主义风格特征,使用长焦镜头和景深控制技术ar 3:2v 6.1 远景,对角线构图,俯视视角,水墨画风格,云雾缭绕的山谷,山峦线条流畅,云雾以墨色深浅表现,山谷中的云雾仿佛在流动,给人以动态的视觉感受,中国山水画风格特征,使用毛笔和水墨渲染技术ar 2:3v 6.1 “Prompt”是指提供给 Midjourney Bot 解读来生成图像的短文本短语。一个基本的提示可以只是一个单词、短语或表情符号。更高级的 Prompts 可以包括一个或多个图片 URL、多个文本短语以及一个或多个参数。图片 URL 始终位于 prompt 的最前面,以影响完成结果的风格和内容。参数需要放在提示语的末尾。 藏师傅教您用 AI 三步制作任意公司的周边图片: 获取 Logo 图片的描述。 根据 Logo 图片的描述和生成意图生成图片提示词。 将图片和提示词输入 Comfyui 工作生成。例如:将第一步生成的提示词填入{图像描述}位置,将您想生成的周边填入{周边描述}部分。给出类似“ The pair of images highlights a logo and its realworld use for a hitech farming equipment;this logo is applied as a black and white tattoo on lower back of an inmate ”的提示词示例。
2024-12-24
优质的生成图片的AI
以下是为您提供的优质生成图片的 AI 相关信息: 图生图产品: 目前比较成熟的通过输入图片生成类似图片的 AI 产品主要有: 1. Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果超级好。 这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出。但仍有一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。 文生图工具: 文生图工具是一种利用人工智能技术生成图片的工具。它通过分析输入的文本描述,使用深度学习算法生成相应的图片。目前,市场上有许多文生图工具,其中一些比较受欢迎的工具包括: 1. DALL·E:DALL·E 是 OpenAI 推出的一款文生图工具,它可以根据输入的文本描述生成逼真的图片。 2. StableDiffusion:StableDiffusion 是一款开源的文生图工具,它可以生成高质量的图片,并且支持多种模型和算法。 3. MidJourney:MidJourney 因其高质量的图像生成效果和用户友好的界面设计而受到广泛欢迎,并且在创意设计人群中尤其流行。 您可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。 判断图片是否为 AI 生成: 如果您不善于判断一张图片是否为 AI 生成,可以借助一些网站。例如使用 AI 来鉴别 AI 绘图性质的网页:ILLUMINARTY(https://app.illuminarty.ai/)。但在测试过程中,可能会出现一些误判,比如有些结构严谨的真实摄影作品,反而会被识别为 AI 作图。这是因为鉴定 AI 自身的逻辑算法,并不能像人类一样综合去考虑不符合人的逻辑的各种表现。
2024-12-23