直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

我做了一个视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作都糊了。 我现在有什么办法优化,对卡通角色五官重绘更清晰的情况下,还保留现实的照片背景。(用sd重绘的话是不是就丢失了)

回答

以下是一些可能有助于您优化视频的建议:

  1. 对于您提到的卡通角色动作模糊的问题,可以尝试使用 Dreamina 工具,并将运动速度设为慢速,同时在 Prompt 里写轻微的动作描述,可能会有不错的效果。
  2. 由于 Dreamina 工具存在只有 8 帧和 720P 的限制,您可以使用 Topaz Video AI 将其增强到 24 帧和 4K。在 B 站搜索“Topaz Video AI 4.2.1”关键词能找到相关教程。增强完成后,再放到剪映里裁成 21:9 的比例。
  3. 对于卡通角色五官不清晰的情况,如果 AI 工具无法处理,可能需要使用传统的 AE 软件自己制作,比如普通的下沉位移动画。

需要注意的是,在某些情况下,如人物在水中下沉时,AI 视频可能会出现脸糊的情况,这种情况可能需要传统手段来解决。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

工具教程:清影

|文生视频|视频(纯享版)|视频(配音版)|PROMPT|<br>|-|-|-|-|<br>|7、阳光森林| | |在一片森林中,人视,参天大树遮蔽着太阳,树叶的缝隙中洒下一些阳光,丁达尔效应|<br>|8、土豆变薯条| | |广告拍摄视角,黄色背景,白色桌子上,画面中一个土豆被扔下来变成一份薯条|<br>|9、吗喽打工| | |Two monkeys in ragged clothes are typing on a computer in a colorful room,their eyes moving exaggeratedly as if telling a humorous story.The room is filled with bizarre decorations and toys,creating a dreamlike atmosphere.The camera uses a whimsical and ethereal style,following the monkeys with a handheld shot to capture their comical movements,occasionally switching to slow motion to highlight their exaggerated expressions.The lighting features a contrast of warm and cool tones,enhancing the playfulness of the scene.The depth of field varies,sometimes focusing on the monkeys and sometimes on the computer screen,creating a light-hearted and humorous visual effect.|<br>|10、赛博吗喽黑客(体现指令跟随能力)| | |在霓虹灯闪烁的赛博朋克风格城市夜景中,手持跟拍的镜头缓缓推近,一个机械风格的小猴子正在用高科技工具维修,周围是闪烁的电子设备和未来主义的装修材料。赛博朋克风格,气氛神秘,4K高清。|

卡兹克:我们花了10天时间,给CCTV6做了一部AI短片 - 5000字全流程复盘拆解

我只能在此呼吁一下Dreamina:求求了,啥时候这个蠢问题,赶紧改了吧。。。Dreamina对Prompt的语义理解非常好,强烈推荐大家把运动速度设为慢速,我经常喜欢慢速+Prompt里面写轻微XX。会有很不错的效果。另一个Dreamina非常智障的一点是,只有8帧+720P,对比Runway这种24帧+4k的,基本约等于没法用。所以还是需要Topaz Video AI去增强到24帧+4K的。Topaz Video AI的教程我就不在这里细说了,给大家一个关键词:Topaz Video AI 4.2.1,拿着这个关键词,去B站搜教程,又好用又简单,非常方便。增强完以后,再扔到剪映里,裁成21:9,这一套就算是齐活了。AI视频的趴写了这么多,基本已经能处理大部分的效果了。但是,很多东西,依然是AI搞不定的。比如人物在水中下沉的时候,不管你用哪家AI视频,脸必糊,跟恐怖片一样。这种糊脸,在视频里,讲道理是无法接受的,太恐怖,也太让人出戏。于是,就只能上传统AE,自己做,反正就是个普通的下沉位移动画。跑了个静态图。

画小二团队:《李清照》AI视频创作流程项目文档

|分镜|子分镜|画面主题|Prompt|效果|创作者|<br>|-|-|-|-|-|-|<br>|29|29|李清照走向窗边,眺望繁华的都市|The aerial view of the city center,showcasing an urban skyline with tall buildings and streets illuminated by lights.The scene includes distant mountains under clear blue sky,in the style of intricate and bizarre illustrations,monochrome ink,light white and dark blue,meticulous design,i can't believe how beautiful this is,charming characters --ar 16:9 --niji 5| ||<br>|30 |30 |返回宋代赵母继续训斥赵明诚,明天我就让孙大人把他小儿女送过给你做小妾,说什么今年我都要抱上大孙子|a elderly Asian grandma sitting wearing Hanfu shouts at a young man,in an ancient Chinese courtyard,song dynasty,in the style of intricate and bizarre illustrations,monochrome ink,light white and dark blue,meticulous design,i can't believe how beautiful this is,charming characters --ar 16:9 --niji 5 | ||<br>|31|31|李清照淡然世外,走进书房|[https://s.mj.run/8dOfsA5iY8w](https://s.mj.run/8dOfsA5iY8w)A beautiful ancient Chinese woman,dressed in Hanfu,stands among the flying papers of ancient China with many scattered papers on her.She holds calligraphy brush,writing carefully,song dynasty,in the style of intricate and bizarre illustrations,monochrome ink,light white and dark blue,meticulous design,i can't believe how beautiful this is,charming characters --ar 16:9 --niji 5| ||

其他人在问
什么软件可以直接生成卡通形象并且能说话
以下是一些可以生成卡通形象并且能说话的软件: 1. Creatie AI:AI 驱动的设计神器,能在几分钟内设计网站或程序,融合多种功能,自动分析设计文件,创建统一样式库,快速转化为高保真可交互原型并生成代码。网址:http://creatie.ai 。 2. 腾讯 AniPortrait:根据音频和静态人脸图片生成逼真的动态视频,支持多种语言、面部重绘、头部姿势控制,比阿里 EMO 项目先开源。网址:https://github.com/ZejunYang/AniPortrait 、https://arxiv.org/abs/2403.17694 、https://x.com/imxiaohu/status/1772965256220045659?s=20 。 3. NoLang:支持将文字、网页链接、PDF 等直接转换为视频,自动总结 PDF 内容并生成解答视频,还可追问,但目前服务器承受压力大,支持日语和英语。网址:http://nolang.com 。 此外,制作数字人的工具还有: 1. HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许用户创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后就能合成一段非常逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。 请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-09-03
我创作了一个AI视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作糊了,我期望通过comfy对其重绘,能解决保留现实背景,卡通角色五官重绘更清晰吗?
在处理您提到的这种情况时,有以下一些建议和方法: 1. Dreamina 对 Prompt 的语义理解较好,您可以将运动速度设为慢速,并在 Prompt 里写轻微的相关描述,可能会有不错的效果。但需要注意的是,Dreamina 存在只有 8 帧和 720P 的限制,对比 Runway 的 24 帧和 4K 有差距。所以需要使用 Topaz Video AI 去增强到 24 帧和 4K,您可以在 B 站通过“Topaz Video AI 4.2.1”这个关键词搜索教程进行学习。增强完以后,再扔到剪映里裁成 21:9。 2. 对于人物在水中下沉等情况导致的脸糊问题,很多时候 AI 搞不定,可能需要使用传统 AE 自己制作普通的下沉位移动画。 不过,需要说明的是,在一些复杂的场景和动作中,AI 可能仍然存在一定的局限性,需要综合多种工具和方法来达到理想的效果。
2024-08-25
有把实际景物一键转化成卡通图片的AI工具吗?
以下是一些可以将实际景物一键转化成卡通图片的 AI 工具: 1. Magnific AI 具有风格转换的新功能,可以将任意照片转换成各种风格的图像,包括卡通风格,同时能保持人物对象的一致性。不过其大 BOSS 的演示和教程下周才开放访问,链接为:https://x.com/imxiaohu/status/1768623077599183111?s=20 。 2. 您还可以尝试用真人照片结合照片描述和特定关键词的方式来生成卡通头像。在玩的过程中如果生成了满意的图,记得存起来,下次想要同种类型的就可以直接拿来喂图,效果会更好。
2024-08-16
如何生成卡通动作
以下是关于生成卡通动作的一些方法: 1. 使用 Panels 命令:可以生成连续的动作和表情设计,若希望设计一个角色并拥有连续动作和表情,此命令会很方便。比如:a Super cute sports anime girl,style by Miyazaki Hayao,6 panels with different poses 8K。如果想画动漫角色,可将模型设置先改为 niji mode,效果会更好。但需注意,约束太多可能导致命令失效,存在权重问题。 2. 利用 continuous running:能更稳定地生成连续动作,甚至可以做成 gif 动画。例如:a Super cute sports anime girl,style by Miyazaki Hayao,6 panels with continuous running。 3. 使用 character sheet 命令:创建一个角色的多角度以及特写细节。比如:a Super cute sports anime girl,style by Miyazaki Hayao,character sheet,full body,8k。同时,实测发现 v5 模型在画手方面比 niji 模型更好。 在游戏创作中,生成出色动画的方式包括: 1. 运动捕捉技术:让演员或舞者穿上运动捕捉服,在特殊设置的运动捕捉舞台上记录他们的动作。 2. 利用生成性 AI 模型直接从视频中捕捉动画,这样效率更高,一是消除了对昂贵运动捕捉设备的需求,二是可以从现有视频中捕捉动画,还能给现有动画应用滤镜。涉足这一领域的公司包括 Kinetix、DeepMotion、RADiCAL、Move Ai 和 Plask。 如果给自己做一个卡通头像,操作如下: 1. 简单提示词:在聊天窗口输入/imainge 找到/imagine prompt,然后把链接放进去,空格后加英文逗号分隔的提示词,最后加上设置参数。 2. 设置参数: iw 1.5:设置参考图片的权重,数值越高与参考图片越接近,默认是 0.5,最大是 2,可选择中间值调整。 s 500:设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为 0 1000 间任意整数。 v 5:指用 midjourney 的第 5 代版本,这一代最真实,目前 v5 需要订阅付费,不想付费可以使用v 4。 no glasses:指不戴眼镜,若不喜欢戴眼镜的图片,可使用此设置。 如果对生成结果不满意,可以选择调整s 和iw 的值来多次尝试。
2024-08-13
有那些好用的卡通头像生成ai工具
以下是一些好用的卡通头像生成 AI 工具: 1. Artguru AI Art Generator:在线平台,能生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,可将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计,能将上传的照片转换为芭比风格,效果很好。 此外,如果想用真人照片来生成卡通头像,可以用“真人照片”+“照片描述”+“方法 1 的关键词”来处理。在使用过程中,如果生成了满意的图,记得存起来,下次想要同种类型的可以直接拿来喂图,效果会更好。 需要注意的是,这些 AI 模型可能存在一些局限,如偶尔性能不稳定、生成内容不当等问题。
2024-08-12
卡通极简风,简笔画,怎么能生成
对于使用Stable Diffusion或Midjourney等文生图AI模型来生成卡通极简风格的简笔画图像,你可以尝试使用以下一些关键词作为提示词: 对于Stable Diffusion: "minimalist line art" "simple line drawing" "cartoon outline sketch" "black and white lineart" "stick figure illustration" "doodle sketch style" "minimalist vector art" 例如:"A cute dog in minimalist line art style" 对于Midjourney: "/l lineart" "/l minimalist" "/l outline drawing" "/l simple line cartoon" "/b outline stylize 1000 v 5" 例如:"/l lineart /b cute cartoon dog stylize 1000 v 5" 其中"/l"代表Midjourney的lineart模式,可指定线条画风格。 "/b"代表基本prompt部分。 "stylize"和"v"可调节图像风格强度和视觉细节水平。 你还可以通过添加具体的物体、动作、姿势等细节,或参考现有的简笔画作品,对Prompt进行优化,以获得更加理想的生成结果。 同时,调整一些参数如Step数、Seed等,也会对最终输出的图像产生一定影响。保持多次尝试和微调,直至获得满意的卡通极简风格简笔画作品。
2024-04-29
如何使用AI 工具分析内容,提取文章关键场景、角色和情节
使用 AI 工具分析内容并提取文章关键场景、角色和情节可以参考以下步骤: 对于将小说做成视频: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 对于利用 AI 写课题: 1. 确定课题主题:明确研究兴趣和目标,选择具有研究价值和创新性的主题。 2. 收集背景资料:使用 AI 工具如学术搜索引擎和文献管理软件来搜集相关的研究文献和资料。 3. 分析和总结信息:利用 AI 文本分析工具来分析收集到的资料,提取关键信息和主要观点。 4. 生成大纲:使用 AI 写作助手生成课题的大纲,包括引言、文献综述、方法论、结果和讨论等部分。 5. 撰写文献综述:利用 AI 工具来帮助撰写文献综述部分,确保内容的准确性和完整性。 6. 构建方法论:根据研究需求,利用 AI 建议的方法和技术来设计研究方法。 7. 数据分析:如果课题涉及数据收集和分析,可以使用 AI 数据分析工具来处理和解释数据。 8. 撰写和编辑:利用 AI 写作工具来撰写课题的各个部分,并进行语法和风格的检查。 9. 生成参考文献:使用 AI 文献管理工具来生成正确的参考文献格式。 10. 审阅和修改:利用 AI 审阅工具来检查课题的逻辑性和一致性,并根据反馈进行修改。 11. 提交前的检查:最后,使用 AI 抄袭检测工具来确保课题的原创性,并进行最后的格式调整。 在扣子 AI 应用于故事与绘本创作中,角色方面的技能包括: 首先引导用户说出故事的中心主题(theme),耐心倾听并给予鼓励。接着询问故事的情节(Plot),帮助用户梳理思路。再让用户描述故事存在的角色(Characters),共同构思角色特点。引导用户设定故事的背景(Setting),丰富故事场景。了解故事的视角(Point_of_view),明晰叙述角度。确定故事的文章风格(Tone),为创作定下基调。基于上述获取的关键词,传入对应的工作流中,调用工作流生成精彩的故事内容。
2024-08-26
ai agent多角色对话
以下是关于 AI Agent 多角色对话的相关内容: 在红杉 AI Ascent 2024 会议中,吴恩达谈到了 Agent Workflow 以及 4 种主流设计模式。其中包括: 1. Reflection(反思):可以有一个代码 Agent 和一个反思 Agent,它们可以是相同的基础 LLM 但以不同方式提示,例如一个是专家级的代码撰写者,另一个是专家级的代码审查者,这种工作流容易实现,能显著提高 LLM 性能,但不总是有效。 2. 规划:通过规划设计模式提升 LLM 性能和拓展应用领域。 3. 多 Agent 合作:不同 Agent 之间的辩论,如让 ChatGPT 和 Gemini 互相辩论,能带来更好的表现,多个模拟的 Agent 一起工作也是强大的设计模式。 4. Agent 推理:这种设计模式将会很重要。 此外,生成式 AI 的人机协同分为 3 种产品设计模式:Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理)。在 Agent 模式下,AI 完成大多数工作,可使用 Multiagent Collaboration 的方法,让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。例如产品经理可以通过 Agents 将任务拆解,最后获得大体符合期望的输出结果再进行修改。 总之,通过这些设计模式,能够提升 LLM 的性能和拓展应用,期待未来 AI Agent 在更多场景发挥关键作用。
2024-08-26
AI角色扮演类的平台有哪些
以下是一些 AI 角色扮演类的平台: 1. Replika:一款 AI 虚拟陪伴应用,用户可以设计理想的伴侣,关系会随时间发展,其能存储记忆并在未来对话中参考,甚至发送照片。 2. Anima:正在尝试建立虚拟朋友。 3. Charisma.ai:旨在为具有情感和自主权的完全渲染的 3D 角色提供动力,并提供工具以便创作者给角色设定目标。 4. Convai.com:为具有情感和自主权的完全渲染的 3D 角色提供动力的平台。 5. Inworld.ai:为具有情感和自主权的完全渲染的 3D 角色提供动力,并提供工具以便创作者给角色设定目标。 6. 筑梦岛:AI 角色扮演对话平台,背靠阅文,内容 IP 资源相对比较丰富。具有单人聊天、多人聊天、AI 角色设定、梦境分享、小剧场、创建角色和群聊等功能。 7. Character.ai:用户可以与数百个 AI 驱动的角色进行信息交流,包括名人、动漫角色等,还可以创建自己的角色。 8. Talkie:主打情感路线,设计有大量 npc,游戏和休闲娱乐体验感更强,每个 npc 带着自己的剧情体系,交流中会触发抽取卡牌机会。
2024-08-21
lora训练的数据集没有闭眼,如何保证人物一致性前提让角色闭眼
在训练 Lora 模型以保证人物一致性的前提下让角色闭眼,以下是一些可能的方法和参考信息: 得益于对 AI 大模型微调 finetuning 技术的研究,摸索出的训练特定画风 Lora 和特定角色 Lora 的方法,对角色一致性的锁定有决定性帮助。比如完善哪吒短褂、小短裤、额前火焰印记、流苏耳饰等细微之处的统一,最终针对不同主要角色分别训练角色 Lora,保障多人同框镜头的一致性。 实现角色一致性最好的方法是使用 Lora。训练 Lora 时,至少要有 15 到 20 张图片的训练集。对于固定形象,面部五官最重要,其次是体型、服装、配饰等。收集训练集时,收集形象的头部图片很重要。对于现实人物可通过照片训练,虚构角色则要能稳定输出多张不同角度的图片以达到训练集要求。 在预处理生成 tags 打标文件后,对文件中的标签进行优化。保留全部标签适用于训练画风或省事快速训练人物模型,优点是省时省力、过拟合出现情况低,缺点是风格变化大、训练时间长。删除部分特征标签适用于训练特定角色,将特征与 Lora 做绑定,优点是调用方便、更精准还原特征,缺点是容易过拟合、泛化性降低。需要删掉如人物特征 long hair、blue eyes 这类标签,不需要删掉如人物动作 stand、run,人物表情 smile、open mouth,背景 simple background、white background,画幅位置 full body、upper body、close up 这类标签。过拟合会导致画面细节丢失、模糊、发灰、边缘不齐、无法做出指定动作、在一些大模型上表现不佳等情况。
2024-08-12
工具助手类ai角色和角色扮演类ai角色在撰写prompt时主要差异是什么
工具助手类 AI 角色和角色扮演类 AI 角色在撰写 prompt 时的主要差异在于: 工具助手类 AI 角色的 prompt 通常更注重明确和直接的指令,以确保其能够准确地执行任务。例如,在解决逻辑谜题时,需要清晰地描述问题和要求。 角色扮演类 AI 角色的 prompt 则需要明确其扮演的角色,这会从两方面改变其响应: 准确性:在某些情况下,如解数学题,能得到提高。 语气和举止:可以调整为与角色匹配的语气和举止。 在具体的应用中,如生成 AI 视频时,可以通过详细描述角色特征、位置关系、环境等,来获得更符合需求的角色形象。同时,对于特定的 AI 工具,如 Niji·journey 5,了解其输入要求和特点,如对二次元风格的偏好,以及通过强调特定关键词来引导生成特定效果,如角色三视图,也是撰写有效 prompt 的关键。
2024-07-03
识别图片中的形状和文字元素并在PPT中重绘图像的AI工具
以下为您推荐一些能够识别图片中的形状和文字元素并在 PPT 中重绘图像的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,简化设计流程,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 另外,如果您想从游戏截图升级到 KV 品质,正式绘画目前有图生图和 controlnet 两种出图方式。但如果底图质量不够,想要 AI 更自由发挥,除了调高重绘幅度,还可以在 controlnet 上有更多探索。输入正负 TAG,设置好图片尺寸、迭代步数、采样器、重绘幅度后,等待图片生成。controlnet 包含的功能很多且在不断更新,如需更多了解可跳转 B 站深度学习:https://www.bilibili.com/video/BV1Ds4y1e7ZB/?spm_id_from=333.337.searchcard.all.click
2024-08-29
视频局部重绘
以下是关于视频局部重绘的相关信息: Haiper 工具: 能进行视频重绘,包括轻松修改颜色、纹理和元素以改变原视频的视觉内容。 局部重绘可通过点选方式选中需重绘区域,再输入替换内容提示词,但大量背景重绘效果一般,视频易崩。 文生视频支持选择风格、秒数(2s 和 4s)、种子值等。 网址:https://haiper.ai/ 文生视频不同风格展示可参考: 图生视频只能写提示词、秒数(2s 和 4s)、种子值。 【SD】工具: 原理是将蒙住的部分重新画,也可将未蒙住的部分重新画,比如蒙住人物重画其背景。 更进阶的用法是进入涂鸦重绘,用颜色画笔画任意想添加的东西,如在头顶加小黄花。 可添加关键词生成相应内容。 如需扩展背景,可在图生图中选择“缩放后填充空白”,重绘幅度 0.5,并增加宽度。 随着重绘幅度增大,人物细节可能改变,若想只改背景不改人物,可借助 PS 制作精确蒙版,进入“上传重绘蒙版”界面,上面放置需重绘的图像,下面放置 PS 中制作好的蒙版。 Video Battle AI 视频挑战: 本次大赛主题为首尾帧要求:视频首、尾、首的方式制作。 方法 1 为【MJ 出图+AI 视频软件】,使用 Midjourney 垫图➕描述出图,再去视频工具中转成视频。可下载项里的深度图,打开 MJ 官网上传深度图。Midjourney 官网:https://www.midjourney.com/ 。局部重绘有难度,最终方式为分开画再合成。
2024-08-15
MJ局部重绘
MJ 局部重绘是一种图像处理技术,它允许用户对图像的特定部分进行重新绘制或修改,而不需要改变整个图像。这种技术可以用于各种应用,如修复照片、创建动画、制作游戏等。 MJ 局部重绘的实现方式有很多种,其中一种常见的方式是使用图像处理软件,如 Adobe Photoshop 或 Sketch。这些软件提供了各种工具,如画笔、橡皮擦、填充工具等,用户可以使用这些工具对图像进行局部重绘。 另一种实现方式是使用深度学习技术,如卷积神经网络(CNN)。这些技术可以自动学习图像的特征,并根据用户的输入对图像进行局部重绘。这种方式通常需要大量的训练数据和计算资源,但可以实现更加复杂和自然的局部重绘效果。 总的来说,MJ 局部重绘是一种非常有用的图像处理技术,它可以帮助用户对图像进行局部修改和优化,以满足各种需求。
2024-05-21
我想学习MJ的局部重绘功能
以下是关于 MJ 局部重绘功能的介绍和使用方法: 1. 介绍:MJ 局部重绘功能可以选择一个区域并重新绘制这部分的内容。 2. 使用方法: 打开图片后,点击“编辑器”,选择需要重绘的区域。 若输入/settings 并启用“remix mode”,在编辑器中还将获得一个文本框,以便为该区域更改/修改提示。 更多详细的介绍可以参考《》这篇文章。
2024-05-02
让照片说话 软件有哪些
以下是一些能让照片说话的软件及相关信息: SadTalker: 开源程序,可让照片说话唱歌,达到基本唇形同步。 独立使用或作为插件放入 StableDiffusion。 整合包:史上最炸裂版 AI 工具箱,包含 SDAI 绘画、VITS 文本转语音、wav2lip、sadTalker 唇型同步、视频修复,支持 A 卡。 相关链接: GitHub 地址:https://github.com/OpenTalker/SadTalker 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 夸克网盘整合包:https://pan.quark.cn/s/1d5ca9f57f5c 视频地址:https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.searchcard.all.click&vd_source=35e62d366d8173e12669705f7aedd122 具体步骤:点我启动,在启动界面中选择音频、图像口型同步的下载图标;下载完毕后启动应用,等待弹出独立窗口;选择 sadtalker 同步器,分别导入图片和声音。 图片预处理方式:crop 只截取图片头部,full 保留整张照片。 由于涉及视频推理和转换,输出时间较长,需做好等待准备。最终生成的视频长度与音频一致,制作长视频建议剪成小段分别推理后合并。完成后可打开输出目录或下载视频文件。 KreadoAI: 点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”功能。 使用方法:点击开始创作,选择自定义照片;配音时可选择提供文字选择音色或直接上传音频;打开绿幕按钮,点击背景可添加背景图;最后点击生成视频。
2024-09-14
上传一张照片,可以输出照片内容的文字说明吗?
上传一张照片是可以输出照片内容的文字说明的。以下为两种常见的实现方式: 1. 利用 Sadtalker 进行处理:在图片预处理方式中,crop 只截取图片的头部,full 就是保留整张照片,下面的勾选项有文字解释,可自行尝试几次。点击 generate 后,由于涉及到视频的推理和转换,输出时间会远远大于 AI 绘图和 sovits 的声音推理,需做好等待准备。例如导入一个 13 秒的音频,预计需要 3 5 分钟(3060 12g 显卡)。最终生成的视频长度与音频一致,若想制作长视频,最好剪成小段分别推理再合并。完成后,可打开输出目录或下载视频文件查看效果。 2. 借助 GPT 识图功能:我们可以借用 GPT 来对图片的内容进行细致描述,当然也可以自行描述。例如对一张人物照片的描述:图片中的人物是一位年轻的男性,年纪大约在 20 到 30 岁之间。他的头发黑亮,整齐地梳向后方,呈现出一种利落而正式的发型,发尾略有一些微卷,显得时尚而有型。他的肤色白皙,面部线条分明,五官端正。他的眉毛浓密而有形,眼睛大而有神,显得非常有精神。鼻梁高挺,鼻翼略窄,嘴唇薄而有弧度,整体面部表情略显严肃,但却不失英俊。下巴线条明显,脸部轮廓立体分明,整体给人一种非常帅气且有魅力的感觉。他穿着一套正式的黑色西装,内搭白色衬衫,并佩戴了一条黑色领结。西装的剪裁非常合身,显示出他的修长身材和优雅气质。他左手握着一只话筒,似乎正在参加某个正式场合或发表演讲。背景较为简约,以浅色为主,突出人物的主体地位,进一步增强了他正式而庄重的形象。总体来看,这位年轻男性看起来像是东亚人种,具有典型的亚洲男性特征,且散发出一种自信和专业的气质。
2024-09-14
怎么才能让FLUX生成的人物更像真人的照片
以下是一些可能有助于让 FLUX 生成的人物更像真人照片的建议: 1. 尝试使用特定的提示词,例如“abstract network out of glass made of holographic liquid crystal, dark background, blue light reflections, symmetrical composition, centered in the frame, highly detailed, hyperrealistic, cinematic lighting, in the style of Octane Rende ar 16:9 style raw personalize v 6.1”。 2. 可以训练 FLUX Lora 模型,如褪色胶片风格,推荐权重 0.6 0.8,人像会偏向复古褪色的胶片风格。 3. 对于生成人物,还可以参考 XLabsAI 发布的不同 Lora,如 mjv6_lora(Midjourney 风格)、realism_lora(写实风格)等,并使用相应的示例进行参考和调整。 4. 您还可以从以下地址下载相关的 Lora:https://hfmirror.com/Kijai/fluxlorascomfyui/tree/main/xlabs
2024-09-13
照片修复
以下是关于照片修复的相关知识: 1. 【SD】无需 Lora,一键换脸插件 Roop:启用 ROOP 插件,选择要替换的人物照片,面部修复选“GFPGAN”。右边参数数值越低人物越像但图像模糊,数值越高人物不像但图像清晰,可按需设置,如 0.5。最下面有放大算法,相当于高清修复。设置好后点击生成,若人脸像素偏低模糊,可将图发送到“图生图”,开较小重绘幅度,使用 controlnet 中的 tile 模型重绘。如需此插件,可添加公众号【白马与少年】回复【SD】。推荐使用最新秋叶整合包,科学上网很重要,此插件需谨慎使用,切勿触犯法律。 2. 图像高清修复,无损放大 N 倍: 实现技术拆解:第二部分进行高清修复,把原本模糊的图片修复,并进行 2 倍放大。 Checkpoint 大模型使用 Iceclear/StableSR,搭配 Stable SR Upscaler 模型,推理图片噪点以还原图像。提示词部分应包含想要达到的目的内容,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)。全程采取两次高清修复。 3. 辅助工具:放大/扩图: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可增加更多细节 开源工作流: 相关工具和网站: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific:https://magnific.ai/ Krea:https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC:https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN 在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/ ,能够提供图片的放大和降噪功能,通过使用深度学习技术提高图像质量,同时保留细节和纹理,简单易用且效果好。
2024-09-11
我想要找一款AI智能消除照片背景杂物的工具
以下为您推荐一些 AI 智能消除照片背景杂物的工具: 1. RMBG1.4 去除照片背景模型:高精度背景去除,适用于电商、广告等场景。支持视频背景批量去除,提供蒙版输出功能。云端处理速度快,性能卓越。链接:https://github.com/ZHOZHOZHO/ComfyUIBRIA_AIRMBG ,https://x.com/xiaohuggg/status/1755075272410538450?s=20 2. AVAide Watermark Remover:在线工具,使用 AI 技术从图片中去除水印。支持多种图片格式,如 JPG、JPEG、PNG、GIF 等。操作简单,上传图片,选择水印区域,保存并下载处理后的图片。还提供去除文本、对象、人物、日期和贴纸等功能。 3. Vmake:提供 AI 去除图片水印的功能。可上传最多 10 张图片,AI 自动检测并移除水印。处理完成后可选择保存生成的文件。适合需快速去除水印、在社交媒体分享图片的用户。 4. AI 改图神器:提供 AI 智能图片修复去水印功能,可一键去除图片中多余物体、人物或水印,不留痕迹。支持直接粘贴图像或上传手机图像,操作简便。 这些工具各有特点,您可以根据具体需求选择最适合您的工具。
2024-09-09
图片风格转换,现实照片转换成动漫风格,有哪些网站、Bot、
目前在将现实照片转换成动漫风格方面,以下为您推荐一些常见的网站和工具: 1. 美图秀秀:功能丰富,操作相对简单,有多种动漫风格转换效果可选。 2. 醒图:提供多种特效和滤镜,包括动漫风格的转换。 至于 Bot 方面,暂时没有特别突出和广泛使用的专门用于现实照片转动漫风格的 Bot。但您可以持续关注相关领域的发展,可能会有新的工具出现。
2024-09-06