Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我做了一个视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作都糊了。 我现在有什么办法优化,对卡通角色五官重绘更清晰的情况下,还保留现实的照片背景。(用sd重绘的话是不是就丢失了)

Answer

以下是一些可能有助于您优化视频的建议:

  1. 对于您提到的卡通角色动作模糊的问题,可以尝试使用 Dreamina 工具,并将运动速度设为慢速,同时在 Prompt 里写轻微的动作描述,可能会有不错的效果。
  2. 由于 Dreamina 工具存在只有 8 帧和 720P 的限制,您可以使用 Topaz Video AI 将其增强到 24 帧和 4K。在 B 站搜索“Topaz Video AI 4.2.1”关键词能找到相关教程。增强完成后,再放到剪映里裁成 21:9 的比例。
  3. 对于卡通角色五官不清晰的情况,如果 AI 工具无法处理,可能需要使用传统的 AE 软件自己制作,比如普通的下沉位移动画。

需要注意的是,在某些情况下,如人物在水中下沉时,AI 视频可能会出现脸糊的情况,这种情况可能需要传统手段来解决。

Content generated by AI large model, please carefully verify (powered by aily)

References

工具教程:清影

|文生视频|视频(纯享版)|视频(配音版)|PROMPT|<br>|-|-|-|-|<br>|7、阳光森林| | |在一片森林中,人视,参天大树遮蔽着太阳,树叶的缝隙中洒下一些阳光,丁达尔效应|<br>|8、土豆变薯条| | |广告拍摄视角,黄色背景,白色桌子上,画面中一个土豆被扔下来变成一份薯条|<br>|9、吗喽打工| | |Two monkeys in ragged clothes are typing on a computer in a colorful room,their eyes moving exaggeratedly as if telling a humorous story.The room is filled with bizarre decorations and toys,creating a dreamlike atmosphere.The camera uses a whimsical and ethereal style,following the monkeys with a handheld shot to capture their comical movements,occasionally switching to slow motion to highlight their exaggerated expressions.The lighting features a contrast of warm and cool tones,enhancing the playfulness of the scene.The depth of field varies,sometimes focusing on the monkeys and sometimes on the computer screen,creating a light-hearted and humorous visual effect.|<br>|10、赛博吗喽黑客(体现指令跟随能力)| | |在霓虹灯闪烁的赛博朋克风格城市夜景中,手持跟拍的镜头缓缓推近,一个机械风格的小猴子正在用高科技工具维修,周围是闪烁的电子设备和未来主义的装修材料。赛博朋克风格,气氛神秘,4K高清。|

卡兹克:我们花了10天时间,给CCTV6做了一部AI短片 - 5000字全流程复盘拆解

我只能在此呼吁一下Dreamina:求求了,啥时候这个蠢问题,赶紧改了吧。。。Dreamina对Prompt的语义理解非常好,强烈推荐大家把运动速度设为慢速,我经常喜欢慢速+Prompt里面写轻微XX。会有很不错的效果。另一个Dreamina非常智障的一点是,只有8帧+720P,对比Runway这种24帧+4k的,基本约等于没法用。所以还是需要Topaz Video AI去增强到24帧+4K的。Topaz Video AI的教程我就不在这里细说了,给大家一个关键词:Topaz Video AI 4.2.1,拿着这个关键词,去B站搜教程,又好用又简单,非常方便。增强完以后,再扔到剪映里,裁成21:9,这一套就算是齐活了。AI视频的趴写了这么多,基本已经能处理大部分的效果了。但是,很多东西,依然是AI搞不定的。比如人物在水中下沉的时候,不管你用哪家AI视频,脸必糊,跟恐怖片一样。这种糊脸,在视频里,讲道理是无法接受的,太恐怖,也太让人出戏。于是,就只能上传统AE,自己做,反正就是个普通的下沉位移动画。跑了个静态图。

画小二团队:《李清照》AI视频创作流程项目文档

|分镜|子分镜|画面主题|Prompt|效果|创作者|<br>|-|-|-|-|-|-|<br>|29|29|李清照走向窗边,眺望繁华的都市|The aerial view of the city center,showcasing an urban skyline with tall buildings and streets illuminated by lights.The scene includes distant mountains under clear blue sky,in the style of intricate and bizarre illustrations,monochrome ink,light white and dark blue,meticulous design,i can't believe how beautiful this is,charming characters --ar 16:9 --niji 5| ||<br>|30 |30 |返回宋代赵母继续训斥赵明诚,明天我就让孙大人把他小儿女送过给你做小妾,说什么今年我都要抱上大孙子|a elderly Asian grandma sitting wearing Hanfu shouts at a young man,in an ancient Chinese courtyard,song dynasty,in the style of intricate and bizarre illustrations,monochrome ink,light white and dark blue,meticulous design,i can't believe how beautiful this is,charming characters --ar 16:9 --niji 5 | ||<br>|31|31|李清照淡然世外,走进书房|[https://s.mj.run/8dOfsA5iY8w](https://s.mj.run/8dOfsA5iY8w)A beautiful ancient Chinese woman,dressed in Hanfu,stands among the flying papers of ancient China with many scattered papers on her.She holds calligraphy brush,writing carefully,song dynasty,in the style of intricate and bizarre illustrations,monochrome ink,light white and dark blue,meticulous design,i can't believe how beautiful this is,charming characters --ar 16:9 --niji 5| ||

Others are asking
照片生成卡通头像
以下是关于照片生成卡通头像的相关内容: 通用人物模版: 如果想用真人照片生成卡通头像,可以使用“真人照片”+“照片描述”+“方法 1 的关键词”来处理。在操作过程中,如果生成了满意的图,一定要记得存起来,下次想要同种类型的可以直接拿来喂图,效果更好。 个性操作: 1. 复杂提示词:例如“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5”。 2. 不同照片生成:如果对照片风格不满意,可以更换新照片使用上述提示词重新生成。 3. 其他调整:如果觉得 Disney 风格太过卡通,可以把提示词里的 Disney 换成 Pixar;如果是女孩,可以把提示词里的 boy 换成 girl。每次会生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击下方的 V1~V4 进行修改。 背景和基础操作: 之前制作过从零开始使用 Midjourney 并通过简单提示词生成图片的教程。今天教利用 Midjourney 的以图绘图功能生成迪斯尼卡通风格的头像。先选一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,在聊天框发送(记得点击回车或发送按钮)。图片会上传到服务器并生成唯一链接,点击图片,在浏览器中打开,复制浏览器上方的链接。使用这个链接加 prompt 提示词发送给 Midjourney,Midjourney 会根据需求生成特定图片,这就是 Midjourney 的以图绘图。如果还没有 Midjourney 账号或不懂基础操作,可以查看之前的教程,如“”。 做卡通头像的教程不少,科技小飞哥这一篇写得通俗易懂,手把手教会怎么做。原文链接:https://leftpocket.cn/post/ai/cartoon/
2025-01-04
我想做简洁卡通风格的ai动画,根据故事文案生成的那种,需要保持人物一致性,用哪个工具比较好?
以下是一些适合生成简洁卡通风格、根据故事文案生成动画并保持人物一致性的工具: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。新注册有免费生成额度。 2. 季梦:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。若为 1.2 版本,选慢速或适中的标准模式,效果更好,且生成的视频无水印。每天给 60 积分。 3. 可玲:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。每天给 60 积分,可用于日常使用,创作片子可能需买会员,生成的视频有无水印选项。 此外,在使用 Midjourney 生图时,若要保持人物和场景一致性,有两个取巧的方式:一个是像上个视频一样生成动物,动物会比较容易保持一致性;另一个方式是特定的名人或者有特殊属性的人物。在确定影片风格时,比如可以选择皮克斯动画风格。同时,在提示词中利用 cref 命令也有助于保持人物的一致性。
2024-12-18
如何在直播中给出镜主播换一个卡通头像
以下是在直播中给出镜主播换一个卡通头像的方法: 1. 复杂提示词: 如果觉得提示词简单,可以选择更复杂的,如:“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultra detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino iw 1.5 s 500 v 5”。 效果示例: 不同照片生成:如果对照片风格不满意,可以换一张新照片使用上述提示词重新生成。 其他调整:如果觉得 Disney 风格太过卡通,可以把提示词里的“Disney”换成“Pixar”;如果是女孩,可以把“boy”换成“girl”。每次会生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击 V1~V4 进行修改。 2. 简单提示词: 在聊天窗口输入/imainge 找到/imagine prompt,然后把链接放进去,空格后加提示词(以英文逗号分隔),最后加上设置参数。 设置参数:“iw 1.5”设置参考图片的权重,数值越高与参考图片越接近,默认 0.5,最大 2,可选择中间值调整;“s 500”设置风格强度、个性化、艺术性,数字越大越有创造力和想象力,可设置 0 1000 间任意整数;“v 5”指用 Midjourney 的第 5 代版本,这一代最真实,目前 v5 需要订阅付费,不想付费可用“v 4”;“no glasses”指不戴眼镜,不喜欢戴眼镜的图片可加上此设置。 完整的提示词示例(替换您的 png 图片地址):“ simple avatar,Disney boy,3d rendering,iw 1.5 s 500 v 5”。如果不满意,可调整“s”和“iw”的值多次尝试。 3. 背景知识: 之前制作过从零开始使用 Midjourney 并通过简单提示词生成图片的视频。 今天教利用 Midjourney 的以图绘图功能生成迪斯尼卡通风格头像。 要生成头像,先选一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,发送(记得点击回车或发送按钮)。 图片上传到服务器会生成唯一链接,点击图片,在浏览器中打开,复制浏览器上方的链接。 使用这个链接加 prompt 提示词发送给 Midjourney,Midjourney 会根据需求生成特定图片,这就是 Midjourney 的以图绘图。 做卡通头像的教程不少,科技小飞哥这一篇写得通俗易懂,手把手教会怎么做。原文链接:https://leftpocket.cn/post/ai/cartoon/ 。如果还没有 Midjourney 账号,或者还不懂基础操作,可以看之前的教程:
2024-11-22
AI画卡通画,有什么平台
以下是一些可以用于 AI 画卡通画的平台: MewXAI:这是一款强大专业且新手友好、操作简单的 AI 绘画创作平台。其功能包括 MX 绘画、MX Cute、MJ 绘画、边缘检测、室内设计、姿态检测、AI 艺术二维码、AI 艺术字等。访问地址:https://www.mewxai.cn/ Lucidchart:强大的在线图表制作工具,集成了 AI 功能,可自动化绘制多种示意图,如流程图、思维导图、网络拓扑图等。拖放界面易于使用,支持团队协作和实时编辑,有丰富的模板库和自动布局功能。官网:https://www.lucidchart.com/ Microsoft Visio:专业的图表绘制工具,适用于复杂的流程图、组织结构图和网络图。其 AI 功能可帮助自动化布局和优化图表设计,集成 Office 365,方便与其他 Office 应用程序协同工作,有丰富的图表类型和模板,支持自动化和数据驱动的图表更新。官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware Diagrams.net:免费且开源的在线图表绘制工具,适用于各种类型的示意图绘制。支持本地和云存储(如 Google Drive、Dropbox),有多种图形和模板,易于创建和分享图表,可与多种第三方工具集成。官网:https://www.diagrams.net/
2024-11-12
照片生成卡通画
以下是关于照片生成卡通画的相关内容: 1. 个性卡通头像生成: 复杂提示词:如“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultra detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino iw 1.5 s 500 v 5”。 不同照片生成:可更换新照片使用上述提示词重新生成。 其他调整:若不喜欢 Disney 风格,可将提示词中的“Disney”换成“Pixar”;若为女孩,可将“boy”换成“girl”。每次生成 4 张图片,满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击 V1~V4 进行修改。 2. 【SD】简笔水彩风格插画生成: 大模型:“Flat2D Animerge”,适合生成卡通动漫图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复可拉到 11)。 Lora:“Chinese painting style”可增加中国画水彩风格效果,权重设置为 0.4;“Crayon drawing”可添加简单线条和小孩子笔触,权重设置为 0.8。 操作步骤:将图片丢到标签器中反推关键词,发送到“文生图”;在正向提示词末尾添加上述 lora;设置好尺寸,重绘幅度开 0.5 让 AI 更自由发挥,想接近原图可降低数值;将图放入 controlnet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。 3. 进阶使用技巧总结: 通用人物模版:想用真人照片生成卡通头像,可用「真人照片」+「照片描述」+「方法 1 的关键词」处理。若生成满意的图要记得保存,下次同种类型可直接喂图,效果更好。
2024-11-07
卡通形象变成卡通视频的工具
以下为将卡通形象变成卡通视频的工具及方法: 使用剪映可以实现此操作,具体步骤如下: 1. 生成数字人 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”,软件会生成对应音视频并添加到当前视频轨道中。左下角会提示渲染完成时间,可点击预览查看效果。 2. 增加背景图片 删除先前导入的文本内容,因为视频音频已包含文字。 点击左上角“媒体”菜单,“导入”本地图片,选择一张图片上传,点击图片右下角加号添加到视频轨道(会覆盖数字人)。 拖动轨道右侧竖线使图片与视频对齐,选中轨道,拖动图片角放大至合适尺寸,将数字人拖动到合适位置。 3. 增加字幕 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段形成字幕。 至此,数字人视频完成。若希望数字人换脸,需使用另一个工具。 另外,数字人视频的整体制作流程大致分为三步: 1. 创建视频内容:通过输入文稿内容,确定数字人播出的内容。 2. 生成数字人:通过工具及视频内容生产数字人形象及播放语音。 3. AI 换脸:通过 AI 工具,将数字人的脸转换成指定宣传的形象,以便以自己的品牌形式宣传。
2024-11-06
图的角色 用 cref 去控制一致性 风格可以用 sref 去控制
在 Midjourney 中,cref 和 sref 是用于引用图片的功能,它们有以下区别和使用方法: 1. 角色参考(cref): 作用:保持图像角色的一致性。 使用方法:在提示后添加“cref”,紧接着指向人物参考图像的 URL。例如:/imagine prompt beautiful girlcref。可以使用“cw”调整参考图像对生成图像的影响程度,数值范围从 0 到 100。强度 100(“cw 100”)是默认值,会使用面部、头发和衣服,cw 为 0 的话仅保证脸部一致。基础格式为“cref 图片链接,cw 100”。 参考链接: 2. 风格参考(sref): 作用:生成类似风格的图片,保持画风的一致性。 使用方法:在提示后添加“sref”,紧接着指向风格参考图像的 URL。例如:/imagine prompt beautiful girlsref。可以使用“sw”调整参考风格对生成图像的影响程度,数值范围从 0 到 1000。基础格式为“sref 图片链接,sw 100”。 参考链接: 如果想引用一张图,但只是把它作为新图的一部分,可以使用“sref”或“cref”,并通过调整“sw”或“cw”的值来控制引用图像的影响程度。例如:/imagine prompt beautiful girlsrefsw 500。这样,生成的图像将会在保持原有风格的同时,融入一部分引用图像的风格。
2025-01-13
帮我生成图片:里面写着“寂然的话语成真”的纯文字海报,字要平常的。不出现角色和人物。
很抱歉,目前无法直接为您生成这样的纯文字海报。但您可以使用一些在线的图片设计工具,如 Canva、稿定设计等,在这些平台上您可以选择合适的模板,输入“寂然的话语成真”的文字,并根据您的需求调整字体样式和布局,以达到您想要的效果。
2025-01-12
我想把ip角色变成动画,可以用哪个ai软件
以下是一些可以将 IP 角色变成动画的 AI 软件及相关信息: Pika、Pixverse、Runway、SVD 这四大 AI 视频工具可以用于制作 AI 短片。在使用时,需要注意写好 prompt 来描述角色形象,比如景别、特征、位置关系、环境、影片风格和比例等。 Midjourney 可以用于生成 IP 角色的动画效果。例如,生成一个帅气的男孩,描述其穿着、鞋子、视图等细节,还可以为女孩生成特定的形象,如来自未来赛博朋克的可爱女孩,穿着银色雨衣等。同时,要注意设置合适的关键词,如干净的背景、电影照明、超细节、3D 渲染等,以获得理想的效果。
2025-01-12
Ai如何绘画动漫人物角色
以下是关于 AI 绘画动漫人物角色的相关内容: Sarah Andersen 风格 主题风格: 漫画特色:通常使用简单黑白线条作画,配以极富表现力的角色表情,探讨如焦虑、社交尴尬、性别问题等,幽默呈现生活瞬间。 线条和轮廓:使用清晰简洁的线条,构建图像。 色调:大多数作品是黑白的,偶尔使用强调色。 角色设计:表情丰富,反映各种情绪状态。 元素:包含幽默和讽刺元素,以幽默方式反映日常生活场景。 技巧: 在主要描述语后面加上“by Sarah Andersen”或者“style reference Sarah Andersen”。 加入情感色彩的描述,如“joyful”“awkward”“anxious”等词。 利用cref 命令保持人物的一致性。 应用: 社交媒体上进行漫画创作。 使故事更加生动有趣的插图。 个性化礼物和商品设计(需注意版权问题)。 Niji·journey 5 生成多样化二次元角色设计风格 可以混合不同游戏风格引导生成角色设计,涉及绘画 AI 的“风格迁移”能力,基本原理是利用深度学习模型提取并分离图像的内容和风格特征,包括特征提取和特征重组。可以通过对游戏风格 Prompt 的更精确调整来控制混合比例。 Action figure 风格 创作建议: 复古风:模仿上世纪 8090 年代的可动人偶风格,采用饱和度较高、边缘略显粗糙的色彩,以及那个时代特有的设计元素。 动漫卡通化:将可动人偶设计成夸张的动漫风格,大眼睛、鲜明色彩,强调动作动态感和表情的戏剧性。 写实风格:追求极度逼真的描绘,细致刻画人物面部特征、服装皱褶和环境光影。 赛博朋克融合:结合赛博朋克元素,创造既未来又反叛的可动人偶形象。 其他: sref 种子值:可以和不同的种子值结合,创造出风格各异的 action figure。 内容: 经典角色重塑:选取广为人知的电影、漫画角色,重新诠释为可动人偶形态。 场景故事化:构想场景,让多个可动人偶在其中互动,讲述微型故事。 系列收藏展示:设计特定主题的可动人偶集合,展示收藏价值和展示美学。 跨界融合:尝试将不同时代或文化背景的角色进行融合,创造新颖独特的视觉体验。
2025-01-08
在使用sys prompt时为什么要为模型定义角色
在使用系统提示词(sys prompt)为模型定义角色具有以下重要性: 1. 符合特定应用场景:通过定义角色,使模型的行为和输出更符合具体的应用需求,例如让模型作为历史顾问回答历史问题,或作为技术专家解决技术难题。 2. 明确任务和风格:不仅可以指定具体的人物角色,还能设定一种交流风格,如正式、幽默、友好等。 3. 引导模型行为和输出:为模型提供固定的模板,确保其输出与期望和工作流的需求保持一致。 4. 优化用户体验:ChatGPT 有默认的“一个乐于助人的助手”角色,可通过修改系统提示词来满足更个性化的需求。 然而,也有观点认为不需要过度依赖角色扮演类的提示词。关键是要非常具体地描述出模型所在的使用环境,提供足够详细的信息,以避免模型未按预期完成任务。提示词最重要的是表达清晰准确。
2024-12-24
我想要让AI来操作,我这个电脑,然后呢?去充当一个AI客服的角色去回答微信上的问题有什么办法吗?
目前在微信中,Coze 平台是一个 AI 智能体创作平台,可以根据需求构建 AI 机器人并发布到多种社交平台。微信的不同功能在与 AI 对接上有所差异: 1. 个人微信/微信群:Coze AI 平台之前不支持直接对接,但国内版正式发布 API 接口功能后,直接对接已成为可能。 2. 微信公众号:Coze AI 平台支持对接,能让 AI 机器人自动回复用户消息。 3. 微信服务号:同样支持对接,可帮助企业提升服务效率。 4. 微信客服:Coze AI 平台支持对接,使 AI 机器人能够自动回答用户咨询,提高客服响应速度。 在把 AI 大模型能力接入微信后,对于类似客服的应用场景,存在模型幻觉导致胡乱回答的问题。对于非技术从业者,落地场景存在困难。一个问答机器人的界面配置包括 AI 模型、提示词、知识库。
2024-12-20
能到达图片重绘效果的软件
以下是一些能够实现图片重绘效果的软件及相关信息: Stable Diffusion: 将照片放入后期处理中,使用 GFPGAN 算法使人脸变清晰。可参考文章。 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。可参考文章。切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写以免对原图产生干扰。 Midjourney: 最新编辑器更新,可上传图片重新绘制。允许从计算机上传图像,然后扩展、裁剪、重绘、添加或修改场景中的元素。还推出了“图像重纹理化模式”,会估算场景的形状,然后重新应用纹理,使得所有光照、材质和表面都发生变化。所有图像编辑操作都可以通过文本提示和区域选择来控制。编辑器兼容模型个性化、风格参考、角色参考和图像提示功能。 常见问题:如果提出极其不合适的请求,或者要求修改一个非常小的区域,可能无法得到预期的结果;如果在场景中放了一个很小的头部并要求进行外绘,生成的身体可能会太大(所以请将头部放大一些)。 重纹理化:是一种通过使用另一张图像来引导图像结构或构图的方法。从构图引导图像开始(在全功能编辑器中上传或链接的基础或母图像),然后使用提示词和参数来添加所需的细节。 右侧显示的缩略图:显示器右侧的缩略图显示的是最近几次编辑会话的记录。左边稍大一点的缩略图是上传或链接的图像。其他四张缩略图是子图像,展示了 Midjourney 根据提示生成的四种不同表达方式。 按钮:用于查看更多相关内容。 使用规则:由于这些功能非常新,Midjourney 希望给社区和人工审核团队一个缓慢适应的时间,因此在第一个发布阶段,将这些功能开放给以下社区群体:已生成至少 10,000 张图像的用户,年度会员可用;过去 12 个月内一直是月度订阅用户的用户(MJ 尝试做得更细致一些,但数据库处理起来有些复杂,抱歉!)
2024-12-05
识别图片中的形状和文字元素并在PPT中重绘图像的AI工具
以下为您推荐一些能够识别图片中的形状和文字元素并在 PPT 中重绘图像的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,简化设计流程,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 另外,如果您想从游戏截图升级到 KV 品质,正式绘画目前有图生图和 controlnet 两种出图方式。但如果底图质量不够,想要 AI 更自由发挥,除了调高重绘幅度,还可以在 controlnet 上有更多探索。输入正负 TAG,设置好图片尺寸、迭代步数、采样器、重绘幅度后,等待图片生成。controlnet 包含的功能很多且在不断更新,如需更多了解可跳转 B 站深度学习:https://www.bilibili.com/video/BV1Ds4y1e7ZB/?spm_id_from=333.337.searchcard.all.click
2024-08-29
我创作了一个AI视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作糊了,我期望通过comfy对其重绘,能解决保留现实背景,卡通角色五官重绘更清晰吗?
在处理您提到的这种情况时,有以下一些建议和方法: 1. Dreamina 对 Prompt 的语义理解较好,您可以将运动速度设为慢速,并在 Prompt 里写轻微的相关描述,可能会有不错的效果。但需要注意的是,Dreamina 存在只有 8 帧和 720P 的限制,对比 Runway 的 24 帧和 4K 有差距。所以需要使用 Topaz Video AI 去增强到 24 帧和 4K,您可以在 B 站通过“Topaz Video AI 4.2.1”这个关键词搜索教程进行学习。增强完以后,再扔到剪映里裁成 21:9。 2. 对于人物在水中下沉等情况导致的脸糊问题,很多时候 AI 搞不定,可能需要使用传统 AE 自己制作普通的下沉位移动画。 不过,需要说明的是,在一些复杂的场景和动作中,AI 可能仍然存在一定的局限性,需要综合多种工具和方法来达到理想的效果。
2024-08-25
视频局部重绘
以下是关于视频局部重绘的相关信息: Haiper 工具: 能进行视频重绘,包括轻松修改颜色、纹理和元素以改变原视频的视觉内容。 局部重绘可通过点选方式选中需重绘区域,再输入替换内容提示词,但大量背景重绘效果一般,视频易崩。 文生视频支持选择风格、秒数(2s 和 4s)、种子值等。 网址:https://haiper.ai/ 文生视频不同风格展示可参考: 图生视频只能写提示词、秒数(2s 和 4s)、种子值。 【SD】工具: 原理是将蒙住的部分重新画,也可将未蒙住的部分重新画,比如蒙住人物重画其背景。 更进阶的用法是进入涂鸦重绘,用颜色画笔画任意想添加的东西,如在头顶加小黄花。 可添加关键词生成相应内容。 如需扩展背景,可在图生图中选择“缩放后填充空白”,重绘幅度 0.5,并增加宽度。 随着重绘幅度增大,人物细节可能改变,若想只改背景不改人物,可借助 PS 制作精确蒙版,进入“上传重绘蒙版”界面,上面放置需重绘的图像,下面放置 PS 中制作好的蒙版。 Video Battle AI 视频挑战: 本次大赛主题为首尾帧要求:视频首、尾、首的方式制作。 方法 1 为【MJ 出图+AI 视频软件】,使用 Midjourney 垫图➕描述出图,再去视频工具中转成视频。可下载项里的深度图,打开 MJ 官网上传深度图。Midjourney 官网:https://www.midjourney.com/ 。局部重绘有难度,最终方式为分开画再合成。
2024-08-15
MJ局部重绘
MJ 局部重绘是一种图像处理技术,它允许用户对图像的特定部分进行重新绘制或修改,而不需要改变整个图像。这种技术可以用于各种应用,如修复照片、创建动画、制作游戏等。 MJ 局部重绘的实现方式有很多种,其中一种常见的方式是使用图像处理软件,如 Adobe Photoshop 或 Sketch。这些软件提供了各种工具,如画笔、橡皮擦、填充工具等,用户可以使用这些工具对图像进行局部重绘。 另一种实现方式是使用深度学习技术,如卷积神经网络(CNN)。这些技术可以自动学习图像的特征,并根据用户的输入对图像进行局部重绘。这种方式通常需要大量的训练数据和计算资源,但可以实现更加复杂和自然的局部重绘效果。 总的来说,MJ 局部重绘是一种非常有用的图像处理技术,它可以帮助用户对图像进行局部修改和优化,以满足各种需求。
2024-05-21
我想学习MJ的局部重绘功能
以下是关于 MJ 局部重绘功能的介绍和使用方法: 1. 介绍:MJ 局部重绘功能可以选择一个区域并重新绘制这部分的内容。 2. 使用方法: 打开图片后,点击“编辑器”,选择需要重绘的区域。 若输入/settings 并启用“remix mode”,在编辑器中还将获得一个文本框,以便为该区域更改/修改提示。 更多详细的介绍可以参考《》这篇文章。
2024-05-02
老照片修复
以下是关于老照片修复的相关内容: ComfyUI 老照片修复 Flux Controlnet Upscale: 以前的高清放大工作流复杂,新模型结合工作流,十几个基础节点就能实现更好效果。 参数调节方面,先确认放大倍数,再根据图片调整 ControlNet 强度。 ControlnetUpscaler 放大模型是 Jasper 研究团队为低分辨率图像开发的,可与 diffusers 库一起使用,采用多种方式对真实图像进行人工退化训练,类似 Wang,Xintao 等人在 2021 年发表的方法,遵循 Flux.1dev 模型许可证范畴。 Flux Ultimator 能增加小细节和鲜艳色彩,在 0.1 强度设置下有显著增强效果,能集成到工作流程中,与其他 LORA 结合使用时强度需小于 0.5。 若图片质量细节不够,可选择 T5 Clip 的 fp16 版本。 ControlNet 传递的应是上传的原始图片。 【SD】用 AI 给老照片上色,岁月不改它模样: 新上线的 controlnet 模型中的 Recolor 模型可给黑白图片重新上色。 人物照片还原选择 realisian 的写实大模型,提示词描述颜色和对应内容,ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果更好。 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。 之后将图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型修复,vae 选择 vqgan,可不写提示词以免干扰原图。
2025-01-20
老旧照片高清修复
以下是关于老旧照片高清修复的方法: 1. 使用 Stable Diffusion 进行修复: 将照片放入后期处理中,使用 GFPGAN 算法使人脸变清晰。可参考文章。 将图片发送到图生图中,打开 stableSR 脚本,放大两倍。此放大插件是所有插件中对原图还原最精准、重绘效果最好的。可参考文章。 切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可以不写以免对原图产生干扰。 为做到颜色与内容的统一,启用 cutoff 插件来进行控制,依次按顺序设置好颜色提示词。可参考文章。 2. 使用 ComfyUI 进行修复: 结合 Flux Controlnet Upscale 模型,以前的工作流比较复杂,现在只要十几个基础的节点就能实现同样的效果,甚至可能更好。 参数调节:一般先确认放大的倍数,然后根据出来的图片调整 controlNet 的强度。 ControlnetUpscaler 放大模型:Flux.1dev ControlNet 是 Jasper 研究团队为低分辨率图像开发的模型,可直接与 diffusers 库一起使用,通过特定代码加载管道,加载控制图像并进行图像处理。其训练方式采用合成复杂数据退化方案,结合图像噪声、模糊和 JPEG 压缩等多种方式对真实图像进行人工退化。 Flux Ultimator 细节增强:能增加小细节,让图像尽可能逼真,可放大色调的丰富性和深度,在 0.1 的强度设置下也能有显著增强效果,能顺利集成到工作流程中,与其他 LORA 结合使用效果好,结合时需将强度降低小于 0.5。 T5 Clip:如果发现出来的图片质量细节不够,选择 fp16 的版本。 图像的传递:controlNet 这里传递的应该是上传的原始图片,因为这个是 controlNet 而不是潜空间图像。
2025-01-19
集合视频翻译和音色克隆,照片说话功能为一体的平台,ViiTorai
很抱歉,目前没有关于“ViiTorai”这个集合视频翻译、音色克隆和照片说话功能为一体的平台的相关信息。
2025-01-12
设计门头照片的AI
以下是一些可以帮助您设计门头照片的 AI 产品: 1. Looka:这是一个在线设计平台,使用 AI 理解您的品牌信息和设计偏好,生成多个门头照片设计方案供您选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过您回答关于品牌和设计风格的问题来生成门头照片选项。 3. Designhill:其门头照片制作器使用 AI 技术创建个性化设计。您可以选择不同的设计元素和风格,AI 基于输入生成方案。 4. LogoMakr:提供简单易用的设计工具,您可以通过拖放方式设计,利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供门头照片设计的模板和元素,利用 AI 辅助的设计建议创建品牌标识。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI 门头照片设计工具,根据您输入的品牌名称和行业类别快速生成设计方案。 7. 标小智:中文 AI 门头照片设计工具,利用人工智能技术帮助创建个性化的门头照片。 使用这些工具时,您通常可以根据自己的品牌理念和视觉偏好,通过简单的交互获得一系列设计方案,并进一步定制和优化,直到满意为止。另外,您可以访问网站的 AI 生成门头照片工具版块,有更多好用的工具:
2025-01-09
我想把照片变成漫画形式,可以帮我找一个ai做吗
以下是 OpenAI 春季发布会中关于将照片转换为漫画的一些示例: 输入:一名留着中长棕色头发、留着胡须的年轻白人男子表情中性。他戴着眼镜,穿着浅灰色 T 恤。背景是简单的米色,方形。图像整体基调卡通俏皮。 输出:相应的漫画。 输入:一位黑发、笑容灿烂的年轻人摆出专业的头像。他穿着深色西装外套,系着图案领带,散发出优雅而专业的气息。他的眼睛明亮,笑容真诚,传达出幸福和自信的感觉。背景是中性灰色,将焦点放在拍摄对象的脸上。 输出:相应的漫画。 输入:一位留着及肩黑发的年轻亚洲女性摆出姿势拍照。她穿着绿色高领毛衣,表情中性。她的眉毛修整整齐,涂着淡粉色的口红。背景是一面朴素的白墙。 输出:相应的漫画。 输入:一位留着整洁黑发、戴着眼镜的年轻亚洲男子摆出姿势拍照。他表情温和,穿着一件休闲的靛蓝色 T 恤。柔和的灯光在中性背景下突出了他的五官,给照片带来了平静的感觉。 输出:相应的漫画。 输入:一名浅棕色头发的年轻白人对着镜头微笑。他穿着一件简单的黑色 T 恤,表情随意、轻松。背景似乎是一个郁郁葱葱的绿色花园,为肖像增添了一种充满活力和自然的感觉。 输出:相应的漫画。 输入:一位年轻的印度男子站在他的家中,脸上挂着欢迎的微笑。他有一头深色短发,穿着一件带有热带图案的蓝色衬衫。背景中的厨房为图像增添了舒适和居住的感觉。 输出:相应的漫画。 输入:一位年轻的白人男子在户外摆姿势,笑容温暖,留着浅棕色短发。他穿着一件经典的蓝色衬衫,给人一种利落又平易近人的感觉。背景柔和模糊,将注意力集中在他友好的表情和随意的举止上。 输出:相应的漫画。 您可以参考以上示例,了解 OpenAI 在照片转漫画方面的能力。但需要注意的是,目前 OpenAI 暂未直接提供将照片转换为漫画的公共服务。您还可以尝试其他专门用于照片转漫画的工具或软件,如 Adobe Photoshop、Prisma 等。
2025-01-03