直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

我创作了一个AI视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作糊了,我期望通过comfy对其重绘,能解决保留现实背景,卡通角色五官重绘更清晰吗?

回答

在处理您提到的这种情况时,有以下一些建议和方法:

  1. Dreamina 对 Prompt 的语义理解较好,您可以将运动速度设为慢速,并在 Prompt 里写轻微的相关描述,可能会有不错的效果。但需要注意的是,Dreamina 存在只有 8 帧和 720P 的限制,对比 Runway 的 24 帧和 4K 有差距。所以需要使用 Topaz Video AI 去增强到 24 帧和 4K,您可以在 B 站通过“Topaz Video AI 4.2.1”这个关键词搜索教程进行学习。增强完以后,再扔到剪映里裁成 21:9。
  2. 对于人物在水中下沉等情况导致的脸糊问题,很多时候 AI 搞不定,可能需要使用传统 AE 自己制作普通的下沉位移动画。

不过,需要说明的是,在一些复杂的场景和动作中,AI 可能仍然存在一定的局限性,需要综合多种工具和方法来达到理想的效果。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

卡兹克:我们花了10天时间,给CCTV6做了一部AI短片 - 5000字全流程复盘拆解

我只能在此呼吁一下Dreamina:求求了,啥时候这个蠢问题,赶紧改了吧。。。Dreamina对Prompt的语义理解非常好,强烈推荐大家把运动速度设为慢速,我经常喜欢慢速+Prompt里面写轻微XX。会有很不错的效果。另一个Dreamina非常智障的一点是,只有8帧+720P,对比Runway这种24帧+4k的,基本约等于没法用。所以还是需要Topaz Video AI去增强到24帧+4K的。Topaz Video AI的教程我就不在这里细说了,给大家一个关键词:Topaz Video AI 4.2.1,拿着这个关键词,去B站搜教程,又好用又简单,非常方便。增强完以后,再扔到剪映里,裁成21:9,这一套就算是齐活了。AI视频的趴写了这么多,基本已经能处理大部分的效果了。但是,很多东西,依然是AI搞不定的。比如人物在水中下沉的时候,不管你用哪家AI视频,脸必糊,跟恐怖片一样。这种糊脸,在视频里,讲道理是无法接受的,太恐怖,也太让人出戏。于是,就只能上传统AE,自己做,反正就是个普通的下沉位移动画。跑了个静态图。

前Sora时代我最想做的AI短片——使用Pika、Pixverse、Runway、SVD四大AI视频工具

(这张双人关系的图我最后没用,因为四个工具都跑不出稳定的视频,我懒得Roll了)(角色一:扎马尾、穿白色T恤、穿牛仔裤的14岁女孩)(角色二:戴眼镜、灰色头发、穿灰色短衬衫的50岁男人)接着,确定了主场景,主场景是四面都是书柜的屋子,但是场景一致性太难保持了,所以我们取巧,用了穿书的方式,把场景分布到不同地区。在室内的镜头,因为AI对书房的理解也还比较相似,尽管有些穿帮的地方,还好主场景出现的时间不算长,倒也还能接受。解决了人物和场景一致性的问题,生图的障碍就还是双人关系镜头的部分。但这次要比上个视频做起来稍微容易一些,因为至少生成关系镜头没有那么麻烦了,MJ的语义理解好多了,部分镜头我们还比较喜欢,比如女孩能在镜子里看到妈妈这个镜头。但我们要自由地生成同场戏内不同角度的关系镜头,还是很难。比如女孩发现不对劲之后,回到书店,问阿叔怎么回事,阿叔没有说话,女孩生气离开这场戏,其实还需要一个两人在书店走廊里的中景或全景镜头,去展示两人的位置关系,但Roll得有点累了。

AI拍电影丨AI脚本+AI视频+AI配音

1.视觉风格:确保赛博朋克的视觉元素(如霓虹灯、高科技界面、未来感城市景观)与《山海经》中神兽的古典形象相协调。使用先进的特效技术来创造神兽的逼真和神秘外观。2.音效与配乐:使用融合传统东方乐器和现代电子音乐的配乐,以增强视频的神秘感和未来感。音效在塑造氛围和强化视觉元素上起着关键作用。3.叙事节奏:考虑到视频长度有限,叙事节奏需要紧凑而流畅。确保每个场景都能有效地推进故事,同时保持观众的兴趣。4.角色设计:主角的形象设计应与赛博朋克环境和神兽的神秘感相协调。他们的服装、装备应体现未来科技的特点,同时在与神兽的互动中显示出好奇和敬畏。5.文化元素的融合:在尊重《山海经》文化精髓的基础上,巧妙融入赛博朋克元素。例如,可以通过高科技设备来解读或与神兽交流。6.观众参与:考虑在视频中加入悬念或互动元素,如隐藏的线索或暗示,鼓励观众进行讨论和猜测。7.后期制作:精心调整色彩、光影和特效,以确保最终视频的视觉效果符合预期。不要忽视细节,因为它们对于营造一个引人入胜的世界至关重要。

其他人在问
AI画卡通画,有什么平台
以下是一些可以用于 AI 画卡通画的平台: MewXAI:这是一款强大专业且新手友好、操作简单的 AI 绘画创作平台。其功能包括 MX 绘画、MX Cute、MJ 绘画、边缘检测、室内设计、姿态检测、AI 艺术二维码、AI 艺术字等。访问地址:https://www.mewxai.cn/ Lucidchart:强大的在线图表制作工具,集成了 AI 功能,可自动化绘制多种示意图,如流程图、思维导图、网络拓扑图等。拖放界面易于使用,支持团队协作和实时编辑,有丰富的模板库和自动布局功能。官网:https://www.lucidchart.com/ Microsoft Visio:专业的图表绘制工具,适用于复杂的流程图、组织结构图和网络图。其 AI 功能可帮助自动化布局和优化图表设计,集成 Office 365,方便与其他 Office 应用程序协同工作,有丰富的图表类型和模板,支持自动化和数据驱动的图表更新。官网:https://www.microsoft.com/enus/microsoft365/visio/flowchartsoftware Diagrams.net:免费且开源的在线图表绘制工具,适用于各种类型的示意图绘制。支持本地和云存储(如 Google Drive、Dropbox),有多种图形和模板,易于创建和分享图表,可与多种第三方工具集成。官网:https://www.diagrams.net/
2024-11-12
照片生成卡通画
以下是关于照片生成卡通画的相关内容: 1. 个性卡通头像生成: 复杂提示词:如“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultra detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino iw 1.5 s 500 v 5”。 不同照片生成:可更换新照片使用上述提示词重新生成。 其他调整:若不喜欢 Disney 风格,可将提示词中的“Disney”换成“Pixar”;若为女孩,可将“boy”换成“girl”。每次生成 4 张图片,满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击 V1~V4 进行修改。 2. 【SD】简笔水彩风格插画生成: 大模型:“Flat2D Animerge”,适合生成卡通动漫图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复可拉到 11)。 Lora:“Chinese painting style”可增加中国画水彩风格效果,权重设置为 0.4;“Crayon drawing”可添加简单线条和小孩子笔触,权重设置为 0.8。 操作步骤:将图片丢到标签器中反推关键词,发送到“文生图”;在正向提示词末尾添加上述 lora;设置好尺寸,重绘幅度开 0.5 让 AI 更自由发挥,想接近原图可降低数值;将图放入 controlnet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。 3. 进阶使用技巧总结: 通用人物模版:想用真人照片生成卡通头像,可用「真人照片」+「照片描述」+「方法 1 的关键词」处理。若生成满意的图要记得保存,下次同种类型可直接喂图,效果更好。
2024-11-07
卡通形象变成卡通视频的工具
以下为将卡通形象变成卡通视频的工具及方法: 使用剪映可以实现此操作,具体步骤如下: 1. 生成数字人 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”,软件会生成对应音视频并添加到当前视频轨道中。左下角会提示渲染完成时间,可点击预览查看效果。 2. 增加背景图片 删除先前导入的文本内容,因为视频音频已包含文字。 点击左上角“媒体”菜单,“导入”本地图片,选择一张图片上传,点击图片右下角加号添加到视频轨道(会覆盖数字人)。 拖动轨道右侧竖线使图片与视频对齐,选中轨道,拖动图片角放大至合适尺寸,将数字人拖动到合适位置。 3. 增加字幕 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段形成字幕。 至此,数字人视频完成。若希望数字人换脸,需使用另一个工具。 另外,数字人视频的整体制作流程大致分为三步: 1. 创建视频内容:通过输入文稿内容,确定数字人播出的内容。 2. 生成数字人:通过工具及视频内容生产数字人形象及播放语音。 3. AI 换脸:通过 AI 工具,将数字人的脸转换成指定宣传的形象,以便以自己的品牌形式宣传。
2024-11-06
哪些软件可以用来生成卡通形象?
以下是一些可以用来生成卡通形象的软件及相关操作: 1. Midjourney 背景:之前有制作过相关教程,可利用其以图绘图功能生成迪斯尼卡通风格的头像。若没有账号或不懂基础操作,可参考之前的教程。 操作: 选一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,上传文件选取图片并发送。 复制图片在浏览器中打开的链接。 在聊天窗口输入/imainge 找到/imagine prompt,将链接放入,加提示词(以英文逗号分隔)和设置参数。 设置参数: iw 1.5:设置参考图片的权重,数值越高与参考图片越接近,默认 0.5,最大 2,可选择中间值调整。 s 500:设置风格强度,个性化、艺术性,数字越大越有创造力和想象力,可设置 0 1000 间任意整数。 v 5:用 Midjourney 的第 5 代版本,需订阅付费,不想付费可用v 4。 no glasses:若不喜欢戴眼镜的图片,可使用此设置。 2. 提示词: 风格提示词:dark fantasy style(黑暗幻想风格)、Pop art(波普艺术)、impressionism(印象派)、Neoimpressionism(后印象派)、fauvism(野兽派)、expressionism(表现主义)、abstract expressionism(抽象表现主义)、cubism(立体主义)、contemporary art(当代艺术)、anime style(动画风格)、cartoon(卡通)、visionary art(视觉艺术)、comic book(漫画书)、streampunk(蒸汽朋克)、dark theme(黑暗主题)、miniature model film(微缩模型电影)、DC Comics(能生成美漫封面的漫画画面)、pixiv(纯二次元风格人像)、style ofAl Williamson(威廉森风格)、Bauhaus Style(包豪斯风格)、Warhol(安迪·沃霍尔风格)、Luminsm(光色主义)、Magic Realism(魔幻现实主义)、fantastic Realism(魔幻现实主义)、Classical Realism(批判现实主义)
2024-11-02
生成卡通形象的AI
以下是关于生成卡通形象的 AI 的相关内容: 1. 通用人物模版:如果想用真人照片生成卡通头像,可以用“真人照片”+“照片描述”+“方法 1 的关键词”来处理。在使用过程中,若生成了满意的图,记得保存,下次同种类型可直接拿来喂图,效果更好。 2. 生成式 AI 和视觉效果:生成式 AI 会被艺术家作为工具,且需要一定程度的用户监督。以漫画家 Yoko Li 为例,用其 70 张图片训练的模型能以令人不安的方式模仿生成图像,每个艺术家都要思考创作方向,训练过的模型能提供更多选项。AI 模型生成的图像通常有非白色背景。在创意资产为重要业务组成部分的行业中,生成式 AI 带来的经济效益提升、创造新风格和概念的灵活性以及生成完整工作成果的能力,将使行业发生明显变化,不仅限于图像,还适用于整个设计领域。 3. 小码哥的 AI 绘画示例:如“一只穿着柔软中国唐代服装的小白兔,超级可爱,电影灯光,复杂的花丝设计,皮克斯风格,拟人化,手持粉色灯笼,大眼睛,微笑,桃花,流动,迷人,不朽,蓬松,闪亮的刷毛,花瓣,童话故事,虚幻引擎 5 和辛烷渲染,令人难以置信的细节,4K,在艺术站流行,华丽,超广角,4K ar 10:16 test video upbeta upbeta upbeta”等十二生肖唐装系的描述。
2024-11-02
Midjourney生成知名动漫或卡通形象受限制了么?
Midjourney 在生成知名动漫或卡通形象时存在一定的限制。例如,在生成角色方面,最好不要生成过多角色,过多甚至可能指 2 个。做人、做动物的情况还好,但对于有拟人角色需求的情况,可能难以生成满意的结果。比如小龙喷火到小兔子举着的礼物盒这种看似简单的需求,可能无法达到满意效果,可能出现动物不拟人或龙的体型超大等情况。对于像中国龙这种数据样本较少的形象,生成符合要求的图很有挑战性。 在视频生成方面,如果想让角色做出一些较大的动作,比如转头、掉眼泪、抬手或更生动的表情变化,现有的技术还不够成熟,还需要更先进的技术、更丰富的数据和更强大的计算能力。此时的策略是尽量规避制作需要大动作表现的视频,如果实在避免不了,可以尝试制作一些只涉及小动作的场景,然后通过加入台词和场景描述来补充细节和深度,帮助观众更好地理解场景背景和角色心理,以弥补视觉上的不足。
2024-10-29
AI如何充当专业顾问和知识助教的角色
AI 充当专业顾问和知识助教的角色主要体现在以下几个方面: 1. 在医疗保健领域,AI 可能通过元学习更快地获取知识,并通过深入探索其内部工作机制,成为下一代专家的教师,最终超越领域专家的角色。 2. 当需要大模型充当专属客服时,如依据特定书籍内容回答问题或作为公司客服了解相关信息,为大模型提供知识背景可减少其幻觉,更高级的方式是使用 RAG 知识内容增强检索。 3. 在其他领域,如搭配服装、提供职业建议、提升沟通能力等方面,已经出现了专门设计的 AI 驱动工具和教练。未来,每个人可能拥有理解自身生活独特背景的个性化聊天机器人,为生活变化和实现目标提供建议与支持,如在离婚、上大学、生孩子、锻炼、改善财务状况等方面。
2024-11-15
如何借鉴“决战拜年之巅”:这是一款基于 GLM 大模型开发的微信小程序游戏,玩家在 10 个 AI 角色组成的家人群里,面对“七大姑八大姨”的连环拷问,自由对话打出属于自己的结局。实现一个工作场合的游戏
以下是借鉴“决战拜年之巅”实现一个工作场合游戏的相关要点: 1. 开发背景:“决战拜年之巅”是参加 Globalgamejam 游戏比赛时,在 48 小时内开发的,主题源于“make me laugh”,产品负责人谐音想到江浙沪孝子排行榜的“孝”,结合春节想到做类似拜年的东西。 2. 火爆情况:在参赛群发布半成品后,在 QQ、微信迅速火爆,两天内有 200 万用户,最高峰同时在线 6 万人,服务器一度支持不了,凌晨才做好调整,后续有厂商赞助服务器,上线约一周。 3. 游戏特点:基于 GLM 大模型开发,又称过年模拟器,玩家在 10 个 AI 角色组成的家人群里,面对“七大姑八大姨”的连环拷问自由对话打出结局。 4. 借鉴要点: 明确创新主题和玩法,结合特定场景和需求。 注重用户体验,及时应对服务器等技术支持问题。 利用 AI 技术实现角色互动和自由对话。 需要注意的是,“决战拜年之巅”被认为可能是一个 chatbot 而非严格意义上的游戏。在设计工作场合的游戏时,要明确以下三个点:(具体要点未在提供的内容中明确)
2024-11-02
有几十个角色台词的语音文件,用什么方式克隆他的声音质量更好?
很抱歉,您提供的内容中并未包含关于克隆几十个角色台词语音文件以获得更好声音质量的具体方法和相关信息。但一般来说,要提高语音克隆的质量,可以考虑以下几个方面: 1. 选择高质量的原始语音文件,确保其清晰、无噪音。 2. 利用先进的语音克隆技术和工具,例如一些专业的语音处理软件。 3. 对语音特征进行精细的分析和提取,以准确捕捉原始声音的特点。 4. 进行适当的参数调整和优化,以适应不同的角色和场景需求。
2024-11-01
AI创建角色的指令
以下是关于 AI 创建角色的一些信息: 在 c.ai 这个 AI 角色扮演对话平台中,创建角色的功能非常简洁,主要依赖用户编写的 Description(基础信息)和 Definition(复杂背景),并且已经支持上传声音片段实现语言克隆。 在筑梦岛中,创建梦中人(捏崽)需要用户提供各类信息,其中最核心的是完整设定这样的人设背景信息;创建梦屋(拉群)则允许用户添加多个 AI 角色创建一个群聊。 在游戏开发中,如 Arrowmancer 这款 RPG 游戏,具有 AI 创造的角色,以实现几乎无限的新游戏玩法。还有游戏开发公司使用 AI 让玩家创建自己的游戏内角色形象,相比让玩家从零开始上传自己的内容,通过 AI 生成内容更安全,因为可避免创造冒犯性内容,同时让玩家有更强的归属感。 在使用 Nijijourney 5 进行二次元角色设计时,为获得最佳结果,可能需要尝试不同的权重组合并根据产出调整 Prompt。
2024-10-31
在一个设定中,使用阿里千问模型,设定角色为“美嘉”,知识库为《爱情公寓》全季剧情,实现问答。
在一个设定中,使用阿里千问模型,将角色设定为“美嘉”,知识库设定为《爱情公寓》全季剧情来实现问答。 大语言模型就像一个学习过无数本书、拥有无穷智慧的人,对公共知识、学识技能、日常聊天很擅长,但在工作场景中需要提示词来告诉它角色和专注技能,变成所需的“员工”。知识库则相当于给这个“聪明员工”发放的工作手册,比如知道老板娘吃饭要打三折等特定信息。 这里的设定为:AI 模型使用阿里千问模型,提示词设定的角色是“美嘉”,按照其人设、背景和对话风格设定,知识库是《爱情公寓》全季剧情,让“美嘉”拥有过往“记忆”。 例如,提问“你是谁?你和子乔在台球厅吵架那次是为了什么吵架?”,回复是“我是陈美嘉,那次在台球厅和吕子乔吵架是因为他约会被人撞见,我讽刺他脸大影响信号,他还反击我。后来谈到过去的事情,我指责他忘恩负义,他就说我平。最后,我伤心地说要分手,因为他之前甩过我。” 然而,有时回答会不准确,比如提问“一菲为美嘉找了一份助教工作”,AI 可能未根据正确的知识库内容回答,这是常见的错误场景,在严肃场景中不能接受。优化 AI 更准确回答问题的过程称为 RAG(RetrievalAugmented Generation),即检索增强生成,由检索器从外部知识中快速找到与问题相关的信息,生成器利用这些信息制作精确连贯的答案,适合处理需要广泛知识的任务,如问答系统,能提供详细准确的回答。
2024-10-29
面試主管請您於第二次面試時回答以下三個問題並以PPT呈現出來。 1. AI 在教育中的發展趨勢 AI 技術未來幾年在教育領域的發展趨勢是什麼?哪些創新技術或應用會對教育產生重大影響? 2. AI 對教育角色的改變 隨著 AI 的應用增多,教師和學生的角色會發生哪些轉變?您如何看待 AI 在教學過程中的定位? 3. AI 賦能的教育未來 請描述一個您心中 AI 賦能的未來教育場景。這個場景下,AI 如何幫助學生、教師和管理者提升教學與學習體驗?
很抱歉,目前知识库中没有关于您所提到的这三个问题的相关内容。但以下是为您提供的一些初步分析和思路: 对于“AI 在教育中的发展趋势”: AI 技术在未来几年于教育领域的发展趋势可能包括更加个性化的学习体验、智能化的教学辅助工具、虚拟现实和增强现实技术的融合应用等。创新技术如自适应学习系统能够根据学生的学习进度和特点提供定制化的学习内容;自然语言处理技术可以实现更智能的辅导和答疑。 对于“AI 对教育角色的改变”: 随着 AI 的应用增多,教师可能会从知识传授者转变为引导者和促进者,更多地关注学生的情感需求和综合素质培养。学生则会更加主动地参与学习过程,成为自我导向的学习者。AI 在教学过程中可以作为辅助工具,帮助教师提高教学效率,为学生提供个性化支持。 对于“AI 赋能的教育未来”: 在一个 AI 赋能的未来教育场景中,学生可以通过智能设备随时随地获取个性化的学习资源,AI 能够根据学生的学习情况实时调整教学内容和进度。教师可以借助 AI 分析学生的学习数据,更精准地进行教学设计和辅导。管理者能够利用 AI 进行教育资源的优化配置和决策制定,提升教育管理的效率和质量。 以上内容仅供参考,您可以根据实际情况进一步深入研究和完善。
2024-10-11
识别图片中的形状和文字元素并在PPT中重绘图像的AI工具
以下为您推荐一些能够识别图片中的形状和文字元素并在 PPT 中重绘图像的 AI 工具: 1. Gamma:这是一个在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片。它支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 2. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出。用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,可根据需求选择不同风格和主题的模板,适用于多种场合。网址:https://www.xdesign.com/ppt/ 3. Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,简化设计流程,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/ 另外,如果您想从游戏截图升级到 KV 品质,正式绘画目前有图生图和 controlnet 两种出图方式。但如果底图质量不够,想要 AI 更自由发挥,除了调高重绘幅度,还可以在 controlnet 上有更多探索。输入正负 TAG,设置好图片尺寸、迭代步数、采样器、重绘幅度后,等待图片生成。controlnet 包含的功能很多且在不断更新,如需更多了解可跳转 B 站深度学习:https://www.bilibili.com/video/BV1Ds4y1e7ZB/?spm_id_from=333.337.searchcard.all.click
2024-08-29
我做了一个视频,背景是实拍的城市照片,角色是一个卡通角色,通过即梦让照片上的卡通角色动起来后,发现卡通角色的脸跟手臂动作都糊了。 我现在有什么办法优化,对卡通角色五官重绘更清晰的情况下,还保留现实的照片背景。(用sd重绘的话是不是就丢失了)
以下是一些可能有助于您优化视频的建议: 1. 对于您提到的卡通角色动作模糊的问题,可以尝试使用 Dreamina 工具,并将运动速度设为慢速,同时在 Prompt 里写轻微的动作描述,可能会有不错的效果。 2. 由于 Dreamina 工具存在只有 8 帧和 720P 的限制,您可以使用 Topaz Video AI 将其增强到 24 帧和 4K。在 B 站搜索“Topaz Video AI 4.2.1”关键词能找到相关教程。增强完成后,再放到剪映里裁成 21:9 的比例。 3. 对于卡通角色五官不清晰的情况,如果 AI 工具无法处理,可能需要使用传统的 AE 软件自己制作,比如普通的下沉位移动画。 需要注意的是,在某些情况下,如人物在水中下沉时,AI 视频可能会出现脸糊的情况,这种情况可能需要传统手段来解决。
2024-08-25
视频局部重绘
以下是关于视频局部重绘的相关信息: Haiper 工具: 能进行视频重绘,包括轻松修改颜色、纹理和元素以改变原视频的视觉内容。 局部重绘可通过点选方式选中需重绘区域,再输入替换内容提示词,但大量背景重绘效果一般,视频易崩。 文生视频支持选择风格、秒数(2s 和 4s)、种子值等。 网址:https://haiper.ai/ 文生视频不同风格展示可参考: 图生视频只能写提示词、秒数(2s 和 4s)、种子值。 【SD】工具: 原理是将蒙住的部分重新画,也可将未蒙住的部分重新画,比如蒙住人物重画其背景。 更进阶的用法是进入涂鸦重绘,用颜色画笔画任意想添加的东西,如在头顶加小黄花。 可添加关键词生成相应内容。 如需扩展背景,可在图生图中选择“缩放后填充空白”,重绘幅度 0.5,并增加宽度。 随着重绘幅度增大,人物细节可能改变,若想只改背景不改人物,可借助 PS 制作精确蒙版,进入“上传重绘蒙版”界面,上面放置需重绘的图像,下面放置 PS 中制作好的蒙版。 Video Battle AI 视频挑战: 本次大赛主题为首尾帧要求:视频首、尾、首的方式制作。 方法 1 为【MJ 出图+AI 视频软件】,使用 Midjourney 垫图➕描述出图,再去视频工具中转成视频。可下载项里的深度图,打开 MJ 官网上传深度图。Midjourney 官网:https://www.midjourney.com/ 。局部重绘有难度,最终方式为分开画再合成。
2024-08-15
MJ局部重绘
MJ 局部重绘是一种图像处理技术,它允许用户对图像的特定部分进行重新绘制或修改,而不需要改变整个图像。这种技术可以用于各种应用,如修复照片、创建动画、制作游戏等。 MJ 局部重绘的实现方式有很多种,其中一种常见的方式是使用图像处理软件,如 Adobe Photoshop 或 Sketch。这些软件提供了各种工具,如画笔、橡皮擦、填充工具等,用户可以使用这些工具对图像进行局部重绘。 另一种实现方式是使用深度学习技术,如卷积神经网络(CNN)。这些技术可以自动学习图像的特征,并根据用户的输入对图像进行局部重绘。这种方式通常需要大量的训练数据和计算资源,但可以实现更加复杂和自然的局部重绘效果。 总的来说,MJ 局部重绘是一种非常有用的图像处理技术,它可以帮助用户对图像进行局部修改和优化,以满足各种需求。
2024-05-21
我想学习MJ的局部重绘功能
以下是关于 MJ 局部重绘功能的介绍和使用方法: 1. 介绍:MJ 局部重绘功能可以选择一个区域并重新绘制这部分的内容。 2. 使用方法: 打开图片后,点击“编辑器”,选择需要重绘的区域。 若输入/settings 并启用“remix mode”,在编辑器中还将获得一个文本框,以便为该区域更改/修改提示。 更多详细的介绍可以参考《》这篇文章。
2024-05-02
什么工具/模型/API 可以根据宠物照片生成数字宠物 可以有简单的活动。
以下是一个可以根据宠物照片生成数字宠物并具有简单活动的工具/模型/API: 出门问问 Mobvoi 的照片数字人工作流及语音合成(TTS)API。 出门问问是一家以生成式 AI 和语音交互为核心的人工智能公司,为全球多个国家提供面向创作者的 AIGC 工具、AI 政企服务,以及 AI 智能硬件。致力于打造国际领先的通用大模型,通过 AI 技术、产品及商业化三位一体发展,致力成为全球 AI CoPilot 的引领者。 在 ComfyUI 全球领导力峰会上,特意搭建了数字人 workflow(照片数字人驱动),仅需上传一张照片,输入一段文字或者上传一段音频,就可以生成短视频让“照片开口说话”。本次活动特意提供了免费 api 额度及操作指南给大家进行体验。以下是一些不同风格的照片驱动效果展示:
2024-11-16
有可以更具提供的文本和照片生成视频的AI吗?
以下是一些可以根据提供的文本和照片生成视频的 AI 工具: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作并支持视频编辑。目前内测免费,其生成服务托管在 Discord 中。操作步骤包括加入 Pika Labs 的 Discord 频道,在“generate”子区输入指令生成或上传本地图片生成视频,对不满意的效果可再次生成优化。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 。 内容由 AI 大模型生成,请仔细甄别。
2024-11-11
照片修复
以下是关于照片修复的相关知识: 图像高清修复与无损放大的流程通常分为三部分: 图像输入:添加 Load Image 节点加载图像,不建议上传大分辨率图片,因其处理时间长。 图像高清修复:使用 Iceclear/StableSR 等模型进行高清修复并 2 倍放大,搭配 Stable SR Upscaler 模型和合适的提示词,如正向:(masterpiece),(best quality),(realistic),(very clear),反向:3d,cartoon,anime,sketches,(worst quality),(low quality)等。 图像高清放大:用 realisticVision 底膜进行二次修复,使用提示词反推 node 提取画面提示词,搭配 tile ControlNet 提升细节感,再用合适的高清放大模型二次放大。 用 AI 给老照片上色: 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时将图片放大。 可在 PS 里调整角度和裁切照片,然后上色。对于复杂照片,可放弃人物服装颜色指定,只给场景方向,加入第二个 controlnet 控制颜色,如使用 t2ia_color 模型,关键词如蓝天、绿树、灰石砖。 将照片放入后期处理,使用 GFPGAN 算法清晰人脸,五官重绘后,再将图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 模型修复,vae 选择 vqgan,可不写提示词以免干扰原图。
2024-11-06
老照片修复
以下是关于用 AI 给老照片上色的详细步骤和方法: 1. 启用 MutiDiffusion 插件,不开放大倍数,仅使用分块渲染功能,在显存不够时放大图片。 2. 在 PS 里进行角度调整和照片裁切。 3. 对于人物照片还原,选择 realisian 的写实大模型,提示词直接描述颜色和对应内容。ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 4. 将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。 5. 把图片发送到图生图中,打开 stableSR 脚本放大两倍,切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 6. 对于复杂的照片,如人物多、场景复杂、像素低的,可先放弃人物服装颜色指定,只给场景方向,让 AI 自行决定颜色。还可加入第二个 controlnet 控制颜色,使用 t2ia_color 模型,给出简单关键词如“蓝天、绿树、灰石砖”。 参考文章: 1. 2. 作者:白马少年,发布时间:20230910 19:00,原文网址:https://mp.weixin.qq.com/s/hlnSTpGMozJ_hfQuABgLw
2024-11-06
能修复老照片吗
AI 可以修复老照片。以下是一些相关的方法和工具: 可以使用 Stable Diffusion(SD)中的 controlnet 模型中的 Recolor 新模型为黑白老照片重新上色。提示词可直接描述颜色和对应的内容,ControlNet 选择 Recolor,预处理器选择“recolor_luminance”效果较好。 将照片放入后期处理中,使用 GFPGAN 算法将人脸变清晰。 把图片发送到图生图中,打开 stableSR 脚本,放大两倍,切换到 sd2.1 的模型进行修复,vae 选择 vqgan,提示词可不写以免干扰原图。 辅助工具方面: 本地工具放大:https://www.upscayl.org/download SD 放大:扩散模型可增加更多细节 开源工作流: 其他工具和网站: stability.ai 的 https://clipdrop.co/tools 画质增强 magnific 遥遥领先:https://magnific.ai/ Krea https://www.krea.ai/apps/image/enhancer Image Upscaler:https://imageupscaler.com/ 佐糖:https://picwish.cn/photoenhancerapi?apptype=apsbdapi&bd_vid=8091972682159211710 腾讯 ARC https://arc.tencent.com/zh/aidemos/humansegmentation?ref=88sheji.cn 腾讯开源的模型,能恢复老照片:https://github.com/TencentARC/GFPGAN ,在线测试地址:https://replicate.com/tencentarc/gfpgan 美图老照片修复:https://www.xdesign.com/quality/?channel=sllbd90&bd_vid=11711254260543749686 Imglarger:https://imglarger.com/ Let's Enhance:https://letsenhance.io/ Waifu2x:http://waifu2x.udp.jp/
2024-11-05