Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

可灵ai如何保持人物一致性

Answer

要保持可灵 AI 中人物的一致性,可以参考以下方法:

  1. 人物设定:
    • 明确主角、配角等人物的性格特点、外貌特征等,如主角是一位 40 岁的中年男探险家,性格特点是面对挑战从不轻言放弃,外貌特征是健壮、棕色头发、常穿探险服。
  2. MJ--cref 控制人物一致性:
    • 先根据人物设定,在 MJ 里筛选适合的人物形象,选中后右键复制图片链接。
    • 在尾缀加入【--cref 图片链接】控制人物一致性,【--cw 数值】控制权重。
    • 对于镜头较多的角色,建议炼个人物模型出来控制,不然 MJ 容易不稳定。
  3. 控制多人物场景统一:
    • 先控制一个角色再进行重绘。
    • 选一张合适的图片后,点击 Vary(Region)进行局部重绘,并把尾缀机器人的 cref 链接改成主角的 cref 链接。
  4. 通过 prompt 格式实现“角色一致性”:
    • 公式:发型+年龄性别+衣物颜色+环境+其他(动作、镜头等)。
    • 发型/衣物:构造尽可能多的角色非面部视觉元素,产生观众对角色的“一致性观感”。
    • 年龄:约束角色年龄特征。
    • 环境:约束能够产生相同观感的环境空间,尤其是光环境,增加观众对于形象认识的“一致性”认知。例如:
      • 特写一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,面部被烛光照亮,表情惊讶,环境昏暗明暗对比强烈。
      • 特写一个棕色卷发,身穿棕褐色上衣的小男孩,侧对镜头,微微仰头走在一片暗绿色的森林中,面部被手中提着的油灯照亮,环境昏暗明暗对比强烈。
      • 一个棕色卷发,身穿棕褐色上衣的小男孩侧对镜头,看着面前桌上的蜡烛,环境昏暗明暗对比强烈。
      • 中景拍摄一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,在一个梦幻感的暖色调房间里,全身贯注地拼装面前的积木玩具。
Content generated by AI large model, please carefully verify (powered by aily)

References

快来围观!8分钟AI视频制作《冷湖案例》

接下来讲解如何控制人物面貌统一~[heading2]1,人物设定[content]主角:主角是一位40岁的中年男探险家性格特点:面对挑战,从不轻言放弃外貌特征:健壮,棕色头发,常穿探险服朵拉:朵拉是一个太岁模型性格特点:对世界充满好奇,具有独立的个性外貌特征:一个小孩的形象,淡黄色凝胶体梅芙:梅芙是主角的搭档和妻子性格特点:梅芙充满爱心和同情心外貌特征:身材苗条,长卷发曼森:机械士兵兼助手性格特点:忠诚,尽职尽责地完成每一项任务外貌特征:黑色金属光泽[heading2]2,MJ--cref控制人物一致性[content]先根据人物设定,在MJ里筛选适合的人物形象,选中后右键复制图片链接在尾缀加入【--cref图片链接】控制人物一致性【--cw数值】控制权重*如果是镜头比较多的角色,建议炼个人物模型出来控制,不然MJ容易不稳定[heading2]3,如何控制多人物场景统一?[content]①先控制一个角色再进行重绘:②U选一张合适的图片后,点击Vary(Region)进行局部重绘,并把尾缀机器人的cref链接改成主角的cref链接:[heading1]PART 05可灵AI延续视频分享!🚉[content]提示词:一个黑色机器人正在尝试开门续写1:机器人开门过程艰难,门很重打不开续写2:打开一点门缝显示故障,机器人跪下起火

海螺AI-Prompt教学

形象控制小Tips我们可以通过这样的prompt格式来巧妙地实现“角色一致性”:公式:发型+年龄性别+衣物颜色+环境+其他(动作、镜头等)发型/衣物:构造尽可能多的角色非面部视觉元素,以便产生观众对角色的“一致性观感”年龄:约束角色年龄特征;环境:约束能够产生相同观感的环境空间,尤其是光环境,可以增加观众对于形象认识的“一致性”认知;下面是四个不同场景/角度/光影下角色产生一致性观感的prompt:(1)特写一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,面部被烛光照亮,表情惊讶,环境昏暗明暗对比强烈;(2)特写一个棕色卷发,身穿棕褐色上衣的小男孩,侧对镜头,微微仰头走在一片暗绿色的森林中,面部被手中提着的油灯照亮,环境昏暗明暗对比强烈(3)一个棕色卷发,身穿棕褐色上衣的小男孩侧对镜头,看着面前桌上的蜡烛,环境昏暗明暗对比强烈:(4)中景拍摄一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,在一个梦幻感的暖色调房间里,全身贯注地拼装面前的积木玩具。[111.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/J0bwbwCFUoHoybxJyrCcPvSrnsg?allow_redirect=1)

视频模型:海螺AI

形象控制小Tips我们可以通过这样的prompt格式来巧妙地实现“角色一致性”:公式:发型+年龄性别+衣物颜色+环境+其他(动作、镜头等)发型/衣物:构造尽可能多的角色非面部视觉元素,以便产生观众对角色的“一致性观感”年龄:约束角色年龄特征;环境:约束能够产生相同观感的环境空间,尤其是光环境,可以增加观众对于形象认识的“一致性”认知;下面是四个不同场景/角度/光影下角色产生一致性观感的prompt:(1)特写一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,面部被烛光照亮,表情惊讶,环境昏暗明暗对比强烈;(2)特写一个棕色卷发,身穿棕褐色上衣的小男孩,侧对镜头,微微仰头走在一片暗绿色的森林中,面部被手中提着的油灯照亮,环境昏暗明暗对比强烈(3)一个棕色卷发,身穿棕褐色上衣的小男孩侧对镜头,看着面前桌上的蜡烛,环境昏暗明暗对比强烈:(4)中景拍摄一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,在一个梦幻感的暖色调房间里,全身贯注地拼装面前的积木玩具。[111.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/PrjPbzaInoEru2xebIecT66bnAc?allow_redirect=1)

Others are asking
我想学习可灵ai的提示词
以下是一些关于可灵 AI 提示词的相关资源和信息: 提示词模板相关网站: 生成新年场景的提示词示例: 戴着醒狮帽,双手抱拳,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆 拿着"福"字,新年气氛,红色背景,新年喜庆。背景中有金粉,碎花,3d 爆竹显得热闹而喜庆 关于律师如何写好提示词用好 AI 的观点: 不能期待设计一个完美的提示词,然后 AI 百分百给到一个完美的符合要求的答案,中间不能有谬误,否则就是一个需要修复的“BUG”。 要给到 AI 的提示词实际上是一个关于此项问题的相对完善的“谈话方案”,真正的成果需要在对话中产生,并且在对话中限缩自己思维中的模糊地带。
2025-02-16
可灵AI视频好用吗
可灵 AI 视频具有以下特点和优势: 1. 今年 6 月爆火,凭借“让老照片动起来”等热点刷了一波好感。9 月更新 1.5 模型能力,使视频的画面表现力、提示词理解能力、画面清晰度上了一个台阶,位列视频生成产品第一梯队。 2. 现阶段免费用户每日免费享 66 灵感值,1.0 模型生成一次视频消耗 10 灵感值,1.5 模型则消耗 35 灵感值。付费用户享有 1.5 模型、去水印、高清晰度视频生成、视频延长能力、大师运镜、AI 生图画质增强能力。 3. 移动端 APP 为快影,网页版访问地址为:https://klingai.kuaishou.com/ ,使用指南:https://docs.qingque.cn/d/home/eZQDKi7uTmtUr3iXnALzw6vxpsection=h.j6c40npi1fan 。 4. 除传统 txt2vid、img2vid 外,还支持首尾帧控制、延长视频、对口型能力。txt2vid 模式下支持运镜控制,普通用户可使用水平/垂直运镜、推进/拉远、垂直/水平摇镜;另有四种大师运镜仅付费用户可用。9 月中,在 1.0 模型中增加了运动笔刷控制。 5. 1.5 模型能力在画面表现力、提示词理解能力上有大幅提升,改善了此前会将相机运动描述当作实物生成的问题,但视频中文本内容生成还做不到。 6. 在评测中,优势在于运动幅度较大,能产生惊喜效果,但在视频清晰度、语义理解、画面表现力上,1.0 比 Runway、Luma 的最新模型弱很多,1.5 进步明显,达到付费产品水平。 在 AI 视频生成领域,可灵的优势主要体现在: 1. 卓越的视频生成质量,在画面清晰度、连贯性、内容丰富性上,达到与国际顶级模型相当的水准,满足普通用户和专业创作者需求。 2. 生成速度表现出色,处理效率高于国外同类产品,能提升用户工作效率。 3. 对于国内用户,可访问性强,提供便捷、稳定的使用体验,降低使用门槛。 此外,快手于 6 月发布“可灵”视频大模型,能生成超过 120 秒 1080P 视频,模拟真实物理特性,准确建模复杂运动场景,采用类 Sora 的 DiT 结构,用 Transformer 代替卷积网络,自研 3D VAE 网络提升视频重建质量。
2025-02-01
怎么最快掌握可灵AI
以下是关于最快掌握可灵 AI 的一些建议: 可灵是由快手团队开发的一款 AI 应用,主要用于生成高质量的图像和视频。 对于初学者,建议您按照以下步骤来尽快掌握: 1. 了解可灵的基本功能和特点:可灵生成的图像质量非常高,但价格相对较高。最初采用内测邀请制,现在已向所有用户开放使用。 2. 考虑使用成本:重度用户的年费可能达几千元人民币,平均每月使用成本在 400 到 600 元之间。临时或轻度使用有每日免费点数和 60 多元单月的最便宜包月选项。 3. 实践操作:可以先从完成简单的图像生成任务开始,逐渐熟悉其操作流程和参数设置。 同时,为了更深入学习 AI,您还可以参考以下简明入门教程,在 20 分钟内循序渐进地完成以下任务: 1. 完成一个简单程序。 2. 完成一个爬虫应用,抓取公众号文章。 3. 完成一个 AI 应用,为公众号文章生成概述。
2025-01-25
如何用可灵AI?来统一自己的国漫风格
以下是一些关于用 AI 绘画(如 Midjourney)来统一国漫风格的建议: 1. 明确关键词:例如,您可以选择与国漫风格相关的具体元素和特征作为关键词,如特定的人物形象、色彩搭配、场景元素等。 2. 参考已有案例:像上述提到的新海诚风格插画、国潮插画等案例,分析其关键词和生成的图片特点,从中获取灵感。 3. 不断尝试和调整:输入关键词后,根据生成的图片效果进行评估,然后对关键词进行修改和优化,以逐渐接近您想要的国漫风格。 4. 注重细节描述:在关键词中加入更多关于细节的描述,比如人物的表情、服饰的纹理、画面的光影效果等,有助于提高生成图片的质量和符合度。 希望这些建议对您有所帮助。
2025-01-10
可灵同一画面,多角度分镜头画面
以下是关于镜头和 AIGC 相关的知识: 镜头提示词: 过肩镜头:从角色肩膀后方拍摄,常用于对话场景,提供角色间关系的视角。 反打镜头:常与过肩镜头结合,用于拍摄对话场景中另一个角色的反应或视角。 潜望镜头:使用特殊设备拍摄,常用于捕捉极低或极高角度的画面。 主观晃动镜头:结合角色视角与晃动效果,模拟紧张或晕眩状态。 分屏镜头:将屏幕分成多个部分,展示不同地点或角度的同时事件,增强叙事复杂性和多样性。 显影镜头:逐步揭示重要信息或角色,通常通过镜头移动或焦点转移实现,增加悬念和期待感。 隐喻镜头:通过象征性画面传达深层意义或主题,深化观众对情节的理解。 负片镜头:使用颜色反转等效果创造不寻常视觉风格,常用于表现梦境或幻想场景。 剪影镜头:通过强光源背对着拍摄对象,使其成为黑色剪影,强调形状和姿态。 聚光镜头:使用聚光灯突出特定角色或物体,使其在画面中显得重要。 双重曝光镜头:将两个画面叠加,创造梦幻或象征性效果。 多重曝光镜头:在同一胶片上多次曝光,形成复合画面,常用于表现复杂情感或梦幻场景。 双重镜头:同时对前景和背景的两个对象保持清晰对焦,常用于复杂场景中的多重叙事。 AIGC 电影化叙事: 电影感与 AI 感:一切元素为叙事服务,将观众沉浸在故事中。视频 AI 感可能存在的问题包括固定镜头、运动幅度小易引起视觉疲劳、镜头间缺乏视听语言、画面跳跃未为故事服务、有不和谐画面元素等。 故事叙事:带着故事去制作,采用三幕式结构(设定、冲突、解决),注重角色弧光、隐喻和主题。 画面分镜:先找到桥段中最重要的画面,进行分镜设计,通过不同视角和构图增强叙事感,分解镜头切换方式打造流畅视觉节奏,保持视觉风格一致性。 音乐与音效:把控情感节奏,用音乐引导观众情绪,配合故事起伏增强感染力;设计音效细节,营造氛围为画面增添真实感,实现音乐与视觉的配合。 图像类 AI 产品: 可灵:由快手团队开发,用于生成高质量图像和视频,图像质量高,最初采用内测邀请制,现向所有用户开放,价格相对较高,重度用户年费可达几千元,平均每月 400 600 元,也有每日免费点数和 60 多元单月的最便宜包月选项供轻度用户选择。 通义万相:在中文理解和处理方面出色,用户可选择多种艺术和图像风格,生成图像质量高、细节丰富,操作界面简洁直观,可与阿里其他产品和服务无缝整合,重点是现在免费,每天签到获取灵感值即可,但存在某些类型图像无法生成、处理非中文或国际化内容可能不够出色、处理多元文化内容可能存在偏差等局限性。
2025-01-09
可灵ai官网教学
以下是关于可灵 AI 的相关信息: 可灵是一款由快手团队开发的 AI 应用,主要用于生成高质量的图像和视频。 其特点包括: 1. 生成的图像质量非常高。 2. 最初采用内测邀请制,现在已向所有用户开放使用。 费用方面: 1. 价格相对较高,重度用户的最高档年费可能达到几千元人民币,平均每月使用成本在 400 到 600 元人民币之间。 2. 对于临时使用或轻度使用的用户,有每日免费点数和 60 多元单月的最便宜包月选项。 您可以通过以下方式获取更多关于可灵 AI 的教学内容: 1. 可灵的官网帮助中心。 2. 相关的视频教程,如“【90 分钟视频教程】全网最详细的 Coze AI 应用教学”。
2024-12-21
wonderdynamics有类似这样的Ai
以下是与 Wonder Dynamics 类似的 AI 相关产品: 1. ViggleAI:由 15 人团队打造,创始人是在多家知名公司工作过的华人 AI 研究员。其核心能力是将视频中的角色替换成其他形象,类似 WonderDynamics 和阿里全民舞王。背后依赖自家训练的 3D 视频模型「JST1」,能够根据一张角色图片生成 360 度角色动画,进行更可控的视频生成。目前支持 Discord 访问和网页版访问,Discord 平台已积累超 400 万用户。网页版访问:https://www.viggle.ai/ 官方推特:https://x.com/ViggleAI 其“Move”模式更擅长将特定角色融入到某个动作场景中,视频生成稳定性、角色前后一致性非常强。 2. Wonder Dynamics 推出自动 3D 动画生成技术 Wonder Animation:只需导入视频,无需手动设置即可自动生成 3D 场景。可与现有动画和 3D 渲染软件无缝整合,支持多种格式,显著加速动画和 3D 内容创作流程,适用于影视和动画项目制作。详情:https://xiaohu.ai/p/15091
2025-03-04
有哪些ai生成网页代码的工具
以下是一些 AI 生成网页代码的工具: 1. 即时设计:https://js.design/ 是一款可在线使用的「专业 UI 设计工具」,为设计师提供更加本土化的功能和服务,相较于其他传统设计工具,更注重云端文件管理、团队协作,并将设计工具与更多平台整合,一站搞定全流程工作。 2. V0.dev:https://v0.dev/ Vercel Labs 推出的 AI 生成式用户界面系统。每个人都能通过文本或图像生成代码化的用户界面。它基于 Shadcn UI 和 Tailwind CSS 生成复制粘贴友好的 React 代码。 3. Wix:https://wix.com/ Wix 是一款用户友好的 AI 工具,可让您在没有任何编码知识的情况下轻松创建和自定义自己的网站,提供广泛的模板和设计供您选择,以及移动优化和集成电子商务功能等功能。Wix 建站工具通过拖放编辑、优秀模板和 250 多种 app,能帮助不同领域的用户创建所有种类的网站。 4. Dora:https://www.dora.run/ 使用 Dora AI,可以通过一个 prompt,借助 AI 3D 动画,生成强大网站。支持文字转网站,生成式 3D 互动,高级 AI 动画。 此外,还有以下制作网站的 AI 工具: 1. Zyro 网址:https://zyro.com/ 特点:使用 AI 生成网站内容,包括文本、图像和布局建议。提供 AI 驱动的品牌和标志生成器,帮助创建独特的品牌形象。包含 SEO 和营销工具,帮助提升网站可见性和流量。 2. 10Web 网址:https://10web.io/ 特点:基于 AI 的 WordPress 网站构建工具,可以自动生成网站布局和设计。提供一键迁移功能,将现有网站迁移到 10Web 平台。集成的 AI 驱动 SEO 分析和优化工具。 3. Jimdo Dolphin 网址:https://www.jimdo.com/ 特点:Dolphin 是 Jimdo 的 AI 网站构建器,通过询问用户问题来定制网站。提供自动生成的内容和图像,帮助快速启动网站。包含电子商务功能,适合小型企业和在线商店。 4. Site123 网址:https://www.site123.com/ 特点:简单易用的 AI 网站构建工具,适合初学者。提供多种设计模板和布局,用户可以快速创建专业网站。包括内置的 SEO 和分析工具,帮助优化网站表现。 另外还有: 1. Wix ADI 网址:https://www.wix.com/ 特点:基于用户提供的信息,Wix ADI 可以自动生成一个定制化的网站。提供多个设计选项和布局,用户可以进一步调整和自定义。集成了 SEO 工具和分析功能,帮助优化网站表现。 2. Bookmark 网址:https://www.bookmark.com/ 特点:AIDA通过询问用户几个简单的问题,快速生成一个网站。提供直观的拖放编辑器,用户可以轻松自定义网站内容和布局。包括多种行业模板和自动化营销工具。 3. Firedrop 网址:https://firedrop.ai/ 特点:Sacha 是 Firedrop 的 AI 设计助手,可以根据用户的指示创建和修改网站设计。提供实时编辑和预览功能,帮助用户随时查看网站效果。包含多种现代设计风格和自定义选项。 4. The Grid 网址:https://thegrid.io/ 特点:Molly 是 The Grid 的 AI 设计助手,可以自动调整网站的设计和布局。基于内容和用户互动进行优化,提供个性化的网站设计体验。支持多种内容类型,包括博客、商店和画廊等。 内容由 AI 大模型生成,请仔细甄别。
2025-03-04
好用的office ai插件有哪些
以下是一些好用的 Office AI 插件: 1. Excel Labs:这是一个 Excel 插件,新增了生成式 AI 功能,基于 OpenAI 技术,可在 Excel 中利用 AI 进行数据分析和决策支持。 2. Microsoft 365 Copilot:微软推出的 AI 工具,整合了 Word、Excel、PowerPoint、Outlook、Teams 等办公软件,通过聊天形式,用户告知需求后,Copilot 自动完成任务。 3. Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,用户可通过自然语言交互式地进行数据分析和生成 Excel 公式。 4. Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,除公式生成外,还可根据提示生成相关文本内容、执行情感分析、语言翻译等任务。 此外,还有一些其他平台的插件,如 Coze 平台提供的丰富插件,涵盖搜索引擎、文本分析、图像识别等领域,包括必应搜索、LinkReader 等。同时,像“核心搭子小组:爸妈防骗助手”使用的工具及插件中,也有一些相关的,如 Moonshot、JinaWebReader 等。 内容由 AI 大模型生成,请仔细甄别。
2025-03-04
写短视频口播文案,用哪个AI效果最好
以下是为您提供的关于写短视频口播文案的 AI 工具相关信息: 在营销板块,有智能营销矩阵平台,其在图文内容生产方面为企业提供选题生成、文案创作等定制化服务。 目前一些相关的 AI 工具包括: 1. 美趣 AI:具有图片生成功能,是原生的写作软件。 2. 说得相机提词器:功能型写作软件。 3. AI 智能写作:原生的写作软件。 此外,TecCreative 创意工具箱中也有一些相关功能,如数字人口播配音,只需输入口播文案,选择期望生成的数字人形象及目标语言,即可生成数字人口播视频。 需要注意的是,不同的 AI 工具可能具有不同的特点和优势,您可以根据自己的需求和使用习惯进行选择。
2025-03-04
写短视频口播最好用的AI是哪个
目前市场上有多种适用于短视频口播创作的 AI 工具,以下为您列举部分: 美趣 AI:具有原生的图片生成功能,是一款 AI 绘画、视频和写作生成神器。 说得相机提词器:功能型写作软件,适用于口播短视频的文案生成及美颜拍摄。 AI 智能写作:原生的写作软件。 创客贴 AI:具有平面设计功能。 360AI 搜索:功能型的智慧搜索工具。 图趣 AI:原生的图片生成工具。 Molica AI:原生的图片生成工具。 文案宝:原生的个人助理,具有 AI Bot 智能生成器和一键 AI 识图功能。 需要注意的是,选择最适合的 AI 工具取决于您的具体需求和使用习惯。
2025-03-04
作为美妆护肤行业的,有什么 AI 工具能够用吗?
在美妆护肤行业,以下是一些可用的 AI 工具: 1. 美丽修行定制方案功能:通过图像识别和数据分析,根据用户上传的照片和肤质信息定制个性化的护肤方案,包括产品推荐和使用顺序,市场规模达数亿美元。 2. 美图美妆 APP:利用图像识别和数据分析,根据用户肤质提供美容护肤建议,市场规模达数亿美元。 3. 美丽修行 APP:基于数据分析和自然语言处理,通过用户上传的照片和填写的肤质信息为用户推荐适合的美容护肤产品,市场规模达数亿美元。
2025-03-04
风格一致性
以下是关于风格一致性的相关内容: Midjourney 中的风格一致性: Midjourney v6 版本提供“风格一致性”功能,用户给 Midjourney 输入一幅图像,它会根据这幅图像的风格进行创作,如素描风、油画风等。(可参考) 使用指令:垫图链接(可选择)+关键词+“sref”+图片链接+风格化参数+“v 6.0” sw 风格化参数用于控制整体的风格强度,默认为 100,数值范围为。参考多张图像风格时,url 间使用空格隔开,权重代表不同参考风格的权重。适用模型为 V6 和 Niji V6。 sref 与垫图的比较: sref 主要模仿图片风格,垫图主要模仿图片结构、元素。 音乐风格中的风格提示词: Equitable:公平和公正的音乐风格,通常具有平等和均衡的特质,用于表现公平和公正情感的音乐作品,示例为公益歌曲和社会正义主题的音乐,关联流派为 Folk、Protest Music、Rock。 Equivalent:等同和相似的音乐风格,通常具有相似和可互换的特质,用于表现相似和可互换情感的音乐作品,示例为翻唱歌曲和不同版本的音乐,关联流派为 Pop、Rock、Cover。 Erudite:博学和有学问的音乐风格,通常具有复杂和深奥的表现,用于表现学术和知识情感的音乐作品,示例为 Bach 的《赋格的艺术》,关联流派为 Classical、Baroque、Modern Classical。 Escalating:逐步增强和上升的音乐风格,通常具有递增和累积的特质,用于表现逐步增强和累积情感的音乐作品,示例为 Led Zeppelin 的《Stairway to Heaven》,关联流派为 Rock、Progressive Rock、Classical。 Esoteric:深奥和神秘的音乐风格,通常具有复杂和不易理解的特质,用于表现神秘和深奥情感的音乐作品,示例为 King Crimson 的《In the Court of the Crimson King》,关联流派为 Progressive Rock、Experimental、Avantgarde。 此外还有: Congenial:友好和谐的音乐风格,带有温暖和愉快的情感,用于表现友好和轻松氛围的音乐作品,示例为 Jack Johnson 的《Banana Pancakes》,关联流派为 Acoustic、Folk、Pop。 Consequential:重要和有影响力的音乐风格,具有深远的意义和影响力,用于表现重要事件和深刻主题的音乐作品,示例为 Bob Dylan 的《The Times They Are AChangin'》,关联流派为 Folk、Protest Music、Rock。 Considerate:体贴和细腻的音乐风格,带有温柔和关怀的情感,用于表现温柔和关怀的音乐作品,示例为 Norah Jones 的《Don't Know Why》,关联流派为 Jazz、Folk、SingerSongwriter。 Consistent:一致和连贯的音乐风格,具有稳定的结构和风格,用于表现连贯和一致性的音乐作品,示例为 AC/DC 的专辑《Back in Black》,关联流派为 Rock、Pop、Indie。 Consonant:和谐和悦耳的音乐风格,具有愉快和协调的和声,用于表现和谐和愉快的音乐作品,示例为莫扎特的《Eine kleine Nachtmusik》。
2025-02-24
图生图, 如何保持幻想生物形象一致性
要在图生图中保持幻想生物形象的一致性,可以参考以下方法: 1. 对于 Midjourney ,可以采用特定的名人或有特殊属性的人物形象,先确定好影片风格,比如皮克斯动画风格,然后确定好人物形象,如角色的发型、穿着等细节。 2. 利用 Midjourney 的新功能 Cref ,先跑一张主角的定妆照,在需要出现主角人物的地方扔进去 Cref ,以保持发型、人脸、衣服等的一致性。但需要注意的是,Midjourney 对亚洲人脸的 Cref 一致性,尤其是亚洲老人的一致性效果相对较差,且 Cref 在画面的审美和构图上有一定的破坏性,所以原则上能不用就不用,比如只有背影时,简单描述即可。 3. 生成动物形象,动物相对更容易保持一致性。
2025-02-14
图生图, 如何保持生物形象一致性
在图生图中保持生物形象一致性,有以下几种方法: 1. 对于人物和场景一致性问题,可以采用生成动物的方式,动物相对容易保持一致性。 2. 选择特定的名人或具有特殊属性的人物。 3. 确定好影片风格,如皮克斯动画风格。 4. 先确定好人物形象,如明确角色的发型、穿着等特征。 5. 使用 Midjourney 的新功能 Cref,在需要出现主角人物的地方,保持发型、人脸、衣服等特征。但需要注意的是,Midjourney 对亚洲人脸的 Cref 一致性效果相对较差,尤其对于亚洲老人,而且 Cref 在画面的审美和构图上有一定破坏性,原则上能不用则不用。例如只有背影时,简单描述特征即可。
2025-02-14
给我5个midjourney确保场景一致性的Sample提示词
以下是 5 个 Midjourney 确保场景一致性的 Sample 提示词: 1. Scifi movie scene. In the silverwhite space environment, from the overtheshoulder lens on the right side of the man with short hair and navy blue jumpsuit, a transparent virtual screen appeared on the wall in front of him. Behind there is the silhouette of another female employee with long blue hair, operating another screen. Rendered in a C4D style inspired by Unreal Engine, with high resolution and rich detail. sref url cref url ar 16:9 style raw sw 30 cw 100 2. In a magical forest, a fairy with colorful wings is sitting on a huge mushroom. The sunlight filters through the leaves, creating dappled patterns on the ground. cref https://my.image.host/fairy.jpg s 800 3. On a sandy beach at sunset, a couple is walking hand in hand, leaving footprints in the sand. The ocean waves crash gently in the background. cref https://my.image.host/couple.jpg ar 9:16 4. In a medieval castle courtyard, a knight in shining armor is training with a sword. The flags are fluttering in the wind. cref https://my.image.host/knight.jpg s 700 5. At a busy city street corner, a street musician is playing a guitar, surrounded by a crowd of people. The buildings are towering in the background. cref https://my.image.host/musician.jpg ar 4:3
2025-02-14
文生图人物一致性
以下是关于文生图人物一致性的相关内容: 在使用 ControlNet 进行文生图时,首先进入文生图界面填写提示词生成一张图。然后将图片拖入 ControlNet 中,预处理器选择 reference only,控制模型选择“均衡”,保真度数值越高对图片的参考越强。在没有明确指向性提示词的情况下,人物形象能保持一致,但表情、动作、服装会有随机不同程度的变化。可以通过添加关键词来给人物换装、更改服装和表情、更改动作和表情、更改姿态、环境和表情等,例如添加“红裙子”“黑色校服、哭泣”“抱手、生气”“在花丛中奔跑、开心”“红色棒球帽,时尚卫衣,在商场逛街”。通过一系列测试,这个功能在绘制系列插画、漫画、小说插图等工作时,能保持主角形象的统一,也能根据情况实时调整,后期配合 lora 潜力巨大。 另外,在 PIKA1.0 新模型中,人的一致性已经逆天,再加上其强大的语义理解和大幅度的动作,在文生图方面表现出色。
2025-02-11
多人物场景,人物一致性如何保证
在多人物场景中保证人物一致性可以参考以下方法: 1. 在使用 Midjourney 出图时,多角色情况下,放弃参考角色(cref 提示),只用参考风格(sref 提示)。这样的好处是不会出现奇怪的组合,坏处是出图较随机。 2. 多用局部重绘,虽然具有随机性,但多试几次能得到一致性较好的图。 3. 出图时先只出一个主要角色和场景。当出现多角色场景时,把其他角色抠图粘贴过来。比如老虎向兔子认错的场景,若兔子和老虎不一致,可先出稳定的老虎,再粘贴兔子以保证一致性。 4. 按照“三个确定”的 SOP 处理: 确定画面元素:优先出一张图,保证风格、构图样式及人物角色。 确定前后图的构图风格:出第二张图时,将第二张图提示词描述后加入第一张图的构图风格(iw 参数)。 确定图片角色一致性:在保证构图风格没问题的基础上,保证人物一致性。先保证构图再确认角色一致性,因为 MJ 在重绘时,将角色在镜头中的位置挪动处理较难,固定位置重绘局部内容相对容易,若先保证人物内容,会很依赖 MJ 抽卡,随机性大。
2025-02-10
我想把人物老照片转彩色并生成视频动起来,用什么工具
以下是一些可以将人物老照片转彩色并生成视频动起来的工具和方法: 1. 对于给老照片上色,可以使用 Stable Diffusion 及其相关插件,如 MutiDiffusion 插件。在显存不够的情况下,可利用分块渲染功能放大图片。还可以加入第二个 controlnet 来控制颜色,使用 t2ia_color 的模型,通过简单的关键词如“蓝天、绿树、灰石砖”来匹配色调。同时,将照片放入后期处理,使用 GFPGAN 算法将人脸变清晰。 2. 对于生成视频让图片动起来,可以使用即梦进行图生视频。只需上传图片至视频生成模块,用简单提示词描绘画面中的动态内容,能生成时长为 3 秒钟的画面,运镜类型可根据剧本中的镜头描绘设置,以随机运镜为主,生成速度可选择慢速。
2025-02-22
音频驱动视频人物口型
以下是关于音频驱动视频人物口型的相关信息: PixVerse V3 : 本次更新内容丰富,包括已有能力升级,提供更精准的提示词理解能力和更惊艳的视频动态效果。 支持多种视频比例,如 16:9、9:16、3:4、4:3、1:1。 Style风格化功能重新回归升级,支持动漫、现实、粘土和 3D 四种风格选择,同时支持文生视频和图生视频的风格化。 全新上线了 Lipsync 功能,在生成的视频基础上,允许用户输入文案或上传音频文件,PixVerse 会自动根据文案或音频文件内容,对视频中的人物口型进行适配。 还有 Effect 功能,提供 8 个创意效果,包括变身僵尸、巫师帽、怪兽入侵等万圣节主题模板,一键实现创意构思。并且 Extend 功能支持将生成的视频再延长 5 8 秒,且支持控制延长部分的内容。 字节跳动开源的 LatentSync : 是精准唇形同步工具,能够自动根据音频调整角色嘴型,实现精准口型同步,无需复杂中间步骤。 提出“时间对齐”技术,解决画面跳动或不一致问题,效果显著。 具有开箱即用的特点,预训练模型加持,操作简单,支持高度定制化训练。 GitHub 链接:https://github.com/bytedance/LatentSync 论文链接:https://arxiv.org/pdf/2412.09262
2025-02-16
基于参考图片人物形象生成指定迪士尼风格的图片
以下是关于基于参考图片人物形象生成指定迪士尼风格图片的相关内容: 在 Midjourney 中,生成指定迪士尼风格的图片可以通过以下方式: 1. 角色参考(cref):cref 的功能是保持图像角色的一致性。使用方法是在提示后添加 cref,并紧接着指向人物参考图像的 URL。您可以使用 cw 来调整参考图像对生成的图像的影响程度,数值范围从 0 到 100。 2. 风格参考(sref):sref 的功能是生成类似风格的图片,保持画风的一致性。使用方法是在提示后添加 sref,并紧接着指向风格参考图像的 URL。您可以使用 sw 来调整参考风格对生成的图像的影响程度,数值范围从 0 到 1000。 如果想引用一张图,但只是把它作为新图的一部分,可以使用 sref 或 cref,并通过调整 sw 或 cw 的值来控制引用图像的影响程度。 生成一张 Disney 风格的头像的具体步骤如下: 1. 选一张比较满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,然后在聊天框发送(记得点击回车或发送按钮)。 2. 图片会上传到服务器并生成一张唯一的链接,点击图片,然后点击在浏览器中打开,然后可以看到浏览器上方有一个链接,复制下来。 3. 使用这个链接加 prompt 提示词来发送给 Midjourney,Midjourney 会根据需求生成特定的图片,这就是 Midjourney 的以图绘图。 此外,在生成 3D 效果图时,如生成可爱的拟人小鹿角色,可以在即梦图片生成界面中导入参考图,参考选项为参考轮廓边缘,生图模型选择 图片 2.0,输入包含角色、细节描述、场景、风格材质等的提示词,生成图片。
2025-02-12
请推荐一下你知道的人物头像转卡通图的平台,要求效果好,和原图相似度高,最好是免费的
以下为一些人物头像转卡通图效果好、与原图相似度高且可能免费的平台及相关操作技巧: 1. Stable Diffusion: 可以使用【X/Y/Z plot】脚本来做参数对比,将 X 轴设置为提示词相关性(取值范围 1 30,每次增加 5),Y 轴设置为重绘幅度(取值范围 0 1,每次增加 0.2)。 提示词相关性在 6 11 中间为最佳,重绘幅度 0.4 时和原图比较接近。 可使用绘图功能,如增加红色眼镜、去掉衣服图案等,局部重绘可只改变涂抹部分。 2. 复杂提示词: 如 Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5 。 可根据需求调整提示词,如将 Disney 换成 Pixar,boy 换成 girl 等。 3. 通用人物模版: 用真人照片+照片描述+方法 1 的关键词来处理。 需要注意的是,不同平台的效果可能因图片和操作而有所差异,您可以自行尝试。
2025-02-06