Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

星流ai人物一致性

Answer

以下是关于星流 AI 人物一致性的相关内容:

在实现角色一致性方面,有以下几种方法和示例:

  1. 可以通过特定的 prompt 格式来实现,公式为:发型+年龄性别+衣物颜色+环境+其他(动作、镜头等)。例如:
    • 特写一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,面部被烛光照亮,表情惊讶,环境昏暗明暗对比强烈。
    • 特写一个棕色卷发,身穿棕褐色上衣的小男孩,侧对镜头,微微仰头走在一片暗绿色的森林中,面部被手中提着的油灯照亮,环境昏暗明暗对比强烈。
    • 一个棕色卷发,身穿棕褐色上衣的小男孩侧对镜头,看着面前桌上的蜡烛,环境昏暗明暗对比强烈。
    • 中景拍摄一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,在一个梦幻感的暖色调房间里,全身贯注地拼装面前的积木玩具。
  2. Midjourney 推出了角色一致性功能,同步支持 MJ V6 和 Niji V6。跟之前的风格一致性--sref 命名基本一致,为--cref。--cref 背后参数--cw 的值可以从 0 设到 100,--cw 100 会参考原图的脸部、头发和衣服,但相应的会非常不吃 Prompt;--cw 0 时,就只会参考脸部,大概约等于一个换脸。
  3. PixVerse 有“角色(Character)”新功能,能实现 AI 生成视频中的角色保持一致。用户只需单击“Character”功能,上传符合要求的图像,点击创建自定义角色,训练一个新角色,然后可使用自定义角色生成视频,可在 AI 生成视频中轻松切换场景,同时保持同一角色身份。该功能目前只支持真实人脸,暂不支持动物或其他风格照片。操作说明:在主页面点击选择“Character”,点击“Create Character”,在此界面通过点击或拖动的方式上传图片,命名您创建的 Character,最后点击“Create Cha”。提示:最好使用包含真实人脸的单人图片效果最佳,脸部大小需要超过 200×200px,面部无遮挡。Character 添加完毕后,等待 20 秒左右,在看到“Success”提示后,点击“Create”进。若未等到“Success”提示便进入创作界面,会找不到创建的 Character,此时需等待 10 - 30 秒,待 Character 创建完成即可。

相关网址:

  1. 111.mp4
  2. 222.mp4
  3. Midjourney 网页版:https://alpha.midjourney.com/
  4. PixVerse:https://app.pixverse.ai/ (目前可以免费使用)
Content generated by AI large model, please carefully verify (powered by aily)

References

海螺AI

形象控制小Tips我们可以通过这样的prompt格式来巧妙地实现“角色一致性”:公式:发型+年龄性别+衣物颜色+环境+其他(动作、镜头等)发型/衣物:构造尽可能多的角色非面部视觉元素,以便产生观众对角色的“一致性观感”年龄:约束角色年龄特征;环境:约束能够产生相同观感的环境空间,尤其是光环境,可以增加观众对于形象认识的“一致性”认知;下面是四个不同场景/角度/光影下角色产生一致性观感的prompt:(1)特写一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,面部被烛光照亮,表情惊讶,环境昏暗明暗对比强烈;(2)特写一个棕色卷发,身穿棕褐色上衣的小男孩,侧对镜头,微微仰头走在一片暗绿色的森林中,面部被手中提着的油灯照亮,环境昏暗明暗对比强烈(3)一个棕色卷发,身穿棕褐色上衣的小男孩侧对镜头,看着面前桌上的蜡烛,环境昏暗明暗对比强烈:(4)中景拍摄一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,在一个梦幻感的暖色调房间里,全身贯注地拼装面前的积木玩具。[111.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/UtHIbKlh7o12iExg2nFcteYEn5c?allow_redirect=1)[222.mp4](https://bytedance.feishu.cn/space/api/box/stream/download/all/L0Z3bHA90o4xsaxZTPecpQ7YnMc?allow_redirect=1)

半个AI圈期待的Midjourney角色一致性首发评测 - 再入迷梦

在MJ一鸽再鸽,鸽了N次之后,今天早上6点,他们终于决定把他们万众期待的功能放出来了。角色一致性。同步支持MJ V6和Niji V6。跟之前的风格一致性--sref命名基本一致,--cref。坦率的讲,风格一致性、角色一致性、场景一致性,是我觉得三个能真正进入生产管线的极度重要的可控性功能。其实现难度由低到高。毕竟,你真要用MJ去带故事带场景的东西,这些一致性肯定是要的,要不然疯狂跳戏,那观感肯定奇差无比,这个妹子一会白头发一会红头发,一会圆脸一会方脸,你都怀疑你在看个什么异世界故事。之前有朋友也在群里疯狂吐槽过:风格一致性MJ有sref命令去做很好的解决了,而角色一致性,今早也终于放出来了,讲道理,他可以节省一半的工期了hhhhh。--cref背后参数--cw的值可以从0设到100,--cw 100是默认参数,此时会参考原图的脸部、头发和衣服,但是相应的,会非常的不吃Prompt。--cw 0的时候,就只会参考脸部,大概就约等于一个换脸。最近《沙丘2》挺火,上个小公主给大家当一下case。原图是这样的:使用--cref之后。还是能明显看出区别的。--cw 100的时候,人物的头饰、衣服都是大差不差的;--cw 0的时候,发型和衣服就全变了。至于用法,我比较习惯使用MJ的网页版,体验真不是好的一点半点,网址在此:https://alpha.midjourney.com/

PixVerse 新功能Character 确保角色一致

本文档可编辑欢迎大家测试后在文档中贴上自己的视频~“角色(Character)”新功能,能实现AI生成视频中的角色保持一致。用户只需单击“Character”功能,上传符合要求的图像,点击创建自定义角色,训练一个新角色,然后可使用自定义角色生成视频,可在AI生成视频中轻松切换场景,同时保持同一角色身份。该功能目前只支持真实人脸,暂不支持动物或其他风格照片。网址https://app.pixverse.ai/目前可以免费使用上传照片,就可以得到这个人物一致性的视频[heading3][heading3]操作说明[heading3]在主页面点击选择“Character”。[content][heading3]点击“Create Character”。[content][heading3]在此界面通过点击或拖动的方式上传图片,命名您创建的Character,最后点击“Create Cha[content]提示:最好使用包含真实人脸的单人图片效果最佳,脸部大小需要超过200×200px,面部无遮挡[heading3]Character添加完毕后,等待20秒左右,在看到“Success”提示后,点击“Create”进[content]若未等到“Success”提示便进入创作界面,会找不到创建的Character,此时需等待10~30秒,待Character创建完成即可。[heading3]点击“Character”。[content]

Others are asking
ai自媒体变现实操
以下是关于 AI 自媒体变现的实操内容: 对于 0 基础编程小白从 0 到 1 搭建网站: IP 用户旅程图包括网站/产品体验、价值展示、口碑裂变、私域转化、深度服务、用户复购等环节。 赛道反差化打法智能体可让视频火速出圈,比如智能体引流效果、反差打法等。 优秀的自媒体不仅是生产者,更是连接者和转化者。 公众号生成器:https://themetunegenerator.vercel.app/ ,可选择主题、风格(如干货实用型、故事叙事型、轻松幽默型等)生成公众号文案。 电脑要求:Windows 需 Windows 10 或以上,macOS 需 macOS 10.15或更高版本。 开发环境部署:魔法很重要,需安装 NodeJS(https://nodejs.org/en/download)、注册 Github 并下载 Github Desktop(https://desktop.github.com/download/),还可能涉及安装 cnpm 等。 会思考产品创意的你加上会编程的 AI 等于产品 MVP,包括产品规划与设计(确定产品核心功能)、开发实施(使用 Lovable 生成前端代码、导入 cursor 等),让 AI 成为产品设计师梳理细节,所有不会的问题都可问 AI。 自媒体人通过 AIGC 进行流量变现的心路历程: 变现渠道包括直播带货、橱窗带货(抖音需 1000 粉丝、托管橱窗)、商单、介绍粉丝接项目等。 具体的商业变现项目有画小二 AIGC 的 AI 绘图十二生肖、化妆品公司产品设计、产品包装设计、海报设计、游戏背景设计、儿童绘本、AI 漫画、PFP 头像设计、AI 图片+视频(徐悲鸿教育系列 AI 内容)、AIGC+地方文旅、重庆美术馆数字人、长沙美仑美术馆数字人、玛莎拉蒂汽车宣传片、喜马拉雅微短剧等。 广告方面,可通过平台(如抖音星图、B 站花火)接私单,视频广告价格可自定义设置。
2025-04-15
最新的AI排行榜
以下是最新的 AI 排行榜相关信息: 3 月 9 日榜单: 文生图:Ideogram 2a(官方评价这是 Ideogram 迄今为止最快、最实惠的文生图模型) 文生视频:SkyReels、海螺01director、Pixverse4.0 图生视频:SkyReels、Pixverse4.0、Adobe Firefly 测评涵盖了 Midjourney,Flux,即梦,Recraft,ideogram,SD3.5,Sora,可灵,通义,即梦,海螺,pixverse,pika,vidu,luma 等 50+国内外热门模型,还有 Veo 2.0 等最新模型上线。本周最出乎意料的是最新上的模型 SkyReels,在文生视频和图生视频榜单都排名靠前。 生成式 AI 季度数据报告 2024 月 1 3 月: 赛道方面:天花板潜力为数亿美金;对标公司有 Xmind 等;总体趋势平稳增长,15.93%;月平均增速 34 万 PV/月;原生产品占比中等。 竞争方面:Top1 占比 32%;Top3 占比 82%;马太效应弱;网络效应中;大厂是否入局是,但大厂占比较低;技术门槛中。 23 年 12 月至 24 年 3 月月访问量排行榜及变化情况: 非大厂的 Top1 公司及产品:Whimsical Al,估值融资 3000 万$(2021),最新月 PV 为 237 万。2023 年 4 月,月访问量 382 万,Whimsical AI、gitmind AI 分别位列第一、第二的位置,月访问量合计占比 84%。2024 年 3 月,月访问量 812 万,Whimsical AI 整年看处于增长态势,仍位列第一,月访问量达到 237 万;ProcessOn 凭借其原有客户积累,月访问量快速增长,位列第二名,占比 25%。 记忆辅助榜单中,2023 年 4 月,月访问量为 83 万,Rewind AI 以 43 万的访问量位居第一,占赛道月总访问量的 52%。Personal.ai 和 Heyday 分别以 25 万和 8 万的访问量位列二、三,分别占赛道月总访问量的 30%和 10%。2024 年 3 月,月访问量增长至 245 万,rabbit inc.以 128 万的访问量跃居第一,占赛道月总访问量的 52%。Humane 和 Rewind AI 分别以 46 万和 22 万的访问量位列二、三,分别占赛道月总访问量的 19%和 9%。 相关网址: https://www.xiaohongshu.com/user/profile/65890e73000000003d035101?xsec_token=AB67OV1KW_ANCcrYRU_oRTJKJ9xLtexbMgyoJq68rxQA%3D&xsec_source=pc_search aiwatch.ai
2025-04-15
ai小白学习课程
对于 AI 小白的学习课程,建议如下: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,还有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库有很多实践后的作品、文章分享,欢迎实践后分享。 5. 体验 AI 产品: 与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解其工作原理和交互方式。 另外,如果让我推荐一门 AI 课,比如【野菩萨】的课程: 1. 预习周课程:包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 2. 基础操作课:涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等内容。 3. 核心范式课程:涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 4. SD WebUi 体系课程:包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 5. ChatGPT 体系课程:有 ChatGPT 基础、核心 文风、格式、思维模型等内容。 6. ComfyUI 与 AI 动画课程:包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 7. 应对 SORA 的视听语言课程:涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 免费课程机会:如果想要免费获得这门课程,可以来参与 video battle,这是唯一一个获胜者就可以拥有课程的机会。每期的 video battle 的评委野菩萨老师都非常严格,需要寓意深度审美并存。 冠军奖励:4980 课程一份 亚军奖励:3980 课程一份 季军奖励:1980 课程一份 入围奖励:598 野神殿门票一张 扫码添加菩萨老师助理,了解更多课程信息。 对于纯小白,还可以参考以下: |分类|标题|文章链接|视频链接|适用人群|简要说明| ||||||| |通识篇|现有常见 AI 工具小白扫盲|(1 小时 32 分开始)|对 AI 都没太多概念的纯纯小白|给与 AI 之间有道墙、还在墙外的人简单介绍当前各种 AI 工具、0 成本最快速感受当下 AI 工具的力量| |通识篇|AI 常见名词、缩写解释|结合食用|
2025-04-15
ai小白学习课程
对于 AI 小白的学习课程,建议如下: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,能找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,还有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,比如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库有很多实践后的作品、文章分享,欢迎实践后分享。 5. 体验 AI 产品: 与现有的 AI 产品如 ChatGPT、Kimi Chat、智谱、文心一言等聊天机器人互动,了解其工作原理和交互方式。 另外,如果让我推荐一门 AI 课,比如【野菩萨】的课程: 1. 预习周课程:包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 2. 基础操作课:涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等内容。 3. 核心范式课程:涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 4. SD WebUi 体系课程:包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 5. ChatGPT 体系课程:有 ChatGPT 基础、核心 文风、格式、思维模型等内容。 6. ComfyUI 与 AI 动画课程:包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 7. 应对 SORA 的视听语言课程:涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 免费课程机会:如果想要免费获得这门课程,可以来参与 video battle,这是唯一一个获胜者就可以拥有课程的机会。每期的 video battle 的评委野菩萨老师都非常严格,需要寓意深度审美并存。 冠军奖励:4980 课程一份 亚军奖励:3980 课程一份 季军奖励:1980 课程一份 入围奖励:598 野神殿门票一张 扫码添加菩萨老师助理,了解更多课程信息。 对于纯小白,还可以参考以下: |分类|标题|文章链接|视频链接|适用人群|简要说明| ||||||| |通识篇|现有常见 AI 工具小白扫盲|(1 小时 32 分开始)|对 AI 都没太多概念的纯纯小白|给与 AI 之间有道墙、还在墙外的人简单介绍当前各种 AI 工具、0 成本最快速感受当下 AI 工具的力量| |通识篇|AI 常见名词、缩写解释|结合食用|
2025-04-15
runway属于什么ai能力类型
Runway 是一家总部位于旧金山的 AI 创业公司推出的产品。 在 AI 能力类型方面: 年初爆火,其 Gen2 代表了当前 AI 视频领域最前沿的模型,能够通过文字、图片等方式生成 4 秒左右的视频。 内测能力可根据参考图像进行 Video to Video 视频风格化。 致力于专业视频剪辑领域的 AI 体验,同时也在扩展图片 AI 领域的能力。 11 月 25 日发布新图像生成模型 Frames,专注打造特定美学和视觉氛围,支持细粒度控制“外观、感觉和氛围”,强调“世界构建”,可设计完整的视觉世界,包括场景、氛围、情感等,提供全面的视觉叙事支持。 目前 Runway 支持在网页、iOS 访问,网页端目前支持 125 积分的免费试用额度(可生成约 105 秒视频),iOS 则有 200 多,两端额度貌似并不同步。官方网站:https://runwayml.com/
2025-04-15
实体从业者从零开始寻找ai副业变现
以下是为实体从业者从零开始寻找 AI 副业变现的一些建议和参考: 一、个人案例参考 1. 北京的识影,拥有 8 年数据开发经验,专注于探索 AI 视频的制作与编辑。能提供数据开发咨询和 AI 视频制作与编辑服务,需求是打造个人 IP 和探索副业变现机会,特别是在 AI 视频制作领域。 2. 北京的 vitaminC 胡,本职固收投行民工,希望在 AI 新兴领域学习并与志同道合的朋友合作,发挥自身特长做有价值的成果。 二、深圳 AI 变现沙龙中的项目 1. 达帅的 AI 抖音发广告项目,借助抖音平台对实体商家的流量扶持,有几万家实体商家购买相关软件,需求是懂软件开发且熟悉抖音的技术人员。 2. 其他人的项目,如 AI 私域做客户培育/用户旅程、AI 绘本、大学生社群对接商家、海外跨境电商和外贸、法律咨询制作劳动合同法 bot、体检报告解读等。 三、AI 写作变现指南 1. 项目启动:确定目标客户群体,如大学生、职场人士、自媒体从业者等;选择合适的 AI 写作工具。 2. 准备阶段:学习并实践 AI 写作技术,构建团队。 3. 商业模式构建:确定服务内容,如论文、报告、文案等写作服务;制定质量控制标准。 4. 运营与推广:在电商平台开设店铺,建立写作培训社群,通过社交媒体和线下活动进行品牌和社群建设,与其他团队合作。 5. 项目优化与发展:持续关注 AI 技术进展,根据市场需求拓展新服务和产品,收集客户反馈优化服务。 总之,实体从业者寻找 AI 副业变现,可先明确自身优势和兴趣,参考他人成功案例,选择适合的方向,不断学习提升技能,注重团队合作和市场推广,持续优化改进。
2025-04-15
星流一站式 AI 设计工具的打开方式
星流一站式 AI 设计工具的打开方式如下: 无限画布: 图像分享与信息查看: 图像信息查看:滑动鼠标到图像上,点击信息查看按钮后弹出生成信息。 图像分享:点击图像右上角的分享标志可生成分享链接与发送到 LiblibAI。发布到 Liblib 时,需输入与内容匹配的图片标题,选择现有活动标签或自定义个性化标签,提供对图片的详细解释或创作理念。 右键功能: 画布空白区域右键: 放大:点击一次,视图放大较小的比例。 缩小:点击一次,视图缩小较小的比例。 显示画布所有图像:扩大视图直到包含全部图片。 图像上右键: 移动至顶层/移动至底层:调整当前图像层级别,层级高的会覆盖层级低的图像。 复制:复制当前图像。按住键盘快捷键 ctrl/command+V 可以在无限画布中直接粘贴一张图像,也可以粘贴到星流网站外的其他界面中。 复制链接:复制图像的链接,点击链接可查看与调取图像信息。 框选多张图像后右键: 创建组(成功创建后左上角有 Group 字样):创建组后,拖动任意图像位置,整个组的图像都会移动;点击组内图像后,可拖动单一图片。 选中组后右键: 合并为图片(左上角为 Merged Image 标志):将组内所有图片(包括空白区域)合并为一张图片。 下方 prompt 输入框: 图生图: 作用:允许用户上传一张图像,并基于该图像生成新的视觉内容。 使用方法: 应用图生图:在 prompt 输入框下,点击“图生图”上传本地文件;在无限画布中下,图片功能区进行选择。 调整“图生图”功能区参数:参考程度分为更像原图(小幅度修改基底图像,有限的增加元素)、更创意(大幅度修改基底图像,可搭配增强模型加入更多的元素)、自定义(可自定义修改重绘幅度);增加参考纬度(点击添加按钮,会自动的应用并打开“生成器”的图片参考功能);替换图像(鼠标滑动到图像,点击“选择参考图”即可重新选择图片);转换提示词(反推参考图信息填入进提示词框中);同步生图尺寸(同步参考图尺寸到“生成器”的生图尺寸中)。 顶部图像编辑工具: 基础工具: 选择(V):可以选中画布上的图片并移动图片。 平移画布:可以移动画布,但是无法选中图片。 上传图片:上传图片到画布。上传大于 20482048 的图片到画布,将会自动压缩到 20482048 以内。也可以直接拖动图像到画布进行上传图片操作。图像选中:左键点击图像进行选中,才能使用图像智能工具。 帮助专区: 教程板块:跳转到星流的详细的图文教程板块。 快速导览:对各个区域逐步进行高亮并进行解释。
2025-03-10
https://www.xingliu.art 这个网站,星流是什么ai,属于哪个旗下
很抱歉,目前没有关于“https://www.xingliu.art”这个网站以及“星流”AI 的相关确切信息,无法确定其所属。
2025-02-26
星流AI绘画是什么?
星流 AI 绘画是一种一站式的 AI 设计工具,具有以下特点和功能: 无限画布: 画布空白区域右键:包括放大、缩小、显示画布所有图像等功能。 图像上右键:可进行移动至顶层/底层、复制等操作,按住键盘快捷键 ctrl/command+V 可以在无限画布中直接粘贴一张图像,也可以粘贴到星流网站外的其他界面中,还能复制图像链接。 框选多张图像后右键:可创建组,创建组后拖动任意图像位置,整个组的图像都会移动,点击组内图像后,可拖动单一图片;选中组后右键可进行合并为图片等操作。 顶部图像编辑工具:包含画布工具、帮助专区、图像智能工具、历史记录。 基础工具:如选择(V)可选中并移动画布上的图片,平移画布,上传图片等,上传大于 20482048 的图片到画布会自动压缩到 20482048 以内,也可直接拖动图像到画布上传。 帮助专区:包括教程板块可跳转到详细的图文教程板块,快速导览对各个区域逐步进行高亮并进行解释。 关键词指南:在描述主体内容时,有多种公式示例,如主体内容为宇宙飞船,可从一艘/一群宇宙飞船等逐步细化描述,还可加入环境、气氛、灯光、色彩、构图、风格参考等元素。
2025-02-09
人物一致性
Midjourney 的角色一致性功能: 功能介绍:类似于“风格参考”功能,尝试使人物与“人物参考”图像相匹配。 使用方法:在提示词后输入`cref URL`并附上一个人物图像的 URL。需注意一定要在提示词后面,否则会报错。可以使用`cw`来修改参考“强度”,从 100 到 0。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;强度 0(`cw 0`)时,只会关注面部(适合改变服装/发型等)。 实际效果:例如以甜茶或小公主的图片为案例,不同的强度参数下,发型、衣服等会有相应变化。 相关优势:能节省工期,提升生产管线的可控性。 其他应用:利用 MJ 重绘功能,在重绘提示词里输入`cref cw`保证角色一致性。对于生成图中的黑边,可框住黑边部分重绘输入关键词“background”去除,保证背景一致。 体验网址:MJ 的网页版体验较好,网址为 https://alpha.midjourney.com/
2025-03-29
人物一致性
Midjourney 的角色一致性功能: 此功能是官方推出的重要功能,可使生成的人物与参考图像相匹配。 使用方法:在提示词后输入 `cref URL` 并附上人物图像的 URL。需注意一定要在提示词后面,否则会报错。 可使用 `cw` 来修改参考强度,从 0 到 100。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;强度 0(`cw 0`)时,只会关注面部(适合改变服装/发型等)。 该功能同步支持 MJ V6 和 Niji V6。 对于保证角色一致性,可利用 MJ 重绘功能,在重绘提示词里输入 `cref cw` 。 若有黑边问题,可将黑边部分框住,重绘输入关键词 `background` 去除黑边保证背景一致。 体验 MJ 网页版效果较好,网址:https://alpha.midjourney.com/
2025-03-18
comfy ui 九宫格生图保持人物一致性的原理
Comfy UI 九宫格生图保持人物一致性的原理主要基于 PuLID 技术,具体如下: PuLID 是一种用于在文本生成图像时自定义图像中人物或物体身份(ID)的新技术,它结合了两个不同的模型分支(Lightning T2I 分支和标准扩散模型),引入了两种损失(对比对齐损失和精确 ID 损失)。 Lightning T2I 分支是一个快速、高效的文本到图像生成模型。 标准扩散模型是常见的、生成高质量图像的模型。 对比对齐损失帮助模型学习将输入的文本和生成的图像内容对齐,使生成的图像更符合文本描述。 精确 ID 损失确保生成的图像中的特定身份特征(比如人物的脸部特征)与目标 ID 一致。 此外,在保持人物一致性方面,还有一些操作步骤: 生成图像(提示词加入分割描述,让一张图生成多张同空间小图)。 通过目标图像不断的重复生成,获取更多一致性的角色图像,下载分类(按照视角不同分类)。 上传图像,调用 prefer option set 命令,先写命令名称(一个视角操作一次),再放入该视角的照片(4 5 张)。 放开角色限制生成图像,在确认好的图像上进行局部重绘,框选头部,在原来的命令下加入—快捷命令名称,确认生成即可。 同时,Eva CLIP 也是相关的技术: Eva CLIP 是一种基于对比学习的视觉文本模型,将文本描述和图像内容映射到一个共享的嵌入空间。 对比学习架构:使用对比学习方法,将图像和文本嵌入到一个共享的空间,通过最大化匹配图像和文本对的相似度,同时最小化不匹配对的相似度,学习到图像和文本之间的关联。 强大的特征提取能力:编码器擅长提取图像中的细节特征,并将其转换为有意义的嵌入向量,用于下游任务。 多模态应用:能够处理图像和文本两种模态,广泛应用于多模态任务中,如生成、检索、标注等。 其应用场景包括图像生成、图像检索、图像标注等。Eva CLIP 编码器通常与深度神经网络结合使用,如卷积神经网络(CNN)用于图像特征提取,Transformer 网络用于处理文本描述。 项目地址:https://github.com/ToTheBeginning/PuLID 相关资源: instant ID 脸部特征抓取得比 pulid 好,放在最后一步重绘,先 pulid,再 instantID https://pan.baidu.com/s/1Tro9oQM85BEH7IQ8gVXKsg?pwd=cycy 工作流与模型地址:https://pan.quark.cn/s/2a4cd9bb3a6b 说明文档:https://xiaobot.net/post/6544b1e8 1d90 4373 94cf 0249d14c73c8 测试案例:
2025-03-17
comfy UI 如何保持人物一致性
要在 ComfyUI 中保持人物一致性,可以通过以下方式实现: 1. PuLID 技术: PuLID 是一种用于在文本生成图像时自定义图像中人物或物体身份(ID)的新技术,无需复杂调整。 它结合了 Lightning T2I 分支和标准扩散模型两个不同的模型分支,并引入了对比对齐损失和精确 ID 损失两种损失,以确保在保持原始模型效果的同时,高精度地自定义 ID。 Lightning T2I 分支是快速、高效的文本到图像生成模型,标准扩散模型是常见的生成高质量图像的模型。 PuLID 可以让您在生成图像时更精确地定制人物或物体的身份,将特定 ID(例如人脸)嵌入到预训练的文本到图像模型中,而不会破坏模型的原始能力。 项目地址:https://github.com/ToTheBeginning/PuLID 相关资源: 百度网盘:https://pan.baidu.com/s/1Tro9oQM85BEH7IQ8gVXKsg?pwd=cycy 工作流与模型地址:https://pan.quark.cn/s/2a4cd9bb3a6b 说明文档:https://xiaobot.net/post/6544b1e81d90437394cf0249d14c73c8 instant ID 脸部特征抓取得比 PuLID 好,可放在最后一步重绘,先 PuLID,再 instantID。 2. 节点设置: 节点插件 PuLID ComfyUI:https://github.com/cubiq/PuLID_ComfyUI model:使用预训练的基础文本到图像扩散模型,如 Stable Diffusion。 pulid:加载的 PuLID 模型权重,定义 ID 信息如何插入基础模型。 eva_clip:用于从 ID 参考图像中编码面部特征的 EvaCLIP 模型。 face_analysis:使用 InsightFace 模型识别和裁剪 ID 参考图像中的面部。 image:提供的参考图像用于插入特定 ID。 method:选择 ID 插入方法,如“fidelity”(优先保真度)、“style”(保留生成风格)和“neutral”(平衡两者)。 weight:控制 ID 插入强度,范围为 0 到 5。 start_at 和 end_at:控制在去噪步骤的哪个阶段开始和停止应用 PuLID ID 插入。 attn_mask:此选项用于提供灰度掩码图像,以控制 ID 自定义的应用位置,但并不是必需输入,而是可选输入。 Advanced Node:提供了高级节点,可以通过调整 fidelity 滑块和 projection 选项进行更精细的生成调优。比如,ortho_v2 和 fidelity:8 等价于标准节点的 fidelity 方法,而 projection ortho 和 fidelity:16 等价于 style 方法。 此外,在 8 月 13 日的 ComfyUI 共学中也提到控制人物一致性有很多方法,课程后期会介绍。
2025-03-17
人物一致性
Midjourney 的角色一致性功能: 此功能类似于“风格参考”,但尝试使人物与“人物参考”图像相匹配。 使用方法:在提示词后输入`cref URL`并附上一个人物图像的 URL。需注意一定要在提示词后面,否则会报错。 可以使用`cw`来修改参考“强度”,从 100 到 0。强度 100(`cw 100`)是默认值,会使用面部、头发和衣服;强度 0(`cw 0`)时,只会关注面部(适合改变服装/发型等)。 该功能同步支持 MJ V6 和 Niji V6。 对于保证角色一致性,可利用 MJ 重绘功能,在重绘提示词里输入`cref cw`。 若有黑边问题,可将黑边部分框住,重绘输入关键词“background”去除黑边,保证背景一致。 体验 MJ 网页版效果更佳,网址:https://alpha.midjourney.com/
2025-03-13
midjourney 一致性
Midjourney 推出了角色一致性功能,以下是相关要点: 1. 该功能在 MJ 一鸽再鸽后终于放出,同步支持 MJ V6 和 Niji V6。 2. 风格一致性、角色一致性、场景一致性是进入生产管线的重要可控性功能,实现难度由低到高。 3. cref 背后参数 cw 的值可从 0 设到 100,cw 100 是默认参数,会参考原图的脸部、头发和衣服,但会非常不吃 Prompt;cw 0 时,就只会参考脸部,约等于一个换脸。 4. 使用方法:在提示词后输入 `cref URL` 并附上一个人物图像的 URL,注意一定要在提示词后面,第一次没注意加在前面会报错。可以使用 `cw` 来修改参考强度,强度 100 是默认值,会使用面部、头发和衣服;强度 0 时,只会关注面部,适合改变服装、发型等。 5. cref 命令适用于单一主题、单一角色的图像。如果计划在场景中添加多个角色,需要使用平移按钮来添加,基于 cref 的多个角色放置到单个画布上的最佳方法是使用平移功能将新的画布与现有画布拼接在一起,每个新画布的部分都将有自己的 cref。使用时需先使用 /settings 将 Remix 打开,然后选择 ,选择将包含第二个字符的图像,然后使用 U 将其从网格中分离出来,寻找蓝色小箭头添加新角色。 6. 您可以仅描述环境、周围环境、背景或情境,Midjourney 将努力将角色融入场景中。如果出现不连贯的结果,可尝试使用更高值的样式化(s),例如 s 800。 7. 体验 MJ 网页版的网址:https://alpha.midjourney.com/
2025-03-11
如果改变照片中人物的表情
要改变照片中人物的表情,可以通过以下几种方式: 1. 在使用 SD 脸部修复插件 After Detailer 时,输入如“伤心、流泪”这样针对表情的正负提示词,人物的表情会进行相应改变。但输入“带着墨镜”可能没有效果。 2. 使用 Magic Brush 工具,选中人物的眉毛、眼睛、嘴唇等部位,通过调节轨迹的方向来实现合理的表情变化。 3. 在 Midjourney V6 中,若遇到无法改变角色脸部等问题,可按照以下步骤排除故障:首先确保写了强有力的提示以建议新的姿势、风格或细节;若角色抗拒被操纵,可能是 cref 图像支配了提示,可通过使用 cw进行处理,尝试将提示与较低的 cref 权重一起使用,如 cw 60,按照特定步骤操作,还可考虑使用 来恢复面部区域。
2025-04-14
我想做视频二创,比如把视频背景换掉,人物上的衣服换掉,请给我推荐一下相关AI工具
以下是为您推荐的一些用于视频二创,如更换视频背景、人物衣服的相关 AI 工具: 1. 山寨版阿里 Animate Anyone 开源:利用图像和视频中的人物姿势来合成动画。Novita AI 开源并提供 API 支持,提供照片和视频即可自动生成动画。 GitHub:https://github.com/novitalabs/AnimateAnyone API:https://novita.ai/playgroundanimateanyone https://x.com/imxiaohu/status/1796191458052944072 2. ViViD 视频虚拟试穿技术:由阿里巴巴开发,可以替换视频中人物的衣服,生成真实自然的视频,支持多种服装类型,在视觉质量、时间一致性和细节保留方面表现优异。 https://x.com/imxiaohu/status/1796019244678906340 3. 在进行视频二创时,若需要更精确的蒙版,比如人物的眼睛或身上的配饰等,可以使用 segment anything 中的 GroundingDINO。启用 GroundingDINO 后,AI 会自动下载模型,也可在没有魔法的情况下到云盘直接下载,放到指定文件目录下“……sdwebuiakiv4.2\\extensions\\sdwebuisegmentanything\\models\\groundingdino”。在检测提示词中输入相关内容,AI 可根据语义分割自动检测并设置好蒙版。还能通过预览箱体得到部分编号进行单一调整。比如给人物换背景时,加载生成的背景蒙版,选择合适的大模型和正向提示词,蒙版模式选择“重绘非蒙版内容”,若有需要还可进行后续细化和 PS 修复。
2025-04-01
如何让一张卡通人物动起来
要让一张卡通人物动起来,可以参考以下几种方法: 1. 使用 AnimateX :类似 Animate Anyone,输入角色图片和参考动作序列,即可实现角色动画,尤其适配拟人化的角色。 2. 借助 Pika : 账号注册:访问完成免费注册。 素材整理: 视频:准备一段视频,可手机实拍,≥5 秒,生成时会自动截取前 5 秒,横屏/竖屏均可(建议 1080p 以上)。 图片:准备一张主体清晰无遮挡的角色图片,生成的视频中将参考此图片的角色并融入视频。 文案思路:提前构思角色动态关键词(如“奔跑/挥手/发光”),也可让模型自由发挥。 3. 运用即梦进行图生视频:只需上传图片至视频生成模块,用简单提示词描绘画面中的动态内容,能生成时长为 3 秒钟的画面,运镜类型可根据剧本中的镜头描绘设置,以随机运镜为主,生成速度可选择慢速。 此外,在制作过程中,还可以像桂大羊的教程那样,通过描绘人物的提示词、上传角色参考图、扣除角色背景以便于进行角色加背景的融合生成时进行垫图操作等方式,提高人物和场景的融合度。
2025-03-30
关于图片生成人物衣服的提示词
以下是关于图片生成人物衣服的一些提示词相关内容: 在使用 Segment Anything 时,启用 GroundingDINO 可自动下载模型,将其放到特定文件目录下,在检测提示词中输入相关内容,如“eye”,可自动检测并设置蒙版。通过预览箱体获取编号,可选择调整单一部分。例如,只想调整左边眼睛,勾选 1 即可。还可给人物换背景,如大模型选择 revAnimated_v122,正向提示词为简单背景、花、国画、工笔,蒙版模式选择“重绘非蒙版内容”。将生成的图片放入图生图中,使用 tile 模型能给人物衣服添加国风元素。 设置模型和提示词时,例如大模型为 ghostmix_v20Bakedvae,正向提示词包含人物特征、服饰等描述,负向提示词包含 EasyNegative、badhandsv5neg 等。生成图片后可进行细节微调。 使用 cutoff 插件时,点击启用后按提示词顺序依次填入颜色提示词,中间用逗号分开,能准确显示颜色。如创建双人物构图,设置好人物形象和提示词,先在不开启插件时生成图片可能有颜色污染,开启插件并输入颜色信息后能保证颜色与提示词的关联性。
2025-03-28
我上传一个ai人物形象,有什么AI能驱动他当做数字人来口播,免费的那种
以下为您介绍一些可以免费驱动 AI 人物形象当做数字人进行口播的工具及使用方法: 1. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片。 上传后效果如图所示,My Avatar 处显示上传的照片。 点开大图后,点击 Create with AI Studio,进入数字人制作。 写上视频文案并选择配音音色,也可以自行上传音频。 最后点击 Submit,就可以得到一段数字人视频。 2. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 点击网址,点击右上角的 Create vedio。 选择人物形象,可以点击 ADD 添加您的照片,或者使用 DID 给出的人物形象。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 最后,点击 Generate vedio 就可以生成一段视频。 打开自己生成的视频,可以下载或者直接分享给朋友。 3. KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很 AI。 使用方法: 点击网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能。 点击开始创作,选择自定义照片。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 打开绿幕按钮,点击背景,可以添加背景图。 最后,点击生成视频。 4. 剪映: 优势:作为字节跳动旗下的产品,在抖音平台上被广泛应用,海外版 CapCut 也有出色表现。其拥有六大 AI 功能,能在编辑器里完成脚本生成、语音克隆、数字人口播等环节。 下载地址:剪映 制作流程: 打开剪映,添加一个文本到文字轨道,并修改好需要朗读的文字。 点击朗读,并进行声音克隆,剪映的声音克隆现在只用念一句话就可以完成克隆。 克隆完成后,选择喜欢的数字人形象,并把自己的克隆音色换上去。 一键智能生成字幕,再自行调整文字样式并校准。 生成数字人: 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象。 当选择一个数字人形象时,软件会马上播放出该数字人的声音。点击右下角的“添加数字人”,就会将选择的数字人添加到当前视频中。 左下角会提示渲染何时完成。然后可以点击预览按钮,查看生成的数字人效果。 增加背景图片: 可以直接删除先前导入的文本内容。 为视频增加背景图片,点击左上角的“媒体”菜单,并点击“导入”按钮,来选择本地的一张图片上传。 点击图片右下角的加号,将图片添加到视频的轨道上(会覆盖数字人)。 点击轨道最右侧的竖线,向右拖拽,直到视频的最后,也就是和视频对齐。
2025-03-27