Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

sd 人物的模样及服装等统一

Answer

以下是关于人物模样及服装的 SD 关键词描述:

  • 人物类型:肌肉公主、舞者、啦啦队等。
  • 性别:单人,包括女人和男人。
  • 身体特征:有光泽的皮肤、苍白皮肤、白皙皮肤等。
  • 头发样式:直发、卷发、波浪卷等。
  • 头发颜色:挑染、内层挑染、头发内变色等。
  • 头发长度:长发、很短的头发、短发等。
  • 具体人物:初音未来、绫波(碧蓝航线)、比那名居天子、蛮啾(碧蓝航线)、爱宕、时崎狂三、洛琪希、西住美穗、星街彗星、时雨、蒂法·洛克哈特、中野一花、南达科他州(碧蓝航线)、白上吹雪、白井黑子、岛风等。
  • 发型特点:身前,单侧编发,人妻发型;挑染,条纹发色;短碎发等。
  • 面部特征:死鱼眼、晒痕、眼睛发光、垂耳(狗)等。
Content generated by AI large model, please carefully verify (powered by aily)

References

SD关键词

|肌肉_princess_dancer_cheerleader|肌肉_公主_舞者_啦啦队|性别_solo_female_male|性别_单人_女人_男人|身体_shiny_skin_pale_skin_fair_skin|身体_有光泽的皮肤_苍白皮肤_白皙皮肤|头发样式_straight_hair_curly_hair|头发样式_直发_卷发_波浪卷|头发颜色_streaked_hair_xx_colored_inner_hair_xx_and_xx_hair|头发颜色_挑染_内层挑染_头发内变色|头发长度_long_hair_very_short_hair _short_hair |头发长度_长发_很短的头发_短发|hatsune_miku_saber|翻译1_初音未来_saber|人物名称2_ayanami_(azur_lane)_hinanawi_tenshi|翻译2_绫波(碧蓝航线)_[比那名居天子](http://www.baidu.com/link?url=DTB-VLskf-_AYaa_jVCViGc1lmBfIkRD6K1F94DBELz2aqXmas9nX_abBrb2AC_4Hz-lTO6CZ2jw56xFmCLnka)|manjuu_(azur_lane)_atago_(azur_lane)|蛮啾(碧蓝航线)_爱宕|tokisaki_kurumi_mushoku_tensei,_roxy_migurdia|时崎狂三_洛琪希|实际组合_身前,单侧编发,人妻发型?|挑染,条纹发色|短碎发|死鱼眼|晒痕|眼睛发光|垂耳(狗)|Option 1_||-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-||||||||||||||nishizumi_miho|西住美穗|hoshimachi_suisei|[星街彗星](http://www.baidu.com/link?url=9PKD0tz9ciaLuMeh_nY2Y_O3P1Ss5dUb5gbDai67AFEabvL75CyXPh3mo613dkY5JjsNWXKpjefdpiTxgHx8cWuU7WubSL8X5DFMRiABVZW)|shigure_(azur_lane)|时雨|||||||||||

SD关键词

|肌肉_princess_dancer_cheerleader|肌肉_公主_舞者_啦啦队|性别_solo_female_male|性别_单人_女人_男人|身体_shiny_skin_pale_skin_fair_skin|身体_有光泽的皮肤_苍白皮肤_白皙皮肤|头发样式_straight_hair_curly_hair|头发样式_直发_卷发_波浪卷|头发颜色_streaked_hair_xx_colored_inner_hair_xx_and_xx_hair|头发颜色_挑染_内层挑染_头发内变色|头发长度_long_hair_very_short_hair _short_hair |头发长度_长发_很短的头发_短发|hatsune_miku_saber|翻译1_初音未来_saber|人物名称2_ayanami_(azur_lane)_hinanawi_tenshi|翻译2_绫波(碧蓝航线)_[比那名居天子](http://www.baidu.com/link?url=DTB-VLskf-_AYaa_jVCViGc1lmBfIkRD6K1F94DBELz2aqXmas9nX_abBrb2AC_4Hz-lTO6CZ2jw56xFmCLnka)|manjuu_(azur_lane)_atago_(azur_lane)|蛮啾(碧蓝航线)_爱宕|tokisaki_kurumi_mushoku_tensei,_roxy_migurdia|时崎狂三_洛琪希|实际组合_身前,单侧编发,人妻发型?|挑染,条纹发色|短碎发|死鱼眼|晒痕|眼睛发光|垂耳(狗)|Option 1_||-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-||||||||||||||tifa_lockhart|蒂法·洛克哈特|nakano_ichika|中野一花|south_dakota_(azur_lane)|南达科他州|||||||||||

SD关键词

|肌肉_princess_dancer_cheerleader|肌肉_公主_舞者_啦啦队|性别_solo_female_male|性别_单人_女人_男人|身体_shiny_skin_pale_skin_fair_skin|身体_有光泽的皮肤_苍白皮肤_白皙皮肤|头发样式_straight_hair_curly_hair|头发样式_直发_卷发_波浪卷|头发颜色_streaked_hair_xx_colored_inner_hair_xx_and_xx_hair|头发颜色_挑染_内层挑染_头发内变色|头发长度_long_hair_very_short_hair _short_hair |头发长度_长发_很短的头发_短发|hatsune_miku_saber|翻译1_初音未来_saber|人物名称2_ayanami_(azur_lane)_hinanawi_tenshi|翻译2_绫波(碧蓝航线)_[比那名居天子](http://www.baidu.com/link?url=DTB-VLskf-_AYaa_jVCViGc1lmBfIkRD6K1F94DBELz2aqXmas9nX_abBrb2AC_4Hz-lTO6CZ2jw56xFmCLnka)|manjuu_(azur_lane)_atago_(azur_lane)|蛮啾(碧蓝航线)_爱宕|tokisaki_kurumi_mushoku_tensei,_roxy_migurdia|时崎狂三_洛琪希|实际组合_身前,单侧编发,人妻发型?|挑染,条纹发色|短碎发|死鱼眼|晒痕|眼睛发光|垂耳(狗)|Option 1_||-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-|-||||||||||||||shirakami_fubuki|白上吹雪|shirai_kuroko|白井黑子|shimakaze_(azur_lane)|岛风|||||||||||

Others are asking
flux和sdXL出图的区别
Flux 和 SDXL 出图主要有以下区别: 1. 生成人物外观:Flux 存在女生脸油光满面、下巴等相同外观问题,而 SDXL 相对在这方面有改进。 2. 模型构成:SDXL 由 base 基础模型和 refiner 优化模型两个模型构成,能更有针对性地优化出图质量;Flux 中 Dev/Schnell 是从专业版中提取出来,导致多样性丧失。 3. 处理方式:在低显存运行时,可采用先使用 Flux 模型进行初始生成,再用 SDXL 放大的分阶段处理方式,有效控制显存使用。 4. 模型参数和分辨率:SDXL 的 base 模型参数数量为 35 亿,refiner 模型参数数量为 66 亿,总容量达 13G 之多,基于 10241024 的图片进行训练,可直接生成 1000 分辨率以上的图片,拥有更清晰的图像和更丰富的细节;而 Flux 在这方面相对较弱。
2024-12-20
flux和sd3.5出图的区别
Flux 和 SD3.5 出图存在以下区别: 1. 模型性质:Flux.1 有多种版本,如开源不可商用的 FLUX.1等。而 SD3.5 未提及相关性质。 2. 训练参数:Flux.1 的训练参数高达 120 亿,远超 SD3 Medium 的 20 亿。 3. 图像质量和提示词遵循能力:Flux.1 在图像质量、提示词跟随、尺寸适应、排版和输出多样性等方面超越了一些流行模型,如 Midjourney v6.0、DALL·E 3和 SD3Ultra 等。 4. 应用场景:Flux.1 可以在 Replicate 或 fal.ai 等平台上试用,支持在 Replicate、fal.ai 和 Comfy UI 等平台上使用,并且支持用户根据自己的数据集进行微调以生成特定风格或主题的图像。而 SD3.5 未提及相关应用场景。 5. 本地运行:文中尝试了在没有 N 卡,不使用复杂工作流搭建工具的 Mac Mini M1 上运行 FLUX.1,以及在边缘设备 Raspberry PI5B 上运行的情况,未提及 SD3.5 的相关内容。 6. 模型安装部署:对于 Flux.1,不同版本的模型下载后放置的位置不同,如 FLUX.1应放在 ComfyUI/models/unet/文件夹中。而 SD3.5 未提及相关安装部署内容。 7. 显存处理:对于 Flux.1,如果爆显存,“UNET 加载器”节点中的 weight_dtype 可以控制模型中权重使用的数据类型,设置为 fp8 可降低显存使用量,但可能会稍微降低质量。而 SD3.5 未提及相关显存处理内容。 8. 提示词使用:在训练 Flux 时,应尽量使用长提示词或自然语言,避免使用短提示词,因为 T5 自带 50%的删标。而 SD3.5 未提及相关提示词使用内容。
2024-12-20
sd的提示词有哪些语法
以下是关于 SD 提示词的语法: 1. 多个提示词之间使用英文半角符号“,”分隔,例如:masterpiece,best quality,ultradetailed,illustration,closeup,straight on,face focus,1girl,white hair,golden eyes,long hair,halo,angel wings,serene expression,looking at viewer。 2. 一般而言,概念性、大范围、风格化的关键词写在前面,叙述画面内容的关键词其次,最后是描述细节的关键词。大致顺序为:。 3. 每个词语本身自带的权重可能不同,模型训练集中较多出现的关键词,输入一个词就能极大影响画面;较少出现的关键词,输入多个相关词汇对画面影响效果可能有限。提示词的顺序很重要,越靠后的权重越低。关键词最好具有特异性,措辞越具体越好,避免抽象和有解释空间的措辞。 4. 可以使用括号人工修改提示词的权重,例如: 将权重减少为原先的 25%。 5. 可以通过 Prompt Editing 使得 AI 在不同的步数生成不一样的内容,语法为:例如:a,100 步采样,一开始。提示词为:fantasy landscape with a mountain and an oak in foreground shoddy 在第 25 步后,提示词为:fantasy landscape with a lake and an oak in foreground in background shoddy 在第 50 步后,提示词为:fantasy landscape with a lake and an oak in foreground in background masterful 在第 60 步后,提示词为:fantasy landscape with a lake and an oak in background masterful 在第 75 步后,提示词为:fantasy landscape with a lake and a christmas tree in background masterful。 6. 提示词还可以轮转,比如:在第一步时,提示词为“cow in a field”;在第二步时,提示词为"horse in a field.";在第三步时,提示词为"cow in a field",以此类推。 7. 交替词:in a field 可以支持多个词交替。 8. 可组合扩散(AND 语法):a cat AND a dog 比如想画一个猫和狗的混合物种,每一个要混合的东西支持加权重,比如 a cat:1.2 AND dog AND a benguin:2.2。通过继续向总数添加更多提示,这可以方便地生成微调的递归变化,比如 log AND frog:0.13 AND yellow eyes:0.08 。 请注意,权重值最好不要超过 1.5。
2024-12-19
SD 怎么赚钱
Stable Diffusion(SD)赚钱的方式有多种可能性: 1. 利用 SD 生成真人 AI 美女相关内容,创建账号吸引流量并实现变现。 2. 为用户生成个性化的头像、壁纸并收取费用。 3. 借助 SD 辅助完成动漫图画、插画等创作,并通过相关渠道获取收益。 4. 后续可能会有更多关于 SD 实际变现方式和案例的详细介绍。 需要注意的是,SD 完全免费开源,所有代码均在 GitHub 上公开,大家可以拷贝使用。Stable Diffusion 模型第一个版本训练耗资 60 万美元,而提供资金支持正是 Stability AI 公司,其成立于 2020 年,最初资金都来自创始人兼 CEO Emad Mostaque。目前市面上主流的 AI 绘图软件除了 SD 还有 Midjourney,Midjourney 操作简单方便但需付费和科学上网,而 SD 开源免费但需要较好的电脑配置。
2024-12-19
sd最新的模式是什么
Stable Diffusion(SD)最新的模式包括: 1. 隐藏在光里的秘密,AI造字光与影的艺术中,将 lightingBasedPicture 模型的终止时机由 0.6 提高到 0.7 能使文字更好识别,但再提高字会显得太突兀,需把握平衡。 2. Stability AI 正式发布了期待已久的 SDXL 1.0。SDXL 1.0 由两个模型组成,第二个模型能生成更鲜艳、更准确的颜色,且比前身具有更好的对比度、光照和阴影。SDXL 1.0 是所有开放获取图像模型中参数数量最多的模型之一,拥有 3.5B 参数基础模型和 6.6B 参数模型集成管道。 如果您想要最新的 controlnet 模型,可以添加公众号【白马与少年】,回复【SD】获取。
2024-12-17
Sd文生图的专业术语有哪些
以下是一些关于 SD 文生图的专业术语: 1. 内容型提示词:主要用于描述想要的画面,如“1 个女孩,黑发,长发,校服,向上看,短袖,粉红色的花,户外,白天,蓝色的天空,云,阳光,上身,侧面”。 2. 标准化提示词:例如“,drawing,paintbrush”。 3. 权重:通过括号和特定数值来增加提示词的权重,权重越高在画面中体现越充分,提示词的先后顺序也会影响权重。 4. 反向提示词:告诉 AI 不要的内容,如“NSFw,”。 5. 采样迭代步数:指 AI 绘画去噪的次数,步数越高绘画越清晰,但绘画速度越慢,通常数值控制在 20 40 之间较好。 6. 采样方法:AI 生成图像时的特定算法,常用的有“Euler a;DPM++2S a Karras;DPM++2M Karras;DPM++SDE Karras;DDIM”。 7. 比例:尺寸并非越大越好,模型练图通常按 512x512 的框架绘制,高宽比尽量在这个数值附近。高清修复可放大图像倍率,高宽比主要控制画面比例。
2024-12-16
生图后,人物的模样及服装等统一,用哪一款
在保持人物模样及服装等统一方面,如果使用 Midjourney ,有以下相关信息: 1. Midjourney 有新功能 Cref ,可以先跑一张主角的定妆照,在需要出现主角人物的地方,扔进去 Cref 以保持发型、人脸、衣服。但需要注意的是,Midjourney 对亚洲人脸的 Cref 一致性,比对欧美的人脸的一致性效果差,年轻人的效果相对较好,亚洲老人的效果惨不忍睹。而且 Cref 的效果在画面的审美和构图上有一定的破坏性,所以原则上能不用 Cref 就不用,比如只有背影的时候,写个短发男人黑卫衣就可以。 2. 对于人物一致性,还有两个取巧的方式,一个是生成动物,动物会比较容易保持一致性,另一个方式是特定的名人或有特殊属性的人物。 3. 在使用 Cref 时,您可以在提示词后添加 cref URL 并附上人物图像的 URL ,还可以使用 cw 来修改参考强度,强度 100(cw 100)为默认值,会使用人物的脸、头发和衣服,强度 0(cw 0)时则只关注脸(适合改变服装或发型等)。Cref 不仅适用于 Niji 和普通的 Midjourney 模型,还可以与 sref 结合使用。在网页版 alpha 中,您可以通过拖拽或粘贴图像到想象栏,选择相应图标来设置图像为图像提示、风格参考或人物参考,Shift + 选择一个选项可以将一张图像用于多个类别。
2024-10-10
AI应用于服装行业的趋势
以下是 AI 应用于服装行业的趋势: 1. 营销应用: DALLE 2 和其他图像生成工具已用于广告,如亨氏使用番茄酱瓶图像和类似标签论证“这就是人工智能眼中‘番茄酱’的样子”,雀巢使用维米尔画作的人工智能增强版帮助销售酸奶品牌,Stitch Fix 用 AI 向客户推荐特定服装并尝试用 DALLE 2 根据客户偏好创建服装可视化,美泰使用该技术生成玩具设计和营销的图像。 2. 协助搭配:InterAlia 可以帮助搭配服装。 3. 人物服装生成:在生成 AI 人物形象时,服装的细致处理需要了解很多相关知识点,可以使用“主题+风格+材质+元素+玄学佐料”的万能固定句式,如“一个穿着中国清代宫廷刺绣旗袍,宽袖渐变红色加上刺绣雪纺面料,镶钻工艺,上面还有金丝雀和白玫瑰元素等刺绣元素”。通过添加材质装饰细节能使生成的服装更精致。
2024-12-12
推荐能作为服装电商模特的AI生成工具
以下为您推荐可作为服装电商模特的 AI 生成工具: 1. DALLE 2:已被用于广告,如亨氏、雀巢等品牌的营销中。Stitch Fix 服装公司也在尝试使用它,根据客户对颜色、面料和款式的偏好创建服装可视化。 2. TryOffDiff:具有颠覆性,能将衣服从照片中“摘取”生成标准化服装图,保留图案、褶皱、徽标等精细细节,即使原图中部分被遮挡也能准确推断,适合商品目录制作及电商平台服装展示需求。详细介绍:
2024-12-12
与ai服装相关的应用
以下是一些与 AI 服装相关的应用: 1. 图像生成工具如 DALLE 2 已被用于广告,例如亨氏使用番茄酱瓶的图像和类似标签来展示“这就是人工智能眼中‘番茄酱’的样子”,雀巢使用维米尔画作的人工智能增强版帮助销售酸奶品牌,服装公司 Stitch Fix 用其根据客户对颜色、面料和款式的偏好创建服装可视化,美泰使用该技术生成玩具设计和营销的图像。 2. TryOffDiff 是一种 AI 脱衣技术,能逆向打造服装图片。它具有颠覆性,与虚拟试衣不同,可将衣服从照片中“摘取”生成标准化服装图;能精细还原图案、褶皱、徽标等细节,即使原图中部分被遮挡也能准确推断;应用场景广泛,适合商品目录制作及电商平台服装展示需求。详细介绍:
2024-12-08
服装设计,可以用哪些AI工具辅助
以下是一些可辅助服装设计的 AI 工具: 1. InterAlia:可以帮助搭配服装。 2. Stitch Fix:能够根据客户对颜色、面料和款式的偏好创建服装可视化。 此外,在设计领域还有一些相关的 AI 工具,虽然不是专门针对服装设计,但也可能有所帮助: 1. CADtools 12:这是一个 Adobe Illustrator(AI)插件,为 AI 添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 2. Autodesk Fusion 360:是 Autodesk 开发的一款集成了 AI 功能的云端 3D CAD/CAM 软件,能创建复杂的几何形状和优化设计。 3. nTopology:基于 AI 的设计软件,可创建复杂的 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 4. ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据用户输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 5. 一些主流 CAD 软件,如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,可根据用户输入的设计目标和约束条件自动产生多种设计方案。但这些工具通常需要一定的 CAD 知识和技能才能有效使用。对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-11-10
服装品牌ai运用
以下是关于服装品牌 AI 运用的相关内容: 在营销应用方面,DALLE 2 和其他图像生成工具已被用于广告。例如,亨氏使用番茄酱瓶的图像和类似标签来展示“这就是人工智能眼中‘番茄酱’的样子”,这意味着模型接受了大量相关照片的训练。雀巢使用维米尔画作的人工智能增强版帮助销售其酸奶品牌。Stitch Fix 是一家服装公司,已使用 AI 向客户推荐特定服装,并正在尝试使用 DALLE 2 根据客户对颜色、面料和款式的偏好创建服装可视化。美泰正在使用该技术生成用于玩具设计和营销的图像。 像 Flair、Booth 和 Bloom 这样的工具帮助品牌创建引人注目的产品照片,这对在线销售产品很重要。例如,一件挂在衣架上的连衣裙的静态照片可变成女人穿着它在花园行走的形象。除产品照片外,品牌还创作了许多可通过 AI 提升的内容类型。如 AdCreative 和 Pencil 可制作用于电子邮件或社交媒体的营销材料,Frase 或 Writesonic 可以编写经过 SEO 优化的产品描述。未来,预计用户仅通过描述期望的审美并点击按钮,就能创建完整的电商商店及营销材料。 在生成 Logo 方面,以下是一些 AI 产品: 1. Looka:在线 Logo 设计平台,使用 AI 理解用户品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:Logo 制作器使用 AI 技术创建个性化设计,用户可选择元素和风格。 4. LogoMakr:提供简单易用的设计工具,用户可拖放设计,利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:根据用户输入的品牌名称和行业类别快速生成设计方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术创建个性化 Logo。
2024-09-04
给我几个免费的图片转视频工具,主要针对于有人物的图片
以下为您推荐几个免费的图片转视频工具,主要针对有人物的图片: 1. Viggle: 网址:http://viggle.ai 有免费额度。 功能: /mix:将角色图像混合到动态视频中。 /animate:使用文本运动提示为静态角色设置动画。 /ideate:纯粹从文本创建角色视频。 /character:通过文本提示创建角色并将其动画化。 /stylize:使用文本提示符重新设计角色的样式并将其动画化。 操作步骤: 上传一张字符清晰的图片。 描述您希望角色执行的动作(或从https://viggle.ai/prompt中复制动作提示词)。 2. Dreamina: 网址:https://dreamina.jianying.com/aitool/home?subTab 优点:不需要🪜,每天有免费额度。 注册:抖音号或手机号。 时间:5min 3. Sora: 网址:https://openai.com/sora 优点:发布的成果好,集成在 openai 一套里可用。 限制:需要🪜,需要 gmail 注册,需要订阅后才能使用。 时间:30 60min 价格:GPT 4 20$一个月
2024-12-25
免费的ai虚拟人物
以下为您介绍一些免费的 AI 虚拟人物相关内容: 1. Vocs AI:这是一个免费的人工智能语音生成器和转换器。您可以按照以下步骤操作: 上传一段清晰的无伴奏人声录音,推荐 wav 或 mp3 格式,更推荐 wav。 从超过 20 名才华横溢的 AI 歌手、说唱歌手、叙述者、角色和配音艺术家中选择,将原始无伴奏声音转换成 AI 虚拟艺术家的声音。 点击“转换”,Vocs AI 的语音技术将把您上传的音频转换成 AI 版本的原声。 下载转换后的音频。需要注意的是,输入音频的质量将直接影响 AI 人声转换的输出质量。链接:https://www.vocs.ai/ 2. 剪映数字人“私有化”: 准备谷歌账号(可在淘宝或者在账号解决平台“”购买)。 第一步,打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”。 第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 第三步,等待专属的数字人视频出炉。 3. 关于数字人的一些算法开源代码仓库: ASR 语音识别:openai 的 whisper:https://github.com/openai/whisper ;wenet:https://github.com/wenete2e/wenet ;speech_recognition:https://github.com/Uberi/speech_recognition 。 AI Agent:大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。Agent 部分可以使用 LangChain 的模块去做自定义,里面基本包含了 Agent 实现的几个组件 。 TTS:微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费;VITS:https://github.com/jaywalnut310/vits,还有很多的分支版本;sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注到唱歌上面。 简单构建数字人还存在一些问题,例如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应的动作、数字人如何使用知识库做出某个领域的专业性回答等。
2024-12-24
可灵ai如何保持人物一致性
要保持可灵 AI 中人物的一致性,可以参考以下方法: 1. 人物设定: 明确主角、配角等人物的性格特点、外貌特征等,如主角是一位 40 岁的中年男探险家,性格特点是面对挑战从不轻言放弃,外貌特征是健壮、棕色头发、常穿探险服。 2. MJcref 控制人物一致性: 先根据人物设定,在 MJ 里筛选适合的人物形象,选中后右键复制图片链接。 在尾缀加入【cref 图片链接】控制人物一致性,【cw 数值】控制权重。 对于镜头较多的角色,建议炼个人物模型出来控制,不然 MJ 容易不稳定。 3. 控制多人物场景统一: 先控制一个角色再进行重绘。 选一张合适的图片后,点击 Vary进行局部重绘,并把尾缀机器人的 cref 链接改成主角的 cref 链接。 4. 通过 prompt 格式实现“角色一致性”: 公式:发型+年龄性别+衣物颜色+环境+其他(动作、镜头等)。 发型/衣物:构造尽可能多的角色非面部视觉元素,产生观众对角色的“一致性观感”。 年龄:约束角色年龄特征。 环境:约束能够产生相同观感的环境空间,尤其是光环境,增加观众对于形象认识的“一致性”认知。例如: 特写一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,面部被烛光照亮,表情惊讶,环境昏暗明暗对比强烈。 特写一个棕色卷发,身穿棕褐色上衣的小男孩,侧对镜头,微微仰头走在一片暗绿色的森林中,面部被手中提着的油灯照亮,环境昏暗明暗对比强烈。 一个棕色卷发,身穿棕褐色上衣的小男孩侧对镜头,看着面前桌上的蜡烛,环境昏暗明暗对比强烈。 中景拍摄一个棕色卷发,身穿棕褐色上衣的小男孩,正对镜头,在一个梦幻感的暖色调房间里,全身贯注地拼装面前的积木玩具。
2024-12-21
我想做简洁卡通风格的ai动画,根据故事文案生成的那种,需要保持人物一致性,用哪个工具比较好?
以下是一些适合生成简洁卡通风格、根据故事文案生成动画并保持人物一致性的工具: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。新注册有免费生成额度。 2. 季梦:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。若为 1.2 版本,选慢速或适中的标准模式,效果更好,且生成的视频无水印。每天给 60 积分。 3. 可玲:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。每天给 60 积分,可用于日常使用,创作片子可能需买会员,生成的视频有无水印选项。 此外,在使用 Midjourney 生图时,若要保持人物和场景一致性,有两个取巧的方式:一个是像上个视频一样生成动物,动物会比较容易保持一致性;另一个方式是特定的名人或者有特殊属性的人物。在确定影片风格时,比如可以选择皮克斯动画风格。同时,在提示词中利用 cref 命令也有助于保持人物的一致性。
2024-12-18
Changer软件能实现视频中人物的无缝换头吗
Changer 软件可以实现视频中人物的无缝换头。以下是一些相关的操作指引和注意事项: 上传原始视频和换脸图片,点击生成,即可自动识别视频中的人脸并进行替换。 在 TecCreative 创意工具箱中,操作指引为:上传原始视频——上传换脸图片——点击生成。 实战中,通过 JupyterLab 工具中的终端输入相关命令启动 facefusion 程序,在 facefusion 软件界面上传准备好的图片、视频,可看到预览效果,点击开始按钮执行换脸处理,完成后可下载处理后的视频。 此外,还有其他与图片和视频处理相关的方法和技巧,例如利用 MJ 画图、InsightFaceSwap 插件等进行处理。
2024-12-17
国内大模型领域关键人物、关键院校
以下是国内大模型领域的关键人物、关键院校及相关信息: 8 月正式上线的国内大模型: 北京: 百度(文心一言):https://wenxin.baidu.com 抖音(云雀大模型):https://www.doubao.com 智谱 AI(GLM 大模型):https://chatglm.cn 中科院(紫东太初大模型):https://xihe.mindspore.cn 百川智能(百川大模型):https://www.baichuanai.com/ 上海: 商汤(日日新大模型):https://www.sensetime.com/ MiniMax(ABAB 大模型):https://api.minimax.chat 上海人工智能实验室(书生通用大模型):https://internai.org.cn 聊天状态下能生成 Markdown 格式的:智谱清言、商量 Sensechat、MiniMax 目前不能进行自然语言交流的:昇思、书生 受限制使用:MiniMax(无法对生成的文本进行复制输出,且只有 15 元的预充值额度进行体验,完成企业认证后可以进行充值) 特色功能:昇思——生图,MiniMax——语音合成 阿里通义千问、360 智脑、讯飞星火等均不在首批获批名单中。据悉,广东地区获批公司分别为华为、腾讯,科大讯飞系其他地区获批产品。 中文大模型评测收集与调研: InfoQ + 极客帮:https://www.guotaixia.com/post/5124.html GAOKAOBench:地址:https://github.com/OpenLMLab/GAOKAOBench ,是一个以中国高考题目为数据集,测评大模型语言理解能力、逻辑推理能力的测评框架 清华安全大模型测评:地址:http://115.182.62.166:18000 ,清华收集的一个评测集,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的 40 余个二级安全类别 JioNLP 个人测评:评测数据集:https://github.com/dongrixinyu/JioNLP/wiki/LLM 评测数据集 ,考察 LLM 模型对人类用户的帮助效果、辅助能力,可否达到一个【智能助手】的水平。题型介绍:选择题来源于中国大陆国内各种专业性考试,重点在于考察模型对客观知识的覆盖面,占比 32%;主观题来源于日常总结,主要考察用户对 LLM 常用功能的效果。 EduTEP:华东师范大学计算机科学与技术学院 EduNLP 团队组建智能教育算法测评小组,开发智能教育可信评测平台(EduTEP)。EduTEP 对比多种大模型在教育领域中的综合性能,针对 K12 教育发布首个 CALMEDU 评测框架与 CALMEDU001 评测报告 娱乐资本论:我们的测试并非旨在提供学术上的严谨标准,我们的目标是:从实用的角度出发,分析这些大模型在各种文本应用场景,如小红书带货文案、抖音直播文案、知乎问答、小说创作、公关信写作、歌词生成、淘宝商品详情页文案、广告宣传片文案、剧本创意策划等方面的综合表现 中国大模型面临的真实问题: OpenAI 对字节跳动可能存在的违规使用其技术和知识产权的指控,字节跳动回应在 2023 年初技术团队在大模型探索初期有部分工程师将 GPT 的 API 服务应用于较小模型的实验性项目研究中,但强调该模型仅用于测试,从未计划上线或对外使用,且自 2023 年 4 月公司引入 GPT API 调用规范检查后已停止这种做法。 2024 年也有更多被指“套壳”国内大模型的事件,比如斯坦福大学 AI 团队主导的 Llama3V 开源模型,被证实套壳抄袭国内清华与面壁智能的开源模型。大模型的建设方式粗浅地分为三类。
2024-12-16