Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

如何用自己的形象做卡通数字人?

Answer

以下是用自己的形象做卡通数字人的方法:

  1. 简单提示词方法:
    • 在聊天窗口输入/imainge找到/imagine prompt,然后把刚才的链接放进去,然后空格。
    • 加一些提示词,这些提示词以英文逗号分隔,最后再加上设置参数。
    • 设置参数:
      • --iw 1.5是设置参考图片的权重,数值越高与参考的图片越接近,默认是0.5,最大是2,可选择中间的某个值并调整。
      • --s 500设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为0-1000间任意整数。
      • --v 5是指用midjourney的第5代版本,这一代的最真实,目前v5需要订阅付费,不想付费可以使用--v 4。
      • --no glasses是指不戴眼镜,如果你不喜欢戴眼镜的图片,可以戴上这个设置,让它不戴眼镜。
    • 完整的提示词如下(替换您的png图片地址):https://cdn.discordapp.com/xxx.pngsimple avatar,Disney boy,3d rendering,--iw 1.5--s 500--v 5。如果对生成的效果不满意,可以调整--s和--iw的值来进行多次尝试。
  2. 剪映生成数字人方法:
    • 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费的、适合的数字人形象,比如“婉婉-青春”。
    • 选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角的“添加数字人”,将其添加到当前视频中。剪映App会根据提供的内容生成对应音视频,并添加到当前视频文件的轨道中。
    • 左下角会提示渲染何时完成,然后可点击预览按钮查看生成的数字人效果。
    • 增加背景图片:
      • 直接删除先前导入的文本内容,因为视频中的音频已包含文字内容。
      • 鼠标点击下方代表文字的轨道,或点击软件中间文字内容,按删除键删去文字。
      • 点击左上角的“媒体”菜单,并点击“导入”按钮,选择本地的一张图片上传。
      • 选择一张图片上传,点击图片右下角的加号,将图片添加到视频的轨道上(会覆盖数字人)。
      • 书架图片所在的轨道会在视频轨道的下面添加一条新轨道。
      • 点击轨道最右侧的竖线,向右拖拽,直到视频的最后,与视频对齐。
      • 背景图片所在的轨道若没选中,鼠标点击一下这个轨道即可。
      • 在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口,并将数字人拖动到合适的位置。
  3. 复杂提示词方法:
    • 如果觉得简单提示词生成效果不好,可以选择更为复杂一点的提示词,比如:https://cdn.discordapp.com/xxx.pngDisney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultra-detailultra-detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino--iw 1.5--s 500--v 5。
    • 不同照片生成:如果对照片风格不满意,可以换一张新的照片使用上面的提示词重新生成。
    • 其他调整:如果觉得Disney风格的头像太过卡通,可以把提示词里面的Disney都换成Pixar,皮克斯头像风格相对更加现代化和真实一点。如果是女孩,可以把提示词里面的boy换成girl。每次会生成4张图片,如果对某一张图片满意,点击下方的U1~U4生成大图,如果对风格满意但是需要调整,点击下方的V1~V4进行修改。
Content generated by AI large model, please carefully verify (powered by aily)

References

个性:给自己做一个卡通头像

1.简单提示词在聊天窗口输入/imainge找到/imagine prompt,然后把刚才的链接放进去,然后空格。加一些提示词,这些提示词以英文逗号分隔,最后再加上设置参数设置参数--iw 1.5是设置参考图片的权重,数值越高与参考的图片越接近,默认是0.5,最大是2,我们可以选择中间的某个值并调整,--s 500设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力。,可设置为0-1000间任意整数。如果你设置1000,那生成的图片不说与你的图片相差甚大,可以说是毫不相关。我们设置500--v 5是指用midjourney的第5代版本,这一代的最真实,目前v5需要订阅付费,不想付费可以使用--v 4--no glasses是指不戴眼镜,如果你不喜欢戴眼镜的图片,可以戴上这个设置,让它不戴眼镜。效果如下:完整的提示词如下(替换你的png图片地址):[https://cdn.discordapp.com/xxx.png](https://cdn.discordapp.com/xxx.png)simple avatar,Disney boy,3d rendering,--iw 1.5--s 500--v 5如果你对这些不满意,可以选择调整--s和--iw的值来进行多次尝试。

实战: 每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法!

3.1生成数字人在剪映右侧窗口顶部,我们打开“数字人”选项,选取一位免费的、适合的数字人形象,这里我选择“婉婉-青春”。当你选择一个数字人形象时,软件会马上播放出该数字人的声音。你可以判断是否是你需要的,点击右下角的“添加数字人”,就会将选择的数字人添加到当前视频中。剪映App将会根据之前提供的内容,来生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示你渲染何时完成。然后你可以点击预览按钮,查看生成的数字人效果。3.2增加背景图片接下来,可以直接删除先前导入的文本内容。这是因为视频中的音频中已经包含文字内容了。鼠标点击下方代表文字的轨道,或者点击软件中间文字内容,按删除键删去文字:为了让视频更美观,我们为视频增加背景图片。当然你可以增加多个背景图片,为简化演示,这里增加1张图片。点击左上角的“媒体”菜单,并点击“导入”按钮,来选择本地的一张图片上传:我选择一张书架图片上传,然后像添加文字内容一样,点击图片右下角的加号,将这个图片添加到视频的轨道上(会覆盖数字人):此时,书架图片就会在视频轨道的下面,添加一条新轨道:为了让图片在整个视频播放的时候都显示,可以点击这个轨道最右侧的竖线,向右拖拽,直到视频的最后,也就是和视频对齐:此时,背景图片所在的轨道是选中状态。如果没选中,鼠标点击一下这个规定即可。在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口。并将数字人拖动到合适的位置:

个性:给自己做一个卡通头像

1.复杂提示词如果你觉得这些提示词太过于简单,可以选择更为复杂一点的提示词,比如我下面这个:[https://cdn.discordapp.com/xxx.png](https://cdn.discordapp.com/xxx.png)Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultra-detailultra-detail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderino--iw 1.5--s 500--v 5效果如下:[heading3][heading3]不同照片生成[content]我又觉得照片风格不是很好,所以我换了一张新的照片使用上面的提示词重新生成:[heading3][heading3]其他调整[content]如果你觉得Disney风格的头像太过卡通,可以把提示词里面的Disney都换成Pixar,皮克斯头像风格相对更加现代化和真实一点。如果是女孩,可以把提示词里面的boy换成girl。每次会生成4张图片,如果你对某一张图片满意,点击下方的U1~U4生成大图,如果对风格满意但是需要调整,点击下方的V1~V4进行修改。

Others are asking
我想用自己训练的卡通形象lora生成一张元宵节放孔明灯的海报,应该怎么制作
以下是用自己训练的卡通形象 lora 生成元宵节放孔明灯海报的制作方法: 1. 关键词: 模型:dreamshaper_8 正关键词:,white,white_background,CGposterrender bsw <lora:电商新年海报 2024_v1.0:0.4>,gold,<lora:新年红包封面_v1.0:0.6>,new year,<lora:gcbottle:0.3> 中文的关键词:(杰作,高分辨率,高品质,高分辨率)中国建筑,红色主题,剪纸,中国结,纸灯笼,中国图案,金色,中国元素,红色背景 2. ControlNet 设置: 预处理器:depth_leres 模型:control_v11f1p_sd15_depth 权重:0.75 预处理器:softedge_pidinet 模型:control_v11p_sd15_softedge 权重:0.3 3. lora 资源: https://www.liblib.ai/modelinfo/bddf824e232f4124991c05a26027504d https://www.liblib.ai/modelinfo/983703dd48134e43983b84abfcb44308 第三个东方瓷器 lora 已经下架(请至 AGI 之路百度云下载) 链接:https://pan.baidu.com/s/10hYM8i2y2Li9OlT2oD1qOQ 密码:asub 您可以参考以上步骤进行制作,同时您还可以访问以下链接获取更多相关信息: 作者小红书:https://www.xiaohongshu.com/user/profile/5cfd0e600000000016029764?wechatWid=803c253b00ed4224d3a2adcd80b46ed7&wechatOrigin=menu 通往 AGI 之路小红书教程:http://xhslink.com/OOeHsy AI 春晚阶段性纪实:https://waytoagi.feishu.cn/wiki/MI0UwhfXJiRH9ak4dwxcwqPVnIh
2025-02-08
如何把拍照头像生成一个卡通头像logo
以下是将拍照头像生成卡通头像 logo 的方法: 1. 复杂提示词: 如果觉得简单提示词不够好,可以使用更复杂的提示词,例如:“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5”。 效果示例: 不同照片生成:如果对照片风格不满意,可以更换新照片并使用上述提示词重新生成。 其他调整:如果觉得 Disney 风格太过卡通,可以把提示词里的“Disney”换成“Pixar”;如果是女孩,可以把“boy”换成“girl”。每次会生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击 V1~V4 进行修改。 2. 操作步骤: 准备工作:如果还没有 Midjourney 账号或不懂基础操作,可以参考之前的教程,如“”。 上传图片:在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,在聊天框发送(记得点击回车或发送按钮)。然后图片会上传到服务器并生成唯一链接,点击图片,在浏览器中打开,复制浏览器上方的链接。 输入提示词:在聊天窗口输入“/imainge”找到“/imagine prompt”,把刚才的链接放进去,然后空格,加一些提示词(以英文逗号分隔),最后再加上设置参数。 设置参数: “iw 1.5”设置参考图片的权重,数值越高与参考图片越接近,默认是 0.5,最大是 2,可选择中间值调整。 “s 500”设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为 0 1000 间任意整数。 “v 5”指用 Midjourney 的第 5 代版本,这一代最真实,目前 v5 需要订阅付费,不想付费可以使用“v 4”。 “no glasses”指不戴眼镜,如果不喜欢戴眼镜的图片,可以加上这个设置。 完整的提示词示例(替换您的 png 图片地址):“simple avatar,Disney boy,3d rendering,iw 1.5s 500v 5”。如果对生成效果不满意,可以调整“s”和“iw”的值进行多次尝试。 您还可以参考“科技小飞哥”的通俗易懂的教程,原文链接:https://leftpocket.cn/post/ai/cartoon/
2025-02-06
请推荐一下你知道的人物头像转卡通图的平台,要求效果好,和原图相似度高,最好是免费的
以下为一些人物头像转卡通图效果好、与原图相似度高且可能免费的平台及相关操作技巧: 1. Stable Diffusion: 可以使用【X/Y/Z plot】脚本来做参数对比,将 X 轴设置为提示词相关性(取值范围 1 30,每次增加 5),Y 轴设置为重绘幅度(取值范围 0 1,每次增加 0.2)。 提示词相关性在 6 11 中间为最佳,重绘幅度 0.4 时和原图比较接近。 可使用绘图功能,如增加红色眼镜、去掉衣服图案等,局部重绘可只改变涂抹部分。 2. 复杂提示词: 如 Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5 。 可根据需求调整提示词,如将 Disney 换成 Pixar,boy 换成 girl 等。 3. 通用人物模版: 用真人照片+照片描述+方法 1 的关键词来处理。 需要注意的是,不同平台的效果可能因图片和操作而有所差异,您可以自行尝试。
2025-02-06
设计卡通头像
以下是使用 Midjourney 设计卡通头像的方法: 1. 简单提示词: 在聊天窗口输入/imainge 找到/imagine prompt,然后把刚才的链接放进去,然后空格。 加一些提示词,这些提示词以英文逗号分隔,最后再加上设置参数。 设置参数: iw 1.5 是设置参考图片的权重,数值越高与参考的图片越接近,默认是 0.5,最大是 2,可选择中间的某个值并调整。 s 500 设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为 0 1000 间任意整数。 v 5 是指用 Midjourney 的第 5 代版本,这一代的最真实,目前 v5 需要订阅付费,不想付费可以使用v 4。 no glasses 是指不戴眼镜,如果你不喜欢戴眼镜的图片,可以加上这个设置,让它不戴眼镜。 完整的提示词如下simple avatar,Disney boy,3d rendering,iw 1.5s 500v 5。如果对生成的结果不满意,可以调整s 和iw 的值进行多次尝试。 2. 复杂提示词: 如果觉得简单提示词不够好,可以选择更复杂的提示词,比如:Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5。 效果展示:不同照片生成,如果对照片风格不满意,可以换一张新的照片使用上面的提示词重新生成。 其他调整:如果觉得 Disney 风格的头像太过卡通,可以把提示词里面的 Disney 都换成 Pixar,皮克斯头像风格相对更加现代化和真实一点。如果是女孩,可以把提示词里面的 boy 换成 girl。 每次会生成 4 张图片,如果对某一张图片满意,点击下方的 U1 U4 生成大图,如果对风格满意但是需要调整,点击下方的 V1 V4 进行修改。 此外,做卡通头像的教程不少,科技小飞哥这一篇写得通俗易懂,手把手教会怎么做。原文链接:https://leftpocket.cn/post/ai/cartoon/ 。之前制作了一篇视频,教大家怎么从零开始使用 Midjourney 并通过简单的提示词来生成图片。今天教点高级的知识,利用 Midjourney 的以图绘图功能来生成属于您的迪斯尼卡通风格的头像。要生成一张 Disney 风格的头像,先选一张比较满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击+,然后点击上传文件,选取图片,然后在聊天框发送(记得这里一定要点击回车或发送按钮)。然后图片会上传到服务器并生成一张唯一的链接,点击图片,然后点击在浏览器中打开,然后可以看到浏览器上方有一个链接,这个链接就是这张图片的链接,复制下来。可以使用这个链接加 prompt 提示词来发送给 Midjourney,Midjourney 会根据需求来生成特定的图片,这就是 Midjourney 的以图绘图。如果还没有 Midjourney 账号,或者还不懂基础操作,可以看之前的教程:
2025-01-26
照片生成卡通头像
以下是关于照片生成卡通头像的相关内容: 通用人物模版: 如果想用真人照片生成卡通头像,可以使用“真人照片”+“照片描述”+“方法 1 的关键词”来处理。在操作过程中,如果生成了满意的图,一定要记得存起来,下次想要同种类型的可以直接拿来喂图,效果更好。 个性操作: 1. 复杂提示词:例如“Disney boy,Low saturation Pixar Super details,clay,anime waifu,looking at viewer,nighly detailedreflections transparent iridescent colors.lonctransparent iridescent RGB hair,art by Serafleurfrom artstation,white background,divine cinematic edgelighting,soft focus.bokeh,chiaroscuro 8K,bestquality.ultradetailultradetail.3d,c4d.blender,OCrenderer.cinematic lighting,ultra HD3D renderinoiw 1.5s 500v 5”。 2. 不同照片生成:如果对照片风格不满意,可以更换新照片使用上述提示词重新生成。 3. 其他调整:如果觉得 Disney 风格太过卡通,可以把提示词里的 Disney 换成 Pixar;如果是女孩,可以把提示词里的 boy 换成 girl。每次会生成 4 张图片,对某一张满意可点击下方的 U1~U4 生成大图,对风格满意但需调整可点击下方的 V1~V4 进行修改。 背景和基础操作: 之前制作过从零开始使用 Midjourney 并通过简单提示词生成图片的教程。今天教利用 Midjourney 的以图绘图功能生成迪斯尼卡通风格的头像。先选一张满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,在聊天框发送(记得点击回车或发送按钮)。图片会上传到服务器并生成唯一链接,点击图片,在浏览器中打开,复制浏览器上方的链接。使用这个链接加 prompt 提示词发送给 Midjourney,Midjourney 会根据需求生成特定图片,这就是 Midjourney 的以图绘图。如果还没有 Midjourney 账号或不懂基础操作,可以查看之前的教程,如“”。 做卡通头像的教程不少,科技小飞哥这一篇写得通俗易懂,手把手教会怎么做。原文链接:https://leftpocket.cn/post/ai/cartoon/
2025-01-04
我想做简洁卡通风格的ai动画,根据故事文案生成的那种,需要保持人物一致性,用哪个工具比较好?
以下是一些适合生成简洁卡通风格、根据故事文案生成动画并保持人物一致性的工具: 1. U 传:在 U 传中,通过点击相应按钮参考角色、风格或图生图,可保持人物一致性。新注册有免费生成额度。 2. 季梦:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。若为 1.2 版本,选慢速或适中的标准模式,效果更好,且生成的视频无水印。每天给 60 积分。 3. 可玲:可辅助写视频提示词,能根据上传的图片生成合理的运镜及提示词,还可写分镜脚本。每天给 60 积分,可用于日常使用,创作片子可能需买会员,生成的视频有无水印选项。 此外,在使用 Midjourney 生图时,若要保持人物和场景一致性,有两个取巧的方式:一个是像上个视频一样生成动物,动物会比较容易保持一致性;另一个方式是特定的名人或者有特殊属性的人物。在确定影片风格时,比如可以选择皮克斯动画风格。同时,在提示词中利用 cref 命令也有助于保持人物的一致性。
2024-12-18
怎么搭建自己的直播数字人平台
搭建自己的直播数字人平台可以参考以下步骤: 1. 了解相关技术和场景: 熟悉企业端 AI 实践经验,包括 AI 生成爆款内容、公域阵地场景(如视频号、抖音、小红书、公众号等平台的营销推广,涉及矩阵号工具、内容抓取分析、脚本创作、AI 剪辑、自动回复评论、无人直播工具等)、私域阵地场景(朋友圈、小红书、社群、个人 IP 的获客转化,销售企微 SCRM 工具、企业智能体进行 AI 内容抓取和自动回复)、服务自动化工具、快速搭建数据分析看板、跨境电商场景(如 tiktok 视频制作及投放、电商图片设计、精准营销、语言翻译、AI 独立站建设、社媒私域、批量混剪、海外达人直播、无人直播等)。 2. 构建数字人躯壳: 可以使用 web 前端页面(Live2D 提供了 web 端的 SDK)或者 Native 的可执行程序进行部署。 例如开源数字人项目选择 live2d 作为数字人躯壳,其驱动方式相比 AI 生成式更加可控和自然,相比虚幻引擎更加轻量和简单,卡通二次元形象接受度更高。可参考 Live2D 官方示例:https://github.com/Live2D 。 3. 延伸阅读相关资料: 参考政策如《互联网信息服务深度合成管理规定》(http://www.gov.cn/zhengce/zhengceku/202212/12/content_5731431.htm )、《北京市促进数字人产业创新发展行动计划》(https://www.ncsti.gov.cn/kjdt/scyq/zcwj_47/202209/P020220906666181884578.pdf )等。 了解应用如《一键拥有自己的 AI 虚拟人合成平台》(https://mp.weixin.qq.com/s/EhukdKOlHYJGwHBldGi4Q )、《使用 AI 工具生成虚拟数字人(视频)》(https://www.bilibili.com/video/BV1Tb411D7fo/?spm_id_from=333.337.searchcard.all.click&vd_source=2c5fdcdac5fea78671c3a8ebd9a134d3 )等。
2025-03-11
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。 增加字幕,点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 至此,数字人视频完成,点击右上角“导出”按钮,导出视频以作备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-03-11
数字人直播
以下是关于数字人直播的相关信息: 会议讨论: 目前数字人在电商直播上有所探索,做电商直播可能只是因为前期宣传及未发现其他更好场景。 数字人在电商领域不能成为壁垒,配套的运营服务才是关键,续费客户多因服务而非数字人本身。 电商直播分达播和店播,数字人直播在店播中的效果较好,数据能与真人相当。 不建议商家依赖数字人,现阶段数字人服务多为辅助。 盈利方式: 直接卖数字人工具软件,实时驱动的一年 4 6 万往上,非实时的一个月 600 元,市场价格混乱。 提供数字人运营服务,按直播间成交额抽佣。 适用品类和场景: 适用于不需要强展示的商品,如品牌食品饮料;不适用于服装,过品快且建模成本高。 适用于虚拟商品,如门票、优惠券等。 不适用于促销场景,涉及主播话术、套路及调动氛围能力等。 店播场景下数字人直播效果较好。 壁垒和未来市场格局: 长期看技术上无壁垒,目前有技术门槛,如更真实对口型、更低响应延迟等。 不会一家独大,可能 4 5 家一线效果,大多二三线效果公司。 把客户服务好、能规模化扩张的公司更有价值,疯狂扩代理割韭菜的公司售后问题多。 有资源、有业务的大平台下场可能带来降维打击。 数字人简介: 数字人是运用数字技术创造出来的,虽现阶段不能高度智能,但在生活场景中已常见,且随 AI 技术发展迎来应用爆发。业界尚无准确定义,一般可分真人驱动和算法驱动两类。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,应用于影视和直播带货,表现质量与建模和动捕设备相关,视觉算法进步使无昂贵设备也能有不错效果。
2025-03-11
我想制作AI数字人,如何去寻找相关资料和教程
以下是寻找制作 AI 数字人相关资料和教程的途径: 1. 在线文档和公众号:可以查看。 2. B 站:在 B 站搜索相关视频教程。 3. 具体操作方法: 在剪映中,右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频。剪映会根据提供的内容生成对应音视频并添加到轨道中,左下角会提示渲染完成时间,可点击预览查看效果。 为让视频更美观,可增加背景图片。删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”按钮选择本地图片上传,将图片添加到视频轨道上,可通过拖拽轨道右侧竖线使其与视频对齐。 此外,还有一些开源的算法代码仓库可供参考: 1. ASR 语音识别: openai 的 whisper:https://github.com/openai/whisper wenet:https://github.com/wenete2e/wenet speech_recognition:https://github.com/Uberi/speech_recognition 2. AI Agent: 大模型包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分可使用 LangChain 的模块去做自定义,包含了 Agent 实现的几个组件 3. TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多分支版本。 sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注到唱歌方面。 除了算法,人物建模模型可以通过手动建模实现,但这种简单的构建方式还存在一些问题,如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应动作、数字人如何使用知识库做出某个领域的专业性回答等。
2025-03-11
视频号数字人
以下是关于视频号数字人的相关内容: 制作方法: 1. 准备内容:先准备一段视频中播放的文字内容,如产品介绍、课程讲解、游戏攻略等,也可利用 AI 生成。 2. 创建视频内容:使用剪映 App 进行简单处理。电脑端打开剪映 App,点击“开始创作”,选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号添加文字内容轨道,将准备好的文字内容替换默认文本内容,为数字人提供语音播放内容及生成相应口型。 3. 生成数字人:在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。增加字幕,点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。完成后点击右上角的“导出”按钮,导出视频以作备用。若希望数字人换成自己希望的面孔,需用另一个工具来进行换脸。 类型和应用场景: 1. 二维/三维虚拟人:用于游戏、IP 品牌(柳夜熙)、内容创作()等。 2. 真人形象数字人:用于直播卖货,营销/投流广告视频录制(Heygen)、语言学习(CallAnnie)等。 价值: 1. 代替人说话,提升表达效率和营销效率,如真人无法 24 小时直播,数字人可以。 2. 创造真实世界无法完成的对话或交流,例如 AI talk 的实验探索,复活故去的亲人等。 面临的问题: 1. 平台限制:目前数字人水平参差不齐,平台担心直播观感,有一定打压限制。如抖音出台一些标准,微信视频号容忍度更低,人工检查封号。 2. 技术限制:形象只是皮囊,智能水平和未来想象空间依赖大模型技术提升。 3. 需求限制:直播带货是落地场景,但不刚需。“懂得都懂”的刚需场景,国内搞不了,目前更多是体验新鲜感。 4. 伦理/法律限制:声音、影像版权等,比如换脸、数字永生等。
2025-03-11
最新的数字人
以下是关于最新数字人的相关信息: 数字人课程: 卡尔的 AI 沃茨推出的数字人课程,共 15 节视频课,持续更新并不定时增加最新内容,附赠课外社群辅导,解决数字人相关问题。 课程建立了一套完整的数字人学习体系,放在《克隆你自己》中,带领大家全方位掌握数字人各技能。 详细回顾了 2023 年数字人领域的破圈事件,如 AI 马斯克对谈 AI 乔布斯超 331.9k 播放、霉霉说中文火遍全网等。 数字人的出现能极大程度优化工作流,在制作个人 IP 短视频、配音、直播、智能客服、虚拟偶像等领域均可赋能。 报名方式:扫码查看课程详细内容和介绍。 数字人的学习路径: 结合“一人公司”的愿景,需要大量智能体(数字员工)替我们打工。未来的 AI 数字员工以大语言模型为大脑,串联所有已有工具和新造的 AI 工具。创造者的学习依照这个方向,用大模型和 Agent 模式把工具串起来,着重关注在创造能落地 AI 的 agent 应用。 数字人的定义: 数字人是运用数字技术创造出来的人,虽现阶段不能像科幻作品中的人型机器人一样具备高度智能,但已在各类生活场景中触手可及,且随着 AI 技术发展迎来应用爆发。目前业界没有准确定义,一般根据技术栈不同分为两类:真人驱动的数字人和算法驱动的数字人。真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,表现质量与手动建模精细程度及动捕设备精密程度直接相关,随着视觉算法进步,在无昂贵动捕设备时也可通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。
2025-03-10
哪些软件可以将2D形象转换为3D
以下是一些可以将 2D 形象转换为 3D 的软件: 1. Kaedim:专注于从图像到 3D 的转换。 2. Mirage:专注于从文本到 3D 的转换。 3. Hypothetic:对从文本到 3D 的搜索以及从图像到 3D 的转换都感兴趣。 4. Nvidia 的 Get3D:专注于从图像到 3D 的转换。 5. Autodesk 的 ClipForge:专注于从文本到 3D 的转换。 6. Tripo AI:能够利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型。 7. Meshy:不仅支持文本生成 3D,还支持图片生成 3D 以及 AI 材质生成。 8. CSM AI:支持从视频和图像创建 3D 模型。 9. Sudo AI:支持通过文本和图像生成 3D 模型,特别适用于游戏领域的模型生成。 10. VoxCraft:能够将图像或文本快速转换成 3D 模型,并提供了图像到 3D、文本到 3D 和文本到纹理等多种功能。
2025-03-06
如何让文生图片保持形象一致
要让文生图片保持形象一致,可以参考以下方法: 1. 首先进入文生图,填写提示词,例如“,一头白发的女孩坐在绿植和鲜花的田野里,温暖的灯光,模糊的前景”,设置常规参数生成一张图。 2. 若想以该人物为主角生成一系列其他图,将图片拖入到 ControlNet 中,预处理器选择 reference only,控制模型选择“均衡”,先将保真度数值设置为 1。 3. 在没有明确指向性提示词的情况下,人物形象能保持一致,但表情、动作、服装可能产生随机变化。 4. 可以通过添加关键词来给人物换装、更改服装和表情、更改动作和表情、更改姿态、环境和表情等,比如添加“红裙子”“黑色校服、哭泣”“抱手、生气”“在花丛中奔跑、开心”“红色棒球帽,时尚卫衣,在商场逛街”。 5. 像制作典籍类作品时,可对主要人物先出一版形象照,后续所有画面用“cref”做人物一致性的操作。 通过以上一系列操作和测试,可以发现这些功能在绘制系列插画、漫画、小说插图等工作时,能保持主角形象的统一,也能根据情况做实时的调整,若后期再配合 lora,潜力非常大。
2025-03-02
如何控制图生图的形象和动作呢
要控制图生图的形象和动作,可以参考以下方法: 1. 使用 ControlNet 插件: 姿态约束类预处理器:包含了所有人物信息的预处理器,可将图片发送到图生图,通过“缩放后留白”和提高重绘幅度改变背景,再次发送到图生图使用 ControlNet 中 tile 模型细化,最后使用 SD 放大插件。 自定义动作骨架:在【扩展】【加载扩展列表】中搜索【posex】安装插件,或将插件文件夹拷贝至指定目录,确保软件是最新版本并重启。重启后点击“将图片发送至 ControlNet”,可通过拖动鼠标左键旋转视角、中键缩放视角、右键拖动视角,玩坏了可点击重置镜头和动作。 2. 参考风格 reference:首先进入文生图,填写提示词生成一张图。然后将图片拖入到 ControlNet 中,预处理器选择 reference only,控制模型选择“均衡”,保真度数值越高对图片的参考越强。可以通过添加关键词的方式来改变人物的服装、表情、动作等。 3. 利用 ControlNet 控制姿势:大模型和关键词正常填写生成想要的小姐姐照片,接着鼠标滑到最下面点击“ControlNet”,上传指定姿势的照片并点击“启用”,在“预处理器”和“模型”里选择“openpose”,点击“预览预处理结果”,最后点击生成照片。
2025-02-28
Ai 换脸形象照怎么换
以下是关于 AI 换脸形象照的相关信息: 法律风险: AI 换脸技术存在民事侵权风险。《民法典》规定,未经肖像权人同意,使用他人肖像的行为侵犯肖像权。 在刑事犯罪方面,使用他人肖像进行 AI 换脸旨在侮辱、诽谤、恶意丑化他人,并在网络上肆意传播,可能涉嫌侮辱、诽谤罪。此外,还存在利用该技术进行诈骗罪和制作、复制、出版、贩卖、传播淫秽物品牟利罪或传播淫秽物品罪等违法犯罪活动的情况。 制作方法: 可以通过某些工具生成数字人,在显示区域调整背景图和数字人的位置,增加字幕,完成后导出备用。若要换脸,需使用其他工具。 例如星流一站式 AI 设计工具,选中图像进入扩展功能界面,自动提取面部信息,上传想要替换的图片,选择重绘风格等参数即可。
2025-02-27
Ai 换脸形象照
以下是关于 AI 换脸的相关信息: 应用场景:包括 ai 写真换脸、工作流、自媒体、设计、电商、修复老照片等。在节目单中,也有 AI 换脸在视频与影视方面的应用,如春晚开头、AI 这一年等节目。 法律风险:民事方面,未经肖像权人同意使用其肖像可能侵犯肖像权。刑事方面,使用他人肖像进行 AI 换脸旨在侮辱、诽谤、恶意丑化他人并在网络上肆意传播,可能涉嫌侮辱、诽谤罪,此外还存在利用该技术进行诈骗罪和制作、复制、出版、贩卖、传播淫秽物品牟利罪或传播淫秽物品罪等违法犯罪活动的风险。
2025-02-27
图生图, 如何保持幻想生物形象一致性
要在图生图中保持幻想生物形象的一致性,可以参考以下方法: 1. 对于 Midjourney ,可以采用特定的名人或有特殊属性的人物形象,先确定好影片风格,比如皮克斯动画风格,然后确定好人物形象,如角色的发型、穿着等细节。 2. 利用 Midjourney 的新功能 Cref ,先跑一张主角的定妆照,在需要出现主角人物的地方扔进去 Cref ,以保持发型、人脸、衣服等的一致性。但需要注意的是,Midjourney 对亚洲人脸的 Cref 一致性,尤其是亚洲老人的一致性效果相对较差,且 Cref 在画面的审美和构图上有一定的破坏性,所以原则上能不用就不用,比如只有背影时,简单描述即可。 3. 生成动物形象,动物相对更容易保持一致性。
2025-02-14