Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

视频换脸有什么工具推荐?

Answer

以下为您推荐一些视频换脸工具:

  1. Tec-Creative:
    • 操作指引:上传原始视频——上传换脸图片——点击生成。
  2. Viggle(有免费额度):
    • 网址:http://viggle.ai
    • discord 免费体验:https://discord.com/invite/viggle
    • 功能:
      • /mix:将角色图像混合到动态视频中。操作步骤:上传一张字符清晰的图片,上传一段清晰运动的视频。
      • /animate:使用文本运动提示为静态角色设置动画。操作步骤:上传一张字符清晰的图片,描述您想让角色做的动作(也可以从 https://viggle.ai/prompt 中复制动作提示词)。
      • /ideate:纯粹从文本创建角色视频。操作步骤:描述您想要创造的角色,描述您希望角色执行的动作(或从 https://viggle.ai/prompt 中复制动作提示词)。
      • /character:通过文本提示创建角色并将其动画化。操作步骤:描述您想要创造的角色,从四个结果中选择一个图像,描述您希望角色执行的动作(或从 https://viggle.ai/prompt 中复制动作提示词)。
      • /stylize:使用文本提示符重新设计角色的样式并将其动画化。操作步骤:上传一张字符清晰的图片,描述您想改变角色的任何地方来重新塑造它,从四个结果中选择一个图像,描述您想要角色做的动作(或者从 https://viggle.ai/prompt 中复制动作提示词)。
    • 官方提供了多种动作提示词可供参考,提示词地址:https://viggle.ai/prompt
  3. 插件 ADetailer:
    • 首先要明白插件原理是识别面部对面部进行扩散,里面可以增加 controlnet 去控制。
    • 操作步骤:
      • 打开 Adetailer,选择模型是关于脸部修复的,选择最常用的模型,在对应的正向提示词中添加一些面部的修饰词,也可以加 lora。
      • 在检测一栏基本上维持默认不变,效果不好适当拉高阈值。
      • 在蒙版处理维持默认不变。
      • 在重绘选项卡中,关注以下参数:
        • 重绘使用的模型、重绘使用的 VAE 以及重绘制使用的采样方式。
        • 局部重绘制强度,推荐 0.5 左右,可自行尝试。
        • Controlnet,和外面用的一样也是增加控制的,选择最适合的,若用 tile 模型要适当调整权重或者调整引导于结束的步数。
Content generated by AI large model, please carefully verify (powered by aily)

References

【Tec-Creative】帮助手册

[heading1]创意工具箱[heading2]数字人口播配音[content]只需输入口播文案,选择期望生成的数字人形象及目标语言,即可生成数字人口播视频,让视频制作变得轻松高效!操作指引输入口播文案——选择目标语言——选择数字人角色——选择输出类型——点击开始生成[heading2]图片换脸[content]仅需上传原始图片和换脸图片,即可一键实现素材换脸,极大提高素材生成效率!操作指引上传原始图片——上传换脸图片——点击开始生成*图片大小上限5M,支持JPG、PNG格式[heading2]视频换脸[content]自动识别视频中的人脸,并将其替换为选择的脸部,实现在视频中快速、精确地替换人物的脸部!操作指引上传原始视频——上传换脸图片——点击生成[heading2]音频合成数字人[content]只需上传音频文件,即可基于音频合成对应的数字人视频,工具支持使用100+数字人模板,一键解决无素材冷启问题!操作指引:上传音频文件——选择数字人角色——选择输出类型——点击开始生成*注意:音频文件支持MP3和WAV格式,文件大小上限5M[heading2]AI配音[content]多语种(包含菲律宾语、印地语、马来语等小语种)智能配音,同时支持区分男声和女声,高效解决素材出海语言障碍问题!操作指引:输入需配音文案——选择音色——点击立即生成注意:输入的配音文案需和选择音色语种保持一致[heading2]AI字幕[content]智能识别视频语言并生成对应字幕,满足海外多国投放场景需求。操作指引:点击上传视频——开始生成——字幕解析完成——下载SRT字幕注意:支持MP4文件类型,大小上限为50M。

小歪:AI视频工具合集

http://viggle.aidiscord免费体验:https://discord.com/invite/viggle图片+动作视频转视频、图片+文字动作描述转视频、文字转视频,可完成视频换脸功能:/mix:将角色图像混合到动态视频中1.上传一张字符清晰的图片2.上传一段清晰运动的视频/animate:使用文本运动提示为静态角色设置动画1.上传一张字符清晰的图片2.描述你想让你的角色做的动作(你也可以从https://viggle.ai/prompt中复制动作提示词)/ideate:纯粹从文本创建角色视频1.描述你想要创造的角色2.描述您希望角色执行的动作(或从https://viggle.ai/prompt中复制动作提示词)/character:通过文本提示创建角色并将其动画化1.描述你想要创造的角色2.从四个结果中选择一个图像3.描述您希望角色执行的动作(或从https://viggle.ai/prompt中复制动作提示词)/stylize:使用文本提示符重新设计角色的样式并将其动画化如何:1.上传一张字符清晰的图片2.描述你想改变角色的任何地方来重新塑造它3.从四个结果中选择一个图像4.描述你想要角色做的动作(或者从https://viggle.ai/prompt中复制动作提示词)官方提供了多种动作提示词可供参考,点击对应动作下方的复制按钮即可复制提示词到生成视频的时候使用提示词地址:https://viggle.ai/prompt

小田:视频转绘制作视频过程中不可或缺的一环

这个插件相信大家都用过,一般我们都觉得她是一个修复脸的插件,其实这个插件换脸也是很好用的。首先我们要明白这个插件的原理是什么,很简单就是识别面部对面部进行扩散这么说大家就明白了吧,它里面也是可以增加controlnet去控制的所以说这就是为什么导致重绘后的脸和原视频还是有点相似的原因。话不多说直接上教程打开我们的Adetailer,这里我们选择模型是关于脸部修复的。选择最常用的模型,在对应的正向提示词中添加一些面部的修饰词,当然这里也可以加lora的。找一个好看的脸部lora加进去。这里随便找了一个具体你想要其他的lora你可以在lib上面搜索对应的脸部模型在检测这一栏基本上维持默认不变就行了如果你觉得效果不好适当的拉高一下阈值。在蒙版处理维持默认不变就可以了。再到下面的重绘选项卡中我们可以做的操作就很多了这里就是对脸部重绘制参数的调整和应用,说一下我们需要关注的参数。1.重绘使用的模型和重绘使用的VAE以及重绘制使用的采样方式。大模型决定你想要让脸重绘成什么风格的。2次元还是2.5D,还是写实类似于换脸。2.再来说一下局部重绘制强度,因为我们在最外面的cn对图像进行了控制所以这里就是拉的越大对面部的修改就会越多。我推荐0.5左右就可以了,当然这个你可以自己进行尝试。3.这里再说一下这里面这个controlnet,其实和我们外面用的是一样的也是增加控制的。选择你觉得最适合的,如果你用的tile模型要适当调整权重或者调整引导于结束的步数下面是一组对照图发现了么?就针对脸部进行了重绘制和改变而且整体五官的位置和原图保持一致。不同大模型带来的效果也不一致。

Others are asking
SD如何人物换脸
以下是关于 SD 人物换脸的详细步骤: 1. 安装 Roop 插件:安装时间较长,需耐心等待。安装好后打开 SD 文件目录下的特定文件夹,在地址栏输入“cmd”并回车,在打开的 dos 界面粘贴“python m pip install insightface==0.7.3 user”自动安装 insightface。若此阶段出错,建议下载最新的秋叶 4.2 整合包(6 月 23 号更新),在云盘后台回复【SD】可下载。 2. 后续操作:安装完成后重新打开启动器,后台会继续下载模型,全程要保证科学上网。Roop 插件主要适用于真实人脸替换,对二次元人物作用不大。选用真实系模型“realisticVisionV20”,关键词描述人物。启用 Roop 插件,选择要替换的人物照片,面部修复选“GFPGAN”,右边参数数值越低人物越像但图像模糊,数值越高人物越不像但图像清晰,可根据需求设置,如 0.5。设置好后点击生成,若人脸像素偏低模糊,可将图发送到“图生图”,开较小重绘幅度,使用 controlnet 中的 tile 模型重绘。 3. 多人物脸部替换:先正常生成图片,如两个古风人物形象。发送到图生图中调整重绘幅度。在 roop 插件中,从左往右编号,载入相应人物照片形象进行脸部替换。 4. 获取插件:想要 Roop 插件,可添加公众号【白马与少年】,回复【SD】。 另外,还有关于 SD 中更精确蒙版的操作,如使用 GroundingDINO 模型分割:启用 GroundingDINO 时 AI 会自动下载模型,也可在云盘下载放到特定文件目录。在检测提示词中输入如“eye”,可自动检测出相应部分并设置蒙版,还能通过预览箱体得到编号选择调整单一部分。选择要修改的蒙版上传到重绘蒙版,添加提示词生成。给人物换背景时,加载生成的背景蒙版,选择大模型和正向提示词,蒙版模式选“重绘非蒙版内容”,生成后可再次放入图生图中细化,还可在 PS 中修复。 特别提醒,使用相关插件需谨慎,切勿触犯法律。
2024-12-31
案例:借助人工智能技术的诈骗 一、案例材料 1.背景资料 (1)近期全国范围内出现了一种新型电信诈骗——AI换脸诈骗,该诈骗利用AI人工智能,通过“换脸”和“拟声”技术模仿受害人的朋友或亲戚的声音和外貌,以此骗取受害者的信任,进行网络诈骗,近日包头警方就根据一起典型案例,向大家发出了防范AI换脸诈骗的警示。 财联社5月22日讯,据平安包头微信公众号消息,包头警方发布了一起利用人工智能(AI)实施电信诈骗的典型案例,一家福州市科技公司的法人代表郭先生竟在短短10分钟内被骗走了430万元人民币。
以下是关于 AI 的相关内容: 律师如何写好提示词用好 AI: 对于不具备理工科背景的文科生,可将 AI 视为黑箱,只需知道其能模仿人类思维理解和输出自然语言。AI 就像似人而非人的存在,与传统道教的驱神役鬼拘灵遣将有相似之处。提示词应是相对完善的“谈话方案”,成果在与 AI 的对话中产生,要接受其存在的“不稳定性”,并在对话中限缩自己思维的模糊地带。 AI 的应用场景: 医疗保健:包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:有产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:包含预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(未具体阐述)
2024-12-25
视频换脸软件有哪些
以下是一些常见的视频换脸软件: 1. :在线换脸,可使用上传的图片。 2. :在线视频操纵软件。 3. :在照片上交换面孔,效果出众。 4. :在自拍上叠加名人的脸。 5. :实时换脸的视频通话。 6. :在线媒体中的换脸。 7. :在线图片换脸。 8. :改进的实时换脸视频通话。 9. :视频和图片的换脸解决方案。 此外,还有以下两款: 1. Viggle(有免费额度): 网址:http://viggle.ai discord 免费体验:https://discord.com/invite/viggle 功能包括图片+动作视频转视频、图片+文字动作描述转视频、文字转视频,可完成视频换脸。 具体操作: /mix:将角色图像混合到动态视频中,上传一张字符清晰的图片和一段清晰运动的视频。 /animate:使用文本运动提示为静态角色设置动画,上传一张字符清晰的图片并描述想让角色做的动作(也可从 https://viggle.ai/prompt 中复制动作提示词)。 /ideate:纯粹从文本创建角色视频,描述想要创造的角色和希望角色执行的动作(或从 https://viggle.ai/prompt 中复制动作提示词)。 /character:通过文本提示创建角色并将其动画化,描述想要创造的角色,从四个结果中选择一个图像,描述希望角色执行的动作(或从 https://viggle.ai/prompt 中复制动作提示词)。 /stylize:使用文本提示符重新设计角色的样式并将其动画化,上传一张字符清晰的图片,描述想改变角色的任何地方来重新塑造它,从四个结果中选择一个图像,描述想要角色做的动作(或者从 https://viggle.ai/prompt 中复制动作提示词)。 官方提供了多种动作提示词可供参考,点击对应动作下方的复制按钮即可复制提示词到生成视频的时候使用,提示词地址:https://viggle.ai/prompt 2. Swapface(有免费额度): 网址:https://swapface.org//home 图片换脸、视频换脸,直播实时换脸,需要下载电脑客户端使用,没有在线版,可以通过邀请好友、点评软件获取积分。视频换脸是可以上传视频或者 gif 图,换脸可以识别图片、视频里的多张脸进行替换。 视频换脸操作流程:效果预览,左边原视频,右边换脸后效果。 示例视频:
2024-12-17
视频换脸
以下是关于视频换脸的相关信息: 视频换脸可以自动识别视频中的人脸,并将其替换为选择的脸部,实现在视频中快速、精确地替换人物的脸部。 操作指引: 1. 上传原始视频。 2. 上传换脸图片。 3. 点击生成。 相关工具及链接: 1. 【TecCreative】: 图片大小上限 5M,支持 JPG、PNG 格式。 2. Swapface(有免费额度): https://swapface.org//home 需要下载电脑客户端使用,没有在线版,可以通过邀请好友、点评软件获取积分。 视频换脸是可以上传视频或者 gif 图,换脸可以识别图片、视频里的多张脸进行替换。 效果预览:左边原视频,右边换脸后效果。 在“AI 摊主速成脑暴会”中,视频换脸属于视频处理类别,积分 60 分。
2024-12-17
换脸AI有免费的吗
以下是一些关于免费换脸 AI 的信息: 有方法可以在大约 10 分钟左右制作 AI 换脸、AI 数字人视频。制作数字人视频免费,数字人换脸约 0.8 元。 Swapface 有免费额度,可通过邀请好友、点评软件获取积分。它支持图片换脸、视频换脸、直播实时换脸,需要下载电脑客户端使用,没有在线版。网址:https://swapface.org//home 。 开源、免费的换脸解决方案 facefusion ,开源地址:https://github.com/facefusion/facefusion 。但该软件需要 python 环境,以及要安装视频解码器等多个依赖的软件,本地安装需要一定编程知识。且本地计算机若无 GPU 或 GPU 显存较小,执行速度会非常缓慢。云服务解决方案如利用阿里云的 PAI 和 AutoDL 则需要产生一定费用。
2024-12-14
给视频里的人换脸用什么AI
以下是一些可以用于给视频里的人换脸的 AI 方法: 1. 使用 facefusion 工具: 点击快捷工具中顶部的“JupyterLab”,打开这个工具。 点击顶部的“+”号选项卡,新打开一个终端窗口。 在终端区域,启动一个终端的选项卡。 在打开的终端窗口中,输入以下 3 条命令: 查看文件列表。输入“ls”并按回车,显示当前位置所在目录下的文件列表。 进入 facefusion 目录,输入“cd facefusion”并按回车,进入程序目录。 启动 facefusion。输入“python./run.py executionproviders cuda cpu”启动程序(注意:后面的参数“executionproviders cuda cpu”非常重要,如果不加“cuda”,则默认不使用 GPU 能力,推理将非常慢)。 当出现提示信息时,说明启动成功。 打开 facefusion 软件,需要返回实例列表,点击自定义服务按钮,会打开一个新的浏览器窗口。 在 facefusion 软件界面上,上传准备好的图片、视频后,在右侧可以看到预览效果。点击下方的开始按钮,执行换脸处理。执行完成后,在输出的位置,会出现处理后的视频,输出窗口的右上角有一个下载按钮,点击它可以导出变量后的视频到本地。 2. 诗云马良平台:早在 21 年,诗云马良平台就推出了给视频中模特换脸、切换语言的能力,方便电商营销商家进行产品的本地化推广。 3. HenGen AI:近期 HenGen AI 也公布了 AI 切换视频内语言的能力,并且能够将 Avatar 口型与视频相匹配。
2024-12-14
Aigc国漫风格视频
以下是为您整理的相关内容: 关于 AIGC 国漫风格视频: 设计方面包括女执事、智能体、守护者等元素,有 3 种形态,平常翅膀呈隐藏状态,是人类的保护者和服务者。比如智小美,身材比 1:2,风格与智小鹿一脉相承但更智能,美貌与智慧并存,是智小鹿的妹妹。其设计灵感综合了导演、猫叔墨镜、影视元素等,猫叔在社区更新的万字编剧日记对创作 AIGC 有很大帮助。 关于 AIGC 小红书博主: 列举了多位小红书博主,如徐若木、笑笑(约稿)、吉吉如意令、发射井、惟玮、Sllanvivi、巧琢、上官文卿|ZHEN、AI 离谱社、布谷咕咕咕、果果(禾夭夭)、壹见空间川上扶蘇、Goooodlan🍅古德兰等,涵盖了商业插画师、约稿、头像、国风人物、创意设计、视频、动画设计教程、壁纸、景观设计等不同领域。 关于 AIGC Weekly88: 封面提示词为“abstract network out of glass made of holographic liquid crystal,dark background,blue light reflections,symmetrical composition,centered in the frame,highly detailed,hyperrealistic,cinematic lighting,in the style of Octane Rendear 16:9style rawpersonalizev 6.1”,可查看更多风格和提示词的链接为:https://catjourney.life/ 。这周训练了一个 FLUX Lora 模型,为褪色胶片风格,推荐权重 0.6 0.8,适合生成毛茸茸的动物玩偶,人像会偏向复古褪色的胶片风格,在玻璃制品产品展示摄影方面表现很好,整体景深模糊自然柔和,下载链接为:https://www.liblib.art/modelinfo/4510bb8cd80142168dc42103d7c20f82?from=personal_page
2025-01-08
AI图片视频提示词怎么编辑
以下是关于 AI 图片视频提示词编辑的相关知识: 1. 提示词的定义:用于描绘您想生成的画面,星流通用大模型与基础模型 F.1、基础模型 XL 使用自然语言(如一个长头发的金发女孩),基础模型 1.5 使用单个词组(如女孩、金发、长头发),支持中英文输入。 2. 写好提示词的方法: 预设词组:小白用户可以点击提示词上方官方预设词组进行生图。 内容准确:包含人物主体、风格、场景特点、环境光照、画面构图、画质等,例如:一个女孩抱着小猫,背景是一面红墙,插画风格、孤独感,高质量。 调整负面提示词:点击提示框下方的齿轮按钮,弹出负面提示词框,负面提示词可以帮助 AI 理解不想生成的内容,如不好的质量、低像素、模糊、水印。 利用“加权重”功能:可在功能框增加提示词,并进行加权重调节,权重数值越大,越优先。还可对已有的提示词权重进行编辑。 辅助功能:包括翻译功能(一键将提示词翻译成英文)、删除所有提示词(清空提示词框)、会员加速(加速图像生图速度,提升效率)。 3. 提示词语法: 权重设置:,请注意,权重值最好不要超过 1.5。 Prompt Editing:通过 Prompt Editing 使得 AI 在不同的步数生成不一样的内容,比如在某阶段后,绘制的主体由男人变成女人。语法为:例如 alandscape 在一开始,读入的提示词为:the model will be drawing a fantasy landscape.在第 16 步之后,提示词将被替换为:a cyberpunk landscape,它将继续在之前的图像上计算。还可以轮转提示词,比如在第一步时,提示词为“cow in a field”;在第二步时,提示词为“horse in a field.”;在第三步时,提示词为“cow in a field”,以此类推。 4. 示例: “城市狂想”教程中提供了一些示例,如远景,三分法构图,俯视视角,数字绘画,云雾缭绕的山谷,群山连绵起伏,山谷间云雾缭绕,阳光透过云层洒在山间,形成光与影的对比,模拟观众的视线逐渐接近这片土地,新印象派风格特征,使用数字画笔和渐变工具ar 16:9v 6.1 等。同时,还为大家生成了 1 组共 12 段提示词,在使用时需注意,如果是其他平台的工具请复制后删除包含“”以后的部分。
2025-01-08
怎么用AI做视频
用 AI 把小说做成视频的一般流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问以下工具网址获取最新信息和使用指南: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 在 Adobe Firefly 的 Advanced 部分,您可以使用 Seed 选项添加种子编号(https://helpx.adobe.com/firefly/generatevideo/generatevideoclips/generatevideofaq.htmlwhatisaseed),以帮助启动流程并控制 AI 创建的内容的随机性。如果使用相同的种子、提示和控制设置,则可以重新生成类似的视频剪辑。然后选择 Generate(生成)。
2025-01-07
文生视频
以下是关于文生视频的相关信息: 文字生成视频的 AI 产品: Pika:出色的文本生成视频 AI 工具,擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频,由 Stability AI 开源。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频功能,收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多文生视频的网站可查看:https://www.waytoagi.com/category/38 。内容由 AI 大模型生成,请仔细甄别。 Sora 的前世今生:官方展示 Sora 的应用包括文生视频、图生视频、视频反推、视频编辑、视频融合等。其模型推理策略中,文生视频时喂入 DiT 的是文本 embedding+全噪声 patch;视频编辑类似 SDEdit 的做法,在视频上加噪声(不全是噪声)然后逐步去噪;图生视频、视频反推、视频融合时喂入 DiT 的是文本 embedding(可选)+特定帧用给定图片的 embedding+其他帧用全噪声 patch。 PixVerse 提示词技巧:文生视频是 AI 生成视频中最直接的方式,通过输入提示词让 PixVerse 生成视频。这种方式需要对提示词有深入了解,能准确描述画面内容,提示词的基本规则可参考:。为方便创作,提供了灵感分镜、风格选择等功能帮助更快掌握文生视频。
2025-01-07
我需要找一个帮我生成数字人口播视频的AI工具
以下为您推荐一些可以生成数字人口播视频的 AI 工具: 1. 【TecCreative】 只需输入口播文案,选择期望生成的数字人形象及目标语言,即可生成数字人口播视频。操作指引:输入口播文案——选择目标语言——选择数字人角色——选择输出类型——点击开始生成。 支持多场景数字人口播配音,操作指引:输入口播文案——选择数字人角色和场景——选择输出类型——点击开始生成。 支持音频驱动多场景数字人,操作指引:上传音频链接——选择数字人角色和场景——选择输出类型——点击开始生成。 2. XiaoHu.AI 推荐的开源且适合小白用户的数字人工具 特点:一键安装包,无需配置环境,简单易用。 功能:生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。 系统兼容:支持 Windows、Linux、macOS。 模型支持:MuseTalk(文本到语音)、CosyVoice(语音克隆)。 使用步骤:下载 8G+3G 语音模型包,启动模型即可。 GitHub: 官网:
2025-01-07
多模态大模型与图像、视频生成
多模态大模型与图像、视频生成相关知识如下: 多模态大模型的架构和原理:基于大圆模型,能识别页面组件结构和位置绝对值信息,并与组件、文本映射。由解码器、backbone、Generator 等部件组成,左侧多模态理解,右侧生成输出。 Stable Diffusion 模型原理:是生成模型,通过加噪和去噪实现图像的正向扩散和反向还原,解决潜在空间模型中的速度问题。其应用场景包括带货商品图生成、模特服装展示、海报生成、装修设计等。 吉梦 AI 和吐司平台的使用体验:吉梦 AI 提供 AI 视频生成等能力,通过简单提示词生成图像,对数字体有专项场景训练;吐司是类似的在线生成平台,具备多种 AI 能力,有模型、在线训练、上传模型工作流等功能,可通过输入提示词生成图片。 模型训练:训练模型需要大量图像数据和标签化处理。 AI 视频生成原理:主要基于 Sara 的整体架构,采用 diffusion Transformer 架构,以扩散模型通过随机造点、加噪和去噪得到连续图像帧,输入视频可看成若干帧图片,经处理后生成视频。 模态生成器 MG_X 一般用于生成不同的模态来输出。当前的工作一般使用现成的扩大模型(Latent diffusion model),例如 Stable Diffusion 用于图像生成,Zeroscope 用于视频生成,AudioLDM2 用于音频生成。 多模态模型的技术架构:如果模型既支持 3D 生成,又支持视频生成,就可以实现图文编辑以及具有强一致性的视频生成。Open AI 可能会尝试把图片、视频、3D 变为一个自然空间。Transformer 架构的多模态模型给机器提供了像人类一样与世界互动的新机会,杨立昆(Yann LeCun)提出的世界模型可能是近一年值得关注的研究点。
2025-01-07
生成海报的AI工具有哪些
以下是一些生成海报的 AI 工具: 1. Canva(可画):https://www.canva.cn/ 这是一个非常受欢迎的在线设计工具,提供大量模板和设计元素,用户通过简单拖放操作创建海报,其 AI 功能可帮助选择合适颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ 这是一个简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,其智能建议功能可帮助快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,简化设计流程。 如果您想使用 AI 快速做一张满意的海报,可以参考以下方法: 1. 需求场景:当您想在社交平台发布内容时,为了获得更多点赞,避免使用网上模糊、常见的图片,或者为了给特定的人定制节日祝福等,都可以考虑自己制作海报。 2. 大致流程: 主题与文案:确定海报主题后,可借助 ChatGPT 等文本类 AI 工具协助完成文案。 风格与布局:选择想要完成的风格意向,背景不一定是空白的,可根据文案和风格灵活调整画面布局。 生成与筛选:使用无界 AI,输入关键词,生成并挑选一张满意的海报底图。 配文与排版:将上述素材进行合理排版,得到成品。排版同样可以参考 AIGC 海报成果。 使用无界 AI 制作海报时的相关指引: 网址:https://www.wujieai.cc/ 其做图逻辑类似于 SD,优势在于国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。 模型:皮克斯卡通。本案例应用场景为朋友圈 po 图,因此画幅比例选择 1:1。 关键词类别:场景(如向日葵花田、面包店等)、氛围(如温馨、温暖等)、人物(如父亲和女儿、父亲和儿子)、造型(如发型、发色、服饰、配饰)、情绪(如笑得很开心、大笑、对视等)、道具(如童话书等)、构图(如半身、中景等)、画面(如色彩明艳)等。
2025-01-08
有声小说封面海报ai工具有哪些
以下是一些可以用于有声小说封面海报设计的 AI 工具: 1. Canva(可画):https://www.canva.cn/ 这是一个非常受欢迎的在线设计工具,提供大量模板和设计元素,用户通过简单拖放操作即可创建海报,其 AI 功能可帮助选择合适颜色搭配和字体样式。 2. 稿定设计:https://www.gaoding.com/ 稿定智能设计工具采用先进人工智能技术,自动分析和生成设计方案,稍作调整即可完成完美设计。 3. VistaCreate:https://create.vista.com/ 这是一个简单易用的设计平台,提供大量设计模板和元素,用户可使用 AI 工具创建个性化海报,其智能建议功能能帮助用户快速找到合适设计元素。 4. Microsoft Designer:https://designer.microsoft.com/ 通过简单拖放界面,用户可快速创建演示文稿、社交媒体帖子等视觉内容,还集成丰富模板库和自动图像编辑功能,如智能布局和文字优化,大大简化设计流程。 此外,若想用 AI 快速做一张满意的海报,可参考以下方法: 1. 需求场景:当想发朋友圈、微博等,干巴巴的文字不易获赞;百度图片质量差且易撞图;相册照片可能不理想。 2. 大致流程: 主题与文案:确定海报主题后,可借助 ChatGPT 等文本类 AI 工具协助完成文案。 风格与布局:选择想要的风格意向,背景可根据文案和风格灵活调整画面布局。 生成与筛选:使用无界 AI,输入关键词,生成并挑选满意的海报底图。 配文与排版:将上述素材进行合理排版,得到成品。排版同样可参考 AIGC 海报成果。 3. 软件指引: 使用工具:无界 AI,网址:https://www.wujieai.cc/ 其做图逻辑类似于 SD,优势在于国内网络即可稳定使用、有免费出图点数、支持中文关键词输入、无需额外下载风格模型,可直接取用。 使用模型:皮克斯卡通,本案例应用场景为朋友圈 po 图,画幅比例选择 1:1。 关键词类别:场景(如向日葵花田、面包店等)、氛围(如温馨、温暖等)、人物(如父亲和女儿、父亲和儿子)、造型(如发型、发色、服饰、配饰)、情绪(如笑得很开心、大笑、对视等)、道具(如童话书等)、构图(如半身、中景等)、画面(如色彩明艳)等。
2025-01-07
哪个AI工具可以对音频内容进行总结
以下是一些可以对音频内容进行总结的 AI 工具: 1. 飞书妙记(https://www.feishu.cn/product/minutes):飞书的办公套件之一。 2. 通义听悟(https://tingwu.aliyun.com/home):阿里推出的 AI 会议转录工具。 3. 讯飞听见(https://www.iflyrec.com/):讯飞旗下智慧办公服务平台。 4. Otter AI(https://otter.ai/):转录采访和会议纪要。 5. BibiGPT·AI 音视频内容一键总结(https://b.jimmylv.cn/) 6. 15 个值得一试的 YouTube 视频摘要 AI 工具(https://nealschaffer.com/youtubevideosummarizerai/) 7. summarize.tech:AIpowered video summaries(https://www.summarize.tech/) 8. NotebookLM:最早主打的是智能笔记,上传文件之后会自动生成概览性的总结。用户可以在对话框里,根据上传文本的内容,直接用文字提问。支持长文本,语言目前只支持英文。
2025-01-07
现在最好的 Ai 跳舞工具是哪一个,或者教程?
目前,在 AI 跳舞领域,以下是一些相关的工具和教程资源: B 站:Ever AI 酱,这里会有教程及 AI 工具界面操作。 DisPose:这是由清华大学与北京大学等组织联合发布的一种可控的人体图像动画方法。输入动作视频参考和人物图像,可以形成新的角色舞蹈视频。其地址为:https://lihxxx.github.io/DisPose/ 。 小红书/抖音:EverAI 。 您可以根据自己的需求选择适合的工具和教程进行学习和使用。
2025-01-07
最好用的小红书写作智能工具
以下是为您整理的一些小红书写作相关的智能工具: 1. Recraft AI:这是一款 AI 平面设计工具,用户可以用其生成和编辑插画、海报、产品周边等。它提供多种样式的可选风格,对所有用户每日都有免费的试用点数,并允许对生成的图像进行商业使用。本次更新了 60 多种图像风格。地址:https://www.recraft.ai/ 2. AI 公文智能体“学习强国公文助手”:在文小言 APP 正式上线,可以帮助用户进行文汇检索、AI 公文书写、AI 公文润色等。其具有权威的“学习强国”数据库背书,具备文汇检索能力,能快速溯源文字材料,重点用横线标注,还能一键看原文,内容覆盖文汇、重要活动、重要会议、指示批示等。使用方式:下载文小言 APP,找寻学习强国公文助手。 3. Kimi+:具有以下功能: 提示词专家:零门槛成为提示词大师,更好地向 Kimi 提问。 学术搜索:可解决学术问题。 翻译通:一键中英互译,直译意译皆可。 Offer 收割机:能改简历、练面试、接 offer。 PPT 助手:让您的 PPT 既有 Power,又有 Point。 小红书爆款生成器:一键生成爆款文案,助力自媒体。 公文笔杆子:公文材料写作必备,提升效率。 论文改写降重:文章降重并去“AI”味。 论文写作助手:像教授一样写论文。 爆款网文生成器:可创作爆款网文。 此外,为您整理了一些小红书优质科技内容案例: :视频,点赞 1.8w,优点是工具使用说明清晰不拖沓。 :视频,点赞 6000,视频制作专业,文稿结构清晰简洁。 :图文,点赞 2.7w,优点众多。
2025-01-07
学习AI工具
以下是关于学习 AI 工具的相关内容: 用 AI 学习一门外语: 1. 语言学习应用: Duolingo:使用 AI 个性化学习体验,根据进度和错误调整练习内容,通过游戏化方式提供词汇、语法、听力和口语练习。下载应用,选择语言,按课程指引学习。 Babbel:结合 AI 技术提供个性化课程和练习,重点在于实际交流所需语言技能。注册账户,选择课程,按学习计划学习。 Rosetta Stone:使用动态沉浸法,通过 AI 分析学习进度,提供适合练习和反馈。注册并选择语言,使用多种练习模式学习。 2. AI 对话助手: ChatGPT:可模拟对话练习,提高语言交流能力。在聊天界面选择目标语言,与 AI 对话,询问语法、词汇等问题,模拟交流场景。 Google Assistant:支持多种语言,用于日常对话练习和词汇学习。设置目标语言,通过语音或文本输入互动,练习日常用语。 中学生学习 AI: 1. 从编程语言入手学习:如 Python、JavaScript 等,学习编程语法、数据结构、算法等基础知识。 2. 尝试使用 AI 工具和平台:如 ChatGPT、Midjourney 等,探索面向中学生的教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识:了解基本概念、发展历程、主要技术(机器学习、深度学习等)及在各领域的应用案例。 4. 参与 AI 相关的实践项目:参加学校或社区组织的编程竞赛、创意设计大赛等,尝试解决实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态:关注权威媒体和学者,思考对未来社会的影响,培养思考和判断能力。 基于 LLM 的 AI Agent: 1. 行动模块(Action):AI Agent 有效使用工具需全面了解其应用场景和调用方法,利用 LLM 的 zeroshot learning 和 fewshot learning 能力获取工具知识。面对复杂任务,应分解子任务并有效组织协调,这依赖 LLM 的推理和规划能力及对工具的理解。 2. 使用工具:学习方法包括从 demonstration 中学习和从 reward 中学习,环境反馈包括结果反馈和中间反馈,人类反馈包括显性评价和隐性行为。 3. 具身智能:具身 Agent 强调智能系统与物理世界紧密结合,与传统深度学习模型不同,LLMbased Agent 能主动感知和理解物理环境并互动,其行为称为“具身行动”。
2025-01-07
是否有推荐的RAG 框架
以下为您推荐常用的 RAG 框架: LangChain 是一个为简化大模型应用开发而设计的开源框架。它通过提供一套模块化的工具和库,允许开发者轻松集成和操作多种大模型,使开发者能将更多精力投入到创造应用的核心价值上。其设计注重简化开发流程,支持广泛的模型,具有良好的可扩展性,以适应不断变化的业务需求。作为一个得到社区广泛支持的开源项目,LangChain 拥有活跃的贡献者和持续的更新,同时提供了全面的文档和示例代码帮助新用户快速掌握。此外,LangChain 在设计时充分考虑了应用的安全性和用户数据的隐私保护,是一个多语言支持的灵活框架,适用于各种规模的项目和不同背景的开发者。 LangChain 官方手册:https://python.langchain.com/docs/get_started/introduction/
2025-01-08
推荐一些适合零基础的小学生、初中生学习的实用的Ai课程
以下是为零基础的小学生、初中生推荐的实用 AI 课程: 1. 首先,建议阅读「」部分,熟悉 AI 的术语和基础概念,了解人工智能及其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。同时浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 在「」中,有一系列为初学者设计的课程,特别推荐李宏毅老师的课程。还可以通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 野菩萨的 AIGC 资深课也是不错的选择,这门课程由工信部下属单位【人民邮电出版社】开设,是市面上为数不多的值得推荐的 AI 课程之一,也是全网技术更新最快的课程。课程内容涵盖 AI 绘画、视听语言和 ChatGPT 等多个体系的知识。预习周课程包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。基础操作课涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影 穿越的大门等内容。核心范式课程涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。SD WebUi 体系课程包括 SD 基础部署、SD 文生图、图生图、局部重绘等。ChatGPT 体系课程有 ChatGPT 基础、核心 文风、格式、思维模型等内容。ComfyUI 与 AI 动画课程包含部署和基本概念、基础工作流搭建、动画工作流搭建等。应对 SORA 的视听语言课程涉及通识 欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。 4. 如果想要免费获得这门课程,可以来参与 video battle,这是唯一一个获胜者就可以拥有课程的机会。每期的 video battle 的评委野菩萨老师都非常严格,需要寓意深度审美并存。冠军奖励:4980 课程一份;亚军奖励:3980 课程一份;季军奖励:1980 课程一份;入围奖励:598 野神殿门票一张。 在学习过程中,您可以根据自己的兴趣选择特定的模块深入学习,一定要掌握提示词的技巧,它上手容易且很有用。理论学习之后,实践是巩固知识的关键,尝试使用各种产品做出您的作品。同时,与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解它们的工作原理和交互方式。
2025-01-08
我想要设计一个以班级期末总结为主题的40分钟班会课,请你帮我推荐一下有哪些AI软件可以完成这项任务
目前没有专门针对设计班级期末总结主题班会课的特定 AI 软件。但您可以借助一些通用的工具来辅助您完成,例如: 1. 文字处理工具,如 Microsoft Word 或 WPS,帮助您撰写班会课的流程和内容。 2. 思维导图工具,如 XMind 或百度脑图,用于梳理班会课的框架和要点。 3. 演示文稿工具,如 Microsoft PowerPoint 或 Keynote,制作展示用的 PPT 来辅助讲解。 希望这些建议对您有所帮助。
2025-01-07
我想在dify里按照一个reranker模型,推荐哪个
在 Dify 中安装 reranker 模型,推荐使用中转服务商。Dify 的部署版本中,模型需自行配置,官方和中转的都支持,但中转服务商从性价比角度更优,充点小钱就能用上各种模型,价格通常有较大折扣,20 刀普通用户能用很久,还能在不同地方使用。若没有合适的中转服务商,可使用我自用的,点击原文即可。模型设置方面,在 Dify 右上角点击设置模型供应商,填入中转服务商提供的信息(一般包括 API base 或 Base URL 以及 key)并保存。若保存成功,回到主页面创建一个 Agent 测试,正常则大功告成。比如我填的 API base 是‘https://one.glbai.com’。
2025-01-07
儿童英文学习推荐
以下是为 4 岁儿童练习英语口语推荐的一些 AI 工具: 1. LingoDeer:这是一款通过游戏和互动活动教孩子英语的应用程序。它提供了从字母、数字到更高级语法和词汇的各种课程,还有家长仪表板,方便跟踪孩子进度和设置学习目标。 2. Busuu:另一个流行的语言学习应用,提供英语及其他多种语言课程。使用多种教学方法,包括音频课程、视频课程和互动练习,还有社区功能让孩子与世界各地的孩子练习口语。 3. Memrise:使用抽认卡和游戏教孩子英语,涵盖从基本词汇到更高级会话技巧的课程,具有社交功能可与朋友和家人一起学习。 4. Rosetta Stone:采用沉浸式方法教孩子英语,让孩子在自然环境中学习,还有语音识别功能帮助练习发音。 5. Duolingo:免费的语言学习应用,提供多种语言课程,通过游戏化方法使学习有趣。 在为 4 岁儿童选择 AI 英语口语学习工具时,需要考虑以下因素: 1. 年龄是否合适:确保应用程序适合孩子的年龄,有些针对年幼孩子,有些针对年长孩子。 2. 是否有趣且引人入胜:孩子更可能坚持使用有趣的应用,应选择有游戏、互动活动等能吸引孩子的应用。 3. 是否有效:有些应用教英语更有效,选择前阅读评论并研究。 4. 是否负担得起:有些应用免费,有些需要付费订阅,要考虑预算。 此外,Genie 模型也对低年级小学生学习有帮助: 1. 学习语言:可以用英语对话,帮助练习发音和听力,纠正错误。 2. 了解文化:能解答不同文化和国家的特色,如展示金字塔图片并讲解历史。 3. 玩游戏:创建各种游戏环境,进行赛车、解谜、探险等有趣活动。 总之,尝试不同的 AI 工具,找到最适合孩子的。随着孩子成长和发展,可能需要切换应用。
2025-01-07
视频面部替换 有什么工具推荐?
以下是为您推荐的视频面部替换工具: 1. 三思教程:https://www.xiaohongshu.com/explore/666e8bfc00000000060044aa 2. 白马少年文生图教程:https://www.xiaohongshu.com/explore/6669d3c9000000000e0300fb 3. 阿米的 VB 工作流拆解:https://www.xiaohongshu.com/explore/66699475000000000e0325cf 4. 红泥小火炉的 VB 工作流拆解:https://www.xiaohongshu.com/explore/66699e13000000000d00d236 5. 岳超楠:AI 教程丨教您如何用 comfyUI 修复脸部:https://www.xiaohongshu.com/explore/666be3ed0000000006004d88 6. guahunyo 老师的工作流: 7. Dreamina 图片生成功能:https://dreamina.jianying.com/aitool/image/generate ,上传深度图,选择适应画布比例并填写描述
2025-01-07