直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

我想让图片的嘴巴动起来

回答

以下是让图片嘴巴动起来的相关方法和教程:

  1. 工具教程“清影”中,有关于图生视频的示例,如赛博女孩的案例中让人物的嘴部微动、眼睛微动,眼镜上的光有闪烁效果。
  2. 实战教程“使用 Sadtalker 让照片说话”:
    • 图片预处理方式中,crop 只截取图片的头部,full 就是保留整张照片,下面的勾选项有文字解释,可自行尝试。
    • 点击 generate,由于涉及到视频的推理和转换,输出时间较长,需做好等待准备。
    • 最终生成的视频长度与音频一致,若想制作长视频,建议剪成小段分别推理后再合并。完成后可打开输出目录或下载视频文件。
    • 利用主流开源程序让照片说话唱歌,达到基本唇形同步,相关链接:https://github.com/OpenTalker/SadTalker ,可独立使用或作为插件放入 stablediffusion 。
    • 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 。
    • 对于编程、python、conda 不熟悉的,可使用整合包:用夸克网盘分享的「EZ-AI-Starter-v0.9.8.zip」,链接:https://pan.quark.cn/s/1d5ca9f57f5c ,视频地址:https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.search-card.all.click&vd_source=35e62d366d8173e12669705f7aedd122 。具体步骤为:点我启动,在启动界面中选择音频、图像口型同步的下载图标,下载完毕后启动应用,会弹出独立窗口(非默认浏览器),选择 sadtalker 同步器,分别导入图片和声音。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

工具教程:清影

||视频(配音版)|视频(纯享版)|首帧图|PROMPT|<br>|-|-|-|-|-|<br>|23、女孩骑车|| ||骑自行车的女孩,风吹动头发,飘落的树叶|<br>|24、赛博女孩|| ||让人物的嘴部微动_眼睛微动,眼镜上的光有闪烁效果|<br>|25、小狗|| ||让这个狗过来,跑向镜头|<br>|26、小丑鱼|| ||小丑鱼围绕着珊瑚游荡,水里面的气泡向上浮动,水下摇晃的镜头|<br>|27、熊|| ||熊缓慢向前走,远处瀑布倾泻而下|<br>|28、长颈鹿|| ||一只长颈鹿正在咀嚼树叶|<br>|29、火|| ||正在燃烧的火堆|

实战教程:使用Sadtalker让照片说话

图片预处理方式中,crop只截取图片的头部,full就是保留整张照片,下面的勾选项已经有文字解释,自己可以试几次点击generate由于涉及到视频的推理和转换,输出时间要远远大于ai绘图和sovits的声音推理,做好等待的准备。下图中,我导入了一个13秒的音频,预计需要3-5分钟(3060 12g显卡)最终生成的视频长度与音频一致,如果想制作一个长视频,最好是剪成小段,分别推理,然后合并。完成后,可以打开输出目录或者下载视频文件。看看效果带面部修复的效果:

实战教程:使用Sadtalker让照片说话

利用目前主流的开源程序让照片说话唱歌,达到基本的唇形同步https://github.com/OpenTalker/SadTalker可以独立使用或者作为插件放入stablediffusion视频教程https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122但是对于编程、python、conda不熟的,强烈建议使用这个整合包:史上最炸裂版AI工具箱来啦,SD-AI绘画、VITS文本转语音,wav2lip、sadTalker唇型同步,视频修复,支持A卡!我用夸克网盘分享了「EZ-AI-Starter-v0.9.8.zip」,点击链接即可保存链接:https://pan.quark.cn/s/1d5ca9f57f5c视频地址:https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.search-card.all.click&vd_source=35e62d366d8173e12669705f7aedd122具体步骤如下:点我启动,在启动界面中,选择音频、图像口型同步的下载图标:下载完毕后如下:启动应用,等待会弹出一个独立的窗口(而不是你的默认浏览器)选择sadtalker同步器,分别导入图片和声音,

其他人在问
图片 视频处理 应用推荐
以下是为您推荐的一些图片和视频处理应用: Runway:具有文生视频、Prompt+图像生成视频、无 Prompt 直接图片转视频等功能。支持 motion 控制和运镜调节,还提供 30 多项图片、视频处理能力,如 Inpainting 视频修复、Motion Tracking 视频主体跟随运动、Remove Any Background 删除视频元素/背景、3D Texture 生成 3D 纹理等。近期控制台上线了 Watch 模块,可查看官方精选的创意案例。 AiLogoArt:将您的 Logo 融入 AI 生成的图象中,能在几分钟内获得专业品牌图片。 PlainScribe:可将大文件转录为完美的文本,上传文件处理完成后可搜索文本或下载 CSV 文件,适用于各种大文件,有灵活的按需付费模式。 RIX:面向开发者的人工智能搜索引擎,可使用 Web 搜索模式查找最新信息或切换到 GPTknowledge 模式获得预先训练的知识即时答案,还能通过流行网站快捷方式简化搜索。 Magic Clips:能让人工智能挑选出录制的最佳时刻,并转化为适合媒体的短视频片段,可添加字幕。 以下是一些从事相关工作的人员: yangzec:学习多模态 AI 的使用和开发应用 凯叔 AI:插画设计 清墨.SALEX:日常工作 above:批量作图 ehhe:绘画,视频,人像,电商背景图 kone:AI 商业应用 xman:自媒体创作 Alan:绘画和视频处理 在野:视频创作 tang:照片处理等 阿鲁:生产 大大大松树:视频工作流 BigPeng:好玩 冻奶味:工作+娱乐休闲 Lily:视频和电商,写真 tim:能用在生产中 木兰:广告推广素材制作 吴:电商 马化腾:Ai 绘画 蔡徐坤:Ai 视频,Ai 绘画,Ai 音乐 吴林林:爱好,家人做写真 初尘:文生视频,做自媒体 ning:工作流
2024-11-16
图片去除水印
以下是一些 AI 去水印的工具和方法: 1. AVAide Watermark Remover:这是一个在线工具,使用 AI 技术从图片中去除水印。它支持多种图片格式,如 JPG、JPEG、PNG、GIF 等。操作简单,只需上传图片,选择水印区域,然后保存并下载处理后的图片即可。这个工具还提供了其他功能,如去除文本、对象、人物、日期和贴纸等。 2. Vmake:同样提供 AI 去除图片水印的功能。用户可以上传最多 10 张图片,AI 会自动检测并移除图片上的水印。处理完成后,用户可以选择保存生成的文件。适合需要快速去除水印的用户,尤其是那些需要在社交媒体上分享图片的用户。 3. AI 改图神器:提供 AI 智能图片修复去水印的功能,可以一键去除图片中的多余物体、人物或水印,不留任何痕迹。支持直接粘贴图像或上传手机图像,操作简单方便。 此外,如果想去掉图片中特定的物体,如右手的手串,除了 PS,还可以选择以下工具: Adobe Firefly 的 AI 版,SD 局部重绘。 Firefly、Canva、Google Photo 都有局部重绘功能。 微软 Designer 也免费。 还可以使用工具 https://clipdrop.co/cleanup 进行图片去水印。 这些工具各有特点,可以根据您的具体需求选择最适合您的去水印工具。内容由 AI 大模型生成,请仔细甄别。
2024-11-15
我想要让ai生成svg图片,如何保证其生成质量
要保证 AI 生成 SVG 图片的质量,您可以参考以下方法: 在使用 AI 生成图片时,可能会遇到即使输入相同关键词,生成的图片仍有很强随机性的情况。为了让生成的图片更加可控,可以利用 seed 参数进行反向生成。 首先,从官方文档中了解 seed 参数的作用:Midjourney 会用一个种子号来绘图,把这个种子作为生成初始图像的起点。种子号为每张图随机生成,但可以使用 Seed 或 same eseed 参数指定。使用相同的种子号和提示符将产生类似的结尾图片。详细参数可查看官方文档: 默认情况下,种子是随机给定的。若想要获得比较相似的图,需要将 seed 固定下来。简单来说,使用时在关键词后添加 seed 参数即可,具体数字在 0–4294967295 范围内均可。例如:caiyunyiueji is a cute sports anime girl,style by Miyazaki Hayao,emoji,expression sheet,8k seed 8888 这样就能保证每次生成的都是相同的图。此外,还可以反向利用这个特性对已经确定的效果图进行微调。比如当发现有一张图已比较接近目标,还需要一些微调时,可以利用确定图片的 seed,在此基础上添加新的关键词来实现。
2024-11-15
生成logo图片的AI工具
以下是一些生成 logo 图片的 AI 工具: 1. Looka:是一个在线 Logo 设计平台,使用 AI 理解用户的品牌信息和设计偏好,生成多个设计方案供选择和定制。 2. Tailor Brands:AI 驱动的品牌创建工具,通过用户回答问题生成 Logo 选项。 3. Designhill:其 Logo 制作器使用 AI 技术创建个性化设计,用户可选择元素和风格。 4. LogoMakr:提供简单易用的设计工具,用户可拖放设计,利用 AI 建议的元素和颜色方案。 5. Canva:广受欢迎的在线设计工具,提供 Logo 设计模板和元素,有 AI 辅助设计建议。 6. LogoAI by Tailor Brands:Tailor Brands 推出的 AI Logo 设计工具,根据用户输入快速生成方案。 7. 标小智:中文 AI Logo 设计工具,利用人工智能技术帮助创建个性化 Logo。 另外,即梦 AI 也有相关功能。制作步骤如下: 1. 在即梦左侧点击「智能画布」,「上传图片」上传一张 logo 图,点击「图生图」输入描述词,参考程度为 55 ,选择「轮廓边缘」,点击立即生成。 2. 右侧图层可看到 4 张图,选择喜欢的图;若不喜欢,可用局部重绘、消除笔等功能调整或重新生成。 还有第六期的活动“一起做个 LOGO 吧”,活动时间为 2024 年 6 月 9 日至 2024 年 6 月 16 日。参与方式为使用 SD 等 AI 工具出图,作品直接发送至 SD 学社微信群。更多 SD 教程可参考: ,并开启本地 sd 客户端。
2024-11-15
能将图片转成线稿的软件
以下是一些能够将图片转成线稿的软件及相关方法: 1. SDXL Prompt Styler:可以把图片转化成近百种风格。在转绘成折纸风时,最好不要加入线稿边缘(canny)的 ControlNet 控制,或者需要把 canny 的控制强度(strength)调到比较小。原始图像是手绘风格时,手绘线条和折纸风格本身互斥。若想转成漫画风格并较好保留人物外轮廓,加入 canny 控制能更好还原人物原本造型。有时内置预设提示词组合不一定能达到想要效果,需自行添加更多相关关键词。此工作流结合 Vid2Vid Style Transfer with IPA & Hotshot XL 工作流,可实现视频不同风格的稳定转绘。 2. Midjourney + Stable Diffusion:在上色时,正关键词主要前面添加增加照片质感常用的+mj 生成线稿的关键词调整等,负关键词根据效果添加。在 ControlNet 设置中,上传自己的草图到 ControlNet 并启用,预处理器需生效。 3. IPA 工作流:基于黑白线条的图案及背景风格重绘,首先创建节点加载图片,其次读取所需风格的参考图,通过 cn 的深度学习模型(SDxl 版本)进行处理,对要生成的图片填写提示词,如正向提示词:illustration,bushes,calm,executable,high quality ,然后生成。 具体五种不同的处理器对比,可以参考我的飞书文档:
2024-11-15
在生成刺绣图片上表现优秀的AI工具
以下是在生成刺绣图片方面可能表现优秀的 AI 工具,以及一些相关的图生图 AI 工具供您参考: 图生图 AI 工具: Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 Retrato:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果超级好。 不过目前尚未有专门针对生成刺绣图片的特定 AI 工具。这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出,但仍有一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。
2024-11-15
AI是什么时候发展起来的
AI(人工智能)的发展最早可以追溯到上世纪。1943 年,心理学家麦卡洛克和数学家皮特斯提出了机器的神经元模型,为后续的神经网络奠定了基础。1945 年,Alan Turing 就考虑用计算机来模拟人脑,设计了 ACE 来模拟大脑工作。1950 年,图灵最早提出了图灵测试,作为判别机器是否具备智能的标准。1956 年,在美国达特茅斯学院,马文·明斯基和约翰·麦凯西等人共同发起召开了著名的达特茅斯会议,“人工智能”一词被正式提出,并作为一门学科被确立下来。此后近 70 年,AI 的发展起起落落。1994 年,一组 52 名心理学家签署了有关智能科学的广泛定义的社论。2000 年代初,“通用人工智能”(AGI)一词流行起来。2022 年 11 月 30 日,OpenAI 发布基于 GPT 3.5 的 ChatGPT,引发了全球的 AI 浪潮。
2024-11-04
命令AI润色论文的一个段落,让这一段看起来是科研论文,应该如何下指令
以下是为您提供的命令 AI 润色论文段落的指令示例: “请将以下段落按照科研论文的风格进行润色,使其语言更加准确、严谨、规范:。注意保持原意,优化句子结构,使用恰当的学术词汇和语法。” 您可以将上述示例中的替换为您想要润色的段落。
2024-10-27
我想翻译一些日漫,我该如何提问才可以让得到的翻译结果更接近正常人说话,而不是简单的直译。并且得到的结果必须与原文所表达的内容不出现差错,翻译结果读起来流畅自然
很抱歉,知识库中的内容没有直接针对您如何翻译日漫以获得更自然流畅且准确结果的相关指导。但一般来说,要实现这样的翻译效果,您可以从以下几个方面考虑: 1. 深入理解日漫的文化背景、角色性格和情节发展,以便更好地把握原文的“意”。 2. 注重上下文的连贯和逻辑,不仅仅是逐句翻译,而是从整体上把握语义。 3. 避免过于拘泥于原文的句式和词汇,灵活运用目标语言的表达方式。 4. 多参考优秀的日漫翻译作品,学习他人的翻译技巧和风格。 5. 对于一些特定的文化元素或术语,要进行适当的解释或转换,以确保目标读者能够理解。
2024-10-27
我计划编写一本关于生成式人工智能的书籍,但是在开始前,我需要确定一个合适的大纲框架来组织我的思路。这个框架应该包括那些部分,以及如何将各个部分连接起来,以便读者能够理解掌握AIGC的概念和应用
以下是为您编写关于生成式人工智能书籍提供的大纲框架建议: 一、引言 介绍编写本书的目的和背景,引导读者进入生成式人工智能的世界。 二、基础概念 1. 什么是生成式人工智能(AIGC) 定义和特点 与传统人工智能的区别 2. 相关技术名词 AI(人工智能) 机器学习(包括监督学习、无监督学习、强化学习) 深度学习(神经网络、神经元) 生成式 AI(可生成文本、图片、音频、视频等内容形式) LLM(大语言模型) 三、AIGC 的应用领域 1. 文字生成(如使用大型语言模型生成文章、故事、对话等) 2. 图像生成(如使用 Stable Diffusion、DALLE 等模型生成艺术作品、照片等) 3. 视频生成(如使用 Runway、KLING 等模型生成动画、短视频等) 四、AIGC 与其他内容生成方式的关系 1. AIGC 与 UGC(用户生成内容) 区别与联系 各自的优势和适用场景 2. AIGC 与 PGC(专业生成内容) 区别与联系 相互的影响和融合 五、技术原理 1. Transformer 模型 自注意力机制 处理序列数据的优势 2. 技术里程碑(如谷歌团队发表的《Attention is All You Need》论文) 六、实际案例分析 展示不同领域中成功的 AIGC 应用案例,分析其实现过程和效果。 七、挑战与展望 1. 面临的挑战(如数据隐私、伦理问题等) 2. 未来发展趋势和前景 八、结论 总结全书重点内容,对 AIGC 的未来发展进行展望。 各个部分之间可以通过逻辑递进、案例引用、对比分析等方式进行连接,使读者能够逐步深入理解掌握 AIGC 的概念和应用。
2024-10-23
推荐让图片中的人物动起来的软件
以下为能让图片中的人物动起来的软件及相关方法: 1. 方法一:利用 MJ 画图先画出想要的底图,然后使用 InsightFaceSwap 插件处理脸部,因该插件对多人脸部同时处理效果不佳,需先对图片进行分割裁剪,分别处理后再缝合,最后利用可灵或其他软件让图片动起来。 2. 方法二:在网上寻找能直接融合两张照片的软件或项目,直接对图片进行融合,若没有则进行纯 P 图处理,然后利用图生视频的项目完成。 此外,还有一些关于图片处理的相关知识: 在 Stable Diffusion 中,通过添加关键词、调整重绘幅度等操作可以实现局部重绘和背景修改。例如,利用 PS 制作精确蒙版,在重绘时选择重绘非蒙版区域,调整提示词等。 利用醒图或美图秀秀等 App 可以调整脸部,如在醒图中关注人像>面部重塑>面部>比例,调整上庭、中庭、下庭。 对于 MJ 画图,若直出的皮肤缺乏质感,可使用醒图的人像>手动美颜>皮肤肌理功能。若想快速调整光源,可试试 Luminar。
2024-10-09
将图片活动起来的AI
以下是一些关于将图片活动起来的 AI 相关内容: 出门问问公司提供了照片数字人的工作流及语音合成(TTS)API。仅需上传一张照片,输入一段文字或上传一段音频,就可以生成短视频让“照片开口说话”,适用于多种风格,如皮克斯风格、真人照片等,还提供了免费 API 额度及操作指南供体验。 利用 GPT 识图功能对照片的内容进行细致描述,例如对一个小男孩和一个年轻人站在一起的场景进行详细的文字表述。 可以使用 Pika、Pixverse、Runway、SVD 四大 AI 视频工具制作视频,包括剧情片、科幻片、战争片、奇幻片等类型,每种工具都能为相应的场景生成效果。
2024-10-09