Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

我想让图片的嘴巴动起来

Answer

以下是让图片嘴巴动起来的相关方法和教程:

  1. 工具教程“清影”中,有关于图生视频的示例,如赛博女孩的案例中让人物的嘴部微动、眼睛微动,眼镜上的光有闪烁效果。
  2. 实战教程“使用 Sadtalker 让照片说话”:
    • 图片预处理方式中,crop 只截取图片的头部,full 就是保留整张照片,下面的勾选项有文字解释,可自行尝试。
    • 点击 generate,由于涉及到视频的推理和转换,输出时间较长,需做好等待准备。
    • 最终生成的视频长度与音频一致,若想制作长视频,建议剪成小段分别推理后再合并。完成后可打开输出目录或下载视频文件。
    • 利用主流开源程序让照片说话唱歌,达到基本唇形同步,相关链接:https://github.com/OpenTalker/SadTalker ,可独立使用或作为插件放入 stablediffusion 。
    • 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 。
    • 对于编程、python、conda 不熟悉的,可使用整合包:用夸克网盘分享的「EZ-AI-Starter-v0.9.8.zip」,链接:https://pan.quark.cn/s/1d5ca9f57f5c ,视频地址:https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.search-card.all.click&vd_source=35e62d366d8173e12669705f7aedd122 。具体步骤为:点我启动,在启动界面中选择音频、图像口型同步的下载图标,下载完毕后启动应用,会弹出独立窗口(非默认浏览器),选择 sadtalker 同步器,分别导入图片和声音。
Content generated by AI large model, please carefully verify (powered by aily)

References

工具教程:清影

||视频(配音版)|视频(纯享版)|首帧图|PROMPT|<br>|-|-|-|-|-|<br>|23、女孩骑车|| ||骑自行车的女孩,风吹动头发,飘落的树叶|<br>|24、赛博女孩|| ||让人物的嘴部微动_眼睛微动,眼镜上的光有闪烁效果|<br>|25、小狗|| ||让这个狗过来,跑向镜头|<br>|26、小丑鱼|| ||小丑鱼围绕着珊瑚游荡,水里面的气泡向上浮动,水下摇晃的镜头|<br>|27、熊|| ||熊缓慢向前走,远处瀑布倾泻而下|<br>|28、长颈鹿|| ||一只长颈鹿正在咀嚼树叶|<br>|29、火|| ||正在燃烧的火堆|

实战教程:使用Sadtalker让照片说话

图片预处理方式中,crop只截取图片的头部,full就是保留整张照片,下面的勾选项已经有文字解释,自己可以试几次点击generate由于涉及到视频的推理和转换,输出时间要远远大于ai绘图和sovits的声音推理,做好等待的准备。下图中,我导入了一个13秒的音频,预计需要3-5分钟(3060 12g显卡)最终生成的视频长度与音频一致,如果想制作一个长视频,最好是剪成小段,分别推理,然后合并。完成后,可以打开输出目录或者下载视频文件。看看效果带面部修复的效果:

实战教程:使用Sadtalker让照片说话

利用目前主流的开源程序让照片说话唱歌,达到基本的唇形同步https://github.com/OpenTalker/SadTalker可以独立使用或者作为插件放入stablediffusion视频教程https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122但是对于编程、python、conda不熟的,强烈建议使用这个整合包:史上最炸裂版AI工具箱来啦,SD-AI绘画、VITS文本转语音,wav2lip、sadTalker唇型同步,视频修复,支持A卡!我用夸克网盘分享了「EZ-AI-Starter-v0.9.8.zip」,点击链接即可保存链接:https://pan.quark.cn/s/1d5ca9f57f5c视频地址:https://www.bilibili.com/video/BV1ga4y1u7Ep/?spm_id_from=333.337.search-card.all.click&vd_source=35e62d366d8173e12669705f7aedd122具体步骤如下:点我启动,在启动界面中,选择音频、图像口型同步的下载图标:下载完毕后如下:启动应用,等待会弹出一个独立的窗口(而不是你的默认浏览器)选择sadtalker同步器,分别导入图片和声音,

Others are asking
图片生图片
以下是关于图片生图片的相关知识: Tusiart 简易上手教程 概念与功能说明: 1. 图生图:上传图片后,SD 会根据您的图片、选择的模型、输入的 prompt 等信息进行重绘。重绘幅度越大,输出的图与输入的图差别越大。 2. 尺寸:图片生成的尺寸大小。尺寸过小,AI 生成内容有限;尺寸过大,AI 可能放飞自我。若要高清图,可设置中等尺寸并用高分辨率修复。 3. 采样算法:即让 AI 用何种算法生图。 4. 采样次数:AI 调整图片内容的次数。次数越多,调整越精密,理论上出图效果越好,但耗时越长。不过并非次数越多越好,效果提升并非线性,过多后效果增长曲线会放平并开始震荡。 5. 提示词相关性:指图像与 prompt 的匹配程度。数字增大将使图像更接近提示,但过高会导致图像质量下降。 6. 随机种子 seed:生成的每张图都有随机种子。固定种子后,可进行“控制变量”操作,如修改提示词等。首次生成图时无种子,无需操作。 7. Clip Skip:可用于生成图片后控制、调整构图变化,一般设为 2,早期无需过多关注。 8. ENSD:eta 噪声种子增量,默认设为 0 即可。 简明操作流程: 在会用文生图之后,上传图片即可尝试图生图。注意重绘幅度,最小可选 0.01 的重绘,输出的图片差别较明显。局部重绘等高阶功能不在本简明操作流程中,后续进阶内容的教程再展开。 Liblibai 简易上手教程 简明操作流程: 在会用文生图之后,上传图片即可尝试图生图。注意重绘幅度,最小可选 0.01 的重绘,输出的图片差别较明显。局部重绘等高阶功能不在本简明操作流程中,后续进阶内容的教程再展开。
2025-02-18
图片提示词反推工具
以下是关于图片提示词反推工具的相关信息: LayerStyle 副本:根据图片反推提示词,可设置替换词。使用 Google Gemini API 作为后端服务,需在申请 API key,并填到插件根目录下的 api_key.ini 文件中(默认名字为 api_key.ini.example,初次使用需将后缀改为.ini,用文本编辑软件打开,在 google_api_key=后面填入 API key 并保存)。节点选项包括:api(目前只有"geminiprovision"一个选项)、token_limit(生成提示词的最大 token 限制)、exclude_word(需要排除的关键词)、replace_with_word(替换 exclude_word 的关键词)。 PromptEmbellish:输入简单的提示词,输出经过润色的提示词,支持输入图片作为参考。使用 Google Gemini API 作为后端服务,同样需申请并填写 API key。节点选项包括:image(可选项,输入图像作为提示词参考)、api(目前只有"googlegemini"一个选项)、token_limit(生成提示词的最大 token 限制)、discribe(在这里输入简单的描述,支持中文)。 【SD】真人转二次元:图生图功能除文本提词框外还有图片框输入口,可通过图片给与 AI 创作灵感。有两个反推提示词的按钮:CLIP 可通过图片反推出完整含义的句子;DeepBooru 可反推出关键词组。但生成的提示词可能有瑕疵,需手动补充信息。调整宽度和高度使红框匹配图片,同时注意提示词相关性和重绘幅度这两个参数。 第二十一期港风胶片: 活动介绍:墨悠大佬的胶片 lora 模型搭配 flux1 dev 大模型,文艺复兴,唯美胶片复古。lora 模型链接:https://www.liblib.art/modelinfo/e16a07d8be544e82b1cd14c37e217119?from=personal_page 教程: 方法 1:利用上一期活动图片反推工作流,使用唯美港风图片进行反推提示词,在大模型后接一个墨悠_胶片 lo。上一期活动链接: 胶片 lora 链接:https://www.liblib.art/modelinfo/e16a07d8be544e82b1cd14c37e217119?from=personal_page 方法 2:利用抱脸的 joycaption 图片反推提示词,然后在哩布上跑 flux 文生图工作流。joycaption 链接(需要魔法):https://huggingface.co/spaces/fancyfeast/joycaptionprealpha 文生图工作流: 在哩布上跑文生图:https://www.liblib.art/modelinfo/e16a07d8be544e82b1cd14c37e217119?from=personal_page
2025-02-18
图片提示词提取工具
以下是一些图片提示词提取工具: MidLibrary:Midjourney 最全面的流派、艺术技巧和艺术家风格库,网址: MidJourney Prompt Tool:类型多样的 prompt 书写工具,点击按钮就能生成提示词修饰部分,网址: OPS 可视化提示词:这个网站有 Mid Journey 的图片风格、镜头等写好的词典库,方便快速可视化生成自己的绘画提示词,网址: AIart 魔法生成器:中文版的艺术作品 Prompt 生成器,网址: IMI Prompt:支持多种风格和形式的详细的 MJ 关键词生成器,网址: Prompt Hero:好用的 Prompt 搜索,Search prompts for Stable Diffusion,ChatGPT&Midjourney,网址: OpenArt:AI 人工智能图像生成器,网址: img2prompt:根据图片提取 Prompt,网址: MidJourney 提示词工具:专门为 MidJourney 做的提示词工具,界面直观易用,网址: PromptBase:Prompt 交易市场,可以购买、使用、销售各种对话、设计 Prompt 模板,网址: AiTuts Prompt:精心策划的高质量 Midjourney 提示数据库,提供了广泛的不同风格供选择,网址: 关于悠船工具的基础使用教程: 进入官网,可以选择桌面端下载和浏览器使用。为方便选择浏览器使用,第一次使用需注册,选择企业用户注册,输入对应名称和手机号即可注册成功(目前不需要填写企业信息)。注册完成后进入具体操作页面。 基础操作:点击开始想象按钮,将生成的提示词粘贴在下面,回车等待几十秒生成 4 张图片,可选择喜欢的图片进行对应操作。 创作调整: 风格化:数字越大,越艺术,但并非越大越好,取决于创作,人像不用调整过高。 怪异化:数字越大越奇怪,可不碰。 多样化:数字越大,结果越意想不到,越低越接近提示词。建议新手一开始不用怪异和多样化,可做实验测试。 模式:默认标准,朴实 raw 会让图片质感更好,个人喜爱。 版本:默认最高 V6,建议最高,二次元可选 NIJI。 生成图片的速度:默认快速,越快对支付套餐要求越高。 “城市狂想”直接上手操作的教程中关于图片提示词生成: 提供了猫叔写的一段提示词的 prompt 并生成了三条,还为大家直接生成了 1 组共 12 段提示词,可直接使用。注意提示词在悠船和 MJ 中可直接用,在其他平台工具请复制后删除包含“”以后的部分。拿到提示词后可进入喜欢的 AI 绘画工具界面,例如悠船,点击开始想象按钮粘贴提示词。
2025-02-18
图片转视频的国产AI推荐
以下是为您推荐的国产图片转视频的 AI 工具: 1. 可灵:由快手团队开发,生成的图像和视频质量高。在视频生成方面,其视频生成质量卓越,画面清晰、连贯且内容丰富,生成速度快,对于国内用户可访问性强。但价格相对较高,重度用户年费可能达几千元,轻度用户有免费点数和较便宜的包月选项。 2. 通义万相:作为国产 AI 工具,在中文理解和处理方面表现出色,可选择多种艺术和图像风格,操作界面简洁直观,用户友好度高,且目前免费,每天签到获取灵感值即可。但为符合国内监管要求,某些类型图像无法生成,处理非中文语言或国际化内容可能不够出色,处理多元文化内容时可能存在偏差。 更多相关网站可以查看: 内容由 AI 大模型生成,请仔细甄别。
2025-02-18
图片转视频的AI推荐
以下是为您推荐的图片转视频的 AI 工具: 1. Pika:出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需要收费。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的相关网站可以查看:https://www.waytoagi.com/category/38 。 另外,在视频转绘制作视频过程中,Topaz Video AI 是一个不错的插件,用于消除视频抖动和运动模糊。其使用方法如下: 解压对应文件,推荐使用绿色版,右键管理员运行 VideoAIportable.exe 文件,导入处理好的视频。主界面左边是原视频,右边是待处理视频,下面是对应的视频轨道。右边部分是主要对视频处理的方式,预设部分主要是放大视频、提升画质、提升帧率等。稳定 AI 模式分为自动裁切和完整帧,做转绘选择完整帧,强度在 60 左右,抖动需要开启,次数一般选择 2 保持默认不变。 在制作新年表情包时,生成新年场景可以输入关键词“新年、中国新年、喜庆热闹、恭喜发财”之类的词汇得到合适的新年背景。然后使用可灵 AI 1.6 图生视频工具让场景动起来,抽卡性价比不错,简单效果一般抽两三次即可。
2025-02-18
有什么可以通过文字生成流程图或其他图片的AI网址
以下是一些可以通过文字生成流程图或其他图片的 AI 网址: DALL·E:由 OpenAI 推出,可根据输入的文本描述生成逼真的图片。 StableDiffusion:开源的文生图工具,能生成高质量图片,支持多种模型和算法。 MidJourney:因高质量的图像生成效果和用户友好的界面设计而受欢迎,在创意设计人群中流行。 您可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104 )查看更多文生图工具。 此外,还有一些文字生成视频的 AI 产品,如: Pika:擅长动画制作,支持视频编辑。 SVD:Stable Diffusion 的插件,可在图片基础上生成视频。 Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频功能,但收费。 Kaiber:视频转视频 AI,能将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可生成长达 1 分钟以上的视频。 更多的文生视频网站可查看:https://www.waytoagi.com/category/38 。 请注意,以上内容由 AI 大模型生成,请仔细甄别。
2025-02-18
如何让老照片动起来
以下是一些让老照片动起来的方法和相关信息: 1. 参加“时光印记”AI 公益挑战赛:该挑战赛采集了杨浦 20 位老一辈建设者老照片与故事,期望用 AIGC 技术创作影视频、AIMV、动图。作品要求任选百年主题,创作视频短片、音乐 AIMV 或动态老照片,AI 制作内容不低于 70%,视频短片时长 60 秒以上,音乐 AIMV 至少 30 秒,图片组让老照片动起来 5 10s。报名及创作时间为即日起至 2024 年 11 月 20 日。参赛方式为填写报名问卷和进群获取素材。 2. 使用 Dreamina 即梦工具:不需要🪜,每天有免费额度。注册可用抖音号或手机号,上传照片即可尝试让老照片动起来。 3. 使用 Sora 工具:优点是发布的成果好,集成在 openai 一套里可用,但需要🪜,需要 gmail 注册,需要订阅后才能使用。
2025-02-14
我想让公司做内容的同时用起来AI工具做好小红书和公众号的内容
以下是关于在公司做小红书和公众号内容时使用 AI 工具的相关信息: 1. 卓 sir 利用 AI 工具完成 PPT 作业的经验: 卓 sir 在时间紧迫的情况下,出于对 AI 提效的好奇,决定自己先用 AI 工具完成电子商务组队的 PPT 汇报作业。 探索写 prompt 花费了 3 个小时,但最终成功完成了包括大纲内容、排版、动画等的 PPT,认为加上企业背景图片即可提交。 用到的 AI 工具为 GPT4、WPS AI 和 chatPPT。 2. 12 月 25 日的 AI 资讯: Recraft AI 更新了 60 种新的图像风格,是一款可用于生成和编辑插画、海报、产品周边等的 AI 平面设计工具,对所有用户每日都有免费试用点数,并允许对生成的图像进行商业使用。地址:https://www.recraft.ai/ AI 公文智能体“学习强国公文助手”在文小言 APP 正式上线,可以帮助用户进行文汇检索、AI 公文书写、AI 公文润色等。使用方式:下载文小言 APP,找寻学习强国公文助手。 3. 关于生成式 AI 内容的思考: 汉青老师分享提到生成式 AI 的内容仍和传统社交媒体内容共存,短期内可能因新鲜感获流量红利,但人们最终在意的仍是高质量内容。 虽掌握了各种先进工具,但应更关注内容,认真感受真实世界和身边普通人。对于如何与 AI 结合还没想好,需慢慢思考。 希望以上信息对您在公司利用 AI 工具做小红书和公众号内容有所帮助。
2025-02-08
我在一周前的文章[1]里说对 DeepSeek-R1 只需要说大白话,但在三天前的文章[2]里又用了看起来还挺复杂的结构化提示词。有伙伴问我到底咋回事。这就来解释下喽。
以下是关于 DeepSeekR1 提示词的相关信息: 历史更新: 字节跳动推出新技术 OmniHuman,利用单张图片和音频生成生动视频。 DeepSeek 的出现标志着算力效率拐点显现,其优化算法架构提升算力利用效率,AI 基础大模型参数量迎来拐点,2025 年是算法变革元年,其训练过程聚焦强化学习提升推理能力。 提示词方法论: 核心原理认知:包括多模态理解、动态上下文、任务适应性等 AI 特性定位,以及采用意图识别+内容生成双通道处理等系统响应机制。 基础指令框架:包括四要素模板、格式控制语法等。 进阶控制技巧:如思维链引导、知识库调用、多模态输出。 高级调试策略:包括模糊指令优化、迭代优化法。 行业应用案例:涵盖技术开发场景、商业分析场景。 异常处理方案:如处理信息幻觉、格式偏离、深度不足等情况。 效能监测指标:包括首次响应准确率、多轮对话效率、复杂任务分解等。 在 R1 时代,使用 AI 提示词关键在于提供足够背景信息,简单大白话有效但信息量不足难达理想结果,示例和框架可助理清思路,最终影响在于思考和表达,利用乔哈里视窗分析信息需求,避免过度指令化,让 AI 自由思考以激发更高创意和效果。
2025-02-07
让图片动起来
以下是关于让图片动起来的相关内容: 关于生成式 AI 的内容承载,短期内可能因新鲜感获流量红利,但人们最终在意的仍是高质量内容。我们掌握了各种先进工具,如让老照片动起来等,但关键是如何更好地结合两张照片。 实现让图片中人物动起来及两张照片更好结合的方法: 方法一:利用 MJ 画图得到想要的底图,使用 InsightFaceSwap 插件处理脸部(因对多人脸部同时处理效果不好,需先分割裁剪图片分别处理再缝合),最后用可灵或其他软件让图片动起来。 方法二:在网上寻找能直接融合两张照片的软件或项目,若没有则纯 P 图,然后用图生视频的项目完成。 使用 Camera Motion 让图片动起来的步骤: 上传图片:点击“AddImage”。 输入提示词:在“Prompt”中输入。 设置运镜方向:选择想要的方向,输入运镜值。 设置运动幅度:与画面主体运动幅度有关,可任意设置。 其它:选择好种子、是否高清、是否去除水印。 生成视频:点击“create”。
2025-01-12
你能让图片动起来么?
要让图片动起来,可以通过以下几种方法: 1. 方法一: 利用 MJ 画图绘制想要的底图。 使用 InsightFaceSwap 插件进行换脸或让脸部更像,但因该插件对多人脸部同时处理效果不佳,需先对图片进行分割裁剪,分别处理后再缝合。 最后使用可灵或其他软件让图片动起来。 2. 方法二: 在网上寻找能够融合两张照片的软件或项目,直接对图片进行融合。若没有,则进行纯 P 图处理,然后利用图生视频的项目完成。 此外,还有一些相关的工具和技巧: 工具“清影”:输入一张图片和相应提示词,清影大模型会将图片转变为视频画面。也可以只输入图片,让模型自行发挥想象力生成有故事的视频。 技巧 1:选用清晰的图片,上传图片比例最好为 3:2(横版),支持上传 png 和 jpeg 图像。若原图不够清晰,可使用分辨率提升工具。 技巧 2:提示词要简单清晰。可以选择不写 prompt,让模型自行操控图片动起来;或者明确想动起来的主体,并以“主体+主题运动+背景+背景运动”的方式撰写提示词。 工具“Camera Motion”: 上传图片:点击“AddImage”。 输入提示词:在“Prompt”中输入。 设置运镜方向:选择想要的运镜方向。 设置运动幅度:与画面主体运动幅度有关,与运镜大小无关,可设置任意值。 其他:选择好种子(seed)、是否高清(HD Quality)、是否去除水印(Remove Watermark)。 生成视频:点击“create”。
2025-01-08
让图片能动起来的工具
以下是一些能让图片动起来的工具: 1. 清影:输入一张图片和相应的提示词,清影大模型会将图片转变为视频画面。您也可以只输入图片,模型会自行发挥想象力生成有故事的视频。使用时的小技巧包括:选用尽可能清晰的图片,上传图片比例最好为 3:2(横版),支持上传 png 和 jpeg 图像。如果原图不够清晰,可使用分辨率提升工具。提示词要简单清晰,可以选择不写 prompt 让模型自行操控,也可以明确想动起来的主体,并以“主体+主题运动+背景+背景运动”的方式撰写提示词。若不明确模型如何理解图片,可将照片发送到清言对话框进行识图明确主体描述。 2. VIGGLE: Mix:先上传一个视频和一张角色图像,Viggle 会自动将视频的动态赋予给这个角色,形成新视频,能模拟角色 3D 状态,准确还原身体旋转、四肢交叠等动作,也可以利用现有的模版视频作为动作获取来源。 Multi:通过视频的动作,将上传的多个角色进行识别并赋予动作,形成新视频。 Move:将视频的动作直接映射在图片人物身上,实现“让静态图动起来”。
2024-12-30