Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

让图片动起来

Answer

以下是关于让图片动起来的相关内容:

  • 关于生成式 AI 的内容承载,短期内可能因新鲜感获流量红利,但人们最终在意的仍是高质量内容。我们掌握了各种先进工具,如让老照片动起来等,但关键是如何更好地结合两张照片。
  • 实现让图片中人物动起来及两张照片更好结合的方法:
    • 方法一:利用 MJ 画图得到想要的底图,使用 InsightFaceSwap 插件处理脸部(因对多人脸部同时处理效果不好,需先分割裁剪图片分别处理再缝合),最后用可灵或其他软件让图片动起来。
    • 方法二:在网上寻找能直接融合两张照片的软件或项目,若没有则纯 P 图,然后用图生视频的项目完成。
  • 使用 Camera Motion 让图片动起来的步骤:
    • 上传图片:点击“AddImage”。
    • 输入提示词:在“Prompt”中输入。
    • 设置运镜方向:选择想要的方向,输入运镜值。
    • 设置运动幅度:与画面主体运动幅度有关,可任意设置。
    • 其它:选择好种子、是否高清、是否去除水印。
    • 生成视频:点击“create”。
Content generated by AI large model, please carefully verify (powered by aily)

References

一个没想好的事情,先记下来

引言之前汉青老师分享的时候说过一段话,生成式AI的内容,并没有新的渠道去承载,它仍然和传统的社交媒体内容共存,小红书,抖音,微信之类。短期内大家可能因为新鲜感获得流量红利,但当潮水褪去,人们在意的仍然是高质量的内容。我们或许已经掌握了各种先进的工具,会在MJ里用各种关键词出图,会用SD做复杂的工作流,会让老照片动起来,也可以做出很炫酷的宣传片。在这件事情里面,我们不去聊任何的工具,只去聊内容,让节奏慢下来,认真去感受周围真实的世界,感受身边每一个我们通常会一扫而过,关注不到的普通人。我们不会为了AI而生活,但AI让我们更热爱生活。具体怎么做还没想好,也没完全想明白怎么和AI结合,先放着慢慢想偶然在朋友的朋友圈刷到的题材:“这两张照片其实是在同一条街道上拍下的,只不过年轻的女孩在街上,孤独的老人在围墙里。”“这张照片传递两种关系、一种爱意,年轻人手牵着怀孕的爱人,老母亲扶着女儿坐上电动车,这应该是这个世界最稳固的两种关系,而现在他们相遇在一张照片当中。”“很多人把生活当中的便利,比如电商快递外卖速度快便宜看着是我们的移动互联网优势,其实唯一的优势是我们的劳动力,无数个在深夜独自啃着馒头的年轻人支撑着美团阿里的市值...放大镜头看你会发现这其实是一个非常年轻的女孩子(为了不把自己晒黑穿了防晒服),她瘦小,即使戴了头盔也比后面的箱子高不了多少,她进食的时候甚至都没玩手机——我骑车路上看到过很多快递小哥都是边骑车边刷短视频,这至少说明他们对生活中的乐子还充满期待,而图中的女孩看着让人垂头丧气,不仅是她,也包括我。”

AI 带你穿越时空,去拥抱儿时的自己

需求分析方法一方法二总结[heading2]一、需求分析[content]其实关于现在的图转视频,很容易做到让图片中的人物动起来,甚至做一些互动性的动作。不只是可灵很多图转视频的软件都可以做到。所以关键点其实是怎么让AI把两张照片更好的结合起来。那我们现在来思考下怎么样实现这个需求,其实一下子就想到了大概两种做法。下面我们分别尝试一下,看看效果。[heading3]一)方法一[content]利用MJ画图,先画出来一张想要的底图。然后使用InsightFaceSwap这个插件来换脸或者说让脸部更像。但是因为这个插件对多人脸部同时处理的效果并不好,所以我们先需要进行图片的分割裁剪,分别利用插件处理后,再把图片重新缝合。最后利用可灵或者其他软件来让图片动起来。流程如下[heading3]二)方法二[content]这个方法必要依赖于现有的项目,就是直接在网上寻找有没有直接能够融合两张照片的软件或者项目。直接对图片进行融合。如果没有那就是纯P图了...然后利用图生视频的项目完成内容。因为这个没什么操作感~我们先放在后面,大家想要简单点的处理办法可以直接翻到后面。

Camera Motion 使用教程

点击"AddImage"上传图片。[heading2]2.输入提示词[content]在“Prompt”中输入提示词。[heading2]3.设置运镜方向[content]选择您想要的运镜方向,输入[运镜值](https://waytoagi.feishu.cn/docx/Ci9yd5xu2o46rXxNofdcnqH9nXb#doxcniTMBNtWHj6MSpXvB2DTyUh)。(下图中所示为向右运镜)[heading2]4.设置运动幅度[content]运动幅度和画面主体运动幅度有关,与运镜大小无关,可以设置成您想要的任意值。[heading2]5.其它[content]选择好种子(seed),是否高清(HD Quality),是否去除水印(Remove Watermark)。[heading2]6.生成视频[content]点击“create”,生成视频。

Others are asking
生成一个标注宽1550mm,长2285mm的长方形图片
很抱歉,暂时无法直接为您生成指定尺寸的长方形图片。但您可以使用专业的图像编辑软件,如 Adobe Photoshop、Illustrator 等,或者一些在线图像生成工具,按照以下步骤来创建: 1. 打开所选的图像编辑工具或在线工具。 2. 在新建文档或项目时,设置宽度为 1550mm,长度为 2285mm。 3. 根据您的需求进行后续的图像绘制、编辑或添加元素等操作。 希望这些信息对您有所帮助。
2025-02-20
生成一个标注宽1550mm,长2285mm的图片
很抱歉,目前仅根据您提供的“生成一个标注宽 1550mm,长 2285mm 的图片”这一需求,无法直接为您生成相应图片。您能否再补充一些更具体的信息,比如图片的内容、风格、用途等,以便为您提供更有效的帮助。
2025-02-20
如何图片生成视频
以下是图片生成视频的方法: 1. 使用 Runway: 图片准备好后,拖到 Runway 里生成 4 秒视频(Runway 收费,可在闲鱼或淘宝买号,也可找免费的)。 进入 Runway 官网首页,点击“start with image”。 直接将图片拖进来。 动画幅度尽量用 3,5 有时会乱跑。 无需等进度条转完,可直接继续往里放图片,能同步执行。 直接点删除,重新上传下面的图,重复步骤生成所有视频。 2. 使用 Camera Motion: 点击“AddImage”上传图片。 在“Prompt”中输入提示词。 选择想要的运镜方向,输入运镜值(https://waytoagi.feishu.cn/docx/Ci9yd5xu2o46rXxNofdcnqH9nXbdoxcniTMBNtWHj6MSpXvB2DTyUh)。 运动幅度和画面主体运动幅度有关,与运镜大小无关,可设置成任意值。 选择好种子(seed)、是否高清(HD Quality)、是否去除水印(Remove Watermark),然后点击“create”生成视频。 3. 使用 Pika: 要生成视频,进入 generate 频道,目前有 10 个 generate 频道,随便选择一个进入。 PIKA 生成视频的工作流程: 直接生成视频:在输入/create,然后输入 prompt,得到视频。 图片生成视频:使用 MJ/SD 生成图像(可选)+在 PIKA 平台添加 prompt=得到视频。
2025-02-19
有没有把视频截取成图片的或者剪辑的AI工具
以下是一些可以将视频截取成图片或进行剪辑的 AI 工具: 1. Clipfly :可用于视频编辑与合成。 2. VEED.IO :能帮助进行视频编辑。 3. MMVid :这是一个集成的视频理解系统,能处理和理解长视频内容并进行问答,可应用于快速的视频剪辑等场景。 4. 可灵 AI :例如通过其图生视频功能进行相关操作。 此外,在进行视频剪辑时,还可以使用剪映等工具,具体步骤如下: 1. 在右上方点击抠像按钮。 2. 鼠标选中要处理的素材。 3. 把带绿幕的素材先放入下面主视频轨道。 4. 导入需要的素材,将扣好的绿幕和下方黑色咖啡的素材合成一个片段,最后点击新建的复合片段,调整对应的参数。 需要注意的是,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。
2025-02-19
可以把图片用很精确的中文描述出来的AI
以下是关于图片描述和文生图提示词的相关内容: 利用 GPT 识图功能对图片进行细致描述: 对于一张包含中国小男孩和年轻男子的照片,小男孩站在年轻男子右侧,面带灿烂微笑,露出整齐乳牙,黑色短发蓬松且有微卷刘海,大眼睛充满好奇,身着蓝色衬衫和白色针织背心,干净整洁。年轻男子站在左侧,弯腰与小男孩同高,面带温和笑容,眼神充满喜爱,黑色头发梳得整齐,发尾微卷,五官分明,浓眉大眼,高挺鼻梁,薄唇微弯,身着正式黑色西装、白衬衫和黑领结,帅气迷人。两人并肩站立,男子右手轻放小男孩肩上,小男孩左手搭在男子手臂上,姿态和表情传递出深厚的情感与相互支持,场景充满温暖和谐。 对于一张成年男性的人物照片,其年龄约 20 至 30 岁,头发黑亮整齐梳向后方,发尾微卷,肤色白皙,面部线条分明,五官端正,浓眉大眼,鼻梁高挺,嘴唇薄而有弧度,表情略显严肃但英俊,下巴线条明显,脸部轮廓立体,身着正式黑色西装、内搭白色衬衫并佩戴黑色领结,左手握话筒,似在参加正式场合或演讲,背景简约浅色,突出人物主体,展现出自信专业气质,具有典型亚洲男性特征。 在 Stable Diffusion 中文生图时的提示词: 避免使用过大的数值(如 1920x1080),以免构图奇怪。若想要高清图,可同时点选高清修复来放大图像倍率,记住高宽比主要控制画面比例。 调整好参数生成图片后,若质感欠佳,可使用标准化提示词,如“,绘图,画笔”,使画面更趋近于固定标准。
2025-02-19
图片生成工具
以下是一些常见的图片生成工具: 1. Tripo AI:由 VAST 发布的在线 3D 建模平台,能利用文本或图像在几秒钟内生成高质量且可立即使用的 3D 模型,基于数十亿参数级别的 3D 大模型,实现快速的 2D 到 3D 转换,提供 AI 驱动的精准度和细节。 2. Meshy:功能全面,支持文本生成 3D、图片生成 3D 以及 AI 材质生成,用户可上传图片并描述材质和风格来生成高质量 3D 模型。 3. CSM AI:支持从视频和图像创建 3D 模型,Realtime Sketch to 3D 功能支持通过手绘草图实时设计 3D 形象再转换为 3D 模型。 4. Sudo AI:支持通过文本和图像生成 3D 模型,特别适用于游戏领域的模型生成,用户可上传图片或输入文本提示词来生成。 5. VoxCraft:由生数科技推出的免费 3D 模型生成工具,能将图像或文本快速转换成 3D 模型,并提供图像到 3D、文本到 3D 和文本到纹理等多种功能。 此外,谷歌图像生成工具具有理解能力强、生成速度快、可调整提示词和选项等特点,但有使用门槛,不能输入中文,每日免费 500 次。纳米搜索反推提示词工具可上传图片反推 midjourney 提示词,输出效果好,能调用多种模型,可用于查阅资料。 OpenAI 的图像生成端点允许在给定文本提示的情况下创建原始图像,生成的图像大小可为 256x26、512x512 或 1024x1024 像素,较小尺寸生成速度更快,可使用参数一次请求 1 10 张图像,描述越详细越可能获得想要的结果。其图像编辑端点允许通过上传蒙版来编辑和扩展图像。 这些工具通常具有用户友好的界面,无需专业 3D 建模技能即可简单操作,广泛应用于游戏开发、动画制作、3D 打印、视觉艺术等领域。
2025-02-19
生成3d模型可以让模型动起来吗?
生成 3D 模型后是可以让模型动起来的。例如,通过以下工具和流程可以实现: 工具链:Midjourney(生成等距图像)→Trellis(图像转 3D 模型)→Browser Lab(浏览器内 3D 编辑器)。 步骤: 使用 Midjourney 生成等距 3D 场景,提示词示例:3D isometric bedroom with a bed and desk。(DALLE 3 也可测试) 用 Trellis 工具将图像转为 3D 模型(支持 Tripo 3D 等其他工具)。工具地址: 下载生成的 3D 模型(GLB 文件或高斯分布文件),然后导入 Browser Lab 编辑器中进一步编辑。编辑器地址: 结合可灵 AI、Hailuo AI、Runway 等工具可让场景中的人物动起来。 对于文物雕塑上色,可使用 runway 让固有想法的物体变得动态,runway gen3 的 V2V 可以让物体重新建模、重新上色,再把背景上个色,传到剪映,加上 BGM。 先上传图片,运用提示词,只要让物体动起来就行,一次可能不成功,可以多次抽卡(分够的话)。 生成好的视频的左下方,点击“Reuse”,再点击上方出现的“Video to Video”,视频就会跳转到我们的工作台。 再在下方输入提示词“3D modeling with vibrant colors”等待生成。 再重复上面一个步骤,把提示词换成“Changing the background to the universe,the body emits light”。 最后导入剪映,按照自己喜欢的风格,剪成一个小短片。 另外,可以用即梦 S2.0(或其他可以动效的工具)出动态视频,在剪映提前转成 9:16 或 16:9 的大小,否则 runway 会裁剪尺寸。
2025-02-20
如何让agent协作起来
要让 Agent 协作起来,可以参考以下方法: 1. 了解不同的产品设计模式:生成式 AI 的人机协同分为 Embedding(嵌入式)、Copilot(副驾驶)、Agent(智能代理)这 3 种模式,每种模式下人与 AI 的协作流程有所差异。其中 Embedding 模式人类完成大多数工作,Copilot 模式人类和 AI 协同工作,Agents 模式 AI 完成大多数工作。 2. 采用 Multiagent Collaboration 的方法:让不同角色的 Agent 按照任务要求自主规划选择工具、流程进行协作完成任务。例如作为产品经理,可将产品功能设计需求通过 Agents 拆解成多个独立任务,遵循不同工作流,生成初步结果后再修改完善。 3. 从原子能力层思考:抽象化拆解大模型的底层能力,如翻译、识别、提取、格式化等,围绕“输入”“处理”“输出”“反馈”构建最底层的信息处理逻辑。 4. 重塑获取信息的方式:搜索引擎和基于大模型的聊天机器人的目标从根本上一致,可根据需求选择。 5. 注意多 Agent 模式中的设置:分为全局设置和节点设置。全局设置中更应注意角色定义和人物刻画,节点设置更关注单个智能体中要详细执行的逻辑。 6. 合理编排智能体:将智能体编排首尾相连,避免成为线性工作流。 7. 明确跳转模式和适用场景:单个 Agent 中两种跳转模式分别适用于通用和复杂的意图识别和跳转,一般场景下前者效果更好,后者适用更复杂的意图识别情景。同时,编排时应明确单个 Agent 的名称和适用场景,以便节点跳转模型更好地识别触发条件。
2025-02-19
如何让老照片动起来
以下是一些让老照片动起来的方法和相关信息: 1. 参加“时光印记”AI 公益挑战赛:该挑战赛采集了杨浦 20 位老一辈建设者老照片与故事,期望用 AIGC 技术创作影视频、AIMV、动图。作品要求任选百年主题,创作视频短片、音乐 AIMV 或动态老照片,AI 制作内容不低于 70%,视频短片时长 60 秒以上,音乐 AIMV 至少 30 秒,图片组让老照片动起来 5 10s。报名及创作时间为即日起至 2024 年 11 月 20 日。参赛方式为填写报名问卷和进群获取素材。 2. 使用 Dreamina 即梦工具:不需要🪜,每天有免费额度。注册可用抖音号或手机号,上传照片即可尝试让老照片动起来。 3. 使用 Sora 工具:优点是发布的成果好,集成在 openai 一套里可用,但需要🪜,需要 gmail 注册,需要订阅后才能使用。
2025-02-14
我想让公司做内容的同时用起来AI工具做好小红书和公众号的内容
以下是关于在公司做小红书和公众号内容时使用 AI 工具的相关信息: 1. 卓 sir 利用 AI 工具完成 PPT 作业的经验: 卓 sir 在时间紧迫的情况下,出于对 AI 提效的好奇,决定自己先用 AI 工具完成电子商务组队的 PPT 汇报作业。 探索写 prompt 花费了 3 个小时,但最终成功完成了包括大纲内容、排版、动画等的 PPT,认为加上企业背景图片即可提交。 用到的 AI 工具为 GPT4、WPS AI 和 chatPPT。 2. 12 月 25 日的 AI 资讯: Recraft AI 更新了 60 种新的图像风格,是一款可用于生成和编辑插画、海报、产品周边等的 AI 平面设计工具,对所有用户每日都有免费试用点数,并允许对生成的图像进行商业使用。地址:https://www.recraft.ai/ AI 公文智能体“学习强国公文助手”在文小言 APP 正式上线,可以帮助用户进行文汇检索、AI 公文书写、AI 公文润色等。使用方式:下载文小言 APP,找寻学习强国公文助手。 3. 关于生成式 AI 内容的思考: 汉青老师分享提到生成式 AI 的内容仍和传统社交媒体内容共存,短期内可能因新鲜感获流量红利,但人们最终在意的仍是高质量内容。 虽掌握了各种先进工具,但应更关注内容,认真感受真实世界和身边普通人。对于如何与 AI 结合还没想好,需慢慢思考。 希望以上信息对您在公司利用 AI 工具做小红书和公众号内容有所帮助。
2025-02-08
我在一周前的文章[1]里说对 DeepSeek-R1 只需要说大白话,但在三天前的文章[2]里又用了看起来还挺复杂的结构化提示词。有伙伴问我到底咋回事。这就来解释下喽。
以下是关于 DeepSeekR1 提示词的相关信息: 历史更新: 字节跳动推出新技术 OmniHuman,利用单张图片和音频生成生动视频。 DeepSeek 的出现标志着算力效率拐点显现,其优化算法架构提升算力利用效率,AI 基础大模型参数量迎来拐点,2025 年是算法变革元年,其训练过程聚焦强化学习提升推理能力。 提示词方法论: 核心原理认知:包括多模态理解、动态上下文、任务适应性等 AI 特性定位,以及采用意图识别+内容生成双通道处理等系统响应机制。 基础指令框架:包括四要素模板、格式控制语法等。 进阶控制技巧:如思维链引导、知识库调用、多模态输出。 高级调试策略:包括模糊指令优化、迭代优化法。 行业应用案例:涵盖技术开发场景、商业分析场景。 异常处理方案:如处理信息幻觉、格式偏离、深度不足等情况。 效能监测指标:包括首次响应准确率、多轮对话效率、复杂任务分解等。 在 R1 时代,使用 AI 提示词关键在于提供足够背景信息,简单大白话有效但信息量不足难达理想结果,示例和框架可助理清思路,最终影响在于思考和表达,利用乔哈里视窗分析信息需求,避免过度指令化,让 AI 自由思考以激发更高创意和效果。
2025-02-07
你能让图片动起来么?
要让图片动起来,可以通过以下几种方法: 1. 方法一: 利用 MJ 画图绘制想要的底图。 使用 InsightFaceSwap 插件进行换脸或让脸部更像,但因该插件对多人脸部同时处理效果不佳,需先对图片进行分割裁剪,分别处理后再缝合。 最后使用可灵或其他软件让图片动起来。 2. 方法二: 在网上寻找能够融合两张照片的软件或项目,直接对图片进行融合。若没有,则进行纯 P 图处理,然后利用图生视频的项目完成。 此外,还有一些相关的工具和技巧: 工具“清影”:输入一张图片和相应提示词,清影大模型会将图片转变为视频画面。也可以只输入图片,让模型自行发挥想象力生成有故事的视频。 技巧 1:选用清晰的图片,上传图片比例最好为 3:2(横版),支持上传 png 和 jpeg 图像。若原图不够清晰,可使用分辨率提升工具。 技巧 2:提示词要简单清晰。可以选择不写 prompt,让模型自行操控图片动起来;或者明确想动起来的主体,并以“主体+主题运动+背景+背景运动”的方式撰写提示词。 工具“Camera Motion”: 上传图片:点击“AddImage”。 输入提示词:在“Prompt”中输入。 设置运镜方向:选择想要的运镜方向。 设置运动幅度:与画面主体运动幅度有关,与运镜大小无关,可设置任意值。 其他:选择好种子(seed)、是否高清(HD Quality)、是否去除水印(Remove Watermark)。 生成视频:点击“create”。
2025-01-08