直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

根据分镜生成连续动漫的ai

回答

目前根据分镜生成连续动漫可以使用多种 AI 工具和技术,例如:

  • Junie 制作中用到的工具包括 AI 图像生成工具如 Stable Diffusion、Midjourney v5.2、DALL·E,AI 动画工具如 Pika、Runway、Deforum(基于 Stable Diffusion 的开源项目,支持多种动画模式和功能,可以根据文本描述或参考图像和视频生成连续的图像序列,并将这些图像序列拼接成视频),口型同步工具 D-ID,AI 旁白工具 ElevenLabs,剪辑工具 Premiere,文字翻译工具 ChatGPT。此外,也会结合 3D 技术、AE 以及实拍等传统影视制作手段。
  • 阿汤在制作动画短片时,由于 AI 视频生成处于抽盲盒阶段,无法精准判断生成的图片能否生成完美的动作视频,所以决定生成一张合适的图片就直接开始对应动画镜头的生成,若视频无法达到预期效果,及时修改图片、补充镜头。例如生成的分镜图片描述有“Heavy rain hits the grass,close-up of the grass,dark environment,in the style of Hayao Miyazaki --ar 16:9 --v 6.0 --s 250”“A tornado rolls in,dark,Hayao Miyazaki style --ar 16:9 --v 6.0 --s 250”“Dark sky,dark clouds,lightning and thunder,sky close-up,in the style of Hayao Miyazaki --ar 16:9 --v 6.0 --s 250”等。动作戏通常包含快速、连续且复杂的动作序列,AI 在处理复杂动作序列,尤其是模拟人类动作的真实性和流畅性方面仍存在局限性。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

Junie:首部AI长电影幕后制作全流程揭秘

制作方面,从图像到视频再到文字翻译,Junie用到了多种AI工具——AI图像生成:Stable Diffusion/Midjourney v5.2/DALL·EAI动画:Pika/Runway/Deforum(基于Stable Diffusion的开源项目,支持多种动画模式和功能,可以根据文本描述或参考图像和视频生成连续的图像序列,并将这些图像序列拼接成视频)口型同步:D-ID AI旁白:ElevenLabs剪辑:Premiere文字翻译:ChatGPT据Junie介绍,每个创作者、每个章节都会用到不同的技术,除了AI工具,也会用到3D技术、AE(After Effects)以及实拍等传统影视制作中常见的制片手段,以达成创作者最终想要实现的影片效果。例如,制片人Nem负责的第41章是一场打斗戏。“涉及到武打部分的内容,没办法在Runway直接生成。为此,Nem只能采取真人绿幕实拍+Kaiber(一款AI视频生成工具)的工作流,一人分饰两角,才完成了这场武戏。”工作流:实拍绿幕+Kaiber动作戏通常包含快速、连续且复杂的动作序列。AI在处理复杂的动作序列,尤其是在模拟人类动作的真实性和流畅性方面,仍然存在局限性。如果把动幅较大的场景,交给AI视频工具直接生成,往往只会让人物或画面显得生硬和不自然甚至崩坏。

阿汤:AI短片探索——第一幕(动画篇)

分镜图片这里通过生成尝试,注意到一个事情。因为我们是做动画短片,按照正常动画制作流程,脚本制作完成之后,是画分镜草图,然后再进行动画制作。但因为AI视频生成目前仍然处于抽盲盒阶段,我们无法精准的判断一个生成好的图片是否能够生成较为完美的动作视频生成。所以为了能够对分镜画面进行及时的调整,这里,我决定生成一张合适的图片就直接开始进行对应动画镜头的生成。一旦有视频无法生成预期效果,就及时修改图片,补充镜头。Heavy rain hits the grass,close-up of the grass,dark environment,in the style of Hayao Miyazaki --ar 16:9 --v 6.0 --s 250A tornado rolls in,dark,Hayao Miyazaki style --ar 16:9 --v 6.0 --s 250Dark sky,dark clouds,lightning and thunder,sky close-up,in the style of Hayao Miyazaki --ar 16:9 --v 6.0 --s 250直接使用文生视频,后期需要叠加到镜2的画面上dark,bad environment,After a dark and dilapidated environment after a big storm,a white cat's paw walks on the wet dirt,side shot,close-up of the cat's paw,dim environment,in the style of Hayao Miyazaki --ar 16:9 --niji 6 --s 250

阿汤AI短片探索——第一幕(动画篇)

分镜图片这里通过生成尝试,注意到一个事情。因为我们是做动画短片,按照正常动画制作流程,脚本制作完成之后,是画分镜草图,然后再进行动画制作。但因为AI视频生成目前仍然处于抽盲盒阶段,我们无法精准的判断一个生成好的图片是否能够生成较为完美的动作视频生成。所以为了能够对分镜画面进行及时的调整,这里,我决定生成一张合适的图片就直接开始进行对应动画镜头的生成。一旦有视频无法生成预期效果,就及时修改图片,补充镜头。Heavy rain hits the grass,close-up of the grass,dark environment,in the style of Hayao Miyazaki --ar 16:9 --v 6.0 --s 250A tornado rolls in,dark,Hayao Miyazaki style --ar 16:9 --v 6.0 --s 250Dark sky,dark clouds,lightning and thunder,sky close-up,in the style of Hayao Miyazaki --ar 16:9 --v 6.0 --s 250直接使用文生视频,后期需要叠加到镜2的画面上dark,bad environment,After a dark and dilapidated environment after a big storm,a white cat's paw walks on the wet dirt,side shot,close-up of the cat's paw,dim environment,in the style of Hayao Miyazaki --ar 16:9 --niji 6 --s 250

其他人在问
如何用AI绘画赚钱
以下是一些用 AI 绘画赚钱的方式: 1. 参与创作者招募:WaytoAGI 联合 GreaterHeat 进行手机壳创作,当商品售出后,创作者会获得相应收益。在 7 8 月测试期间,每件商品售出按 3 美元/件计算收益(需扣除韩国的预扣税),预扣税以财务的计算口径为准,7 8 月产生的收益,9 月可以开始提现。9 月平台正式上线后,收益计算公式为:×分成比例 预扣税净额支付 = 当月总收益,采用阶梯分成机制,按商品售价的实际分成比例结算。 2. 在小红书上变现: 用 AI 做手机壁纸,6 块钱一张,卖了 463 张,一个月约 2400 左右。这种号一般能同时上架很多壁纸,速度快的一天可以做几十套。制作时把咒语搞定以后不停出图,唯一需要花时间的就是排版,可使用美图秀秀或者醒图自带的手机壁纸模版。 3. 电商领域的珠宝设计:提升珠宝玉器行业定制效率,包括输入原始纹理、生成 AI 设计、叠加纹理效果、机器雕刻生产等环节。
2024-09-17
@ 用ai制作优美的歌曲用什么工具软件,详细的使用教程
以下是用 AI 制作优美歌曲的相关工具软件及使用教程: 工具软件: 1. Udio:由前 Google DeepMind 工程师开发,通过文本提示快速生成符合用户音乐风格喜好的高质量音乐作品。网址:https://www.udio.com/ 2. Suno AI:是一款革命性的人工智能音乐生成工具,它通过先进的深度学习技术,能够将用户的输入转化为富有情感且高质量的音乐作品。网址:https://suno.com/ 使用教程: 1. 导出时间轴歌词:使用剪映(剪辑软件),其导出时间轴歌词的功能位置如下图所示。 2. 音乐分轨:可以使用腾讯 QQ 音乐旗下的 TME Studio,支持一键分轨,再将分轨好的音频文件进行全部导出。TME Studio 网站链接:https://y.qq.com/tme_studio/ 3. 音频编辑:对于分轨好的视频,可以导入 Adobe Audition 进行编辑。有编曲经验的同学可以自由发挥,没有编曲经验的小白可以打开电脑的录屏工具,录制歌曲的工程文件,上传提供创作证明。 4. 准备音频素材: 使用干声转换时,在软件中分别导入人声干声和伴奏,放在两个轨道上。干声用于转成 MIDI 做 AI 演唱。 男歌女唱或者女歌男唱时,在导入前先进行变调。常用的工具包括 TME Studio(腾讯音乐开发的 AI 音频工具箱,其中最常用的是音频分离,可用于将人声和伴奏从歌曲中提取出来。地址:https://y.qq.com/tme_studio/index.html/editor)和 Vocalremover(包含音频分离、变调、BPM 查询等功能,使用较多的是变调和 BPM 查询。建议在准备素材阶段,就将音频调整到所需调,并获取到 BPM。地址:https://vocalremover.org/zh/keybpmfinder) 关于申请网易云音乐人和上传音乐,只提供了认证成功的方法和过程,不能确保所有人都能成功,这是一个概率性的问题。此外,根据 AI 创作目前的特殊性,会在平台上声明此音乐为 AI 创作,并且也绝对支持尊重所有原创作品,也希望平台能尽快开辟一个 AI 创作的专区,可以提供一个容纳并保护所有群体的不同板块。
2024-09-17
能整理网上信息的ai
以下是为您整理的关于能整理网上信息的 AI 的相关内容: 存在能联网检索的 AI,它们通过连接互联网,实时搜索、筛选并整合所需数据,为用户提供更精准和个性化的信息。例如: 1. ChatGPT Plus 用户现在可以开启 web browsing 功能,实现联网功能。 2. Perplexity 结合了 ChatGPT 式的问答和普通搜索引擎的功能,允许用户指定希望聊天机器人在制定响应时搜索的源类型。 3. Bing Copilot 作为一个 AI 助手,旨在简化您的在线查询和浏览活动。 4. 还有如 You.com 和 Neeva AI 等搜索引擎,它们提供了基于人工智能的定制搜索体验,并保持用户数据的私密性。 在利用 AI 打造爆款公众号文章时,可在搜索框中输入具体的 Prompt 来快速定位相关资讯,如“查找关于 OpenAI 对马斯克言论回应的博客文章”。通过 AI 工具如 Perplexity.AI 获取搜索结果,结果中包含大量引用和来源链接,可点击回答内容下方的拷贝按钮获取相关引用网站链接。同理,微软的 Bing 搜索引擎等也提供类似功能,从而快速搜集大量相关资料。 收集完资料后,可使用月之暗面开发的 Kimi 这个 AI 会话助手进行整理。Kimi 具备读取网页内容的能力,并能在此基础上生成一定内容,读取完毕会显示绿色标点作为提示。但需注意其阅读能力有一定限制,可能无法一次性处理大量资讯或读取某些网站内容,可分批次提供资料以确保其有效读取和理解。 内容由 AI 大模型生成,请仔细甄别。
2024-09-17
中国好用的ai
以下是为您推荐的中国好用的 AI 产品: 图像类产品:通义万相。它在中文理解和处理方面表现出色,用户可选择多种艺术和图像风格,生成的图像质量高、细节丰富,操作界面简洁直观、用户友好度高,且能与阿里其他产品和服务无缝整合。目前免费,每天签到获取灵感值即可。但也存在一些局限性,如为符合国内监管要求,某些类型图像无法生成,处理非中文语言或国际化内容可能不够出色,处理多元文化内容时可能存在偏差。 健身类产品: Keep:中国最大的健身平台,为用户提供全面的健身解决方案。网址:https://keep.com/ Fiture:沸彻魔镜由核心 AI 技术打造,集硬件、丰富课程内容、明星教练和社区于一体。网址:https://www.fiture.com/ Fitness AI:利用人工智能进行锻炼,增强力量和速度。网址:https://www.fitnessai.com/ Planfit:健身房家庭训练与 AI 健身计划,AI 教练是专门针对健身的生成式人工智能,使用 800 多万条文本数据和 ChatGPT 实时提供指导。网址:https://planfit.ai/
2024-09-17
能将论文形成总结的AI
在论文写作领域,AI 技术提供了多方面的辅助,以下是一些相关的工具和方法: 文献管理和搜索: Zotero:结合 AI 技术,可自动提取文献信息,助于管理和整理参考文献。 Semantic Scholar:由 AI 驱动的学术搜索引擎,能提供文献推荐和引用分析。 内容生成和辅助写作: Grammarly:通过 AI 技术提供文本校对、语法修正和写作风格建议,提升语言质量。 Quillbot:基于 AI 的重写和摘要工具,可精简和优化论文内容。 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于数据分析和可视化。 Knitro:用于数学建模和优化,助力复杂数据分析和模型构建。 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,有丰富模板库和协作功能,简化编写过程。 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 对于医学课题需要 AI 给出修改意见,您可以考虑使用以下工具: Scite.ai:是一个创新平台,提供引用声明搜索、自定义仪表板和参考检查等工具,增强对科学文献的洞察。 Scholarcy:能从文档中提取结构化数据,并通过知识归纳引擎生成文章概要,包含关键概念、摘要、学术亮点等板块内容。 ChatGPT:强大的自然语言处理模型,可提供修改意见。 关于总结长文档,由于 GPT 具有固定的上下文长度,不能在单个查询中总结太长的文本。要总结长文档,如一本书,可以使用一系列查询来总结文档的每一部分,部分总结连接并再次总结,递归进行直至完成。若需使用早期章节信息理解后期章节,在总结某一点内容时,可包括前文的运行总结。OpenAI 在使用 GPT3 的变体进行的之前的研究中,已研究过此程序对总结书籍的有效性。
2024-09-17
适合短剧的ai
以下是关于适合短剧的 AI 相关内容: 介绍了使用 Pika、Pixverse、Runway、SVD 四大 AI 视频工具制作 AI 短片的情况。 决定每张图片只抽一次卡,包括科幻片、战争片等剧情的远景、特写、全景、中景等画面。 提到 Midjourney 的语义理解有进步,在生图时可采用生成动物或特定名人/有特殊属性人物的取巧方式。 确定影片风格为皮克斯动画风格,明确主要角色形象并按特定格式写 prompt。 解决了部分人物和场景一致性问题,如主场景为四面是书柜的屋子,采用穿书方式分布场景。但双人关系镜头部分仍有困难,如特定场景的中景或全景镜头生成较难。
2024-09-17
想找一个强大的生成视频文本解读分镜头解读的AI工具
以下为您推荐一个强大的生成视频文本解读分镜头解读的 AI 工具——MMVid。 这是一个集成的视频理解系统,能处理和理解长视频内容并进行问答。其应用场景广泛,包括: 1. 快速的视频剪辑:只需输入镜头脚本,即可提取素材库内容进行拼接。 2. 快速的图生视频:结合图像识别,根据镜头脚本提取相同 seed 值的图片,通过 runwayml 思路生成 3 5 秒视频,再结合 comfy ui 自动化拼接。 3. 快速诊断:思路和之前的医疗诊断类似。 MMVid 属于 AI 学习模型,由 Microsoft Azure AI 开发,结合了 GPT4V 的能力和其他视觉、音频和语音处理工具,能够自动识别和解释视频中的元素,如人物行为、情感表达、场景变化和对话内容,从而实现对视频故事线的理解。其核心功能是将视频中的多模态信息(如视觉图像、音频信号和语言对话)转录成详细的文本脚本,以便大语言模型理解视频内容。 其官方网站等更多详细信息可进一步查询。
2024-09-16
我想知道如何制作AI视频的脚本和分镜
以下是关于制作 AI 视频脚本和分镜的方法: 脚本创作: 使用 Claude(https://claude.ai/new),它在脚本创作方面具有优势。 脚本提示词的结构包括:明确要做什么样的视频(如 30 秒时长的广告宣传片脚本、儿童绘本脚本等);指出视频要包含的关键元素(如产品特性或广告风格,像奔驰的高端商务、豪华舒适特性,苹果的香脆多汁、红润饱满特点);对脚本的输出提出要求(推荐使用 Markdown 格式输出,方便后续操作)。 分镜创作: 分镜提示词的结构为:确定要做多长时间的视频、要出多少个分镜、每个分镜包含哪些内容、对输出格式有什么要求。 例如,将故事脚本改写成 30 秒时长的广告片分镜脚本,脚本结构包括序号、场景、景别、镜头时长、镜头运动、画面内容、对话旁白和音乐音效。每个分镜拆分细致,单镜头时长控制在不超过 5 秒,一共拆分 10 个分镜,并转换成 markdown 列表形式输出,第一列是场景,第二列是景别,第三列是镜头时长,第四列是镜头运动,第五列是画面内容,第六列是对话旁白,第七列是音乐音效。 景别是让 MJ 生图时的提示词内容之一,设定景别能让 MJ 更好地理解需求。 镜头时长设定每个分镜的长度。 画面内容是接下来让 MJ 生图的提示词。 对话旁白的内容可直接用于生成配音。 音乐音效为创作背景音提供思路。 对于简短的广告,分镜不宜太多或太少,按照每个分镜平均 3 秒来算,30 秒的视频 10 个分镜比较合适。
2024-09-08
通过分镜头生成mg动画
以下是关于通过分镜头生成 MG 动画的相关内容: 动态叙事动画生成器 方案效果: 通过 NAG 模块,用户能够轻松创建出具有叙事性和连贯性的动画视频,同时保持人物特征的一致性。这将大大提升 AnimateDiff 框架的创作能力和应用范围,为用户提供更加丰富和多样化的动画创作体验。 系统处理流程: 1. Prompt 解析器(Prompt Parser):处理解析 Prompt,提取关键信息,如主要人物、场景、活动以及时间线索。 2. 分镜生成器(Storyboard Generator):根据提取的信息生成分镜脚本,每个季节一个分镜,每个分镜包含具体的背景、人物动作和情感状态。例如春天公园里女性坐在画板前,夏天海滩上女性吃冰淇淋等。 3. 视频渲染引擎(Video Rendering Engine):将分镜脚本转换为视频帧,并渲染成连贯的视频动画。使用 AnimateDiff 框架生成每一帧的图像,确保人物动作的连贯性和场景的平滑过渡,并对每个季节的场景应用不同的色调和光影效果。 模块设计: 1. Prompt 解析器(Prompt Parser): 模块目的:准确解析用户的描述性 Prompt,提取关键信息。 模块功能:包括自然语言处理、实体和关系抽取、场景和动作映射。 技术实现:利用预训练的 NLP 模型,应用依存解析和实体识别技术,使用知识图谱和语义理解来确定实体之间的关系。 2. 分镜生成器(Storyboard Generator): 模块目的:根据解析出的信息生成详细的分镜脚本,为视频生成提供蓝图。 模块功能:分镜脚本创建、时序和逻辑校验、风格和情感适配。 技术实现:使用脚本编写规则和模式识别技术,通过有限状态机或 Petri 网来管理和调整分镜的时序,集成风格迁移和情感分析工具。 3. 视频渲染引擎(Video Rendering Engine) 尾鳍 Vicky:AI 动画短片制作全流程《月夜行》森林篇 分镜头写作: 假如已有简单的故事梗概,1 分钟的视频大概需要 25 30 个镜头,需要写出 30 个镜头的分镜头脚本,并将其翻译成英文,放到 Dalle3 或者 Midjourney 中去进行文生图的工作。文生图的逻辑是要写清楚画面内容。 模板包括景别、风格、角色、环境、比例等。例如:Closeup macro shot,A white flower blooms,the sun shines on the white flower,in the forest,Makoto Shinkai style,Japanese anime style ar 235:100 。以下是最开始写的分镜内容(超级简化版本)作为参考,如 1. 主观,海边电闪雷鸣;2. 特写,树干被折断等。
2024-09-08
做动画分镜头可以用啥ai工具
以下是一些可用于制作动画分镜头的 AI 工具: 1. pixverse:可用于动画镜头的制作。 2. pika:在动画制作中发挥作用。 3. runway:常用于动画制作,其控制笔刷具有一定优势。 此外,在生成分镜图片方面,Midjourney 也可作为辅助工具,通过编写如“a small white Chiense dragon,anthropomorphic,Smile with surprise,wearing a school uniform,looking at a blurry gift box in the foreground,super closeup shot,camera focus on his face,3D render,Unreal Engine,Pixar 3D style,blurry classroom scene,bright sunshine ar 16:9 niji 6”这样围绕皮克斯、迪士尼、3D 风格的提示词来生成所需图片。
2024-09-07
怎样用SD生成分镜图?
以下是使用 SD 生成分镜图的步骤: 1. 选择模型(底模):这对生成结果影响最大,主要体现在画面风格上。 2. 填写提示词:在第一个框中填入对想要生成的东西的文字描述。 3. 填写负面提示词:在第二个框中填入不想要生成的东西的文字描述。 4. 选择采样方法:如 Euler a 能以较少步数产生多样性;Euler 简单快速;DPM 效果不错但耗时增加;DDIM 适合重绘;LMS 和 PLMS 是 Euler 的衍生。 5. 设置采样次数:不同采样方法可能有不同的最佳步数。 6. 选择图片尺寸:注意尺寸太宽可能出现多个主体,1024 之上尺寸可能效果不理想,推荐小尺寸分辨率结合高清修复。 7. 设定每批数量:若显存不足 12G,保持为 1。 8. 利用种子:相同参数下理论上能生成相同图片。 9. 高清修复:勾选“Highres.fix”,先按指定尺寸生成再放大。放大算法中,Latent 在某些情况下效果好,ESRGAN_4x、SwinR 4x 对低重绘幅度支持较好。 10. 局部重绘:蒙版白色区域默认重绘,若只想改变背景可切换“重绘非蒙版区域”,调整提示词和重绘幅度,最后使用放大功能进行高清重绘。
2024-08-27
AI视频的分镜
以下是关于《李清照》AI 视频的部分分镜内容: |分镜|子分镜|分镜主视觉|配音|角色|画面| ||||||| |7|07|李清照高兴奔向王维|王伯伯~王伯伯~(高兴)|少年李清照|无| |8|0801 0802| |嗯~谁在叫我小姑娘,你从哪里来?你叫什么名字呀?|王维|无| |9|0901 疑惑 0902 诗文|疑惑自言自语疑惑的表情看到明月松间照,清泉石上流惊喜|我叫什么名字呢?(疑惑)哦~(惊讶)李清照吟诵:明月松间照,清泉石上流。|少年李清照|无| |10|1001 惊喜 1002 照清高亮|李清照灵机一动墙上诗:明月松间照,清泉石上流。照和清高亮显示|背景音效:灵机一动|无|无| |11|11 得意|李清照脸部特写,惊喜表情|我叫李清照(高兴)|少年李清照|无| |12|12 王维沉思|王维沉思|李清照~李清照,好名字、好名字|王维|无| |13|13 夜景|明月下溪水潺潺|王维吟诵:明月松间照,清泉石上流。|王维|无| |1| |远景一个古装小女孩草丛中嬉戏|背景音乐:小女孩嬉戏声|无|无| |2|0201 欢快 0202 疑惑|李清照与蝴蝶对话:远景、特写|蝴蝶:你叫什么名字呀?(欢快)李清照:嗯~嗯~我叫什么名字呢?(疑惑)|蝴蝶 少年李清照|无| |3|0202 放大|李清照特写|无|无|无| |4|04 穿越唐代|李清照满是疑惑|画外音:这是什么地方?(疑惑)|少年李清照|无| |5|《辋川别业》建筑|写有《辋川别业》的古代建筑|辋川别业、辋川别业,难到这是王维的住处!(恍然大悟)|少年李清照|无| |6|06|《维摩诘诗集》特写|真的是王维(高兴)|少年李清照|无| |14|14 与蝴蝶对话|画面切回,李清照与蝴蝶对话|我叫李清照,嬉笑声|少年李清照|无| |15|1501 诗文交错 1502 成长变化 1503 作诗 1503 结婚|诗文交错、小女成长、嫁人、相夫|苏轼呀,他的诗词缺少音律之美、柳永呢、他的就一个字太俗了、陆游,本小姐只能说呵呵|李清照|无| |16|16 府宅大院|府宅大院|无|无|无| |17|17 佣人窃窃私语|佣人窃窃私语|咱们家夫人是不会下蛋的老母鸡|佣人|无| |18|18 赵母训斥赵明诚|赵母训斥赵明诚|男人不孝有三无后为大你看看你们结婚多少年了一儿半女的都没有生下一个你怎么对得起赵家的列祖列宗|赵母|无| |19|19 李清照羞愧|躲在一旁听的李清照羞愧、内疚、自责|无|无|无|
2024-08-20
推荐小说生成动漫的软件
以下是一些可以将小说生成动漫的软件及相关制作流程: 软件推荐: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。 网址:https://github.com/StabilityAI 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。 网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。 网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。 网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。 网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。 网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。 网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。 网址:https://www.aihub.cn/tools/video/gushiai/ 制作流程: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。内容由 AI 大模型生成,请仔细甄别。
2024-09-07
图片风格转换,现实照片转换成动漫风格,有哪些网站、Bot、
目前在将现实照片转换成动漫风格方面,以下为您推荐一些常见的网站和工具: 1. 美图秀秀:功能丰富,操作相对简单,有多种动漫风格转换效果可选。 2. 醒图:提供多种特效和滤镜,包括动漫风格的转换。 至于 Bot 方面,暂时没有特别突出和广泛使用的专门用于现实照片转动漫风格的 Bot。但您可以持续关注相关领域的发展,可能会有新的工具出现。
2024-09-06
图片转动漫风格
以下是关于图片转动漫风格的相关信息: SDXL Prompt Styler 插件可以把图片转化成近百种风格。原始图像为手绘风格时,手绘线条和折纸风格互斥。包含 canny 控制和跳过 canny 控制会有不同的风格转化效果,若想把图片转成漫画风格并较好保留人物外轮廓,加入 canny 控制能更好还原人物造型。有时直接用插件内置预设的提示词组合不一定能达到想要的效果,需在 prompt 中添加更多相关关键词。此工作流结合 Vid2Vid Style Transfer with IPA & Hotshot XL 工作流,可实现视频不同风格的稳定转绘。 3 月 18 日的 Xiaohu.AI 日报: Magnific AI 推出照片风格化功能,可将任意照片转换成任意风格,能控制样式数量和结构完整性,适用于多种用例。链接:https://x.com/imxiaohu/status/1769710736132227434?s=20 《滚石》报道 Suno AI 与 ChatGPT 合作创作的歌曲,Suno AI 生成音乐,ChatGPT 提供歌词和标题,模仿独奏原声密西西比三角洲蓝调,讲述悲伤的 AI 故事。相关链接:https://rollingstone.com/music/musicfeatures/sunoaichatgptformusic1234982307/ 、https://soundcloud.com/rs539916550/soulofthemachine 、https://x.com/imxiaohu/status/1769702028425744427?s=20 Animagine XL 3.1 动漫主题文本到图像模型更新发布,扩展了对广泛动漫风格的理解,提高了生成图像质量,解决过曝问题,新增美学标签,优化了结果准确性。链接:https://cagliostrolab.net/posts/animaginexlv31release 、https://huggingface.co/cagliostrolab/animaginexl3.1
2024-08-23
照片转动漫工具
以下为一些将照片转动漫的工具及相关介绍: 1. SD: 图生图功能除文本提词框外还有图片输入口,可通过图片给 AI 创作灵感。 可通过两种反推方式获取提示词,如 CLIP 和 DeepBooru,但生成的提示词可能有瑕疵,需手动补充信息。 调整宽度和高度使红框匹配图片。 2. Fooocus: 在“图生图”中载入图片并点击“加载到输入”,勾选“图生图”后点击生成,可得到相同构图的图像。 能切换“SAI 动漫”风格,右边参数可控制与参考图的相似程度。 3. AnimeAI: 官网为 https://animeai.app/ ,是一个能将肖像照片转化为个性化动漫艺术作品的 AI 动漫图片生成器,有广泛的动漫风格选择和先进算法。
2024-08-23
一个把真人视频转化成动漫视频的工具
以下为您介绍把真人视频转化成动漫视频的相关工具和信息: 利用图生图功能可以实现真人转二次元。此功能除了文本提词框,还有图片输入口,可通过图片给 AI 创作灵感。随便照一张照片拖入,文本输入框旁有两个反推提示词的按钮:CLIP 能通过图片反推出完整含义的句子;DeepBooru 能反推出关键词组。但两种方式生成的提示词可能有瑕疵,需手动补充信息,还可调整宽度和高度使红框匹配图片。 有爽文转简单动漫的视频上了 B 站热门,涨粉十万,如链接:https://www.bilibili.com/video/BV1Pc411Q77b/?spm_id_from=333.999.0.0&vd_source=4f7659a23dafc8b331c8f784bf762298 。这类视频可简单拆解为人物站位调度+DNF/LOL 特效(纯视觉特效不考虑),随机摆放 SD 生成图片的小说改视频也有一定传播力。有人想验证“人物站位的调度”这个步骤是否可以让 openai 的 GPT 来自动完成。
2024-08-22
我想生成个人动漫形象
以下是生成个人动漫形象的方法: 1. 简单提示词: 在聊天窗口输入/imainge 找到/imagine prompt,然后把刚才的链接放进去,然后空格。 加一些提示词,这些提示词以英文逗号分隔,最后再加上设置参数。 设置参数: iw 1.5 是设置参考图片的权重,数值越高与参考的图片越接近,默认是 0.5,最大是 2,可选择中间的某个值并调整。 s 500 设置风格强度,个性化,艺术性,数字越大,更有创造力和想象力,可设置为 0 1000 间任意整数。 v 5 是指用 midjourney 的第 5 代版本,这一代的最真实,目前 v5 需要订阅付费,不想付费可以使用v 4 。 no glasses 是指不戴眼镜,如果你不喜欢戴眼镜的图片,可以加上这个设置,让它不戴眼镜。 效果如下: 完整的提示词如下 simple avatar,Disney boy,3d rendering,iw 1.5 s 500 v 5 。 如果对生成的结果不满意,可以选择调整s 和iw 的值来进行多次尝试。 2. 进阶使用技巧总结: 如果想用真人照片来生成卡通头像,就用「真人照片」+「照片描述」+「方法 1 的关键词」来处理即可。 细心的友友可能发现了刚开始喂的图其实也是 AI 生成的。在玩的过程中如果生成了自己比较满意的图,一定要记得存起来。下次想要同种类型的就可以直接拿来喂图,效果要比重新找的好很多。 3. 背景: 之前制作了一篇视频,教大家怎么从零开始使用 Midjourney 并通过简单的提示词来生成图片。 今天教更高级的知识,利用 Midjourney 的以图绘图功能来生成属于您的迪斯尼卡通风格的头像。 这就是使用照片为底图生成的迪斯尼风格的头像。 如果还没有 Midjourney 账号,或者还不懂基础操作,可以看之前的教程: 。 要生成一张 Disney 风格的头像,先选一张比较满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击+,然后点击上传文件,选取图片,然后在聊天框发送(记得这里一定要点击回车或发送按钮)。 然后图片会上传到服务器并生成一张唯一的链接,点击图片,然后点击在浏览器中打开,然后可以看到浏览器上方有一个链接,这个链接就是这张图片的链接,复制下来。 可以使用这个链接加 prompt 提示词来发送给 Midjourney,Midjourney 会根据需求来生成特定的图片,这就是 Midjourney 的以图绘图。
2024-08-14
文字生成视频怎么做
文字生成视频通常指使用人工智能技术将文本内容转换成视频的服务。以下为您介绍一些相关产品及操作方法: 产品推荐: 1. Pika:一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:若您熟悉 Stable Diffusion,可安装其最新插件,能在图片基础上直接生成视频,这是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需注意是收费的。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看:https://www.waytoagi.com/category/38 (内容由 AI 大模型生成,请仔细甄别) Sora 的功能: 1. 文字生成视频,时长可到 60 秒。 2. 图片生成视频。 3. 扩展视频,能够在时间上向前或向后扩展视频,可产生无缝的无限循环。 4. 通过文本编辑视频,使用扩散模型的相关技术零次射击地转换输入视频的风格和环境。 Runway 生成视频的操作步骤: 1. 选择左侧工具栏“生成视频”。 2. 选择“文字/图片生成视频”。 3. 将图片拖入框内。 4. 选择一个动画系数。 5. 点击生成 4 秒视频。 6. 下载视频。 您可以根据自己的具体情况选择适合的工具。
2024-09-17
用文本生成PPT的AI工具
以下是一些用文本生成 PPT 的 AI 工具: 1. 熊猫 Jay:点击文本转 PPT,在提示框中选择确定,即可得到转换后的 PPT,并可在线编辑。 2. 讯飞智文:由科大讯飞推出的 AI 辅助文档编辑工具,利用科大讯飞在语音识别和自然语言处理领域的技术优势,可能提供智能文本生成、语音输入、文档格式化等功能,旨在提高文档编辑效率。网址:https://zhiwen.xfyun.cn/ 3. Gamma:在线 PPT 制作网站,允许用户通过输入文本和想法提示快速生成幻灯片,支持嵌入多媒体格式,如 GIF 和视频,以增强演示文稿的吸引力。网址:https://gamma.app/ 4. 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,允许用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素,适用于多种场合。网址:https://www.xdesign.com/ppt/ 5. Mindshow:AI 驱动的 PPT 辅助工具,提供自动布局、图像选择和文本优化等智能设计功能,还包括互动元素和动画效果,以增强演示文稿的吸引力。网址:https://www.mindshow.fun/ 目前市面上大多数 AI 生成 PPT 按照如下思路完成设计和制作: 1. AI 生成 PPT 大纲 2. 手动优化大纲 3. 导入工具生成 PPT 4. 优化整体结构 推荐 2 篇市场分析的文章供参考: 1. 《》 2. 《》
2024-09-15
表格生成的ai
以下是关于表格生成的 AI 相关内容: 1. 在 Excel 方面,有以下几种增强数据处理和分析能力的 AI 工具和插件: Excel Labs:是一个 Excel 插件,新增了基于 OpenAI 技术的生成式 AI 功能,可在 Excel 中进行数据分析和决策支持。 Microsoft 365 Copilot:微软推出的整合了多种办公软件的 AI 工具,能通过聊天形式完成如数据分析、格式创建等任务。 Formula Bot:提供数据分析聊天机器人和公式生成器两大功能,支持自然语言交互进行数据分析和生成 Excel 公式。 Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,可生成公式、文本内容,执行情感分析、语言翻译等任务。 2. 多模态数据生成产业中,表格生成通过变分自编码器(VAEs)和序列到序列模型(Seq2Seq)等技术实现,包括生成表格文件、表格公式,以及进行表格结构设计、数据分析表、表格自动化等操作。 3. 相关产品推荐: GPT3.5 Tableinator:输入主题可生成带有维基百科链接的信息表,但需要使用自己的 Open AI API key。 随着技术发展,未来可能会有更多 AI 功能集成到 Excel 中,进一步提高工作效率和数据处理的智能化水平。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-09-15
文档自动生成PPT
以下是关于文档自动生成 PPT 的相关内容: 生成 PPT 的方法: 1. 点击文本转 PPT,并在提示框中选择确定,得到转换后的 PPT 后可在线编辑。 2. 利用讯飞智文等工具,它是由科大讯飞推出的 AI 辅助文档编辑工具,利用了科大讯飞在语音识别和自然语言处理领域的技术优势,可能提供智能文本生成、语音输入、文档格式化等功能。网址:https://zhiwen.xfyun.cn/ 3. 目前市面上大多数 AI 生成 PPT 的思路是:AI 生成 PPT 大纲,手动优化大纲,导入工具生成 PPT,优化整体结构。 相关案例: 卓 sir 的做法是先让 GPT4 生成 PPT 大纲,然后把大纲导入到 WPS 当中,启用 WPS AI 一键生成 PPT,为了让 PPT 更有灵动性和观感,让 chatPPT 添加一些动画,最后手动修改细节,比如字体、事实性错误等。 扩展阅读: 1. 《》 2. 《》 相似问题: 1. 有没有生成 PPT 的应用推荐,不用翻墙的 2. 免费生成 PPT 的网站有哪些 3. 推荐一款文字生成 ppt 的工具
2024-09-14
AI生成3D模型
以下是关于 AI 生成 3D 模型的相关信息: 使用 Tripo AI 生成 3D 模型: 在「Create」界面底部的输入框中输入提示词(不支持中文)。不会写提示词可点击输入框左侧的</>按钮随机生成并自动填入。填写好后点击右侧的「Create」生成 3D 模型,每次会生成 4 个基础模型。若不满意可点击最下方白色的「Retry」重新生成 4 个。若有满意模型,点击单个模型下方黄色的「Refine」精修,在「My Models」中可查看精修进度,一般 5 分钟左右完成。 其他 AI 生成 3D 模型工具: 1. xiaohu.ai 相关: BakedAvatar 动态 3D 头像:从视频创建逼真 3D 头部模型,实时渲染和多视角查看,兼容多种设备,交互性编辑。链接:https://buaavrcg.github.io/BakedAvatar/ 、https://x.com/xiaohuggg/status/1744591059169272058?s=20 MakeACharacter:一键生成 3D 数字人,可自定义面部特征,基于真实人类扫描数据,使用 Unreal Engine 渲染,支持中英文提示,兼容多个行业应用。链接:https://x.com/xiaohuggg/status/1743986486780076279?s=20 Rodin Gen1:3D 原生生成模型,拥有 1.5B 参数,可实现 3Dto3D 生成,生成 3D 模型及物理基础渲染材质,支持 3D LoRA 技术。链接:https://x.com/xiaohuggg/status/1743638052097184102?s=20 Skybox AI 0.9 版本更新:可以从文本提示或草图生成 360 度 3D 世界,使用 NeRF 技术,增强图像的空间深度和真实感,提供不同分辨率的 3D 网格下载。 2. CSM_ai:文本、图像或草图转换为 3D 素材,直接应用于游戏中,无需后期处理。体验地址:https://cube.csm.ai 链接:https://x.com/xiaohuggg/status/1763758877999587757?s=20 3. Move AI 推出 Move API:从 2D 视频生成 3D 运动数据,支持多种 3D 文件格式导出,为 AR 应用、游戏开发等提供高质量 3D 运动数据。链接:https://move.ai/api 、https://x.com/xiaohuggg/status/1761590288576061573?s=20 4. ComfyUI 3D Pack 引入 3D 图像处理:快速将图片转换为 3D 模型,支持多角度查看,使用 3D 高斯扩散技术提升模型质量,支持多种格式导出,集成先进 3D 处理算法。链接:https://github.com/MrForExample/ComfyUI3DPack/tree/main 、https://x.com/xiaohuggg/status/1755824687811346514?s=20 5. Medivis 的 SurgicalAR 手术应用:将 2D 医疗图像转化为 3D 互动视觉,提高手术精度,支持 3D 模型的放大、缩小、旋转,精确手术计划。链接:https://t.co/3tUvxB0L4I
2024-09-14