直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

根据自己5000小时的视频制作属于自己的数字人

回答

以下是根据您 5000 小时的视频制作属于自己的数字人的方法:

生成数字人

  1. 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,比如“婉婉-青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,然后点击右下角的“添加数字人”,将其添加到当前视频中。剪映会根据提供的内容生成对应音视频,并添加到视频文件的轨道中,左下角会提示渲染完成时间。之后可点击预览按钮查看效果。
  2. 增加背景图片:删除先前导入的文本内容,点击左上角的“媒体”菜单并点击“导入”按钮,选择本地一张图片上传,如书架图片,点击图片右下角的加号将其添加到视频轨道(会覆盖数字人)。书架图片所在轨道会新增,将轨道最右侧的竖线向右拖拽至视频最后使其在整个视频播放时显示。选中背景图片所在轨道,在显示区域拖动图片的角将其放大到适合尺寸,如覆盖视频窗口,并将数字人拖动到合适位置。
  3. 增加字幕:点击文本-智能字幕-识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。完成后点击右上角的“导出”按钮,导出视频备用。

AI 换脸: 打开 facefusion 软件,返回实例列表,点击自定义服务按钮,通过 web 浏览器访问 facefusion 提供的 UI 界面。在 facefusion 软件界面上传准备好的图片、视频,在右侧可看到预览效果,点击下方的开始按钮执行换脸处理。处理完成后,在输出位置会出现处理后的视频,输出窗口右上角有下载按钮,可导出换脸后的视频到本地。

本次制作的成本和时间:

  1. 时间:大约 10 分钟左右。
  2. 制作数字人视频:免费。
  3. 数字人换脸:约 0.8 元。
  4. 数字人换脸时长:经实际测试 1 分 28 秒的视频,总转换时间在 200 秒。GPU 服务器此次整体运行时长所需花费 0.97 元,facefusion 软件运行只占服务器运行时长的一部分,所以换脸的成本约 0.8 元。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

实战: 每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法!

3.1生成数字人在剪映右侧窗口顶部,我们打开“数字人”选项,选取一位免费的、适合的数字人形象,这里我选择“婉婉-青春”。当你选择一个数字人形象时,软件会马上播放出该数字人的声音。你可以判断是否是你需要的,点击右下角的“添加数字人”,就会将选择的数字人添加到当前视频中。剪映App将会根据之前提供的内容,来生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示你渲染何时完成。然后你可以点击预览按钮,查看生成的数字人效果。3.2增加背景图片接下来,可以直接删除先前导入的文本内容。这是因为视频中的音频中已经包含文字内容了。鼠标点击下方代表文字的轨道,或者点击软件中间文字内容,按删除键删去文字:为了让视频更美观,我们为视频增加背景图片。当然你可以增加多个背景图片,为简化演示,这里增加1张图片。点击左上角的“媒体”菜单,并点击“导入”按钮,来选择本地的一张图片上传:我选择一张书架图片上传,然后像添加文字内容一样,点击图片右下角的加号,将这个图片添加到视频的轨道上(会覆盖数字人):

实战: 每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法!

此时,书架图片就会在视频轨道的下面,添加一条新轨道:为了让图片在整个视频播放的时候都显示,可以点击这个轨道最右侧的竖线,向右拖拽,直到视频的最后,也就是和视频对齐:此时,背景图片所在的轨道是选中状态。如果没选中,鼠标点击一下这个规定即可。在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口。并将数字人拖动到合适的位置:3.3增加字幕点击文本-智能字幕-识别字幕,点击开始识别:软件会自动将文字智能分段并形成字幕:至此,数字人视频就完成了。点击右上角的“导出”按钮,导出视频以作备用。如果你希望数字换成自己希望的面孔,比如这个:就需要用另一个工具来进行换脸了。

实战: 每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法!

打开facefusion软件,需要返回实例列表,点击自定义服务按钮,会打开一个新的浏览器窗口。这样,我们才能够通过web浏览器来访问facefusion提供的UI界面:在facefusion软件界面上(见上图),上传准备好的图片,视频后,在右侧可以看到预览效果。点击下方的开始按钮,执行换脸处理。执行完成后,在输出的位置,会出现处理后的视频,输出窗口的右上角有一个下载按钮,点击它你可以导出变量后的视频到本地。最后来看看效果:通过剪映制作的数字人视频:1.变脸前的视频:1.变脸后的视频:本次GPU服务器的使用花费:总成本:1.时间:大约10分钟左右2.制作数字人视频:免费3.数字人换脸:约0.8元4.数字人换脸时长:经实际测试1分28秒的视频,总转换时间在200秒,下方是运行facefusion的终端反馈的信息:如上图所示,GPU服务器此次整体运行时长所需花费0.97元,facefusion软件运行其实只占服务器运行时长的一部分,所以换脸的成本应该在0.8元左右。

其他人在问
我现在需要写一篇工作经验分享发言稿,有什么好用的AI工具可以帮我生成一篇5000字的发言稿吗?
以下为您推荐一些可能有助于生成工作经验分享发言稿的 AI 工具: 1. GPT4:可以通过输入相关提示生成较为丰富和准确的文本内容。 2. WPS AI:在处理文档相关任务时能提供一定的帮助。 3. chatPPT:有助于完成 PPT 的大纲内容、排版和动画等方面。 您还可以参考以下相关案例: 1. 卓 sir 利用 AI 完成了电子商务汇报的 PPT,包括大纲内容、排版、动画等,最后仅需添加企业背景图片即可提交。想查看 PPT 可移步飞书:https://fr3qe44cid.feishu.cn/docx/DW44djbRioSL4lxURmlcn5cEnte?from=from_copylink (也可以点击最后的阅读原文)。 2. 大聪明通过 PUA AI 完成了 500 万字的报告,最近在玩 Coze/扣子,发现无需代码,人人都能操作,比如将链接丢过去即可完成工作,还可搭配飞书,实现“AI 打工你躺平”。
2024-08-03
国内外好用的图生视频模型
以下是一些国内外好用的图生视频模型: 可灵(国内,免费) 网址:https://klingai.kuaishou.com/ 支持文生视频、图生视频。 支持图生视频首尾帧功能。 提示词可使用中文。 文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持 16:9、9:16、1:1 尺寸。 图生视频除了不可运镜控制以外,其他跟文生视频基本相同。 默认生成 5s 的视频。 ETNA(国内) 网址:https://etna.7volcanoes.com/ 由七火山科技开发的文生视频 AI 模型。 可以根据用户简短的文本描述生成相应的视频内容。 生成的视频长度在 8 15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps。 文生视频,支持中文,时空理解。 关于可灵的文生视频效果,测试者 Austin 周安鑫进行了以下测试: 1. 场景识别:包括室内和室外,如客厅的沙发、液晶电视、漂亮的波斯猫、超现实主义的蜿蜒河流、茂密森林、灿烂花海、碧绿草坪等。 2. 物体识别:涵盖静态和动态物体,如水晶球、跳动的火焰、翱翔的飞鸟、闪烁的流星、飞溅的水珠等。 3. 人物识别:包括面部和姿态,如一个人笑容灿烂、一个人惊恐愤怒,一位芭蕾舞女孩在冰面上跳舞等。 4. 动作识别:包含基本和复杂动作,如短跑运动员快速奔跑、赛车手驾驶跑车激烈漂移等。 5. 事件检测:有简单和复杂事件,如一位帅哥在喝水、外星文明和地球进行星际大战等。 6. 环境变化:涉及光线和天气,如奇幻的极光舞动变幻、城市写字楼灯光忽明忽暗、闪电交加、乌云密布、台风、大雨等。 7. 多对象场景:包括单一和多对象场景,如 1 个飞行员驾驶战斗机翱翔太空、海军指挥航母战斗群展开激烈战斗等。 8. 特殊场景:有遮挡和非标准场景,如城市大雾遮挡摩天大楼、一边是神秘海底世界,一边是梦幻糖果屋。 9. 细节检测:包含小物体和微表情,如崭新的苹果电脑屏幕上播放电影、瞳孔收缩、脸颊泛红、嘴唇微微颤抖。
2024-09-19
我想了解 AI 创作视频相关的资料
以下是关于 AI 创作视频的相关资料: 在人员方面,有以下人员从事与 AI 创作相关的工作: 路西:从事 AI 视频创作。 汪汪汪:制作 AI 视频、AI 图文。 大白光:在生活和工作中出图和视频。 kone:从事 AI 商业实战应用,包括 AI 短片、AI 广告、AI 电影、AI MV 等。 一花一世界:从事视频相关工作。 林旭辉:从事视频制作、电商相关工作。 如果想用 AI 把小说做成视频,一般的制作流程如下: 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。 如果您想参加 filMarathon 全球 AI 电影马拉松大赛,以下是一些学习资料和参赛方式: 剧本创作:人力为主,可参考 图片生成:AI 作图绘画,可参考 视频生成:AI 视频生成,可参考 音频生成: AI 音乐创作,可参考 音效创作指导,可参考 语音合成,可参考 剪辑工具:剪映剪辑,可参考
2024-09-19
AI怎么把图片做成视频
以下是将图片制作成视频的几种方法: 1. 使用 PixVerse 网站(https://app.pixverse.ai):涂抹选区,给出相应的运动方向,最后加入配音,剪辑一下即可。 2. 利用快影(需先通过内测申请): 打开快影,选择 AI 创作。 选择 AI 生成视频。 选择图生视频。 上传处理好的图片,填写想要的互动动作和效果,然后点击生成视频,排队等待生成结束后点击下载。 3. 采用 Midjourney 出图结合 AI 视频软件的方法: 使用 Midjourney 垫图加描述出图。 下载“素材”项里的深度图,打开 MJ 官网(https://www.midjourney.com/)上传深度图。 若图片完美可直接生成视频,若有黑边则需下载图片并用 PS 创成式充填处理黑边。
2024-09-19
推荐将线上视频转变成文字的运用
以下是一些将线上视频转换成文字的应用推荐: 1. Pika:是一款出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 2. SVD:如果熟悉 Stable Diffusion,可以安装这款最新的插件,能在图片基础上直接生成视频,它是由 Stability AI 开源的 video model。 3. Runway:老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,但需注意是收费的。 4. Kaiber:视频转视频 AI,能够将原视频转换成各种风格的视频。 5. Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的相关网站可以查看: 另外,为您推荐在线 TTS 工具 Voicemaker(https://voicemaker.in/),它可将文本转换为各种区域语言的语音,并允许创建自定义语音模型,易于使用,适合为视频制作画外音或帮助视障人士。 以上内容由 AI 大模型生成,请仔细甄别。
2024-09-19
有什么工具可以将视频生成脚本
以下是一些可以将视频生成脚本的工具和方法: 1. 工具组合: ChatGPT(https://chat.openai.com/)+剪映(https://www.capcut.cn/):ChatGPT 生成视频小说脚本,剪映根据脚本自动分析出视频所需场景、角色、镜头等要素,并生成对应素材和文本框架,可快速实现从文字到画面的转化,节省时间和精力。 PixVerse AI(https://pixverse.ai/):在线 AI 视频生成工具,支持将多模态输入(如图像、文本、音频)转化为视频。 Pictory(https://pictory.ai/):AI 视频生成器,用户提供文本描述即可帮助生成相应视频内容,无需视频编辑或设计经验。 VEED.IO(https://www.veed.io/):提供 AI 图像生成器和 AI 脚本生成器,帮助从图像制作视频,并规划内容。 Runway(https://runwayml.com/):AI 视频创作工具,能将文本转化为风格化的视频内容,适用于多种场景。 2. 将小说做成视频的制作流程: 小说内容分析:使用 AI 工具(如 ChatGPT)提取关键场景、角色和情节。 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成视觉描述。 图像生成:使用 AI 图像生成工具创建角色和场景的图像。 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 后期处理:对生成的视频进行剪辑、添加特效和转场,提高视频质量。 审阅与调整:观看生成的视频,根据需要调整,如重新编辑某些场景或调整音频。 输出与分享:完成编辑后,输出最终视频并在所需平台分享。 请注意,具体操作步骤和所需工具可能因项目需求和个人偏好不同而有所差异。此外,AI 工具的可用性和功能可能会随时间变化,建议直接访问工具网址获取最新信息和使用指南。
2024-09-19
有没有把公众号文章转成视频的工具呀
以下是一些可以将公众号文章转成视频的工具: :一个使用人工智能将博客文章转化为播客的工具。用户只需将博客文章复制粘贴到该工具中,几分钟内就能生成一个有声播客。该工具还提供了免费试用和多个价格层级选择。用户无需具备技术知识,可以轻松地将播客发布到 Spotify 等平台,吸引更多的听众。 如果您想用 AI 把小说做成视频,以下是一些相关工具及网址: Stable Diffusion(SD):一种 AI 图像生成模型,可以基于文本描述生成图像。网址: Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址: Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址: Pika AI:文本生成视频的 AI 工具,适合动画制作。网址: Clipfly:一站式 AI 视频生成和剪辑平台。网址: VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址: 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址: 故事 AI 绘图:小说转视频的 AI 工具。网址: 以下是一些文字生成视频的 AI 产品: Pika:一款非常出色的文本生成视频 AI 工具,擅长动画制作,并支持视频编辑。 SVD:如果熟悉 Stable Diffusion,可以直接安装这款最新的插件,在图片基础上直接生成视频。这是由 Stability AI 开源的 video model。 Runway:一款老牌 AI 视频生成工具,提供实时涂抹修改视频的功能,不过需要注意的是,Runway 是收费的。 Kaiber:一款视频转视频 AI,能够将原视频转换成各种风格的视频。 Sora:由 OpenAI 开发,可以生成长达 1 分钟以上的视频。 更多的文生视频的网站可以查看这里: 内容由 AI 大模型生成,请仔细甄别。
2024-09-18
有什么免费的,普通人好操作的工具帮我制作ppt里的逻辑图吗
以下是一些免费且普通人好操作的可用于制作 PPT 里逻辑图的工具: 1. PlantUML:通过编写描述性文本自动生成序列图、用例图、类图等,辅助创建逻辑视图。 2. Gliffy:基于云的绘图工具,能创建各种架构图,包括逻辑视图和部署视图。 3. Archi:免费开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图创建。 4. Lucidchart:流行的在线绘图工具,支持多种图表创建,如逻辑视图、功能视图和部署视图,可通过拖放界面轻松操作。 5. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,包括逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 6. ArchiMate:开源建模语言,专门用于企业架构,支持逻辑视图创建,可与 Archi 工具配合使用。 7. Enterprise Architect:强大的建模、设计和生成代码工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 8. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 9. draw.io(现称为 diagrams.net):免费在线图表软件,允许创建各种类型图表,包括软件架构图,支持创建逻辑视图和部署视图等。 在选择工具时,您应考虑具体需求,比如是否需要支持特定建模语言、是否需要与特定开发工具集成、是否偏好在线工具或桌面应用程序等。请注意,虽然这些工具可以辅助创建架构视图,但它们不都是基于 AI 的。AI 在绘图工具中的应用通常涉及到智能推荐布局、自动生成图表代码或识别图表中的模式和关系。
2024-09-19
有什么工具能帮助我制作ppt里的逻辑图吗
以下是一些可以帮助您制作 PPT 里逻辑图的工具: 1. PlantUML:通过编写描述性文本自动生成序列图、用例图、类图等,有助于创建逻辑视图。 2. Gliffy:基于云的绘图工具,提供创建各种架构图的功能,包括逻辑视图和部署视图。 3. Archi:免费的开源工具,用于创建 ArchiMate 和 TOGAF 模型,支持逻辑视图的创建。 4. Rational Rose:IBM 的 UML 工具,支持创建多种视图,包含逻辑视图和部署视图。 此外,还有以下工具: 1. Lucidchart:流行的在线绘图工具,支持多种图表创建,如逻辑视图、功能视图和部署视图,可通过拖放界面轻松操作。 2. Visual Paradigm:全面的 UML 工具,提供创建各种架构视图的功能,包括逻辑视图(类图、组件图)、功能视图(用例图)和部署视图(部署图)。 3. ArchiMate:开源的建模语言,专门用于企业架构,支持逻辑视图的创建,可与 Archi 工具配合使用,该工具提供图形化界面创建 ArchiMate 模型。 4. Enterprise Architect:强大的建模、设计和生成代码的工具,支持创建多种架构视图,包括逻辑、功能和部署视图。 5. Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板用于创建逻辑视图、功能视图和部署视图等。 6. draw.io(现称为 diagrams.net):免费的在线图表软件,允许创建各种类型的图表,包括软件架构图,支持创建逻辑视图和部署视图等。 请注意,虽然这些工具可以辅助创建架构视图,但它们不都是基于 AI 的。AI 在绘图工具中的应用通常涉及到智能推荐布局、自动生成图表代码或识别图表中的模式和关系。在选择工具时,您应该考虑您的具体需求,比如是否需要支持特定的建模语言、是否需要与特定的开发工具集成、是否偏好在线工具或桌面应用程序等。
2024-09-19
制作修改简历的AI工具哪个好
以下是一些制作修改简历的 AI 工具推荐: 1. Kickresume 的 AI 简历写作器:使用 OpenAI 的 GPT4 语言模型自动生成简历,能为简历摘要、工作经验和教育等专业部分编写内容,并保持一致语调。 2. Rezi:受到超过 200 万用户信任的领先 AI 简历构建平台,使用先进的 AI 技术自动化创建可雇佣简历的每个方面,包括写作、编辑、格式化和优化。 3. Huntr 的 AI 简历构建器:提供免费的简历模板,以及 AI 生成的总结/技能/成就生成器和 AI 驱动的简历工作匹配。 更多 AI 简历产品,还可以查看这里:https://www.waytoagi.com/category/79 。您可以根据自己的需要选择最适合您的工具。 如果您是医学课题需要 AI 给出修改意见,可以考虑使用以下工具: 1. Scite.ai:为研究人员、学者和行业专业人员打造的创新平台,提供引用声明搜索、自定义仪表板和参考检查等工具,能简化学术工作。 2. Scholarcy:可以从文档中提取结构化数据,并通过知识归纳引擎生成文章概要,包含关键概念、摘要、学术亮点、学术总结、比较分析、局限等板块的内容。 3. ChatGPT:强大的自然语言处理模型,能提供有关医学课题的修改意见。 以下是一些内容仿写的 AI 工具推荐: 1. 秘塔写作猫:https://xiezuocat.com/ 写作猫是 AI 写作伴侣,能推敲用语、斟酌文法、改写文风,还能实时同步翻译。支持全文改写,一键修改,实时纠错并给出修改建议,智能分析文章的各类属性,为文章的正负情感、情绪强度和易读性打分。 2. 笔灵 AI 写作:https://ibiling.cn/ 是得力的智能写作助手,能写心得体会、公文、演讲稿、小说、论文等,支持一键改写/续写/扩写,智能锤炼打磨文字。 3. 腾讯 Effidit 写作:https://effidit.qq.com/ 由腾讯 AI Lab 开发的智能创作助手,能提升写作者的写作效率和创作体验。 更多 AI 写作类工具可以查看这里:https://www.waytoagi.com/sites/category/2 。请注意,内容由 AI 大模型生成,请仔细甄别。
2024-09-19
国内ai制作ppt的最好软件
在国内,AI 辅助制作 PPT 的软件中,爱设计 PPT 表现出色,是值得推荐的选择。 爱设计 PPT 不仅代表了当前国内 AI 辅助 PPT 制作的最高水平,还在不断进步,为用户提供越来越好的体验。它的成功有以下原因: 1. 拥有实力强大的团队,技术过硬且对市场需求有敏锐洞察力,能持续推动产品创新和进步。 2. 成功把握住 AI 与 PPT 结合的市场机遇,具备前瞻性的市场洞察力和快速的执行能力。 3. 已在国内 AI 生成 PPT 产品中确立了市场领先地位,反映了用户的高度认可。 对于经常需要制作 PPT 的人,无论是商务人士、教育工作者还是学生,爱设计 PPT 都能大大提高制作效率,保证高质量输出。随着 AI 技术的不断进步,爱设计 PPT 有望在未来带来更多惊喜的功能和性能提升,继续引领 AI 辅助 PPT 制作领域的发展。
2024-09-18
如何使用ai制作一个ppt课件
使用 AI 制作 PPT 课件可以按照以下步骤进行: 1. 生成 PPT 大纲:使用 GPT4 生成符合要求的 PPT 大纲,这可能需要花费较多时间来明确和优化大纲内容。 2. 一键生成 PPT:将大纲导入到 WPS 中,启用 WPS AI 一键生成 PPT。 3. 添加动画效果:使用 chatPPT 为 PPT 添加动画,增强观感和灵动性。 4. 手动修改细节:对生成的 PPT 进行手动修改,如调整字体、纠正事实性错误等。 此外,还有一些相关的 PPT 网站和应用可供选择,包括:SlidesAI、Decktopus AI、Tome、MagicSlides、Presentations.AI、Canva、Simplified、GlimmerAI、Sendsteps、Plus AI、Microsoft 365 Copilot、Gamma、Canva Magic Design、ChatGPT、Beautiful.AI 等。您还可以参考群友的实践教程,如熊猫 Jay 的相关内容(https://mp.weixin.qq.com/s/uVoIIcePa7WTx7GNqkAPA)。
2024-09-18
@ 用ai制作优美的歌曲用什么工具软件,详细的使用教程
以下是用 AI 制作优美歌曲的相关工具软件及使用教程: 工具软件: 1. Udio:由前 Google DeepMind 工程师开发,通过文本提示快速生成符合用户音乐风格喜好的高质量音乐作品。网址:https://www.udio.com/ 2. Suno AI:是一款革命性的人工智能音乐生成工具,它通过先进的深度学习技术,能够将用户的输入转化为富有情感且高质量的音乐作品。网址:https://suno.com/ 使用教程: 1. 导出时间轴歌词:使用剪映(剪辑软件),其导出时间轴歌词的功能位置如下图所示。 2. 音乐分轨:可以使用腾讯 QQ 音乐旗下的 TME Studio,支持一键分轨,再将分轨好的音频文件进行全部导出。TME Studio 网站链接:https://y.qq.com/tme_studio/ 3. 音频编辑:对于分轨好的视频,可以导入 Adobe Audition 进行编辑。有编曲经验的同学可以自由发挥,没有编曲经验的小白可以打开电脑的录屏工具,录制歌曲的工程文件,上传提供创作证明。 4. 准备音频素材: 使用干声转换时,在软件中分别导入人声干声和伴奏,放在两个轨道上。干声用于转成 MIDI 做 AI 演唱。 男歌女唱或者女歌男唱时,在导入前先进行变调。常用的工具包括 TME Studio(腾讯音乐开发的 AI 音频工具箱,其中最常用的是音频分离,可用于将人声和伴奏从歌曲中提取出来。地址:https://y.qq.com/tme_studio/index.html/editor)和 Vocalremover(包含音频分离、变调、BPM 查询等功能,使用较多的是变调和 BPM 查询。建议在准备素材阶段,就将音频调整到所需调,并获取到 BPM。地址:https://vocalremover.org/zh/keybpmfinder) 关于申请网易云音乐人和上传音乐,只提供了认证成功的方法和过程,不能确保所有人都能成功,这是一个概率性的问题。此外,根据 AI 创作目前的特殊性,会在平台上声明此音乐为 AI 创作,并且也绝对支持尊重所有原创作品,也希望平台能尽快开辟一个 AI 创作的专区,可以提供一个容纳并保护所有群体的不同板块。
2024-09-17
推荐一个做数字人直播的团队
以下为您推荐一些关于数字人直播的相关信息: 在电商领域,数字人直播带货可通过以下步骤实现: 1. 添加产品/介绍背景:若有自己的视频/图片素材可用自己的,没有则可根据搜索添加。 2. 扣像结合背景:在剪映里把数字人扣下来,导入视频,点击画面选择抠像,点击智能扣像,调整到合适大小和位置。 3. 添加字幕和音乐:智能识别字幕,可搜索或手动添加喜欢的音乐。 目前业界对数字人的定义尚未统一,一般根据技术栈不同分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,表现质量与手动建模精细程度及动捕设备精密程度直接相关,随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 在电商直播方面的探索结果: 1. 选择做电商直播并非因电商适合数字人,可能是前期宣传及未发现其他更好场景。 2. 数字人不能成为壁垒,配套的运营服务才是,续费客户多因服务而非数字人。 3. 店播中数字人直播效果较好,数据能与真人基本保持一致。 4. 建议商家别依赖数字人,单纯数字人甚至算不上辅助。 此外,还有几个领域数字人效果很棒,ROI 比电商还高。在店播场景下,实时互动必要性没那么高,多轮 AB 测效果差不多。 但目前直播可能需要收费,短视频可通过购买邮箱注册使用免费时长或直接购买会员版。 由于不清楚具体的团队推荐,以上信息供您参考,希望对您有所帮助。
2024-09-19
数字人直播
以下是关于数字人直播的相关信息: KreadoAI 的使用方法: 1. 点击上面的网址注册,可获得 120 免费 k 币,选择“照片数字人口播”功能。 2. 点击开始创作,选择自定义照片。 3. 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 4. 打开绿幕按钮,点击背景,可添加背景图。 5. 最后,点击生成视频。 AI 直播卖货适用品类和场景: 1. 适用于不需要强展示的商品,如品牌食品饮料;不适用于服装,因过品快且衣服建模成本高。 2. 适用于虚拟商品,如门票、优惠券等。 3. 不适用于促销场景,涉及主播话术、套路及调动直播间氛围能力等。 4. 电商直播分为达播跟店播,数字人直播在店播中的效果最好,数据基本能保持跟真人一样(朋友公司数据)。 数字人视频的整体制作流程: 大致分为三步: 1. 创建视频内容:通过输入文稿内容,确定数字人播出的内容。 2. 生成数字人:通过工具,以及视频内容生产数字人形象及播放语音。 3. AI 换脸:通过 AI 工具,将数字人的脸,转换成指定宣传的形象,以便以自己的品牌形式宣传。
2024-09-19
免费制作数字人程序
以下是免费制作数字人的方法: 1. 打开剪映,添加文本到文字轨道,修改好需要朗读的文字。 2. 点击朗读进行声音克隆,剪映的声音克隆现在只用念一句话就可完成。 3. 克隆完成后,选择喜欢的数字人形象,并把自己的克隆音色换上去。 4. 一键智能生成字幕,自行调整文字样式并校准。 在剪映中生成数字人的具体步骤: 1. 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”,将其添加到当前视频中,软件会根据提供的内容生成对应音视频并添加到轨道中,左下角会提示渲染完成时间,可点击预览查看效果。 2. 增加背景图片:删除先前导入的文本内容,为视频增加背景图片。点击左上角“媒体”菜单,点击“导入”按钮选择本地图片上传,点击图片右下角的加号将其添加到视频轨道上(会覆盖数字人)。 数字人“私有化”的方法: 1. 尽管剪映已有很多公模数字人,但私模数字人更受欢迎。可使用 AI 换脸软件完成最后一步。 2. 注意需要谷歌账号(淘宝或者在账号解决平台“”可直接购买)。 3. 第一步:打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的 URL 就会打开操作界面。 4. 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成。 5. 第三步:等待自己专属的数字人视频出炉。
2024-09-17
数字媒体艺术专业,毕设建筑浏览动画,灵感推荐
很抱歉,目前知识库中没有关于数字媒体艺术专业毕设建筑浏览动画灵感推荐的相关内容。但您可以从以下几个方面获取灵感: 1. 研究著名建筑大师的作品及其设计理念,从中汲取创意。 2. 观察不同文化和地域的特色建筑,将其独特元素融入动画。 3. 参考科幻电影或游戏中对未来建筑的想象和呈现方式。 4. 关注当下的建筑趋势,如绿色建筑、智能建筑等,从中获得启发。 5. 从自然景观中获取灵感,例如山脉、河流等的形态和韵律,运用到建筑的造型和布局中。
2024-09-14
数字媒体艺术专业,毕设做三维建筑浏览动画,灵感推荐
很抱歉,目前知识库中没有关于数字媒体艺术专业毕设做三维建筑浏览动画的灵感推荐相关内容。但您可以从以下几个方面获取灵感: 1. 研究不同风格的建筑,如现代主义、古典主义、后现代主义等,从中汲取设计元素和特点。 2. 观察自然景观,如山峦、水流、森林等,将自然元素融入建筑设计中。 3. 参考著名建筑师的作品,分析其创意和表现手法。 4. 从科幻电影、游戏中的虚拟建筑获取灵感,想象未来建筑的可能性。 5. 关注当下的城市发展和社会需求,思考如何通过建筑解决实际问题并展现创新理念。
2024-09-14
开源的数字人方案
以下是开源的数字人方案: 1. 第一步:先剪出音频,使用 https://elevenlabs.io/speechsynthesis 或使用 GPTsovits克隆声音,做出文案的音频。 2. 第二步:使用 wav2lip 整合包,导入视频和音频,对口型得到视频。基础 wav2lip+高清修复整合包下载地址为 https://github.com/Rudrabha/Wav2Lip 。这就是目前的本地跑数字人的方案,效果都差不多,都是用的 wav2lip 。产品为 https://synclabs.so/ 。 3. 构建数字人躯壳:笔者的开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。
2024-09-14