直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

推荐一个做二次元风格的数字人的软件

回答

以下为您推荐一些可用于制作二次元风格数字人的软件:

  1. Live2D Cubism(https://www.live2d.com/):这是一款 2D 引擎,风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,深受年轻人喜欢,能将喜欢的动漫人物变成数字人的躯壳。
  2. 剪映:虽然本身有很多公模数字人,但可以通过 AI 换脸软件(如按照以下步骤操作:第一步打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusion-colab 并点击 open colab 就进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的 URL 就会打开操作界面;第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成;第三步:等着自己专属的数字人视频出炉)来实现数字人的“私有化”。

此外,关于数字人的更多知识和操作,您还可以参考以下内容:

  • 建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署。
  • 笔者的开源数字人项目(项目地址:https://github.com/wan-h/awesome-digital-human-live2d)选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。

有关数字人使用上的问题,欢迎在底部评论区留言,一起交流。同时如果对数字人课程感兴趣的话,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程!

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AI 数字人-定义数字世界中的你

[title]AI数字人-定义数字世界中的你[heading2]二、如何构建高质量的AI数字人[heading4]2.1构建数字人躯壳数字人的躯壳就是建模过程,有多种构建方式:1.2D引擎风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢,毕竟能将喜欢的动漫人物变成数字人的躯壳,是一件很棒的事情。2D引擎的代表就是Live2D Cubism(https://www.live2d.com/)。1.3D引擎风格偏向超写实的人物建模,拟真程度高,定制化成本高,目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体(如下图,NextHuman(https://nexthuman.cn/))。3D引擎的代表是UE(Unreal Engine)、Unity,虚幻引擎MetaHuman等(个人学习在电脑配置和学习难度上有一定门槛。1.AIGC虽然AIGC的方式相比前两者省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持ID一致性,帧与帧的连贯性上会让人有虚假的感觉。如果项目对人物模型真实度要求没有那么高,可以使用这种方案(算法发展非常快,可能不久就会有连贯度很高的生成方式),典型的项目有wav2lip(https://github.com/Rudrabha/Wav2Lip)、video-retalking(https://github.com/OpenTalker/video-retalking)等。AIGC还有一个方向是直接生成2d/3d引擎的模型,而不是直接生成数字人的最终展示部分,但该方向还在探索中。得益于现有各类技术方案的成熟度,以往建模往往都是由专业的建模师完成工作,不久之后相信大家就可以通过一些生成算法快速生成自己的人物模型了。

AI 数字人-定义数字世界中的你

[title]AI数字人-定义数字世界中的你[heading2]二、如何构建高质量的AI数字人[heading4]2.1构建数字人躯壳建好的模型可以使用web前端页面(Live2D就提供了web端的SDK)或者Native的可执行程序进行部署,最后呈现在用户面前的是一个GUI。笔者的开源数字人项目(项目地址:https://github.com/wan-h/awesome-digital-human-live2d)选择了live2d作为数字人躯壳,因为这类SDK的驱动方式相比现在的AI生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于live2d的SDK驱动方式可以参考官方示例:https://github.com/Live2D。

方案:剪映数字人“个性化“—无限免费私模数字人

尽管剪映已经有很多公模数字人,但是从抖音上大火的数字人账号上看,私模数字人更受欢迎所以这里我将教大家用AI换脸软件来完成最后一步。📍注意:需要谷歌账号(淘宝或者在我们账号解决平台“[有号](https://www.learnprompt.pro/aiMarket)”就可以直接购买)1.第一步打开谷歌浏览器,点击链接https://github.com/facefusion/facefusion-colab并点击open colab就进到程序主要运行界面.在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的URL就会打开操作界面2.第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成!反复调试后给大家选出了最佳参数!1.第三步:等着自己专属的数字人视频出炉!有关数字人使用上的问题,欢迎在底部评论区留言,一起交流~同时如果对数字人课程感兴趣的话,欢迎查看通往AGI之路X AI沃茨的《克隆你自己》课程!📌课程内容:[实战课程:数字人课程](https://waytoagi.feishu.cn/wiki/JOWjwM0qfi2rYVkUIwychk9MnSh)🎉在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0 🌍:aiwarts101

其他人在问
如何制作AI二次元动画
以下是一些关于制作 AI 二次元动画的方法和资源: 1. 您可以参考视频“”,其步骤为:通过 Midjourney 生成图像后,使用 let's enhance.io 增强图像质量,然后使用 Monster Mash 将图像转换为 3D,再导入 Cinema 4D 进行材质、光影以及场景布置,最后使用 After Effects 进行渲染和处理。 2. 对于构建数字人躯壳,开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择了 live2d 作为数字人躯壳,这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎等驱动方式又更加轻量和简单。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D。 3. 如果您想制作 AI 海报,可使用无界 AI(网址:https://www.wujieai.cc/),其做图逻辑类似于 SD,优势在于国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。在制作二次元风格海报时,可选择皮克斯卡通模型,设定相关关键词类别,如场景(向日葵花田、面包店等)、氛围(温馨、温暖等)、人物(父亲和女儿、父亲和儿子等)、造型(发型、发色、服饰、配饰等)、情绪(笑得很开心、大笑、对视等)、道具(童话书等)、构图(半身、中景等)、画面(色彩明艳)等。
2024-10-05
如何用midjourney生成等距视角的,二次元画风的 房间内饰参考设计图
以下是使用 Midjourney 生成等距视角、二次元画风的房间内饰参考设计图的一些方法和关键词示例: 1. 欧式风格:Interior Design,European style,home with desk,lamp,bookshelf,wooden board 2. 极简风格:Minimalist style,floortoceiling Windows,living room,Architecture 3. 独有风格(Explode 艺术家):Explode+物体描述词+by Nychos(这位艺术家画风具有放射性) 4. 字符艺术:描述物体+ASCII art 5. 欧普艺术:Op art portrait+描述文字 6. 粘土风格(图标):Tiny cute isometric(等距)+(物体)+maxemoji,soft lightingsoft pastel colors+3Dicon+clay+blender 3d+名人画风(或者背景颜色) 需要注意的是: 1. 等距+物体+maxemoji,soft lightingsoft pastel colors/pastel background+3Dicon+clay+blender 3d+背景颜色=等距粘土物体 2. yasuko blythe dolls(安子布莱斯娃娃/也可以换成其他知道的娃娃名称)+灯光/颜色/背景/材质+clay(粘土)+style Yoshitomo Nara(良奈吉友画风/或者其他名人风格)=人偶
2024-08-14
如何用ai输入二次元风格的提示词
二次元风格通常指的是源自日本的动漫、漫画和游戏文化中的视觉艺术风格。使用AI生成二次元风格的提示词,您可以遵循以下步骤: 1. 确定主题: 确定您想要的二次元风格的主题,比如是校园生活、幻想世界、科幻未来等。 2. 了解风格特点: 研究二次元风格的特点,包括角色设计(如大眼睛、多彩发色)、服饰风格、场景构图等。 3. 使用描述性语言: 使用描述性的语言来表达您想要的风格,比如“穿着日本高中制服的少女,背景是樱花盛开的校园”。 4. 利用AI工具: 使用支持文本到图像的AI工具,如DALLE、Stable Diffusion或Midjourney等,这些工具可以根据文本提示生成图像。 5. 输入提示词: 在AI工具中输入您的提示词,可以包括角色特征、环境元素、动作等,越详细越好。 6. 调整和优化: 根据生成的图像结果,调整提示词,增加或减少描述的细节,以达到最佳效果。 7. 使用专业术语: 如果可能,使用一些二次元文化中的专业术语,比如“傲娇”、“御姐”、“萌”等,这可以帮助AI更准确地理解您的需求。 8. 考虑情感和氛围: 二次元作品常常带有特定的情感和氛围,比如“温馨的日常场景”或“激烈的战斗场面”,在提示词中包含这些元素。 9. 迭代过程: 生成图像后,根据结果反复迭代您的提示词,直到获得满意的风格。 10. 获取反馈: 如果可能,从二次元社区获取反馈,看看您的提示词是否能够准确地传达您想要的风格。 例如,如果您想生成一个二次元风格的女战士形象,您的提示词可能是:“一个身穿未来机甲的女战士,手持光剑,背后是战争废墟的末世城市,眼神坚定。” 记住,不同的AI工具可能对提示词的理解和反应不同,所以实验和迭代是得到理想结果的关键。
2024-07-22
midjourney如何画二次元
Midjourney 是一个强大的 AI 图像生成工具,它支持多种风格和类型的图像创作,包括二次元风格的绘画。以下是使用 Midjourney 绘制二次元图像的一些基本步骤和技巧: 1. 了解二次元风格: 二次元通常指的是具有特定风格的日本动漫和漫画中的艺术形式。了解这种风格的特点是开始创作之前的重要步骤。 2. 使用正确的参数: Midjourney 支持多种参数来控制图像的生成。对于二次元风格,可以使用特定的参数,如 `v 5`(选择模型版本)和 `ar 16:9`(设置图像宽高比)。 3. 利用Niji模式: Midjourney 提供了一个名为 Niji 的二次元模型,专门为生成动漫风格的图像而设计。通过在命令中添加 `v 5 ar 2:3 stylize 500 q 2 ar 16:9` 参数,可以激活 Niji 模型。 4. 构建详细的提示词(Prompt): 提示词是告诉 Midjourney 你想要的图像类型和风格的关键。例如,如果你想生成一个穿着校服的二次元少女,你的提示词可能是 `"a school uniform anime girl with big eyes and long flowing hair"`。 5. 使用图生图(ImagetoImage): 如果你有一张现有的二次元图像,并且想要用 Midjourney 进行编辑或改进,可以使用图生图功能。上传你的图像并提供相应的提示词来指导 AI。 6. 调整权重和风格: 通过调整不同元素的权重,可以控制生成图像的特定方面,如颜色、细节或风格。 7. 迭代和实验: 由于 AI 生成图像的过程涉及随机性,可能需要多次尝试和调整提示词来获得最佳结果。 8. 学习社区和教程: 加入 Midjourney 社区,查看其他艺术家的作品和教程,这可以提供灵感和学习的机会。 9. 参考官方教程和资源: Midjourney 的官方文档和教程是学习如何使用该工具的宝贵资源。 10. 审美提升: 观看推荐的电影和阅读推荐的书籍可以提升你对二次元风格的审美和理解。 请记住,生成理想的二次元图像可能需要一些实验和练习,但随着时间的推移,你将能够更好地掌握 Midjourney 的使用,并创作出令人满意的作品。
2024-05-12
ai剪辑软件
以下是为您介绍的一些 AI 剪辑软件: 11labs:英文效果较好,但无法使用语速、情绪调节等控件,只能通过标点符号改变语音效果。官网:https://elevenlabs.io/ 出门问问的魔音工坊:国内可用,有情绪调节控件。 剪映:对于 1 3 分钟的短片较为方便,有很多人性化设计及简单音效库/小特效,但无法协同工作和导出工程文件。 Opusclip:可利用长视频剪成短视频。 Raskai:能将短视频素材直接翻译至多语种。 InvideoAI:输入想法可自动生成脚本和分镜描述,进而生成视频,之后人工二编合成长视频。 Descript:屏幕/播客录制后以 PPT 方式做视频。 Veed.io:自动翻译自动字幕。 Clipchamp:微软的 AI 版剪映。 Typeframes:类似 InvideoAI,内容呈现文本主体比重更多。 关于剪辑流程: 视频粗剪:先确定画面逻辑,声音可作部分参考,等画面确定后再制作和精调。画面不需要精美,先对片子全貌有整体把握,再调整和替换素材。 视频定剪:将画面素材调整和替换到满意效果。 音效/音乐:以剪映为例,有简单音效库,复杂真实音效可能需另外制作。音乐商用要注意版权。 特效:以剪映为例,可加一些光的效果。 包装(如字幕):字幕最后上,剪映可智能匹配字幕再修改。 另外,为您推荐一些剪辑相关的书籍。
2024-10-24
有什么辅助写作的ai软件
以下是一些辅助写作的 AI 软件: 邮件写作: Grammarly:提供语法检查、拼写纠正、风格建议和语气调整等功能,易于使用,支持多种平台,适用于多种语言。网站:https://www.grammarly.com/ Hemingway Editor:简化句子结构,提高可读性,标记复杂句和冗长句,界面简洁,重点突出,适用于改善写作风格和简洁性。网站:http://www.hemingwayapp.com/ ProWritingAid:全面的语法和风格检查,提供详细的写作报告和建议,功能强大,支持多种平台和集成,特别适合专业写作者。网站:https://prowritingaid.com/ Writesonic:基于 AI 生成各种类型的文本,包括电子邮件、博客文章、广告文案等,生成速度快,适合需要快速创作和灵感的用户。网站:https://writesonic.com/ Lavender:专注于邮件写作优化,提供个性化建议和模板,帮助用户提高邮件打开率和回复率。 论文写作: 文献管理和搜索: Zotero:结合 AI 技术,自动提取文献信息,帮助管理和整理参考文献。 Semantic Scholar:AI 驱动的学术搜索引擎,提供文献推荐和引用分析。 内容生成和辅助写作: Grammarly:提供文本校对、语法修正和写作风格建议,提高语言质量。 Quillbot:基于 AI 的重写和摘要工具,精简和优化论文内容。 研究和数据分析: Google Colab:提供基于云的 Jupyter 笔记本环境,支持 AI 和机器学习研究,便于进行数据分析和可视化。 Knitro:用于数学建模和优化,进行复杂的数据分析和模型构建。 论文结构和格式: LaTeX:结合自动化和模板,高效处理论文格式和数学公式。 Overleaf:在线 LaTeX 编辑器,提供丰富模板库和协作功能,简化编写过程。 研究伦理和抄袭检测: Turnitin:广泛使用的抄袭检测工具,确保论文原创性。 Crossref Similarity Check:检测潜在抄袭问题。 代码写作或辅助编程: GitHub Copilot:支持和兼容多种语言和 IDE,为程序员快速提供代码建议。 通义灵码:提供行级/函数级实时续写、自然语言生成代码等能力。 CodeWhisperer:为开发人员实时提供代码建议。 CodeGeeX:基于 130 亿参数的预训练大模型,快速生成代码。 Cody:借助 Sourcegraph 强大的代码语义索引和分析能力。 CodeFuse:基于蚂蚁集团自研的基础大模型进行微调的代码大模型。 Codeium:提供代码建议、重构提示和代码解释。 更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能会有所不同,您可以根据自己的需求选择最适合的工具。
2024-10-23
用什么软件让照片说话
以下是一些可以让照片说话的软件及相关信息: Sadtalker: 开源程序,可独立使用或作为插件放入 stablediffusion。 相关链接:https://github.com/OpenTalker/SadTalker 。 整合包:夸克网盘分享的「EZAIStarterv0.9.8.zip」,链接:https://pan.quark.cn/s/1d5ca9f57f5c 。 视频教程:https://www.bilibili.com/video/BV1Dc411W7V6/?vd_source=35e62d366d8173e12669705f7aedd122 。 具体步骤:点我启动,在启动界面中选择音频、图像口型同步的下载图标;下载完毕后启动应用,会弹出独立窗口;选择 sadtalker 同步器,分别导入图片和声音,根据需求选择图片预处理方式,点击 generate ,由于涉及视频推理和转换,需做好等待准备。 生成视频长度与音频一致,制作长视频建议剪成小段分别推理后合并。 HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片;上传后效果在 My Avatar 处显示上传的照片;点开大图后,点击 Create with AI Studio ,进入数字人制作;写上视频文案并选择配音音色,也可以自行上传音频;最后点击 Submit ,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法:点击上面的网址,点击右上角的 Create vedio ;选择人物形象,可以点击 ADD 添加照片,或者使用 DID 给出的人物形象;配音时,可以选择提供文字选择音色,或者直接上传一段音频;最后,点击 Generate vedio 就可以生成一段视频;打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很 AI 。 使用方法:点击上面的网址,注册后获得 120 免费 k 币,选择“照片数字人口播”的功能;点击开始创作,选择自定义照片;配音时,可以选择提供文字选择音色,或者直接上传一段音频;打开绿幕按钮,点击背景,可以添加背景图;最后,点击生成视频。
2024-10-22
国外可以自动生成ppt的ai网站或ai软件
以下是一些国外可以自动生成 PPT 的 AI 网站或软件: Gamma:在各种交流群中被频繁推荐,以卓越的性能和用户体验赢得广泛认可。即使是免费版本,也能生成质量很高的 PPT。从个人使用体验来看,其在内容组织、设计美观度和整体专业感方面都表现出色。网址:https://gamma.app/ 此外,还有一些其他好用的 AI PPT 工具: 美图 AI PPT:由知名图像编辑软件“美图秀秀”的开发团队推出,允许用户通过输入简单的文本描述来生成专业的 PPT 设计,包含丰富的模板库和设计元素。网址:https://www.xdesign.com/ppt/ Mindshow:一款 AI 驱动的 PPT 辅助工具,提供一系列智能设计功能,如自动布局、图像选择和文本优化等,还可能包括互动元素和动画效果。网址:https://www.mindshow.fun/
2024-10-21
哪个软件做出来的数字人最好
以下是一些制作数字人效果较好的软件及相关介绍: 剪映: 优势:作为字节跳动旗下产品,在抖音平台广泛应用,海外版 CapCut 成绩斐然。具有声音克隆、公模数字人等 AI 功能,能在编辑器内完成脚本生成、语音克隆、数字人口播等环节。 制作流程:打开剪映,添加文本到文字轨道并修改文字,点击朗读进行声音克隆,选择数字人形象并换上克隆音色,一键智能生成字幕并调整文字样式。 生成数字人:在右侧窗口顶部打开“数字人”选项,选取免费合适的形象,软件会播放声音供判断,添加后可预览效果。还可增加背景图片等进行美化。 下载地址: Heygen: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片,上传后效果在 My Avatar 处显示,点开大图后,点击 Create with AI Studio 进入制作,写上视频文案并选择配音音色,也可自行上传音频,最后点击 Submit 得到数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:免费版下载后有水印。 使用方法:点击网址,点击右上角的 Create vedio,选择人物形象,可添加自己照片或使用给出的形象,配音时可选择提供文字选择音色或直接上传音频,最后点击 Generate vedio 生成视频,打开可下载或分享。 KreadoAI: 优点:免费,功能齐全。 缺点:音色较 AI。 使用方法:点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”功能,点击开始创作,选择自定义照片,配音时可选择提供文字选择音色或直接上传音频,打开绿幕按钮,点击背景添加背景图,最后点击生成视频。
2024-10-20
哪些软件可以做数字人
以下是一些可以制作数字人的软件: 1. 剪映:在剪映右侧窗口顶部打开“数字人”选项,可选取免费且适合的数字人形象,如“婉婉青春”。添加数字人后,软件会生成对应音视频并添加到当前视频中,还可进行增加背景图片等操作。 2. HeyGen:这是一个 AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 3. Synthesia:这是一个 AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 4. DID:这是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化。在使用时,请遵守相关使用条款和隐私政策,并注意生成内容的版权和伦理责任。 此外,还可以通过以下方式实现数字人的“私有化”: 尽管剪映已有很多公模数字人,但私模数字人更受欢迎。可以使用 AI 换脸软件来完成,具体步骤如下: 1. 第一步:打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”,无需安装和付费。点击红框对应的 URL 打开操作界面。 2. 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成。 3. 第三步:等待专属的数字人视频出炉。 有关数字人使用上的问题,欢迎在底部评论区留言交流。同时如果对数字人课程感兴趣,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程。 在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0
2024-10-20
如何生成数字人
以下是生成数字人的方法和相关工具: 方法: 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,左下角会提示渲染完成时间,之后可点击预览查看效果。 增加背景图片:删除先前导入的文本内容,点击左上角“媒体”菜单并导入本地图片,将图片添加到视频轨道上,可调整图片位置、大小和显示时长。 增加字幕:点击文本智能字幕识别字幕,软件会自动将文字智能分段形成字幕,完成后可点击右上角“导出”按钮导出视频备用。 工具: HeyGen:AI 驱动的平台,可创建逼真的数字人脸和角色,适用于游戏、电影和虚拟现实等应用。 Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 DID:上传人像照片和输入内容,平台的 AI 语音机器人将自动转换成语音并合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关条款和政策,并注意版权和伦理责任。
2024-10-23
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货。其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 2. 算法驱动的数字人: 相关算法开源代码仓库众多,如 ASR 语音识别方面有 openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition);AI Agent 方面大模型包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可用 LangChain 模块自定义(https://www.langchain.com/);TTS 方面有微软的 edgetts(https://github.com/rany2/edgetts)、VITS(https://github.com/jaywalnut310/vits)、sovitssvc(https://github.com/svcdevelopteam/sovitssvc)。 人物建模模型可通过手动建模(音频驱动)或 AIGC 方式生成人物动态效果(如 wav2lip 模型),但这种简单构建方式存在诸多问题,如如何生成指定人物声音、TTS 生成的音频如何精确驱动数字人口型及动作、数字人如何使用知识库做出专业回答等。
2024-10-23
数字员工
数字员工是一种通过 AI 智能体实现的为个人提效的方式。在 WaytoAGI 的分享中,大聪明(赛博禅心作者)认为,AI 智能体就如同个人拥有的数字员工,您可以不断向其下达任务,就像老板给员工下达任务一样。每个数字员工有不同的特点和能力,下达任务时目标是否清晰以及能否被理解很重要,这考验写提示词的能力。数字员工会基于对目标的理解,按照计划不断尝试完成,并适时寻求反馈。例如句子互动就在打造大模型驱动的领先数字员工。
2024-10-21
AI数字主播
以下是关于 AI 数字主播的相关内容: 节目单方面: 节目单 1.3 中包含了多种传统艺术与 AI 技术结合的节目,如新式变脸换装秀,需要绿幕、大量服装和好身材演员,存在缺服装和场地、缺换脸大佬的问题;剪纸/皮影戏/花灯,需要传统文化串烧脚本、AI 图片诠释、AI 视频空镜和脚本串词,有想法但无人认领。 节目单 1.2 中有 AIGC 技术短片,涉及 AI 转绘和 AI 蒙版抠图等技术;AIGC 温情短片,以叙事为主;原创 RAP,包括原创 RAP、AI Raper 和视频驱动;经典节目再现,需考虑形式;猜真人,属于魔术互动类表演,涉及数字人及 AI 数字人,可参考 heygen 官网视频。 Character.ai 方面:其愿景是让每个人都能获得深度个性化超级智能,例如授课教师、游戏玩家、情感伴侣等服务都可被 AI 重构。在教育培训领域,借助大型语言模型,人工智能生成的角色可作为数字教师,如让牛顿、白居易授课,能实现一对一辅导,提供定制化学习计划和资源,提高教育效率和质量,缓解教育资源不平等问题。还可作为数字陪伴促进儿童成长。
2024-10-21
相同风格的图片进行二创
以下是关于相同风格图片进行二创的相关知识: DALLE 中: 每次通过 Prompt 生成图像时,都会随机选取一个 Seed 值。使用同样的 Prompt 和 Seed 值,能生成相同或相似的图片。 您可以自己测试效果,步骤如下: 1. 新开一个对话,使用 Prompt 让 DALLE 画图,要求提供 Seed。 2. 查看图片的 Prompt 并复制。 3. 在当前对话输入上一条 Prompt,另起一行输入“Use seed number '您在第一步拿到的 Seed'”。 Tusiart 中: 生图入口有以下几种: 1. 网页顶部的右方有生图按钮,点击进入生图界面。 2. 点进首页任意一个模型(checkpoint 或 lora),有运行按钮。 3. 点进任意一个模型下面的返图区(相关帖子),点开一张喜欢的图片,右侧有做同款的按钮。点开之后可以选择自动复制所有设置,尝试复现图片。 Midjourney 中: Midjourney 会用一个种子号来绘图,把这个种子作为生成初始图像的起点。种子号随机生成,但可以使用Seed 或same eseed 参数指定。使用相同的种子号和提示符将产生类似的结尾图片。默认情况下种子随机,若想要相似的图,需固定 seed。比如“caiyunyiueji is a cute sports anime girl,style by Miyazaki Hayao,emoji,expression sheet,8k seed 8888”就能保证每次生成一样的图。还可以利用确定图片的 seed 加上新的关键词对效果图进行微调。
2024-10-23
我有张动漫风格图片,有什么 ai 可以仿制出来吗,我要的是在网页就可以直接使用 门槛低的 我是小白
以下为您推荐一些门槛低、可在网页直接使用的仿制动漫风格图片的 AI 工具和网站: 吐司网站:首页最上方有对话生图的快速入口,输入想画的文字或点击随机提示词,点击“对话生图”即可出图。站内所有帖子均可“一键做同款”,还有“今日灵感”提供绘画想法。有多种模型、lora 可供选择,如写实、2.5D、二次元等,涵盖风格、元素、形象等。还有控制线条、深度、姿态、语义、风格迁移等的 Controlnet 功能。同时有扩图、高清修复、去背景等多个设计小工具,以及趣味玩法和风格滤镜,一键真人转动漫,包括韩漫、日漫风格。使用小工具前请阅读标题和详情页描述。 扣子网站:输入一个关键词,会直接生成 4 张包含金句的图片。整个工作流程包括用户输入关键词,大模型制作金句,根据金句生成画面描述,结合描述和关键词使用插件生成图片,再用图像流结合金句和图片。但扣子官方的画图工具绘制小林漫画风格效果不佳,可尝试使用 MJ 等工具绘制小林漫画风格。
2024-10-21
我有一张动漫风格的图片,希望可以生成类似的图片
以下是为您生成类似动漫风格图片的方法和相关信息: 方法一: 使用大模型和 lora 的组合。 大模型:“Flat2D Animerge”,适合生成卡通动漫图片,官方建议 CFG 值在 5 或 6(使用动态阈值修复时可拉到 11)。 lora:“Chinese painting style”可增加中国画水彩风格效果,权重设置为 0.4;“Crayon drawing”可添加简单线条和小孩子的笔触,权重设置为 0.8。 操作步骤:将图片丢到标签器中反推关键词,发送到“文生图”。在正向提示词末尾添加上述 lora,设置好尺寸,重绘幅度开 0.5(若想更接近原图可降低数值)。将图放入 controlnet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。 方法二: 利用 DALLE 中的 Seed 值。 DALLE 每次通过 Prompt 生成图像时会随机选取一个 Seed 值。使用同样的 Prompt 和 Seed 值能生成相同或相似的图片。您可以按照以下步骤进行测试: 1. 新开一个对话,随便使用一个 Prompt 让 DALLE 画图,要求提供 Seed。 2. 查看图片的 Prompt 并复制。 3. 在当前对话输入上一条 Prompt,另起一行输入“Use seed number '您在第一步拿到的 Seed'”。 好用的图生图产品: 目前比较成熟的产品主要有: 1. Artguru AI Art Generator:在线平台,生成逼真图像,为设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,将图片转换为非凡肖像,有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果很好。 但这些 AI 模型仍存在一些局限,如偶尔性能不稳定、生成内容不当等问题,使用时请仔细甄别。
2024-10-21
deforum中初始化为什么不能以视频路径的视频进行风格转变?而是随机生成新视频?是哪里出现了问题?
很抱歉,目前知识库中没有关于“deforum 中初始化不能以视频路径的视频进行风格转变,而是随机生成新视频的原因及问题所在”的相关内容。但一般来说,出现这种情况可能是由于以下原因: 1. 视频格式或编码不兼容:deforum 可能不支持您所提供的视频的特定格式或编码方式。 2. 参数设置错误:可能在初始化过程中的某些参数设置不正确,导致无法按照预期使用指定视频进行风格转变。 3. 软件版本问题:您使用的 deforum 版本可能存在缺陷或不具备该功能。 建议您检查视频格式和编码,确认参数设置是否正确,并尝试更新到最新版本的 deforum 以查看是否能解决问题。
2024-10-18
AI视频转视频风格
以下是一些关于 AI 视频转视频风格的相关信息: DomoAI 主打风格转绘,效果稳定,支持多种风格如动画风、粘土风、折纸风、像素风,还能根据参考图切换视频风格,与开源模型中 IPAdapter 的能力相似。每个账号仅有 15 个免费 credits,仅能生成 3s 视频。网页版访问:https://domoai.app/ ,官方推特:https://x.com/DomoAI_ 。输入任意图片和视频,可实现人脸替换、视频风格切换。博主 Framer 曾用其制作多个 AI 动画视频,通过人物动作拍摄➡️ Runway 绿幕抠像➡️ DomoAI 转绘➡️ MJ 绘制背景图➡️分图层动画剪辑能快速出效果。在 AI 技术无法精确生成目标动作时,实拍转绘+简单后期剪辑是更易产出效果的做法。 ComfyUI AnimateDiff 可进行 vid2vid 视频转换,使用 ControlNet 的 Openpose 和 Depth 功能转换视频风格。详细步骤可参考:https://note.com/bakushu/n/n502fca61423b 。
2024-10-18
转换图片风格
以下为您介绍两种转换图片风格的方法: 方法一:使用 SDXL Prompt Styler 插件 SDXL Prompt Styler 是一个集成近百种风格的 ComfyUI 插件。其核心节点是 SDXL Prompt Styler 插件+ControlNet,以达到风格转化的结果。插件的 style 中有近百种风格预设可供选择,例如 sai3dmodel(3D 模型)、saianalog film(胶片电影)、sailowpoly(低面)、gamezelda(塞尔达)、gamemario(马里奥)、artstyleimpressionist(印象派)等。 插件的原理是在 prompt 中加入各风格预设好的关键词组合。通过在 SDXL Prompt Styler 节点后增加一个 Show Text 的节点,运行后可看到具体工作方式。 对于不同对象进行风格转绘时,需要合理平衡 controlnet 的组合和参数。例如转绘成折纸风时,最好不要加入线稿边缘(canny)的 controlnet 控制,或者需把 canny 的控制强度(strength)调到较小。若想转成漫画风格并较好保留人物外轮廓,则加入 canny 控制。 有时直接用插件内置预设的提示词组合不一定能达到想要的效果,此时需要在 prompt 中添加更多相关风格的关键词。 此外,该工作流结合 Vid2Vid Style Transfer with IPA & Hotshot XL 工作流,可较好实现视频不同风格的稳定转绘。 方法二:大模型和 lora 的组合运用 使用大模型“Flat2D Animerge”和两个 lora,即“Chinese painting style”和“Crayon drawing”的组合,可以生成简笔水彩风格的插画。 首先将图片丢到标签器中反推出关键词,然后发送到“文生图”。在正向提示词的末尾添加这两个 lora,“Chinese painting style”权重设置为 0.4,“Crayon drawing”权重设置为 0.8。尺寸按照参考图设置好,重绘幅度开 0.5 可让 AI 更自由发挥,若想和原图更接近,可降低数值。将图放入 controlnet 中,选择 tile 模型,权重为 0.5,控制模式选择“更注重提示词”。这里的权重主要影响画面复杂度,数值越高,细节越多,数值太低会和图像差得较远。点击生成即可完成简笔水彩风格的插画。
2024-10-15