Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

推荐一个做二次元风格的数字人的软件

Answer

以下为您推荐一些可用于制作二次元风格数字人的软件:

  1. Live2D Cubism(https://www.live2d.com/):这是一款 2D 引擎,风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,深受年轻人喜欢,能将喜欢的动漫人物变成数字人的躯壳。
  2. 剪映:虽然本身有很多公模数字人,但可以通过 AI 换脸软件(如按照以下步骤操作:第一步打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusion-colab 并点击 open colab 就进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的 URL 就会打开操作界面;第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成;第三步:等着自己专属的数字人视频出炉)来实现数字人的“私有化”。

此外,关于数字人的更多知识和操作,您还可以参考以下内容:

  • 建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署。
  • 笔者的开源数字人项目(项目地址:https://github.com/wan-h/awesome-digital-human-live2d)选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。

有关数字人使用上的问题,欢迎在底部评论区留言,一起交流。同时如果对数字人课程感兴趣的话,欢迎查看通往 AGI 之路 X AI 沃茨的《克隆你自己》课程!

Content generated by AI large model, please carefully verify (powered by aily)

References

AI 数字人-定义数字世界中的你

[title]AI数字人-定义数字世界中的你[heading2]二、如何构建高质量的AI数字人[heading4]2.1构建数字人躯壳数字人的躯壳就是建模过程,有多种构建方式:1.2D引擎风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢,毕竟能将喜欢的动漫人物变成数字人的躯壳,是一件很棒的事情。2D引擎的代表就是Live2D Cubism(https://www.live2d.com/)。1.3D引擎风格偏向超写实的人物建模,拟真程度高,定制化成本高,目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体(如下图,NextHuman(https://nexthuman.cn/))。3D引擎的代表是UE(Unreal Engine)、Unity,虚幻引擎MetaHuman等(个人学习在电脑配置和学习难度上有一定门槛。1.AIGC虽然AIGC的方式相比前两者省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持ID一致性,帧与帧的连贯性上会让人有虚假的感觉。如果项目对人物模型真实度要求没有那么高,可以使用这种方案(算法发展非常快,可能不久就会有连贯度很高的生成方式),典型的项目有wav2lip(https://github.com/Rudrabha/Wav2Lip)、video-retalking(https://github.com/OpenTalker/video-retalking)等。AIGC还有一个方向是直接生成2d/3d引擎的模型,而不是直接生成数字人的最终展示部分,但该方向还在探索中。得益于现有各类技术方案的成熟度,以往建模往往都是由专业的建模师完成工作,不久之后相信大家就可以通过一些生成算法快速生成自己的人物模型了。

AI 数字人-定义数字世界中的你

[title]AI数字人-定义数字世界中的你[heading2]二、如何构建高质量的AI数字人[heading4]2.1构建数字人躯壳建好的模型可以使用web前端页面(Live2D就提供了web端的SDK)或者Native的可执行程序进行部署,最后呈现在用户面前的是一个GUI。笔者的开源数字人项目(项目地址:https://github.com/wan-h/awesome-digital-human-live2d)选择了live2d作为数字人躯壳,因为这类SDK的驱动方式相比现在的AI生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于live2d的SDK驱动方式可以参考官方示例:https://github.com/Live2D。

方案:剪映数字人“个性化“—无限免费私模数字人

尽管剪映已经有很多公模数字人,但是从抖音上大火的数字人账号上看,私模数字人更受欢迎所以这里我将教大家用AI换脸软件来完成最后一步。📍注意:需要谷歌账号(淘宝或者在我们账号解决平台“[有号](https://www.learnprompt.pro/aiMarket)”就可以直接购买)1.第一步打开谷歌浏览器,点击链接https://github.com/facefusion/facefusion-colab并点击open colab就进到程序主要运行界面.在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的URL就会打开操作界面2.第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成!反复调试后给大家选出了最佳参数!1.第三步:等着自己专属的数字人视频出炉!有关数字人使用上的问题,欢迎在底部评论区留言,一起交流~同时如果对数字人课程感兴趣的话,欢迎查看通往AGI之路X AI沃茨的《克隆你自己》课程!📌课程内容:[实战课程:数字人课程](https://waytoagi.feishu.cn/wiki/JOWjwM0qfi2rYVkUIwychk9MnSh)🎉在线观看第一节:https://www.bilibili.com/video/BV1yw411E7Rt/?spm_id_from=333.999.0.0 🌍:aiwarts101

Others are asking
AI画二次元头像的软件或网站
以下是一些可以用于绘制二次元头像的软件或网站: 1. 无界 AI: 网址:https://www.wujieai.cc/ 新用户扫码注册可领取积分。 基础关键词: 二次元插画:画面质量为大师作品、最佳质量、精致细节、高细节、完美的脸;画面内容为少女、云朵、夏日、蓝天、海洋、;风格控制为可爱风格;背景控制为蓝色背景、纯色背景、简单背景。 平面构成:平面艺术、平面构成、几何线条、红蓝。 参数设置: 模型选择:风格模型或通用模型。 画面大小:3:4 社交媒体(推荐竖构图)。 底模选择:二次元→动感涂鸦;模型主题:写实插画;风格选择:Glitch 艺术+街头涂鸦。 2. 无界 AI 还可用于快速制作海报,其做图逻辑类似于 SD,优势在于国内网络即可稳定使用、有免费出图点数、支持中文关键词输入、无需额外下载风格模型,可直接取用。使用模型如皮克斯卡通,本案例中朋友圈 po 图的画幅比例选择 1:1。关键词类别包括场景、氛围、人物、造型、情绪、道具、构图、画面、特殊等方面。
2024-12-04
如何制作AI二次元动画
以下是一些关于制作 AI 二次元动画的方法和资源: 1. 您可以参考视频“”,其步骤为:通过 Midjourney 生成图像后,使用 let's enhance.io 增强图像质量,然后使用 Monster Mash 将图像转换为 3D,再导入 Cinema 4D 进行材质、光影以及场景布置,最后使用 After Effects 进行渲染和处理。 2. 对于构建数字人躯壳,开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择了 live2d 作为数字人躯壳,这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎等驱动方式又更加轻量和简单。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D。 3. 如果您想制作 AI 海报,可使用无界 AI(网址:https://www.wujieai.cc/),其做图逻辑类似于 SD,优势在于国内网络即可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。在制作二次元风格海报时,可选择皮克斯卡通模型,设定相关关键词类别,如场景(向日葵花田、面包店等)、氛围(温馨、温暖等)、人物(父亲和女儿、父亲和儿子等)、造型(发型、发色、服饰、配饰等)、情绪(笑得很开心、大笑、对视等)、道具(童话书等)、构图(半身、中景等)、画面(色彩明艳)等。
2024-10-05
如何用midjourney生成等距视角的,二次元画风的 房间内饰参考设计图
以下是使用 Midjourney 生成等距视角、二次元画风的房间内饰参考设计图的一些方法和关键词示例: 1. 欧式风格:Interior Design,European style,home with desk,lamp,bookshelf,wooden board 2. 极简风格:Minimalist style,floortoceiling Windows,living room,Architecture 3. 独有风格(Explode 艺术家):Explode+物体描述词+by Nychos(这位艺术家画风具有放射性) 4. 字符艺术:描述物体+ASCII art 5. 欧普艺术:Op art portrait+描述文字 6. 粘土风格(图标):Tiny cute isometric(等距)+(物体)+maxemoji,soft lightingsoft pastel colors+3Dicon+clay+blender 3d+名人画风(或者背景颜色) 需要注意的是: 1. 等距+物体+maxemoji,soft lightingsoft pastel colors/pastel background+3Dicon+clay+blender 3d+背景颜色=等距粘土物体 2. yasuko blythe dolls(安子布莱斯娃娃/也可以换成其他知道的娃娃名称)+灯光/颜色/背景/材质+clay(粘土)+style Yoshitomo Nara(良奈吉友画风/或者其他名人风格)=人偶
2024-08-14
如何用ai输入二次元风格的提示词
二次元风格通常指的是源自日本的动漫、漫画和游戏文化中的视觉艺术风格。使用AI生成二次元风格的提示词,您可以遵循以下步骤: 1. 确定主题: 确定您想要的二次元风格的主题,比如是校园生活、幻想世界、科幻未来等。 2. 了解风格特点: 研究二次元风格的特点,包括角色设计(如大眼睛、多彩发色)、服饰风格、场景构图等。 3. 使用描述性语言: 使用描述性的语言来表达您想要的风格,比如“穿着日本高中制服的少女,背景是樱花盛开的校园”。 4. 利用AI工具: 使用支持文本到图像的AI工具,如DALLE、Stable Diffusion或Midjourney等,这些工具可以根据文本提示生成图像。 5. 输入提示词: 在AI工具中输入您的提示词,可以包括角色特征、环境元素、动作等,越详细越好。 6. 调整和优化: 根据生成的图像结果,调整提示词,增加或减少描述的细节,以达到最佳效果。 7. 使用专业术语: 如果可能,使用一些二次元文化中的专业术语,比如“傲娇”、“御姐”、“萌”等,这可以帮助AI更准确地理解您的需求。 8. 考虑情感和氛围: 二次元作品常常带有特定的情感和氛围,比如“温馨的日常场景”或“激烈的战斗场面”,在提示词中包含这些元素。 9. 迭代过程: 生成图像后,根据结果反复迭代您的提示词,直到获得满意的风格。 10. 获取反馈: 如果可能,从二次元社区获取反馈,看看您的提示词是否能够准确地传达您想要的风格。 例如,如果您想生成一个二次元风格的女战士形象,您的提示词可能是:“一个身穿未来机甲的女战士,手持光剑,背后是战争废墟的末世城市,眼神坚定。” 记住,不同的AI工具可能对提示词的理解和反应不同,所以实验和迭代是得到理想结果的关键。
2024-07-22
midjourney如何画二次元
Midjourney 是一个强大的 AI 图像生成工具,它支持多种风格和类型的图像创作,包括二次元风格的绘画。以下是使用 Midjourney 绘制二次元图像的一些基本步骤和技巧: 1. 了解二次元风格: 二次元通常指的是具有特定风格的日本动漫和漫画中的艺术形式。了解这种风格的特点是开始创作之前的重要步骤。 2. 使用正确的参数: Midjourney 支持多种参数来控制图像的生成。对于二次元风格,可以使用特定的参数,如 `v 5`(选择模型版本)和 `ar 16:9`(设置图像宽高比)。 3. 利用Niji模式: Midjourney 提供了一个名为 Niji 的二次元模型,专门为生成动漫风格的图像而设计。通过在命令中添加 `v 5 ar 2:3 stylize 500 q 2 ar 16:9` 参数,可以激活 Niji 模型。 4. 构建详细的提示词(Prompt): 提示词是告诉 Midjourney 你想要的图像类型和风格的关键。例如,如果你想生成一个穿着校服的二次元少女,你的提示词可能是 `"a school uniform anime girl with big eyes and long flowing hair"`。 5. 使用图生图(ImagetoImage): 如果你有一张现有的二次元图像,并且想要用 Midjourney 进行编辑或改进,可以使用图生图功能。上传你的图像并提供相应的提示词来指导 AI。 6. 调整权重和风格: 通过调整不同元素的权重,可以控制生成图像的特定方面,如颜色、细节或风格。 7. 迭代和实验: 由于 AI 生成图像的过程涉及随机性,可能需要多次尝试和调整提示词来获得最佳结果。 8. 学习社区和教程: 加入 Midjourney 社区,查看其他艺术家的作品和教程,这可以提供灵感和学习的机会。 9. 参考官方教程和资源: Midjourney 的官方文档和教程是学习如何使用该工具的宝贵资源。 10. 审美提升: 观看推荐的电影和阅读推荐的书籍可以提升你对二次元风格的审美和理解。 请记住,生成理想的二次元图像可能需要一些实验和练习,但随着时间的推移,你将能够更好地掌握 Midjourney 的使用,并创作出令人满意的作品。
2024-05-12
有没有装修的Ai软件
以下是一些与装修相关的 AI 软件: 1. 酷家乐装修设计软件:利用 AI 生成各种装修设计方案,用户可根据自己的喜好进行选择和调整。 2. HDAidMaster:云端工具,在建筑设计、室内设计和景观设计领域表现出色,搭载自主训练的建筑大模型。 3. Maket.ai:主要面向住宅行业,在户型设计和室内软装设计方面有 AI 技术探索。 4. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期阶段可引入相关标准和规范约束设计结果。 5. Fast AI 人工智能审图平台:形成全自动智能审图流程,将建筑全寿命周期内的信息集成,实现数据汇总与管理。 同时,以下是一些辅助创建 CAD 图的 AI 工具: 1. CADtools 12:Adobe Illustrator 插件,添加 92 个绘图和编辑工具。 2. Autodesk Fusion 360:集成 AI 功能的云端 3D CAD/CAM 软件。 3. nTopology:基于 AI 帮助创建复杂 CAD 模型。 4. ParaMatters CogniCAD:根据输入的设计目标和约束条件自动生成 3D 模型。 5. 主流 CAD 软件(如 Autodesk 系列、SolidWorks 等)中的生成设计工具:可根据输入自动产生多种设计方案。 需要注意的是,这些工具通常需要一定的 CAD 知识和技能才能有效使用。对于 CAD 初学者,建议先学习基本的 3D 建模技巧,然后尝试使用这些 AI 工具来提高设计效率。
2025-02-20
免费好用的文生视频软件 做小说漫画推文
以下是一些免费好用的文生视频软件,可用于将小说做成漫画推文视频: 1. Stable Diffusion(SD):这是一种 AI 图像生成模型,能够基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):另一个适用于创建小说中场景和角色图像的 AI 图像生成工具。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可以生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 将小说转换成 AI 视频通常包括文本分析、角色与场景生成、视频编辑与合成等多个步骤。您可以根据具体需求选择合适的工具来完成您的小说漫画推文视频制作。
2025-02-20
facefusion是什么软件
FaceFusion 是一款面部交换和面部增强的开源软件,可以在本地运行。它不仅能将源图像中的面部与目标图像或视频中的面部进行交换,还提供了多种面部和帧处理器以改进或定制面部特征。FaceFusion 1.1.0 版本更新后,增加了摄像头功能,可进行实时换脸和面部改造。该软件有多种选项和参数,允许用户根据需要进行定制,并且内置了一些检查机制以防止被用于不道德或非法用途。其开源地址为:https://github.com/facefusion/facefusion 。 使用该软件存在一定的条件和限制: 本机解决方案:需要 Python 环境以及安装视频解码器等多个依赖软件,有一定编程知识要求。而且其运行推理计算速度非常依赖 GPU,若本地计算机没有 GPU 或者 GPU 显存较小,执行速度将会非常缓慢。 云服务解决方案:可利用云厂商如阿里云的 PAI 和 AutoDL 已提供的大模型运行环境和计算能力,但会产生一定费用。 在云服务解决方案中,以 AutoDL 为例,注册完成后在算力市场中选择能接受价格的算力服务器,建议选取 GPU 配置更高的算力设备。通过模型镜像启动 GPU 服务器,在算法社区查找 facefusion 镜像,创建实例并启动,利用终端输入相关命令启动程序,注意添加“executionproviders cuda cpu”参数以使用 GPU 能力加快推理速度。最后通过自定义服务按钮打开新的浏览器窗口,访问 facefusion 提供的 UI 界面,上传准备好的图片、视频进行换脸处理。
2025-02-20
免费的文生视频软件 做小说推文
以下是一些免费的可用于将小说做成视频的文生视频软件及相关网址: 1. Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI 2. Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com 3. Adobe Firefly:Adobe 的 AI 创意工具,可生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html 4. Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist 5. Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ 6. VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 7. 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 8. 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/ 将小说转换成 AI 视频通常包括文本分析、角色与场景生成、视频编辑与合成等多个步骤。您可以根据自己的需求选择合适的工具来进行操作。
2025-02-20
规划设计涉及的AI软件
以下是一些涉及规划设计的 AI 软件: 1. 对于建筑设计师审核规划平面图,有以下工具: HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型 ArchiMaster,软件 UI 和设计成果颜值在线。 Maket.ai:主要面向住宅行业,在户型和室内软装设计方面有 AI 技术探索,能根据输入自动生成户型图。 ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期可引入标准和规范约束生成结果,保证合规性。 Fast AI 人工智能审图平台:形成全自动智能审图流程,能将建筑全寿命周期内信息集成。 2. 绘制逻辑视图、功能视图、部署视图的工具包括: Lucidchart:流行的在线绘图工具,支持多种图表创建,可通过拖放界面轻松创建架构图。 Visual Paradigm:全面的 UML 工具,提供多种架构视图创建功能。 ArchiMate:开源建模语言,与 Archi 工具配合使用可创建逻辑视图。 Enterprise Architect:强大的建模、设计和生成代码工具,支持多种架构视图创建。 Microsoft Visio:广泛使用的图表和矢量图形应用程序,提供丰富模板。 draw.io(diagrams.net):免费在线图表软件,支持多种图表创建。 PlantUML:文本到 UML 转换工具,可通过描述文本生成相关视图。 Gliffy:基于云的绘图工具,提供创建架构图功能。 Archi:免费开源工具,支持逻辑视图创建。 Rational Rose:IBM 的 UML 工具,支持多种视图创建。 3. 辅助或自动生成 CAD 图的工具: CADtools 12:Adobe Illustrator 插件,添加 92 个绘图和编辑工具。 Autodesk Fusion 360:集成 AI 功能的云端 3D CAD/CAM 软件,能创建复杂几何形状和优化设计。 nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型。 ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据输入自动生成 3D 模型。 一些主流 CAD 软件如 Autodesk 系列、SolidWorks 等提供的基于 AI 的生成设计工具。 但每个工具都有其特定应用场景和功能,建议根据具体需求选择合适的工具。同时,使用这些工具通常需要一定的 CAD 知识和技能,初学者可先学习基本建模技巧再尝试使用。
2025-02-20
现在有哪些个人知识库软件可以用,请推荐。
以下是为您推荐的个人知识库软件: 1. Coze:如果您想使用专门搭建个人知识库的软件,可以参考文章,忽略本地部署大模型环节,直接看其中推荐的软件。但使用该软件可能需要对接一些额外的 API,建议先了解 RAG 的原理再使用。 2. AnythingLLM:包含所有 Open WebUI 的能力,并且额外支持选择文本嵌入模型和向量数据库。安装地址:https://useanything.com/download 。安装完成后,配置页面主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。在 AnythingLLM 中有 Workspace 的概念,可以创建自己独有的 Workspace 跟其他项目数据进行隔离,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式和 Query 模式),配置完成后即可进行对话测试。 此外,还有通过 GPT 打造个人知识库的方法,比如将文本转换成向量节省空间,拆分成小文本块并通过 embeddings API 转换成 embeddings 向量,在向量储存库中保存这些向量和文本块作为问答的知识库。当用户提问时,将问题转换成向量与库中向量比对,提取关联度高的文本块与问题组合成新的 prompt 发送给 GPT API 。
2025-02-19
如何做数字人视频
以下是用 10 分钟轻松制作 AI 换脸、AI 数字人视频的方法: 生成数字人: 1. 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,剪映会生成对应音视频并添加到视频轨道中,左下角会提示渲染完成,可点击预览按钮查看效果。 2. 增加背景图片:删除先前导入的文本内容,为视频增加背景图片。点击左上角“媒体”菜单并点击“导入”按钮选择本地图片上传,如选择一张书架图片上传,点击图片右下角的加号将其添加到视频轨道上(会覆盖数字人)。点击轨道最右侧竖线向右拖拽,直到与视频对齐。 增加字幕: 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 导出视频: 数字人视频完成后,点击右上角的“导出”按钮,导出视频以作备用。 AI 换脸: 执行完成后,在输出位置会出现处理后的视频,输出窗口右上角有下载按钮,点击可导出变量后的视频到本地。 成本方面: 1. 时间:大约 10 分钟左右。 2. 制作数字人视频:免费。 3. 数字人换脸:约 0.8 元。 4. 数字人换脸时长:经实际测试 1 分 28 秒的视频,总转换时间在 200 秒。GPU 服务器此次整体运行时长所需花费 0.97 元,facefusion 软件运行只占服务器运行时长的一部分,所以换脸成本约 0.8 元。
2025-02-20
实现基于个人聊天记录的数字分身的最佳实践
实现基于个人聊天记录的数字分身的最佳实践包括以下方面: 虚拟数字人的类型和驱动方式: 虚拟数字人通过各种技术创造,具有外观、行为和思想等人类特征,呈现为虚拟形象。 从驱动层面可分为中之人驱动和 AI 驱动两类。中之人驱动运用动作捕捉和面部捕捉技术实现交互,有上限且缺乏高并发和量产化能力;AI 驱动使用 AI 技术创建、驱动和生成内容,赋予感知和表达等交互能力。 虚拟数字人的应用类型: 服务型:如虚拟主播、助手、教师、客服和医生等,为物理世界提供服务。 表演型:如虚拟偶像,用于娱乐、影视等场景。 身份型:是物理世界“真人”进入虚拟世界的数字分身,在元宇宙中有广泛应用场景。 相关开源项目: 熊猫大侠基于 COW 框架的 ChatBot 最新版本支持多端部署、基础对话、语音识别、图片生成、丰富插件、Tool 工具和知识库等功能。可接入个人微信、微信公众号、企业微信应用,支持多种模型和个性化插件扩展,通过上传知识库文件自定义专属机器人,可作为数字分身、领域知识库、智能客服使用。项目地址包括 Github:https://github.com/zhayujie/chatgptonwechat ,Gitee:https://gitee.com/zhayujie/chatgptonwechat 。
2025-02-20
数字人
数字人是运用数字技术创造出来的人,目前业界还没有准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化。使用时请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,比如覆盖视频窗口,并将数字人拖动到合适位置。 增加字幕,点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 至此,数字人视频完成,点击右上角“导出”按钮,导出视频以作备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-02-20
我想了解如何在微信公众号搭建一个能发语音的数字人
以下是在微信公众号搭建能发语音的数字人的相关步骤: 1. 照片数字人工作流及语音合成(TTS)API 出门问问 Mobvoi: 工作流地址:https://github.com/chaojie/ComfyUImobvoiopenapi/blob/main/wf.json 相关文件: 记得下载节点包,放进您的 node 文件夹里,这样工作流打开就不会爆红了!ComfyUI 启动后就可以将 json 文件直接拖进去使用了! 2. 「AI 学习三步法:实践」用 Coze 免费打造自己的微信 AI 机器人: 组装&测试“AI 前线”Bot 机器人: 返回个人空间,在 Bots 栏下找到刚刚创建的“AI 前线”,点击进入即可。 组装&测试步骤: 将上文写好的 prompt 黏贴到【编排】模块,prompt 可随时调整。 在【技能】模块添加需要的技能:工作流、知识库。 【预览与调试】模块,直接输入问题,即可与机器人对话。 发布“AI 前线”Bot 机器人: 测试 OK 后,点击右上角“发布”按钮即可将“AI 前线”发布到微信、飞书等渠道。 发布到微信公众号上: 选择微信公众号渠道,点击右侧“配置”按钮。 根据以下截图,去微信公众号平台找到自己的 App ID,填入确定即可。不用了解绑即可。 最后去自己的微信公众号消息页面,就可以使用啦。
2025-02-18
数字人项目
以下是关于数字人项目的相关信息: 构建高质量的 AI 数字人: 建好的数字人模型可以使用 web 前端页面(如 Live2D 提供的 web 端 SDK)或者 Native 的可执行程序进行部署,最终以 GUI 的形式呈现给用户。 开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择 live2d 作为数字人躯壳,原因是其驱动方式相比 AI 生成式更可控和自然,相比虚幻引擎更轻量和简单。卡通二次元形象的接受度更高,超写实风格在目前技术下易出现一致性问题和恐怖谷效应。Live2d 的 SDK 驱动方式可参考官方示例:https://github.com/Live2D 。 MimicMotion 项目: 腾讯发布的 MimicMotion 项目效果显著优于阿里,支持面部特征和唇形同步,不仅用于跳舞视频,也可应用于数字人。 相较阿里的方案,MimicMotion 的优化包括:基于置信度的姿态引导机制,确保生成视频更加连贯流畅;基于姿态置信度的区域损失放大技术,显著减少图像扭曲和变形;创新的渐进式融合策略,在可接受的计算资源消耗下,实现任意长度视频生成。项目地址:https://github.com/tencent/MimicMotion ,节点地址:https://github.com/AIFSH/ComfyUIMimicMotion 。 爱的传承·数字母亲: 内容负责人:朱睿电子酒 统筹负责人:张小琳电子酒 摄影:万阳 剪辑:萧川布丁子健 数字人:大萌子 使用工具:剪辑:剪映、imovie、美图秀秀;数字人:heygen 为完成数字人的拍摄,朱妈妈吃了 4 片吗啡。2 月 4 号制作完数字人,2 月 5 号拍摄,布丁川川子健凌晨开始剪辑,协调补拍追加了很多镜头,朱哥也熬了几个通宵来丰满素材。虽然最后呈现的效果不完美,但相信这部片子具有一定的社会价值。
2025-02-18
数字人
数字人是运用数字技术创造出来的人,目前业界还没有一个关于数字人的准确定义,但一般可根据技术栈的不同分为两类,一类是由真人驱动的数字人,另一类是由算法驱动的数字人。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业以及现下很火热的直播带货,其表现质量与手动建模的精细程度及动捕设备的精密程度直接相关,不过随着视觉算法的不断进步,现在在没有昂贵动捕设备的情况下也可以通过摄像头捕捉到人体骨骼和人脸的关键点信息,从而做到不错的效果。 制作数字人的工具主要有: 1. HeyGen:是一个 AI 驱动的平台,可以创建逼真的数字人脸和角色。使用深度学习算法生成高质量的肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:是一个 AI 视频制作平台,允许用户创建虚拟角色并进行语音和口型同步。支持多种语言,并可用于教育视频、营销内容和虚拟助手等场景。 3. DID:是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后就能合成一段非常逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 每个人都可以用 10 分钟轻松制作 AI 换脸、AI 数字人视频,具体步骤如下: 在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口。并将数字人拖动到合适的位置。 增加字幕,点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 至此,数字人视频就完成了。点击右上角的“导出”按钮,导出视频以作备用。如果希望数字人换成自己希望的面孔,就需要用另一个工具来进行换脸。
2025-02-17
找一个能够生成音乐的AI。我给一个曲名(比如《生日快乐歌》),他就能给我生成不同风格的音乐供我下载。
以下为您推荐能够根据给定曲名生成不同风格音乐并供下载的 AI 工具: 1. Suno AI: 地址:https://www.suno.ai/ 简介:被誉为音乐界的 ChatGPT,能够根据简单提示创造出从歌词到人声和配器的完整音乐作品。 账号要求:需要拥有 Discord、谷歌或微软中的至少一个账号,并确保网络环境稳定。 订阅信息: 免费用户每天 50 积分,每首歌消耗 5 积分,每天可创作 10 首歌曲,每次点击生成两首歌曲。 Pro 用户每月 2500 点数(大约 500 首歌),按月每月 10 美元,按年每月 8 美元,每年 96 美元。 Premier 用户每月 10000 点数(大约 2000 首歌),按月每月 30 美元,按年每月 24 美元,每年 288 美元。 操作模式: 默认模式:包括关闭个性化、歌曲描述、乐器开关、模型选择 v3 等设置。 个性化模式:开启个性化定制,可填写歌词、曲风、标题等。 生成歌词:可使用大模型如 Kimi、GPT、文心一言等生成。 开始生成:填写好所需内容后点击 Create,等待 2 3 分钟即可。 下载:生成后可下载。 2. Udio:由前 Google DeepMind 工程师开发,通过文本提示快速生成符合用户音乐风格喜好的高质量音乐作品。地址:https://www.udio.com/ 3. YuE:支持从歌词生成 5 分钟高质量音乐(含人声与伴奏),多语言支持(中、英、日、韩),覆盖多种音乐风格与专业声乐技术。详细介绍:https://www.xiaohu.ai/c/xiaohuai/yue5
2025-02-18
生成浮世绘风格的提示词
以下是一些生成浮世绘风格的提示词: Ukiyoe:浮世绘的准确翻译。 Flat illustration:保持画面扁平风,避免视觉冲击过度。 Doraemon from Manga Doraemon:漫画《哆啦 A 梦》里的哆啦 A 梦;该句式还原热门动漫形象效果好,把 from 前后继续对应修改即可。 Surfing:冲浪。会自动关联到《神奈川冲浪里》风格。 Block print:木版画。提升纹理质感。 1700s:年代关键词,提升质感。浮世绘源自 17 世纪,实测 1700s 效果较好。 niji 6:该系列创作使用 niji 6 比 V6 出图效果好。 style raw:更贴近描述词本身。“限制 AI 自由发挥”
2025-02-17
基于参考图片人物形象生成指定迪士尼风格的图片
以下是关于基于参考图片人物形象生成指定迪士尼风格图片的相关内容: 在 Midjourney 中,生成指定迪士尼风格的图片可以通过以下方式: 1. 角色参考(cref):cref 的功能是保持图像角色的一致性。使用方法是在提示后添加 cref,并紧接着指向人物参考图像的 URL。您可以使用 cw 来调整参考图像对生成的图像的影响程度,数值范围从 0 到 100。 2. 风格参考(sref):sref 的功能是生成类似风格的图片,保持画风的一致性。使用方法是在提示后添加 sref,并紧接着指向风格参考图像的 URL。您可以使用 sw 来调整参考风格对生成的图像的影响程度,数值范围从 0 到 1000。 如果想引用一张图,但只是把它作为新图的一部分,可以使用 sref 或 cref,并通过调整 sw 或 cw 的值来控制引用图像的影响程度。 生成一张 Disney 风格的头像的具体步骤如下: 1. 选一张比较满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,然后在聊天框发送(记得点击回车或发送按钮)。 2. 图片会上传到服务器并生成一张唯一的链接,点击图片,然后点击在浏览器中打开,然后可以看到浏览器上方有一个链接,复制下来。 3. 使用这个链接加 prompt 提示词来发送给 Midjourney,Midjourney 会根据需求生成特定的图片,这就是 Midjourney 的以图绘图。 此外,在生成 3D 效果图时,如生成可爱的拟人小鹿角色,可以在即梦图片生成界面中导入参考图,参考选项为参考轮廓边缘,生图模型选择 图片 2.0,输入包含角色、细节描述、场景、风格材质等的提示词,生成图片。
2025-02-12
我们是做小红书笔记的,目前有没有哪个软件可以把我们上千篇以往人工写的笔记,投喂给它,训练出一个能按照以往风格来写笔记的呢?比如扣子或者钉钉,可以吗
目前市面上常见的软件中,豆包暂时未获取到扣子或钉钉有此功能的相关信息。不过,像一些专门的自然语言处理和机器学习平台,如 OpenAI 的 GPT 系列、百度的文心一言等,在一定的技术支持和合规操作下,有可能实现您的需求。但需要注意的是,将大量以往的笔记用于训练模型可能涉及到数据隐私和版权等问题,需要谨慎处理。
2025-02-07
我们是做小红书笔记的,目前有没有哪个软件可以把我们上千篇以往人工写的笔记,投喂给它,训练出一个能按照以往风格来写笔记的呢
目前市面上还没有专门针对小红书笔记且能完全满足您需求的成熟软件。一般来说,使用现有的自然语言处理模型进行这样的训练存在诸多限制和法律风险。小红书对于内容的原创性和合规性有严格要求,使用以往的笔记进行训练可能违反平台规定。但您可以通过学习和借鉴以往笔记的写作风格、结构和主题,人工创作出新的优质笔记。
2025-02-07
我需要你给我生成一些提示词,我会给你我想的想法。《》以内的是想法。《我想写一篇影视解说的文案,写作的视角以我,第一人称的视角来写。想要风格偏幽默风趣一点,就像跟朋友在讲述一样,可以模仿鲁迅先生的手法。而且还想把影片的剧情内容写出来,从开篇到电影的结尾,如果有需要保留原片的地方,请把原片的画面场景以及时间段描述出来。要求这篇文案要附上我自己的内心独白,以此引人深思!请你深度思考后,在做答复!要求字数不少于5000字。》请问我该如何写提示词?请你整理好提示词后发给我
以下是为您生成的一些提示词,希望对您有所帮助: 影视解说文案提示词 1. 以第一人称幽默风趣的口吻,像与朋友讲述般,描绘影片从开篇到结尾的精彩剧情,融入自己的内心独白,模仿鲁迅先生的手法,展现独特的视角和深刻的思考。 2. 用轻松幽默的语言,以我的视角详述影片情节,穿插搞笑的评论和内心想法,借鉴鲁迅先生的讽刺技巧,使解说引人入胜。 3. 以亲切自然的叙述方式,如同与好友聊天,讲述影片故事,从开头至结束,结合鲁迅先生的文风,加入个人的情感起伏和独特见解。 DALL·E 相关提示词 1. 绘画:提及颜料种类、画布纹理和笔触形状/纹理(列表)。 2. 数字:注明使用的软件、阴影技术和多媒体方法(列表)。 3. 基于详细提示使用 DALL·E 3 生成图像,让创意鲜活起来,为提示的每个元素做出大胆有趣的选择。 4. 遵循提示指南,提出四个全新的简单概念,而非完整提示,从上次给出的建议中获取灵感。 请注意,默认方面比率为正方形(1:1),默认风格为摄影,包括相机设置、摄影类型和设备。同时,避免违反服务条款的词汇或概念,不侵犯版权,不使用暗示性或露骨的图像,强调符合 G 级评级的元素。
2025-02-06