Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

动漫风格的数字人

Answer

以下是关于动漫风格数字人的相关信息:

构建动漫风格数字人的躯壳有多种方式:

  1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢,能将喜欢的动漫人物变成数字人的躯壳。代表如 Live2D Cubism(https://www.live2d.com/)。
  2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高。代表有 UE(Unreal Engine)、Unity,虚幻引擎 MetaHuman 等,但个人学习在电脑配置和学习难度上有一定门槛。
  3. AIGC:省去了建模流程,直接生成数字人的展示图片,但算法生成的数字人很难保持 ID 一致性,帧与帧的连贯性上会让人有虚假的感觉。典型的项目有 wav2lip(https://github.com/Rudrabha/Wav2Lip)、video-retalking(https://github.com/OpenTalker/video-retalking)等。AIGC 还有一个方向是直接生成 2D/3D 引擎的模型,但该方向还在探索中。

建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI。

另外,【SD】一键切换不同画风中也包含动漫风格,例如“花丛中的小猫”。

Content generated by AI large model, please carefully verify (powered by aily)

References

AI 数字人-定义数字世界中的你

[title]AI数字人-定义数字世界中的你[heading2]二、如何构建高质量的AI数字人[heading4]2.1构建数字人躯壳数字人的躯壳就是建模过程,有多种构建方式:1.2D引擎风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢,毕竟能将喜欢的动漫人物变成数字人的躯壳,是一件很棒的事情。2D引擎的代表就是Live2D Cubism(https://www.live2d.com/)。1.3D引擎风格偏向超写实的人物建模,拟真程度高,定制化成本高,目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体(如下图,NextHuman(https://nexthuman.cn/))。3D引擎的代表是UE(Unreal Engine)、Unity,虚幻引擎MetaHuman等(个人学习在电脑配置和学习难度上有一定门槛。1.AIGC虽然AIGC的方式相比前两者省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持ID一致性,帧与帧的连贯性上会让人有虚假的感觉。如果项目对人物模型真实度要求没有那么高,可以使用这种方案(算法发展非常快,可能不久就会有连贯度很高的生成方式),典型的项目有wav2lip(https://github.com/Rudrabha/Wav2Lip)、video-retalking(https://github.com/OpenTalker/video-retalking)等。AIGC还有一个方向是直接生成2d/3d引擎的模型,而不是直接生成数字人的最终展示部分,但该方向还在探索中。得益于现有各类技术方案的成熟度,以往建模往往都是由专业的建模师完成工作,不久之后相信大家就可以通过一些生成算法快速生成自己的人物模型了。

AI 数字人-定义数字世界中的你

[title]AI数字人-定义数字世界中的你[heading2]二、如何构建高质量的AI数字人[heading4]2.1构建数字人躯壳建好的模型可以使用web前端页面(Live2D就提供了web端的SDK)或者Native的可执行程序进行部署,最后呈现在用户面前的是一个GUI。笔者的开源数字人项目(项目地址:https://github.com/wan-h/awesome-digital-human-live2d)选择了live2d作为数字人躯壳,因为这类SDK的驱动方式相比现在的AI生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于live2d的SDK驱动方式可以参考官方示例:https://github.com/Live2D。

【SD】一键切换不同画风,SDXL Styles汉化版插件

海边的女孩。(有一种电影剧照的感觉,可以试试16:9的比例)[heading1]动漫:[content]花丛中的小猫。(这个动漫风格和我们常见的二次元风格还不太一样)[heading1]连环漫画:[content]超人。(果然是美漫)[heading1]工艺黏土:[content]可爱的熊猫。(黏土的感觉很棒,可以做一些很萌的东西)[heading1]数字艺术:[content]赛博朋克摩托车。(细节还是很不错的,不愧是提升了分辨率后的图片)[heading3][heading1]等距离空间:[content]温馨的儿童卧室。(看这种风格的图片总是觉得被治愈了是怎么回事……)[heading1]线条艺术:[content]抽雪茄的牛仔。(有点大表哥2里面亚瑟的味道)[heading1]低多边形:[content]海边的小岛。(以前玩三维的时候做过好多这种低多边形的模型,结果现在十秒出图了……)[heading1]折纸艺术:[content]一只大象。(旁边的小花是赠送的不?)[heading1]摄影:[content]冬天大雪里的女孩。(官方模型的欧美女性还是很好看的,亚洲的就有点刻板印象了,等民间大佬们的私炉吧)[heading1]像素画:[content]城市街道。(复古游戏的感觉,很有趣,像素画永不过时)[heading1]美食摄影:[content]黄焖鸡米饭。(你确定?)[heading1]抽象艺术:[content]耕地的牛。(感觉还可以更抽象一点)[heading1]水彩画:[content]开满鲜花的小屋。(蛮漂亮的,又被治愈了)[heading1]精灵宝可梦:[content]趴在床上的皮卡丘。(本来描述的是皮卡丘在床上睡觉,但是这个家伙的眼睛怎么都不闭上,一直炯炯有神地看着我,我扭头看了一眼旁边的小朋友,叹了口气,唉……)

Others are asking
如何制作动漫角色工作的AI视频
以下是制作动漫角色工作的 AI 视频的相关方法和建议: 一、准备工作 1. 想出点子 最佳免费选项: 付费选项:4.0,但由于与互联网连接,必应可能更好 2. 选择工具 用于在视频中为人脸制作动画的。 用于从文本创建视频的 最佳语音克隆: 二、制作流程 1. 小说内容分析:使用 AI 工具(如 ChatGPT)分析小说内容,提取关键场景、角色和情节。 2. 生成角色与场景描述:根据小说内容,使用工具(如 Stable Diffusion 或 Midjourney)生成角色和场景的视觉描述。 3. 图像生成:使用 AI 图像生成工具根据描述创建角色和场景的图像。 4. 视频脚本制作:将提取的关键点和生成的图像组合成视频脚本。 5. 音频制作:利用 AI 配音工具(如 Adobe Firefly)将小说文本转换为语音,添加背景音乐和音效。 6. 视频编辑与合成:使用视频编辑软件(如 Clipfly 或 VEED.IO)将图像、音频和文字合成为视频。 7. 后期处理:对生成的视频进行剪辑、添加特效和转场,以提高视频质量。 8. 审阅与调整:观看生成的视频,根据需要进行调整,比如重新编辑某些场景或调整音频。 9. 输出与分享:完成所有编辑后,输出最终视频,并在所需平台上分享。 三、解决技术问题的策略 1. 面对一致性的挑战时,尽可能保持叙事性内容中角色的关键特征和外轮廓的一致。 2. 保持角色的位置一致性。 3. 减少故事中需要观众记住的角色数量。 请注意,具体的操作步骤和所需工具可能会根据项目的具体需求和个人偏好有所不同。此外,AI 工具的可用性和功能也可能会随时间而变化,建议直接访问上述提供的工具网址获取最新信息和使用指南。同时,深度伪造是一个巨大的问题,这些系统需要合乎道德地使用。
2025-02-17
国内哪些免费的AI画动漫图或视频软件
以下是一些国内免费的可用于画动漫图或生成视频的软件: 1. 无界 AI: 网址:https://www.wujieai.cc/ 优势:国内网络可稳定使用,有免费出图点数,支持中文关键词输入,无需额外下载风格模型,可直接取用。 做图逻辑类似于 SD。 应用场景示例:朋友圈 po 图,画幅比例选择 1:1。 皮克斯卡通模型:二次元模型》模型主题》皮克斯卡通。 关键词类别包括场景、氛围、人物、造型、情绪、道具、构图、画面等。 2. 2024 年国内涌现的类似工具,如可灵、即梦、智谱清影等一系列 AI 生成视频工具,其生成结果甚至远超国外。 此外,国内免费的大模型 APP 有 Kimi 智能助手、文心一言、通义千问等。 Kimi 智能助手:由 Moonshot AI 出品,是一个有着超大“内存”的智能助手,可以一口气读完二十万字的小说,还会上网冲浪。 文心一言:百度出品的 AI 对话产品,定位是智能伙伴,能写文案、想点子,又能陪你聊天、答疑解惑。 通义千问:由阿里云开发的聊天机器人,能够与人交互、回答问题及协作创作。
2025-02-04
利用AI创作动漫短剧
利用 AI 创作动漫短剧可以参考以下内容: 有创作者决定使用 Pika、Pixverse、Runway、SVD 四大 AI 视频工具制作 AI 短片,每张图片只抽一次卡,生成了包括科幻片、战争片、奇幻片等不同类型的视频内容,如太空舰队交战、宇航员头盔特写、士兵在战壕准备迎击等场景。 现阶段,AI 视频产品的主要受众群体包括专业创作者(艺术家、影视人等),其能为作品赋予独特风格和想象力,降低后期制作门槛和成本,目前主要应用在音乐 MV、短篇电影、动漫等方向;自媒体、非专业创作者,他们在制作视频时存在如寻找素材、版权问题、不同平台内容形式转换等痛点,一些产品已在发力解决;企业客户,AI 视频生成可为资金不足的小企业、非盈利机构大幅缩减成本。 尾鳍 Vicky 用 AI 工具制作了动画短片,虽然存在一些问题,但仍有惊喜。制作流程包括写故事和分镜头,可以自己构思,也可借助 GPT4、Claude2、智谱清言、Kimi.chat 等应用帮忙想故事,写故事梗概时要明确时长、主题、人物、人物关系、结构等要素。
2025-02-02
制作自己的动漫数字人
以下是制作自己的动漫数字人的相关信息: 构建数字人躯壳: 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢,能将喜欢的动漫人物变成数字人的躯壳。代表是 Live2D Cubism。 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高。目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体,如 NextHuman、Unity,虚幻引擎 MetaHuman 等,但个人学习在电脑配置和学习难度上有一定门槛。 AIGC:省去了建模流程,直接生成数字人的展示图片,但弊端是算法生成的数字人很难保持 ID 一致性,帧与帧的连贯性上会让人有虚假的感觉。典型的项目有 wav2lip等。AIGC 还有一个方向是直接生成 2d/3d 引擎的模型,但该方向还在探索中。 生成数字人的方法: 在剪映中,右侧窗口顶部打开“数字人”选项,选取一位免费的、适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中。左下角会提示渲染完成时间,完成后可点击预览按钮查看效果。 增加背景图片:删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”按钮选择本地图片上传,将图片添加到视频轨道上,可调整图片大小和位置。 相关工具及使用方法: HEYGEN:优点是人物灵活,五官自然,视频生成很快;缺点是中文的人声选择较少。使用方法为点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片,上传后效果在 My Avatar 处显示,点开大图后,点击 Create with AI Studio 进入数字人制作,写上视频文案并选择配音音色,也可自行上传音频,最后点击 Submit 得到数字人视频。 DID:优点是制作简单,人物灵活;缺点是免费版下载后有水印。使用方法为点击网址,点击右上角 Create vedio,选择人物形象,可添加自己的照片或使用给出的人物形象,配音时可选择提供文字选择音色或直接上传音频,最后点击 Generate vedio 生成视频,打开可下载或分享。 KreadoAI:优点是免费,功能齐全;缺点是音色很 ai。使用方法为点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”功能,点击开始创作,选择自定义照片,配音时可选择提供文字选择音色或直接上传音频,打开绿幕按钮,点击背景添加背景图,最后点击生成视频。
2025-01-09
国风动漫创作
以下是关于国风动漫创作的相关信息: 一、Midjourney 商业实战案例中的插画类型 1. 像素风格插画 关键词:3D,16bit pixel art,Super mario,Minecraft,LEGO,pixel style,Blocksplicing,girl with long hair,Alice in Wonderland,garden background,8K–uplight–ar 9:16–v 5 Midjourney 生成的图片示例:像素女孩插画 2. 手机壁纸插画 关键词:mobile wallpaper illustrations,four seasons,natural landscapes,minimalist illustrations,line illustrations–ar 9:16–niji Midjourney 生成的图片示例:手机壁纸 3. 新海诚风格插画 关键词:Makoto Shinkai animation style,a girl,4K–ar 9:16–niji Midjourney 生成的图片示例:新海诚动漫海报 4. 国潮插画 关键词:Make posters of James Jean,white deer,auspicious clouds,birds,distant mountains,Chinese ChinaChic style,colorful,light color,gradient color–ar 9:16 Midjourney 生成的图片示例:国潮白鹿插画 二、使用 Midjourney 进行国风动漫创作的流程 1. 确定要绘画的主题,比如国风、动漫等。 2. 登录国内版 Midjourney(https://ai.midjourney9.com/?channel=0519116),注册账号,来到灵感广场。 3. 以“国风”为主题,浏览灵感广场的相似作品,或直接搜索关键词,选择相似主题,借鉴其提示词,并形成自己的风格。 4. 点击“画同款”,快速生成一张类似图片作品。 5. 跳转到文生图工作台(可二次优化提示词)。 6. 点击提交任务。 快图模式:4 积分/张图。 常规模式:1 积分/张图。 三、AI 绘画常用的风格提示词 ink render 墨水渲染、Ethnic Art 民族艺术、retro dark vintage 复古黑暗、Tradition Chinese Ink Painting style 国风、Steampunk 蒸汽朋克、film photography 电影摄影风格、concept art 概念艺术、montage 剪辑、full details 充满细节、Gothic gloomy 哥特式黑暗、realism 写实主义、black and white 黑白、Unity Creations 统一创作、Baroque 巴洛克时期、Impressionism 印象派、Art Nouveau 新艺术风格、Rococo 新艺术、Renaissance 文艺复兴、Fauvism 野兽派、Cubism 立体派、Abstract Art 抽象表现主义、OP Art/Optical Art 欧普艺术/光效应艺术、Victorian 维多利亚时代、futuristic 未来主义、Minimalist 极简主义
2025-01-08
Ai如何绘画动漫人物角色
以下是关于 AI 绘画动漫人物角色的相关内容: Sarah Andersen 风格 主题风格: 漫画特色:通常使用简单黑白线条作画,配以极富表现力的角色表情,探讨如焦虑、社交尴尬、性别问题等,幽默呈现生活瞬间。 线条和轮廓:使用清晰简洁的线条,构建图像。 色调:大多数作品是黑白的,偶尔使用强调色。 角色设计:表情丰富,反映各种情绪状态。 元素:包含幽默和讽刺元素,以幽默方式反映日常生活场景。 技巧: 在主要描述语后面加上“by Sarah Andersen”或者“style reference Sarah Andersen”。 加入情感色彩的描述,如“joyful”“awkward”“anxious”等词。 利用cref 命令保持人物的一致性。 应用: 社交媒体上进行漫画创作。 使故事更加生动有趣的插图。 个性化礼物和商品设计(需注意版权问题)。 Niji·journey 5 生成多样化二次元角色设计风格 可以混合不同游戏风格引导生成角色设计,涉及绘画 AI 的“风格迁移”能力,基本原理是利用深度学习模型提取并分离图像的内容和风格特征,包括特征提取和特征重组。可以通过对游戏风格 Prompt 的更精确调整来控制混合比例。 Action figure 风格 创作建议: 复古风:模仿上世纪 8090 年代的可动人偶风格,采用饱和度较高、边缘略显粗糙的色彩,以及那个时代特有的设计元素。 动漫卡通化:将可动人偶设计成夸张的动漫风格,大眼睛、鲜明色彩,强调动作动态感和表情的戏剧性。 写实风格:追求极度逼真的描绘,细致刻画人物面部特征、服装皱褶和环境光影。 赛博朋克融合:结合赛博朋克元素,创造既未来又反叛的可动人偶形象。 其他: sref 种子值:可以和不同的种子值结合,创造出风格各异的 action figure。 内容: 经典角色重塑:选取广为人知的电影、漫画角色,重新诠释为可动人偶形态。 场景故事化:构想场景,让多个可动人偶在其中互动,讲述微型故事。 系列收藏展示:设计特定主题的可动人偶集合,展示收藏价值和展示美学。 跨界融合:尝试将不同时代或文化背景的角色进行融合,创造新颖独特的视觉体验。
2025-01-08
数字人
数字人是运用数字技术创造出来的人,目前业界还没有一个关于数字人的准确定义,但一般可根据技术栈的不同分为两类,一类是由真人驱动的数字人,另一类是由算法驱动的数字人。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业以及现下很火热的直播带货,其表现质量与手动建模的精细程度及动捕设备的精密程度直接相关,不过随着视觉算法的不断进步,现在在没有昂贵动捕设备的情况下也可以通过摄像头捕捉到人体骨骼和人脸的关键点信息,从而做到不错的效果。 制作数字人的工具主要有: 1. HeyGen:是一个 AI 驱动的平台,可以创建逼真的数字人脸和角色。使用深度学习算法生成高质量的肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:是一个 AI 视频制作平台,允许用户创建虚拟角色并进行语音和口型同步。支持多种语言,并可用于教育视频、营销内容和虚拟助手等场景。 3. DID:是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后就能合成一段非常逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 每个人都可以用 10 分钟轻松制作 AI 换脸、AI 数字人视频,具体步骤如下: 在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口。并将数字人拖动到合适的位置。 增加字幕,点击文本 智能字幕 识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 至此,数字人视频就完成了。点击右上角的“导出”按钮,导出视频以作备用。如果希望数字人换成自己希望的面孔,就需要用另一个工具来进行换脸。
2025-02-17
数字员工如何实现?
数字员工的实现方式主要包括以下步骤: 1. 声音克隆:先剪出音频,使用 https://elevenlabs.io/speechsynthesis 或使用 GPTsovits(GPTSoVITS 实现声音克隆)克隆声音,做出文案的音频。 2. 视频整合:使用 wav2lip 整合包,导入视频和音频,对口型得到视频。基础 wav2lip+高清修复整合包下载地址为 https://github.com/Rudrabha/Wav2Lip 。产品可参考 https://synclabs.so/ 。 从学习路径的角度来看,结合“一人公司”的愿景,需要大量的智能体(数字员工)替我们打工。未来的 AI 数字员工会以大语言模型为大脑,串联所有已有的工具和新造的 AI 工具。数字员工(agent)=学历(大模型)+察言观色(观察)+逻辑思维(推理)+执行(SOP)。创造者的学习也依照这个方向,用大语言模型和 Agent 模式把工具串起来,着重关注在创造能落地 AI 的 agent 应用。 Agent 工程(基础版)如同传统的软件工程学,有一个迭代的范式: 1. 梳理流程:梳理工作流程 SOP,并拆解成多个单一「任务」和多个「任务执行流程」。 2. 「任务」工具化:自动化每一个「任务」,形成一系列的小工具,让机器能完成每一个单一任务。 3. 建立规划:串联工具,基于 agent 框架让 bot 来规划「任务执行流程」。 4. 迭代优化:不停迭代优化「任务」工具和「任务执行流程」规划,造就能应对实际场景的 Agent。 在摊位信息方面,有摊位主题为“AI 数字员工”的展示,内容为为企业和个人提供数字劳动力,解决重复性、创意性工作难题。体验 demo 包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等。
2025-02-17
ai数字人
AI 数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货。其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 2. 算法驱动的数字人:强调自驱动,人为干预更少,技术实现更复杂。其大致流程中的三个核心算法分别是: ASR(语音识别):能将用户音频数据转化为文字,便于数字人理解和生成回应。 AI Agent(人工智能体):充当数字人大脑,可接入大语言模型,拥有记忆模块等使其更真实。 TTS(文字转语音):将数字人依靠 LLM 生成的文字转换为语音,保持语音交互一致性。 此外,还有一些关于 AI 数字人的摊位活动,例如:为企业和个人提供数字劳动力,解决重复性、创意性工作难题的“AI 数字员工”体验 demo 包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等;“AIGC(图生图)趣味定制;AI 数字人定制”等。
2025-02-17
ai数字人
AI 数字人是运用数字技术创造出来的人,目前业界没有关于其的准确定义,但一般可根据技术栈分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货。其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 2. 算法驱动的数字人:强调自驱动,人为干预更少,技术实现更复杂。其大致流程中的三个核心算法分别是: ASR(语音识别):能将用户音频数据转化为文字,便于数字人理解和生成回应。 AI Agent(人工智能体):充当数字人大脑,可接入大语言模型,拥有记忆模块等使其更真实。 TTS(文字转语音):将数字人依靠 LLM 生成的文字转换为语音,保持语音交互一致性。 此外,摊位活动中也有关于 AI 数字人的主题,如为企业和个人提供数字劳动力,解决重复性、创意性工作难题,包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等体验 demo。还有 AIGC 数字艺术挂画、AI 智能体应用、AI 数字人定制等相关内容。
2025-02-17
AI数字人
AI 数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为两类: 1. 真人驱动的数字人:重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货。其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过随着视觉算法进步,在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 2. 算法驱动的数字人:强调自驱动,人为干预更少,技术实现更复杂。其大致流程包含三个核心算法: ASR(语音识别):能将用户音频数据转化为文字,便于数字人理解和生成回应,以实现像人与人一样的对话交互。 AI Agent(人工智能体):充当数字人的大脑,可接入大语言模型,拥有记忆模块等使其更真实。 TTS(文字转语音):将数字人依靠 LLM 生成的文字输出转换为语音,保持语音交互一致性。 此外,还有一些与 AI 数字人相关的摊位活动,如为企业和个人提供数字劳动力,解决重复性、创意性工作难题的“AI 数字员工”体验 demo,包括抖音运营、AI 客服、智能问诊、企业定制员工、定制知识库等;以及“AIGC 数字艺术挂画”“数字生命赋予每个人的新生”“AI 智能体应用”“Ai 心理疏导”“AIGC(图生图)趣味定制;AI 数字人定制”等。
2025-02-17
好用的数字人
以下为您推荐一些好用的数字人工具及相关信息: HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 1. 点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。 2. 上传后效果如图所示,My Avatar处显示上传的照片。 3. 点开大图后,点击Create with AI Studio,进入数字人制作。 4. 写上视频文案并选择配音音色,也可以自行上传音频。 5. 最后点击Submit,就可以得到一段数字人视频。 DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 1. 点击上面的网址,点击右上角的Create vedio。 2. 选择人物形象,可以点击ADD添加照片,或者使用DID给出的人物形象。 3. 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 4. 最后,点击Generate vedio就可以生成一段视频。 5. 打开自己生成的视频,可以下载或者直接分享给朋友。 KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法: 1. 点击上面的网址,注册后获得120免费k币,这里选择“照片数字人口播”的功能。 2. 点击开始创作,选择自定义照片。 3. 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 4. 打开绿幕按钮,点击背景,可以添加背景图。 5. 最后,点击生成视频。 此外,还有一些其他的AI视频工具: SVD:https://stablevideo.com/ ,对于景观更好用。 Morph Studio:https://app.morphstudio.com/ ,还在内测。 Kaiber:https://kaiber.ai/ 。 Moonvalley:https://moonvalley.ai/ 。 Mootion:https://discord.gg/AapmuVJqxx ,3d人物动作转视频。 美图旗下:https://www.miraclevision.com/ 。 Neverends:https://neverends.life/create ,操作傻瓜。 SD:Animatediff SVD deforum ,需要自己部署。 Leiapix:https://www.leiapix.com/ ,可以把一张照片转动态。 Krea:https://www.krea.ai/ 。 Opusclip:https://www.opus.pro/ ,利用长视频剪成短视频。 Raskai:https://zh.rask.ai/ ,短视频素材直接翻译至多语种。 invideoAI:https://invideo.io/make/aivideogenerator/ ,输入想法>自动生成脚本和分镜描述>生成视频>人工二编>合成长视频。 descript:https://www.descript.com/?ref=feizhuke.com 。 veed.io:https://www.veed.io/ ,自动翻译自动字幕。 clipchamp:https://app.clipchamp.com/ 。 typeframes:https://www.revid.ai/?ref=aibot.cn 。 另外,12 月 29 日的 Xiaohu.AI 日报还推荐了以下内容: 开源且适合小白用户的数字人工具,特点是一键安装包,无需配置环境,简单易用。功能包括生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。系统兼容 Windows、Linux、macOS。模型支持 MuseTalk(文本到语音)、CosyVoice(语音克隆)。下载地址:GitHub: 。 Google Veo 2:AI生成逼真的 Vlog 视频,生成的视频接近真实,几乎难以分辨,适合创作和内容制作。
2025-02-15
生成浮世绘风格的提示词
以下是一些生成浮世绘风格的提示词: Ukiyoe:浮世绘的准确翻译。 Flat illustration:保持画面扁平风,避免视觉冲击过度。 Doraemon from Manga Doraemon:漫画《哆啦 A 梦》里的哆啦 A 梦;该句式还原热门动漫形象效果好,把 from 前后继续对应修改即可。 Surfing:冲浪。会自动关联到《神奈川冲浪里》风格。 Block print:木版画。提升纹理质感。 1700s:年代关键词,提升质感。浮世绘源自 17 世纪,实测 1700s 效果较好。 niji 6:该系列创作使用 niji 6 比 V6 出图效果好。 style raw:更贴近描述词本身。“限制 AI 自由发挥”
2025-02-17
基于参考图片人物形象生成指定迪士尼风格的图片
以下是关于基于参考图片人物形象生成指定迪士尼风格图片的相关内容: 在 Midjourney 中,生成指定迪士尼风格的图片可以通过以下方式: 1. 角色参考(cref):cref 的功能是保持图像角色的一致性。使用方法是在提示后添加 cref,并紧接着指向人物参考图像的 URL。您可以使用 cw 来调整参考图像对生成的图像的影响程度,数值范围从 0 到 100。 2. 风格参考(sref):sref 的功能是生成类似风格的图片,保持画风的一致性。使用方法是在提示后添加 sref,并紧接着指向风格参考图像的 URL。您可以使用 sw 来调整参考风格对生成的图像的影响程度,数值范围从 0 到 1000。 如果想引用一张图,但只是把它作为新图的一部分,可以使用 sref 或 cref,并通过调整 sw 或 cw 的值来控制引用图像的影响程度。 生成一张 Disney 风格的头像的具体步骤如下: 1. 选一张比较满意的图片,在 Discord 社区的 Midjourney 服务器聊天栏点击“+”,然后点击上传文件,选取图片,然后在聊天框发送(记得点击回车或发送按钮)。 2. 图片会上传到服务器并生成一张唯一的链接,点击图片,然后点击在浏览器中打开,然后可以看到浏览器上方有一个链接,复制下来。 3. 使用这个链接加 prompt 提示词来发送给 Midjourney,Midjourney 会根据需求生成特定的图片,这就是 Midjourney 的以图绘图。 此外,在生成 3D 效果图时,如生成可爱的拟人小鹿角色,可以在即梦图片生成界面中导入参考图,参考选项为参考轮廓边缘,生图模型选择 图片 2.0,输入包含角色、细节描述、场景、风格材质等的提示词,生成图片。
2025-02-12
我们是做小红书笔记的,目前有没有哪个软件可以把我们上千篇以往人工写的笔记,投喂给它,训练出一个能按照以往风格来写笔记的呢?比如扣子或者钉钉,可以吗
目前市面上常见的软件中,豆包暂时未获取到扣子或钉钉有此功能的相关信息。不过,像一些专门的自然语言处理和机器学习平台,如 OpenAI 的 GPT 系列、百度的文心一言等,在一定的技术支持和合规操作下,有可能实现您的需求。但需要注意的是,将大量以往的笔记用于训练模型可能涉及到数据隐私和版权等问题,需要谨慎处理。
2025-02-07
我们是做小红书笔记的,目前有没有哪个软件可以把我们上千篇以往人工写的笔记,投喂给它,训练出一个能按照以往风格来写笔记的呢
目前市面上还没有专门针对小红书笔记且能完全满足您需求的成熟软件。一般来说,使用现有的自然语言处理模型进行这样的训练存在诸多限制和法律风险。小红书对于内容的原创性和合规性有严格要求,使用以往的笔记进行训练可能违反平台规定。但您可以通过学习和借鉴以往笔记的写作风格、结构和主题,人工创作出新的优质笔记。
2025-02-07
我需要你给我生成一些提示词,我会给你我想的想法。《》以内的是想法。《我想写一篇影视解说的文案,写作的视角以我,第一人称的视角来写。想要风格偏幽默风趣一点,就像跟朋友在讲述一样,可以模仿鲁迅先生的手法。而且还想把影片的剧情内容写出来,从开篇到电影的结尾,如果有需要保留原片的地方,请把原片的画面场景以及时间段描述出来。要求这篇文案要附上我自己的内心独白,以此引人深思!请你深度思考后,在做答复!要求字数不少于5000字。》请问我该如何写提示词?请你整理好提示词后发给我
以下是为您生成的一些提示词,希望对您有所帮助: 影视解说文案提示词 1. 以第一人称幽默风趣的口吻,像与朋友讲述般,描绘影片从开篇到结尾的精彩剧情,融入自己的内心独白,模仿鲁迅先生的手法,展现独特的视角和深刻的思考。 2. 用轻松幽默的语言,以我的视角详述影片情节,穿插搞笑的评论和内心想法,借鉴鲁迅先生的讽刺技巧,使解说引人入胜。 3. 以亲切自然的叙述方式,如同与好友聊天,讲述影片故事,从开头至结束,结合鲁迅先生的文风,加入个人的情感起伏和独特见解。 DALL·E 相关提示词 1. 绘画:提及颜料种类、画布纹理和笔触形状/纹理(列表)。 2. 数字:注明使用的软件、阴影技术和多媒体方法(列表)。 3. 基于详细提示使用 DALL·E 3 生成图像,让创意鲜活起来,为提示的每个元素做出大胆有趣的选择。 4. 遵循提示指南,提出四个全新的简单概念,而非完整提示,从上次给出的建议中获取灵感。 请注意,默认方面比率为正方形(1:1),默认风格为摄影,包括相机设置、摄影类型和设备。同时,避免违反服务条款的词汇或概念,不侵犯版权,不使用暗示性或露骨的图像,强调符合 G 级评级的元素。
2025-02-06
即梦AI里做儿童绘本制作、故事绘本里,怎么做到人物一致,风格一致,场景风格一致。
要在即梦 AI 中制作儿童绘本并做到人物、风格和场景风格一致,可以按照以下步骤进行: 1. 描述故事场景:利用 ChatGPT 或者自行构思一段适合画绘本的故事,将其分为多个场景,用一句包含环境、人物、动作的话描述每个场景。例如,故事名《Lily 的奇妙之旅》,场景 1 为“探险开始,Lily 来到一个阳光明媚的森林,跳过清澈的小溪,愉快玩耍。在路上结识了一只友善的棕熊,她们成为了旅伴”。 2. 生成场景图片:为每个场景生成图片时,使用固定的 prompt 风格词,如“super high details,HDsmooth,by Jon Burgerman,s 400niji 5style expressivear 3:4”。为了使熊和人物有更好的互动感,生成场景时也包括人物主角。如场景 2 的 prompt 为“Walking in a mysterious cave with glittering gems,little girl Lily wearing a yellow floral skirt,her friend brown bear,dim,dreamlike,super high details,HDsmooth,by Jon Burgerman,s 400niji 5style expressivear 3:4”。如果需要,可使用 mj 的 region vary 工具将小女孩完全框选,在提示词中完全删除 Lily 的描述词,重新生成得到场景图像。 3. 绘制绘本主角:确定人物形象,如“a little girl wearing a yellow floral skirt+人物动作+风格词”,在 mj 中生成直到得到一张满意的人物图像,且一套绘本中风格词语不要改变。 4. 保持一致性描述:在写 prompt 时,应从多个角度描述需求,包括人种、画风、宠物品种等,以稳定内容符合预期。例如,如果想生成一个关于“狗”的视频,提供不同狗的品种、外貌、行为等信息,确保物种和画风的一致性。
2025-01-23