Navigate to WaytoAGI Wiki →
Home/question.detail.breadcrumb.questionList/question.detail.breadcrumb.questionDetail

生成数字个人用哪个软件

Answer

以下为生成数字个人的相关软件及操作方法:

  • 剪映:
    • 打开剪映右侧窗口顶部的“数字人”选项,选取免费且适合的数字人形象,如“婉婉-青春”。选择后可听到数字人的声音,判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,左下角会提示渲染完成时间,完成后可点击预览查看效果。
    • 可删除先前导入的文本内容,为视频增加背景图片。点击左上角“媒体”菜单并点击“导入”按钮,选择本地图片上传,将图片添加到视频轨道上,可通过拖拽轨道右侧竖线使其与视频对齐,调整图片大小和数字人位置。
    • 点击文本-智能字幕-识别字幕,点击开始识别,软件会自动将文字智能分段形成字幕。完成后点击右上角“导出”按钮导出视频备用。
  • 谷歌浏览器:
    • 打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusion-colab 并点击 open colab 进入程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”。
    • 点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。
Content generated by AI large model, please carefully verify (powered by aily)

References

实战: 每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法!

3.1生成数字人在剪映右侧窗口顶部,我们打开“数字人”选项,选取一位免费的、适合的数字人形象,这里我选择“婉婉-青春”。当你选择一个数字人形象时,软件会马上播放出该数字人的声音。你可以判断是否是你需要的,点击右下角的“添加数字人”,就会将选择的数字人添加到当前视频中。剪映App将会根据之前提供的内容,来生成对应音视频,并添加到当前视频文件的轨道中。左下角会提示你渲染何时完成。然后你可以点击预览按钮,查看生成的数字人效果。3.2增加背景图片接下来,可以直接删除先前导入的文本内容。这是因为视频中的音频中已经包含文字内容了。鼠标点击下方代表文字的轨道,或者点击软件中间文字内容,按删除键删去文字:为了让视频更美观,我们为视频增加背景图片。当然你可以增加多个背景图片,为简化演示,这里增加1张图片。点击左上角的“媒体”菜单,并点击“导入”按钮,来选择本地的一张图片上传:我选择一张书架图片上传,然后像添加文字内容一样,点击图片右下角的加号,将这个图片添加到视频的轨道上(会覆盖数字人):

实战: 每个人都可以用10分钟轻松制作AI换脸、AI数字人视频的方法!

此时,书架图片就会在视频轨道的下面,添加一条新轨道:为了让图片在整个视频播放的时候都显示,可以点击这个轨道最右侧的竖线,向右拖拽,直到视频的最后,也就是和视频对齐:此时,背景图片所在的轨道是选中状态。如果没选中,鼠标点击一下这个规定即可。在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口。并将数字人拖动到合适的位置:3.3增加字幕点击文本-智能字幕-识别字幕,点击开始识别:软件会自动将文字智能分段并形成字幕:至此,数字人视频就完成了。点击右上角的“导出”按钮,导出视频以作备用。如果你希望数字换成自己希望的面孔,比如这个:就需要用另一个工具来进行换脸了。

方案:剪映数字人“个性化“—无限免费私模数字人

尽管剪映已经有很多公模数字人,但是从抖音上大火的数字人账号上看,私模数字人更受欢迎所以这里我将教大家用AI换脸软件来完成最后一步。📍注意:需要谷歌账号(淘宝或者在我们账号解决平台“[有号](https://www.learnprompt.pro/aiMarket)”就可以直接购买)1.第一步打开谷歌浏览器,点击链接https://github.com/facefusion/facefusion-colab并点击open colab就进到程序主要运行界面.在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的URL就会打开操作界面1.第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成!反复调试后给大家选出了最佳参数!1.第三步:等着自己专属的数字人视频出炉!

Others are asking
目前AI写小说最好的软件或者网站是哪个
以下是一些在 AI 写小说方面表现较好的软件或网站: Novel.ai:AI 写小说领域的头部应用,是典型的 LLM 产品。其产品功能复杂但使用模式简单,利用 LLM 的续写能力将写作改造成交互式的文本生成,渐进式生成小段,用户可自由更改或继续生成下一段,还抽象出模型风格、写作方式、故事世界、记忆等细分功能,本质上还是构造 Prompt,交互式、渐进式的 Prompt 构建降低了使用门槛。 Character.ai:大名鼎鼎的角色扮演类 AI 陪伴产品,服务游戏和二次元用户。使用简单,选择角色对话即可,创建也不难,角色的核心差异靠不同的详细描述,还开放用户角色 Prompt 可见。 筑梦岛:国内同类产品,玩法多样。和角色聊天、捏角色是共同主题,捏角色的产品化本质是收集信息产生高质量角色 Prompt 的过程,基于聊天模式有很多衍生玩法。 此外,还有一些可将小说制作成视频的工具和网址: Stable Diffusion(SD):一种 AI 图像生成模型,可基于文本描述生成图像。网址:https://github.com/StabilityAI Midjourney(MJ):另一个 AI 图像生成工具,适用于创建小说中的场景和角色图像。网址:https://www.midjourney.com Adobe Firefly:Adobe 的 AI 创意工具,可生成图像和设计模板。网址:https://www.adobe.com/products/firefly.html Pika AI:文本生成视频的 AI 工具,适合动画制作。网址:https://pika.art/waitlist Clipfly:一站式 AI 视频生成和剪辑平台。网址:https://www.aihub.cn/tools/video/clipfly/ VEED.IO:在线视频编辑工具,具有 AI 视频生成器功能。网址:https://www.veed.io/zhCN/tools/aivideo 极虎漫剪:结合 Stable Diffusion 技术的小说推文视频创作提效工具。网址:https://tiger.easyartx.com/landing 故事 AI 绘图:小说转视频的 AI 工具。网址:https://www.aihub.cn/tools/video/gushiai/
2024-12-24
我如何利用AI软件写出好 的小说
以下是利用 AI 软件写好小说的一些方法: 1. 显式归纳与列出想要的文本特征:比如明确小说需要优秀的文风、细腻的文笔,具体描述如“几句话一换行”“以短句和对话为主,结构紧凑”“用词直白犀利”等,在调试过程中逐步增减描述,直至达到理想效果。 2. 通过 prompt 中的描述与词语映射到预训练数据中的特定类型的文本:直接指出想要的文本类型,如“充满张力的女性复仇文,可能会出现在晋江文学城或者起点中文网的古代言情分类中”。对于新的创作领域,可从熟悉的相关元素入手,如让模型写特殊格式的网络小说,并显式描述特征。 3. 往 prompt 里面塞例子:这是一种暴力但管用且流行的办法。 此外,要用 AI 创作出好的作品,首先要有足够的审美,知道“什么是好的,好在哪里”。同时,固定的故事结构写在 prompt 里可能不好使,因为会丧失多样性和惊喜。
2024-12-24
免费AI作图软件
以下是一些免费的 AI 作图软件: 1. draw.io(现在称为 diagrams.net):免费的在线图表软件,支持创建逻辑视图和部署视图等。 2. Archi:免费的开源工具,用于创建逻辑视图。 以下是一些与思维导图相关的 AI 工具: 1. GitMind:免费的跨平台 AI 思维导图软件,支持多种模式,如提问、回答、自动生成等。 2. ProcessOn:国内思维导图+AIGC 的工具,可利用 AI 生成思维导图。 3. AmyMind:轻量级的在线 AI 思维导图工具,无需注册登录即可使用,支持自动生成节点。 Imagen 3 是一款 AI 绘图工具,具有以下功能点和优势: 功能点: 1. 图像生成:根据用户输入的 Prompt 生成图像。 2. Prompt 智能拆解:自动拆解用户输入的 Prompt,并提供下拉框选项。 3. 自动联想:提供自动联想功能,帮助用户选择更合适的词汇。 优势: 1. 无需排队:用户可直接使用。 2. 免费使用。 3. 交互人性化:提供人性化的交互设计,如自动联想和下拉框选项。 4. 语义理解:能根据 Prompt 生成符合描述的图像。 5. 灵活性:用户可根据自动联想功能灵活调整 Prompt 以生成不同图像。
2024-12-23
办公Ai软件
以下是一些办公 AI 软件: Excel 相关: Excel Labs:Excel 插件,新增生成式 AI 功能,基于 OpenAI 技术,可在 Excel 中进行数据分析和决策支持。 Microsoft 365 Copilot:整合了 Word、Excel 等办公软件,通过聊天形式完成数据分析或格式创建等任务。 Formula Bot:提供数据分析聊天机器人和公式生成器功能,可自然语言交互进行数据分析和生成 Excel 公式。 Numerous AI:支持 Excel 和 Google Sheets 的 AI 插件,能生成公式、文本内容、执行情感分析、语言翻译等任务。 WPS 文档翻译功能:快速翻译办公文档,如 Word、Excel、PPT 等,提高工作效率。 腾讯文档分类功能:利用 AI 自动分类办公文件,方便管理。 随着技术的不断发展,未来会有更多 AI 功能集成到办公软件中,进一步提高工作效率和智能化水平。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-23
最近最好用的ai编程软件有哪些
以下是一些最近好用的 AI 编程软件: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议,助其更快、更少地编写代码。 2. 通义灵码:阿里巴巴团队推出,基于通义大模型,提供多种编程辅助能力。 3. CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,为开发人员实时提供代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型,可提升开发效率。 5. Cody:代码搜索平台 Sourcegraph 推出,借助强大的代码语义索引和分析能力,了解开发者的整个代码库。 6. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供的免费 AI 代码助手,基于自研基础大模型微调。 7. Codeium:由 AI 驱动,通过提供代码建议、重构提示和代码解释等帮助软件开发人员提高编程效率和准确性。 更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同,您可以根据自身需求选择最适合的工具。 另外,Cursor 也是一款好用的 AI 编程工具,它是一个专为人工智能辅助编程设计的现代化集成开发环境,具有 AI 辅助编码、代码自动补全、实时代码分析、多语言支持、集成终端、Git 集成、自定义主题、跨平台、性能优化和实时协作等特点。您可以通过 https://www.cursor.com/ 链接进入其产品主页,在右上角点击下载,下载后解压安装即可使用。 到 2024 年 9 月,大多数程序员使用 Cursor 搭配 Anthropic Sonnet 3.5 或 OpenAI o1 可以获得最佳效果。
2024-12-23
目前最有优势的几款ai软件是什么
以下是目前一些具有优势的 AI 软件: 在移动设备上,图片和视频内容编辑方面,传统创意工具转型的生成式 AI 优先,如排名较高的美图秀秀(第 9 位)、SNOW(第 30 位)和 Adobe Express(第 35 位)。 ChatGPT 第三次以巨大优势成为网络和移动端排名第一的产品。 Perplexity 在网络上排名第三,是一款专注于提供简明、实时和准确查询答案并引用来源的人工智能搜索引擎,其在访问时长方面略胜于 ChatGPT,且首次进入移动端前 50 名榜单。 Anthropic 的 Claude 是 ChatGPT 的直接竞争对手,在网页排名中进入前五,排名第 4。
2024-12-23
周报生成器
以下是关于周报生成器的相关信息: 周报生成器是一种能够根据用户提供的日常工作内容提取要点并适当扩充,从而生成周报的工具。它可以将用户输入的信息转化为一份高质量的周报,适用于自媒体、市场营销等职业类型,常用于热门、职场、营销、创作等场景类型。 其特点包括: 提供周报框架及要求,以简明格式帮助补充周报内容。 能够对用户输入的周报信息进行筛选和精简,并按照结构化格式排版。 适当扩写用户提供的信息,不主动索取其他信息,按照用户提供的截止日期完成工作。 相关链接: 作者有 LingGame 金永勋、李继刚等。 版本有 0.1 等。
2024-12-24
有哪些工具可以生成对口型
以下是一些可以生成对口型的工具: 即梦 AI:是「视频生成」中的二次编辑功能,现支持中文、英文配音。可上传包含完整人物面容的图片进行视频生成,完成后点击预览视频下的「对口型」按钮,输入台词并选择音色,或上传配音文件进行对口型效果生成。目前支持语言包括中文(全部音色)、英文(推荐「超拟真」内的音色)。使用技巧包括上传写实/近写实的人物单人图片,输入 prompt 并选择参数生成视频,确保人物无形变等扭曲效果,确保人物生成的情绪与希望匹配的口型内容匹配,在生成的视频下方进行对口型操作,输入或上传配音内容并注意视频生成时长和配音试听时长尽量对齐。 PlayHT:https://play.ht/studio/,包含预设音色,可免费克隆一个音色,若想生成多个,删除上一个音色即可。 Elevenlabs:https://elevenlabs.io/app,包含预设音色,新用户 1 美元开通一个月会员可使用克隆音色。 魔搭社区:https://www.modelscope.cn/home,是一个模型开源社区及创新平台,由阿里巴巴通义实验室联合 CCF 开源发展委员会共同发起,包含各种声音模型,有开发经验的朋友可使用。 Dubbingx:https://dubbingx.com/,免费克隆音色,有桌面版,Mac、Window 均可用。 魔音工坊:https://www.moyin.com/ Runway:静态图片+音频文件,可生成对口型视频;动态视频+音频文件,可生成对口型视频,但需要消耗 20 点。 Pika:静态图片+音频文件,可生成对口型视频。 请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-12-24
视频生成
以下是关于视频生成的相关内容: 使用 Adobe Firefly 生成带有文本提示和图像的视频: 1. 在 Advanced 部分,您可以使用 Seed 选项添加种子编号,帮助启动流程并控制 AI 创建内容的随机性。如果使用相同的种子、提示和控制设置,可以重新生成类似的视频剪辑。 2. Adobe Firefly 中的“生成视频”(测试版)能将您的书面描述转换为视频剪辑。使用文本提示定义内容、情感和设置(包括摄像机角度),以指导摄像机移动并创建传达所需情绪和信息的视频。您还可以合并图像,为视频生成提供视觉提示。 在 Adobe Firefly 网站上,选择“生成视频”。 在 Generate video 页面上,在 Prompt 字段中输入文本提示。您还可以使用 Upload 部分中的 Image 选项,将图像用于第一帧,并为视频剪辑提供方向参考。添加图像以提供清晰的视觉引导,使生成的视频更紧密地与您的愿景对齐。 在 General settings 部分,您可以确定 Aspect ratio 和 Frames per second。 Stable Video Diffusion 模型的视频生成: 1. 手动下载相关内容并分别放到指定路径。 2. 做好准备工作后再次运行,复制 url 到浏览器中打开。 3. 点击下拉箭头选择不同模型版本,勾选 load Model。 4. 目前 SVD 本地部署仅支持图生视频,图片来源可以选择 AI 绘画工具如 Midjourney、Stable Diffusion 等生成图片,然后上传到 SVD 进行视频生成。同时,可以调左侧的一些参数控制视频的生成效果。视频生成的保存路径在 outputs 下。
2024-12-24
从图片生成 prompts
从图片生成 prompts 的方法如下: 可以参考以下生成的提示词示例: 远景,三分法构图,俯视视角,数字绘画,云雾缭绕的山谷,群山连绵起伏,山谷间云雾缭绕,阳光透过云层洒在山间,形成光与影的对比,模拟观众的视线逐渐接近这片土地,新印象派风格特征,使用数字画笔和渐变工具ar 16:9v 6.1 远景,中心对称构图,俯视视角,摄影风格,云雾中的山谷,山峦在云雾中若隐若现,山谷中隐约可见的河流蜿蜒流淌,云雾的流动感和山的静态形成对比,现实主义风格特征,使用长焦镜头和景深控制技术ar 3:2v 6.1 远景,对角线构图,俯视视角,水墨画风格,云雾缭绕的山谷,山峦线条流畅,云雾以墨色深浅表现,山谷中的云雾仿佛在流动,给人以动态的视觉感受,中国山水画风格特征,使用毛笔和水墨渲染技术ar 2:3v 6.1 “Prompt”是指提供给 Midjourney Bot 解读来生成图像的短文本短语。一个基本的提示可以只是一个单词、短语或表情符号。更高级的 Prompts 可以包括一个或多个图片 URL、多个文本短语以及一个或多个参数。图片 URL 始终位于 prompt 的最前面,以影响完成结果的风格和内容。参数需要放在提示语的末尾。 藏师傅教您用 AI 三步制作任意公司的周边图片: 获取 Logo 图片的描述。 根据 Logo 图片的描述和生成意图生成图片提示词。 将图片和提示词输入 Comfyui 工作生成。例如:将第一步生成的提示词填入{图像描述}位置,将您想生成的周边填入{周边描述}部分。给出类似“ The pair of images highlights a logo and its realworld use for a hitech farming equipment;this logo is applied as a black and white tattoo on lower back of an inmate ”的提示词示例。
2024-12-24
优质的生成图片的AI
以下是为您提供的优质生成图片的 AI 相关信息: 图生图产品: 目前比较成熟的通过输入图片生成类似图片的 AI 产品主要有: 1. Artguru AI Art Generator:在线平台,生成逼真图像,给设计师提供灵感,丰富创作过程。 2. Retrato:AI 工具,将图片转换为非凡肖像,拥有 500 多种风格选择,适合制作个性头像。 3. Stable Diffusion Reimagine:新型 AI 工具,通过稳定扩散算法生成精细、具有细节的全新视觉作品。 4. Barbie Selfie Generator:专为喜欢梦幻童话风格的人设计的 AI 工具,将上传的照片转换为芭比风格,效果超级好。 这些 AI 模型通过组合技术如扩散模型、大型视觉转换器等,可以根据文本或参考图像生成具有创意且质量不错的相似图像输出。但仍有一些局限,如偶尔会出现性能不稳定、生成内容不当等问题。 文生图工具: 文生图工具是一种利用人工智能技术生成图片的工具。它通过分析输入的文本描述,使用深度学习算法生成相应的图片。目前,市场上有许多文生图工具,其中一些比较受欢迎的工具包括: 1. DALL·E:DALL·E 是 OpenAI 推出的一款文生图工具,它可以根据输入的文本描述生成逼真的图片。 2. StableDiffusion:StableDiffusion 是一款开源的文生图工具,它可以生成高质量的图片,并且支持多种模型和算法。 3. MidJourney:MidJourney 因其高质量的图像生成效果和用户友好的界面设计而受到广泛欢迎,并且在创意设计人群中尤其流行。 您可以在 WaytoAGI 网站(https://www.waytoagi.com/category/104)查看更多文生图工具。 判断图片是否为 AI 生成: 如果您不善于判断一张图片是否为 AI 生成,可以借助一些网站。例如使用 AI 来鉴别 AI 绘图性质的网页:ILLUMINARTY(https://app.illuminarty.ai/)。但在测试过程中,可能会出现一些误判,比如有些结构严谨的真实摄影作品,反而会被识别为 AI 作图。这是因为鉴定 AI 自身的逻辑算法,并不能像人类一样综合去考虑不符合人的逻辑的各种表现。
2024-12-23
如何利用AI生成环形图
以下是利用 AI 生成环形图的相关信息: 存在一些可以辅助或自动生成 CAD 图的 AI 工具和插件,在设计和工程领域较为常用。例如: CADtools 12:这是 Adobe Illustrator(AI)插件,添加了 92 个绘图和编辑工具,包括图形绘制、编辑、标注、尺寸标注、转换、创建和实用工具。 Autodesk Fusion 360:Autodesk 开发的云端 3D CAD/CAM 软件,集成了 AI 功能,能创建复杂几何形状和优化设计。 nTopology:基于 AI 的设计软件,可创建复杂 CAD 模型,包括拓扑优化、几何复杂度和轻量化设计等。 ParaMatters CogniCAD:基于 AI 的 CAD 软件,能根据输入的设计目标和约束条件自动生成 3D 模型,适用于拓扑优化、结构设计和材料分布等领域。 一些主流 CAD 软件如 Autodesk 系列、SolidWorks 等,提供了基于 AI 的生成设计工具,可根据输入自动产生多种设计方案。但使用这些工具通常需要一定的 CAD 知识和技能,对于初学者,建议先学习基本的 3D 建模技巧。 如果您是要生成其他类型的环形示意图,例如项目管理流程图,可以按照以下步骤使用 Lucidchart: 1. 注册并登录: 2. 选择模板:在模板库中搜索“项目管理流程图”。 3. 编辑图表:根据项目需求添加和编辑图形和流程步骤。 4. 优化布局:利用 AI 自动布局功能,优化图表的外观。 5. 保存和分享:保存图表并与团队成员分享,或导出为 PDF、PNG 等格式。 利用这些 AI 工具,您可以快速、高效地创建专业的示意图,满足各种工作和项目需求。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-12-23
数字人
数字人是运用数字技术创造出来的人,虽现阶段不能如科幻作品中的人型机器人般高度智能,但已在生活各场景中常见,且随 AI 技术发展迎来应用爆发。目前业界对其尚无准确定义,一般根据技术栈不同分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要用于影视行业及直播带货,表现质量与手动建模精细度及动捕设备精密程度直接相关,不过视觉算法进步使在无昂贵动捕设备时,通过摄像头捕捉人体骨骼和人脸关键点信息也能有不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,能创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等。 2. Synthesia:AI 视频制作平台,可创建虚拟角色并进行语音和口型同步,支持多种语言,用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音并合成逼真说话视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请遵守相关使用条款和隐私政策,注意生成内容的版权和伦理责任。 以下是一些包含数字人的节目单示例: 1. 节目“猜真人”:魔术互动类表演,2 个、8 个数字分身,猜测哪个是真正的我,用到 AI 数字人技术。 2. 节目“亲情的应用场景(逝者)”:女儿打扫房间扫到去世父亲的二维码再次对话,涉及 AI 分身的积累准备。 3. 节目“AI 转绘”:经典电影混剪,包括短片素材、AI 转绘、Lora 等技术。 4. 节目“AI 贺岁”:晚会中场致谢,用到共创团队记录、新年祝福等。 5. 节目“打工人共情”:涉及 AI 素材、共情脚本、炫技视频剪辑等。
2024-12-24
AI 数字人哪家的好
以下为您介绍一些较好的 AI 数字人相关的资源和产品: 1. 数字人躯壳构建: 可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署。笔者的开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单。另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D。 2. 数字人课程: 强烈推荐卡尔的 AI 沃茨做的这门数字人课程,一共 15 节视频课,持续更新还会不定时增加最新的数字人内容,附赠课外社群辅导,专门解决数字人相关的问题。关于卡尔,从创建 AIGC 开源学习网站 learnpromptl.pro,到建立卡尔的 AI 沃茨万人社群,他一直致力于 AI 学习圈。这一次,他建立了一套完整的数字人学习体系,放在这门《克隆你自己》的课程中,带领大家全方位掌握数字人各技能。同时,他详细回顾了 2023 年数字人领域的破圈事件,如 AI 马斯克对谈 AI 乔布斯超 331.9k 播放、霉霉说中文火遍全网、AI 郭德纲讲英文相声、硅语翻译|海外明星送出中文新年祝福、通义千问|兵马俑跳科目三、小冰推出支持交互的多模态数字人、阿根廷新总统用 HeyGen 做演讲等。数字人的出现,可以极大程度上优化工作流,尤其在制作个人 ip 短视频、配音、直播甚至到智能客服、虚拟偶像等各种领域都可以完成赋能。如果您想加入这场数字人浪潮,拥有自己的数字分身,优化自己的工作流,这门具备完整数字人学习体系的课程,正是您的需求。(扫码可以查看课程详细内容和介绍) 3. 算法驱动的数字人相关开源代码: ASR 语音识别:openai 的 whisper:https://github.com/openai/whisper ;wenet:https://github.com/wenete2e/wenet ;speech_recognition:https://github.com/Uberi/speech_recognition 。 AI Agent:大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。Agent 部分可以使用 LangChain 的模块去做自定义,里面基本包含了 Agent 实现的几个组件 。 TTS:微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费;VITS:https://github.com/jaywalnut310/vits,还有很多的分支版本,可以去搜索一下,vits 系列可以自己训练出想要的人声;sovitssvc:https://github.com/svcdevelopteam/sovitssvc,专注到唱歌上面,前段时间很火的 AI 孙燕姿。 当然这种简单的构建方式还存在很多的问题,例如:如何生成指定人物的声音?TTS 生成的音频如何精确驱动数字人口型以及做出相应的动作?数字人如何使用知识库,做出某个领域的专业性回答?
2024-12-23
有没有免费是数字人工具
以下是一些免费的数字人工具: 1. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片。 上传后效果如图所示,My Avatar处显示上传的照片。 点开大图后,点击Create with AI Studio,进入数字人制作。 写上视频文案并选择配音音色,也可以自行上传音频。 最后点击Submit,就可以得到一段数字人视频。 2. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 点击上面的网址,点击右上角的Create vedio。 选择人物形象,可以点击ADD添加照片,或者使用DID给出的人物形象。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 最后,点击Generate vedio就可以生成一段视频。 打开自己生成的视频,可以下载或者直接分享给朋友。 3. KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很AI。 使用方法: 点击上面的网址,注册后获得120免费k币,选择“照片数字人口播”的功能。 点击开始创作,选择自定义照片。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 打开绿幕按钮,点击背景,可以添加背景图。 最后,点击生成视频。 此外,还有一些常用于营销领域且可制作数字人的工具,如Synthesia、HeyGen等。更多数字人工具请访问相关网站查看。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-12-21
数字孪生
数字孪生是一个涉及多个领域的概念。在表演方面,曾测试过号称能做数字孪生的软件,结果发现存在一定局限性,如只是换脸的小变体且表现中庸。表演的本质是放大情感,通过强烈的情感表达来吸引观众。 在人际关系中,每个人都可能有一个由 AI 驱动的“数字双胞胎”,它接受了我们所有的写作和言语的训练,已经有人开始这样的探索。 在前期筹备方面,包括为患病老人构建能语音输出的数字人,如一位大哥为患病母亲自学 AI 构建数字人;还有 AI 相声,如为侯宝林、马三立、马季三位相声大师做数字化形象和声音建模;以及网站图片的生成和红包封面的探讨等相关工作。
2024-12-20
免费制作数字人
以下为免费制作数字人的几种方法: 1. 剪映: 打开剪映右侧窗口顶部的“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择后软件会播放数字人的声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中。左下角会提示渲染完成时间,完成后可点击预览查看效果。 为让视频更美观,可删除先前导入的文本内容,通过左上角“媒体”菜单导入本地背景图片,添加到视频轨道上,并将其轨道右侧竖线向右拖拽至与视频对齐,选中轨道后可调整背景图大小和数字人位置。 2. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片,上传后效果在My Avatar处显示,点开大图后点击Create with AI Studio进行制作,写上视频文案并选择配音音色,也可自行上传音频,最后点击Submit得到数字人视频。 3. DID: 优点:制作简单,人物灵活。 缺点:免费版下载后有水印。 使用方法:点击网址,点击右上角Create vedio,选择人物形象,可添加自己的照片或使用给出的形象,配音时可选择提供文字选择音色或上传音频,最后点击Generate vedio生成视频,打开视频可下载或分享。 4. KreadoAI: 优点:免费,功能齐全。 缺点:音色很AI。 使用方法:点击网址注册后获得120免费k币,选择“照片数字人口播”功能,点击开始创作,选择自定义照片,配音时可选择提供文字选择音色或上传音频,打开绿幕按钮,点击背景添加背景图,最后点击生成视频。 此外,剪映作为字节跳动旗下产品,具有诸多优势,其下载地址为: 。制作流程为:首先打开剪映,添加文本到文字轨道并修改朗读文字,然后点击朗读进行声音克隆,完成后选择喜欢的数字人形象并换上克隆音色,最后一键智能生成字幕,自行调整文字样式并校准即可。
2024-12-20
哪个工具可以免费自己创建数字人
以下是一些可以免费创建数字人的工具及使用方法: 1. 剪映: 在剪映右侧窗口顶部,打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择后软件会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中。左下角会提示渲染完成时间,之后可点击预览查看效果。 还可增加背景图片,删除先前导入的文本内容,点击左上角“媒体”菜单并“导入”选择本地图片上传,将图片添加到视频轨道上,调整图片位置和大小。 2. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择Photo Avatar上传自己的照片,上传后效果在My Avatar处显示,点开大图后,点击Create with AI Studio,进入数字人制作,写上视频文案并选择配音音色,也可自行上传音频,最后点击Submit得到数字人视频。 3. DID: 优点:制作简单,人物灵活。 缺点:免费版下载后有水印。 使用方法:点击网址,点击右上角Create vedio,选择人物形象,可点击ADD添加照片或使用给出的人物形象,配音时可选择提供文字选择音色或直接上传音频,最后点击Generate vedio生成视频,打开生成的视频可下载或分享。 4. KreadoAI: 优点:免费,功能齐全。 缺点:音色很AI。 使用方法:点击网址注册后获得120免费k币,选择“照片数字人口播”功能,点击开始创作,选择自定义照片,配音时可选择提供文字选择音色或直接上传音频,打开绿幕按钮,点击背景可添加背景图,最后点击生成视频。 此外,还有Synthesia等工具。更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化,使用时请遵守相关条款和政策,并注意版权和伦理责任。
2024-12-20
个人如何用Ai通过改写文案快速经营好公众号
目前知识库中没有关于个人如何用 AI 通过改写文案快速经营好公众号的相关内容。但一般来说,您可以利用一些自然语言处理的 AI 工具,如 ChatGPT 等,输入您的原始文案和具体的改写要求,获取新的文案。不过,在使用 AI 生成的文案时,需要您进行仔细的审核和修改,以确保内容符合公众号的定位和风格,同时保持高质量和独特性。另外,要经营好公众号,还需要关注内容的选题、排版、与读者的互动等多个方面。
2024-12-24
想制作个人的知识库国内有什么好的AI工具么
以下是一些国内可用于制作个人知识库的 AI 工具: 1. Kimi 智能助手:是 ChatGPT 的国产平替,上手体验好,适合新手入门学习和体验 AI。不用科学上网、不用付费、支持实时联网,是国内最早支持 20 万字无损上下文的 AI,对长文理解表现出色,能一次搜索几十个数据来源,无广告,能定向指定搜索源(如小红书、学术搜索)。PC 端可通过下载。 2. 飞书:汇集了各类 AI 优质知识库、AI 工具使用实践,助力人人成为效率高手。可通过下载。 此外,学习使用国内大语言模型工具可以从提示词开始。一些国产大模型如智谱和文心可以实现文生图的功能。
2024-12-24
想建立个人知识库使用什么AI工具更好一些
以下是为您推荐的用于建立个人知识库的 AI 工具: 1. AnythingLLM:包含所有 Open WebUI 的能力,额外支持选择文本嵌入模型、选择向量数据库。安装地址:https://useanything.com/download 。安装完成后需进行配置,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。在使用时,可创建独有的 Workspace 与其他项目数据隔离,包括创建工作空间、上传文档并进行文本嵌入、选择对话模式(Chat 模式会综合训练数据和上传文档给出答案,Query 模式仅依靠文档数据给出答案),配置完成后即可进行对话测试。 2. LlamaIndex:是更高一层 LangChain 的抽象,简化了 LangChain 对文本分割、查询的接口,提供了更丰富的 Data Connector。只针对 GPT Model 做 Index,参考 https://gptindex.readthedocs.io/en/latest/ 。 3. ExoBrain 的集成软件 Maimo.ai:作为外脑的主要记忆空间,能捕获多种数字内容并随时随地访问,可挂接和导入外部记忆,能快速理解捕获内容、灵活创作笔记、生成创作建议,可与外脑知识库对话并自动做外部检索完善答案。今年十一月将开放第一个体验版,关注获取最新信息。
2024-12-24
我想用AI完成一个编程项目,帮我从零到一完成一个个人介绍网站,我现在使用vo.dev完成了一个网站,但是不可以供我使用我上传github后再vercel运行发现会出现404请问我该怎么办
很抱歉,暂时没有关于您所描述问题的相关内容。出现 404 错误通常是由于页面未找到导致的。您可以先检查一下以下几个方面: 1. 确认您在 GitHub 上的代码上传是否完整且正确,包括相关的配置文件和依赖项。 2. 检查 Vercel 的部署设置,确保配置正确,例如域名绑定、环境变量等。 3. 查看服务器的日志,以获取更详细的错误信息,从而确定问题的具体原因。 希望这些建议能对您有所帮助,如果问题仍未解决,建议您进一步查阅相关的技术文档或向技术社区寻求帮助。
2024-12-19
怎么构建个人本地知识库
构建个人本地知识库可以按照以下步骤进行: 1. 了解 RAG 技术: 利用大模型的能力搭建知识库是 RAG 技术的应用。 大模型训练数据有截止日期,RAG 可解决依靠不在训练集中的数据的问题。 RAG 应用包括文档加载、文本分割、存储、检索和输出 5 个过程。 文档加载可从多种来源加载,如 PDF 等非结构化数据、SQL 等结构化数据和代码等。 文本分割将文档切分为指定大小的块。 存储涉及将文档块嵌入转换为向量形式并存储到向量数据库。 检索通过算法找到与输入问题相似的嵌入片。 输出是将问题和检索出的嵌入片提交给 LLM 生成答案。 文本加载器将用户提供的文本加载到内存以便后续处理。 2. 准备软件: 需要一个额外的软件 AnythingLLM,它包含所有 Open WebUI 的能力,并额外支持选择文本嵌入模型和向量数据库。 3. 安装和配置: 安装地址:https://useanything.com/download 。 安装完成后进入配置页面,主要分为三步:选择大模型、选择文本嵌入模型、选择向量数据库。 4. 构建本地知识库: 在 AnythingLLM 中创建自己独有的 Workspace 与其他项目数据隔离。 首先创建一个工作空间。 上传文档并在工作空间中进行文本嵌入。 选择对话模式,AnythingLLM 提供 Chat 模式(大模型根据训练数据和上传文档综合给出答案)和 Query 模式(大模型仅依靠文档中的数据给出答案)。 完成配置后进行测试对话。 本文的思路来源于视频号博主黄益贺,作者按照其视频进行了实操并附加了一些关于 RAG 的额外知识。
2024-12-19
在个人赚钱方面,AGI最常用的三个方面
在个人赚钱方面,AGI 较为常用的三个方面包括: 1. 合成数据:通过生产数据喂给 AI 模型以提高效果。传统做数据的核心竞争力在于获取他人无法拿到的数据以及低成本进行大量数据清洗和标注,新兴的是用 AI 来生成数据再喂给其他 AI。 2. 模型市场/平台:如当前热门的 HuggingFace(HF),提供模型市场服务。在 AI Agent 出现时,模型之间的互相调用可能会用到此类服务和规则。 3. 开发 AI 代理:例如 AutoGPT GUI、MULTI·ON plugin by MULTI·ON、BabyBeeAGI、MiniAGI 等,可实现自动执行任务等功能,具有一定的商业价值。
2024-12-12