Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

数字人开发的网站

Answer

以下是一些与数字人开发相关的信息:

  • 推荐卡尔的 AI 沃茨制作的数字人课程,共 15 节视频课,持续更新,附赠课外社群辅导,涵盖完整的数字人学习体系。报名方式为扫码查看课程详细内容和介绍。
  • 制作数字人的工具主要有:HeyGen 是一个 AI 驱动的平台,可创建逼真的数字人脸和角色;Synthesia 是一个 AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步;D-ID 是一家提供 AI 拟真人视频产品服务和开发的公司。更多工具可访问网站 https://www.waytoagi.com/category/42 查看。
  • 前期筹备的相关工作包括:1 月 25 日,为患病老人构建能语音输出的数字人;进行 AI 相声项目,缺声音建模大佬和数字化形象;网站图片方面,已生成近 1500 张入场券头像,还差一半,网站首页(春晚预约)周末上线;探讨红包封面是 AI 还是新年元素重要,以及龙的动画与 AI 春晚的关系。
Content generated by AI large model, please carefully verify (powered by aily)

References

实战课

程:数字人课程强烈推荐一下卡尔的AI沃茨做的这门数字人课程,一共15节视频课,持续更新还会不定时增加最新的数字人内容,附赠课外社群辅导,专门解决数字人相关的问题。关于卡尔,从创建AIGC开源学习网站learnpromptl.pro,到建立卡尔的AI沃茨万人社群,他一直致力于AI学习圈。这一次,他建立了一套完整的数字人学习体系,放在这门《克隆你自己》的课程中,带领大家全方位掌握数字人各技能💪同时,他详细回顾了2023年数字人领域的破圈事件⬇️AI马斯克对谈AI乔布斯超331.9k播放霉霉说中文火遍全网,HeyGen再破圈AI郭德纲讲英文相声硅语翻译|海外明星送出中文新年祝福通义千问|兵马俑跳科目三小冰推出支持交互的多模态数字人阿根廷新总统用HeyGen做演讲🤖️数字人的出现,可以极大程度上优化工作流,尤其在制作个人ip短视频、配音、直播甚至到智能客服、虚拟偶像等各种领域都可以完成赋能。所以如果你想加入这场数字人浪潮,拥有自己的数字分身,优化自己的工作流,这门具备完整数字人学习体系的课程,正是你的需求💡[heading2]报名方式[content]🎉24年是数字人元年,人人都将拥有自己的数字人!(扫码可以查看课程详细内容和介绍)[heading2]行业评价[content]业内KOL数字人发言💬[heading2]课程大纲[content][heading2]教学形式

问:有哪些制作数字人的工具

制作数字人(Digital Human)的工具主要是指那些能够创建虚拟角色、虚拟形象或者虚拟代言人的软件和技术。以下是几个可以用来制作数字人的工具:1.HeyGen:HeyGen是一个AI驱动的平台,可以创建逼真的数字人脸和角色。它使用深度学习算法来生成高质量的肖像和角色模型,适用于游戏、电影和虚拟现实等应用。2.Synthesia:Synthesia是一个AI视频制作平台,允许用户创建虚拟角色并进行语音和口型同步。它支持多种语言,并可以用于教育视频、营销内容和虚拟助手等场景。3.D-ID:D-ID是一家提供AI拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的AI语音机器人将自动转换成语音,然后就能合成一段非常逼真的会开口说话的视频。更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。内容由AI大模型生成,请仔细甄别。类似问题:对口型的软件有哪些?

前期筹备

1、数字往生:需要为一位患病的老人构建一个能语音输出的数字人。(可以有延迟)[太阳]背景:我们找到了一位母亲被病魔困扰的大哥,他从0自学AI就是为了趁母亲还在构建一个数字人,让母亲能一直陪在身边。我和辽台的导演@张小琳已经取得了他家人同意,愿意拍摄一部纪实短片,讲述他对AI的探索和AI对人的意义[太阳]他的母亲也很慷慨,愿意讲述为何支持孩子这么做。(这样的活人数字人成立了,相信有很多老人和子女会被打动,这等于提前为自己的家人留下一份数字遗产。他的奶奶也不在了,他手握着不到1分钟的影响资料,一直期待着技术进步,让自己的孩子跟她见面)[苦涩]2、AI相声:缺一位声音建模大佬+给三位相声大师做数字化形象(嘴型要对的上)目前规划侯宝林,马三立,马季三位同台讲演,每位都由不同的大佬训练声音某位圈内顶级大佬已完成了马三立声音模型,并愿意参与共创[奸笑]现在缺数字化形象&再加入一位声音模型大佬主题脚本可以参考@程宇Alex的脱口秀方向3、网站图片:目前@云尚AI-图形处理-设计老哥已经MJ生成了近1500张入场券头像,网站首页(春晚预约)也将在周末上线,现在还差一半的入场券头像。有prompt参考。需求MJ图像批量生成。可提供技术支持,但需求大量图片[社会社会]4、红包封面探讨:大家觉得AI还是新年元素重要?还是先有龙的动画再体现AI春晚?可以随意甩图到群里来

Others are asking
能使用对话生成 figma 设计稿的网站有哪些
以下是一些能使用对话生成 Figma 设计稿的网站: 1. Figma to HTML:这是 Figma 用于生成 html 文件的小插件,适用于 Figma 设计稿,使用方法为在设计好的界面中,右击 Plugins Figma to HTML,选取设计稿并设置转换目标为 html 文件,点击 Convert 后开始下载,得到 html 文件。 2. Literally Anything:优点是极其方便,可用于获得复杂网页的部分小组件的代码;缺点是功能单一,很难实现精美网页。使用方法是描述想要生成的网页,点击 Edit Code 显示 html 代码。 3. Stunning:优点是便捷,制作的网页较为精美;缺点是灵活性不高。使用方法为点击 New Website 新建,根据需求选择对应的模版,和 Stunning AI 交流设计需求。 4. GPTs Instant Website :使用方法暂未提及。 5. Texttofigma:可以对话生成 Figma 设计稿,目前来看还比较初级。 6. Master GO:国内模仿 Figma 的软件之一,公布了自己的 AI 能力,即对话生成设计稿。 7. 即时 AI:推出了 AI 能力的预告,但目前还是期货。
2025-03-23
哪些免费生成视频的网站
以下是一些免费生成视频的网站: 海外: Haiper(有免费额度):https://haiper.ai/ 。支持文生视频、图生视频、素描生视频、扩展视频,能生成 HD 超高清的视频。文生视频支持选择风格、秒数(2s 和 4s)、种子值。图生视频只能写提示词、秒数(2s 和 4s)、种子值。还支持视频重绘和局部重绘。 DynamiCrafter(免费):https://huggingface.co/spaces/Doubiiu/DynamiCrafter ,https://github.com/Doubiiu/DynamiCrafter?tab=readmeovfile 。可以生成 2 秒图生视频,还能做短视频拼长视频。 Morph studio(内测):https://app.morphstudio.com/ 。暂未对外开放,可在官网提交内测申请。在 discord 上可以免费体验,支持文生视频、图生视频,英文提示词,支持运镜、运动强度、尺寸、秒数设置,默认生成 3s 视频。 国内: Hidreamai(有免费额度):https://hidreamai.com//AiVideo 。支持文生视频、图生视频,提示词使用中文、英文都可以。文生视频支持正向提示词、反向提示词、运镜控制、运动强度控制,支持多尺寸,可以生成 5s 和 15s 的视频。 ETNA:https://etna.7volcanoes.com/ 。可以根据用户简短的文本描述生成相应的视频内容。生成的视频长度在 8~15 秒,画质可达到 4K,最高 38402160,画面细腻逼真,帧率 60fps。支持中文,时空理解。 Dreamina(国内内测,有免费额度):https://jimeng.jianying.com/aitool/video/generate 。支持文生视频、图生视频,视频生视频,支持图生视频首尾帧功能,提示词使用中文、英文都可以。文生视频支持正向提示词、运镜控制、运动强度控制、帧数选择,支持多种尺寸。 可灵(免费):https://klingai.kuaishou.com/ 。支持文生视频、图生视频,支持图生视频首尾帧功能,提示词可使用中文。文生视频支持正向提示词、反向提示词、运镜控制、时长选择(5s、10s),支持多种尺寸。
2025-03-22
免费的PPT加工网站
以下为您介绍一些免费的 PPT 加工网站: 歌者 PPT(gezhe.com):这是一款永久免费的智能 PPT 生成工具。具有话题生成、资料转换、多语言支持、海量模板和案例库、在线编辑和分享、增值服务等功能。其产品优势包括免费使用、智能易用、海量案例、资料转 PPT 专业、AI 翻译等。推荐理由为完全免费、智能化程度高、模板和案例丰富、支持多语言以及学习成本低。 讯飞智文(https://zhiwen.xfyun.cn/) Mindshow.fun(http://Mindshow.fun ,支持 Markdown 导入) kimi.ai(http://kimi.ai ,选 PPT 助手暂时免费效果好) Tome.app(http://Tome.app ,AI 配图效果好) Chatppt.com(http://Chatppt.com ,自动化程度高) 目前市面上大多数 AI 生成 PPT 按照 AI 生成 PPT 大纲、手动优化大纲、导入工具生成 PPT、优化整体结构的思路来完成设计和制作。 此外,还为您推荐两篇市场分析的文章供参考: 《》 《》
2025-03-21
请你介绍一下WaytoAGI,他是怎么样的一个网站,推荐几篇内容,快速吸引人的眼球,让人对这个网站充满兴趣。
WaytoAGI 是一个内容丰富多样的网站,涵盖了众多与 AI 相关的领域和活动。 在视频作品社区方面,有杭州云小镇相关的内容,展现了从创意到完成的精彩过程,还包括真人与 AI 结合的视觉音乐等。 在音乐方面,有 AI 音乐社区诗歌音乐、AI 音乐教程、提示词分享等,如《PROMPTS FOR AI DANCE MUSIC》,包含了多种音乐相关的标签、提示词和编曲介绍。 此外,还有关于 AI 学习的内容,如“【AI 学习笔记】小白如何理解技术原理与建立框架(通俗易懂内容推荐)”,其中推荐了对建立入门框架有重大帮助的视频,如“【包教包会】一条视频速通 AI 大模型原理_哔哩哔哩_bilibili”和“用大模型保存你的全部人生,你会接受吗:专访安克创新 CEO 阳萌|大咖谈芯第 11 期_哔哩哔哩_bilibili”。 总之,WaytoAGI 网站充满了创新和学习的资源,能满足不同用户对 AI 相关内容的需求。
2025-03-21
请你介绍一下WaytoAGI,他是怎么样的一个网站,普通在这个网站可以学到什么?要让人最快的发现这个网站的宝藏之处,首先应该看哪些内容。
WaytoAGI 是一个专门讲人工智能(AI)的网站,就像一个“百科全书”,里面内容丰富: 1. 无需注册和付费,点开链接即可访问:。 2. 内容分类清晰,想学 AI 绘画可看“AI 绘画”部分,找 AI 工具可去“工具推荐”部分,方便查找所需。 3. 若有不懂或想交流,可加入社群讨论。 它对您的作用包括: 1. 对 AI 零基础者,能从零开始教学,如“AI 是啥”“ChatGPT 怎么用”“AI 绘画是咋回事”等,助您从小白变高手。 2. 对懂些 AI 者,提供超多实用工具和案例,如用 AI 写文案、做设计、创业等,可直接应用,节省摸索时间。 3. 为您整理 AI 最新资讯,让您及时了解领域变化,不错过新工具和新技术。 4. 告诉您哪些 AI 工具能助您低成本创业,如用 AI 开网店、做自媒体、搞设计服务等,助普通人用 AI 取得成就。 5. 帮您筛选靠谱的 AI 相关资料,节省找资源的时间和精力。 此外,访问 WaytoAGI 还有以下好处: 1. 了解最新的 AI 技术,它像免费的“技术期刊”,不仅让您知晓最新动态,还传授实用技能,且开源免费。 2. 提供线上共学,手把手教您应用 AI 技术,无论基础如何,都能找到适合的学习路径。 3. 是寻找志同道合队友的好平台,若您想创业、做副业或找对 AI 感兴趣的伙伴,这里很合适。 在这个网站,您可能会有如下收获: 1. 体验到 AI 自动化的强大,如用 DeepSeek 加飞书多维表格实现自动化。 2. 找到副业和创业的伙伴。 3. 有机会与高手和大佬面对面交流,请教实际操作中的问题,避免走弯路和浪费时间。 总之,WaytoAGI 是一个能帮您快速入门 AI、学会用 AI 搞事情的“武器库”,无论您是小白还是想靠 AI 赚钱,都能从中受益。
2025-03-21
现在社区WaytoAGI是不是最好系统性学习ai的网站,请说明理由
WaytoAGI 不是一个系统性学习 AI 的最佳网站。原因如下: WaytoAGI 更像是一个一起做有趣事情的游乐场,不是专门用于系统性学习的地方。在这里,更鼓励发挥对 AI 天马行空的想象,把 AI 玩出新花样。 但对于想要系统性学习 AI 的人来说,个人观点认为一开始应该进行系统性的学习,比如系统地看几本书、听几门好课,不能仅依靠刷短视频等碎片化输入。 不过,WaytoAGI 也有其优势,比如它是一个开源的知识库和社区平台,汇集了丰富的 AI 资源,包括上千个人工智能网站和工具,提供最新的 AI 工具、应用、智能体和行业资讯,还有丰富的学习资源、实践活动等。在没有任何推广的情况下,一年时间已有超过 100 万用户和超千万次的访问量。
2025-03-21
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,但一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息以达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 生成数字人视频的方法:在显示区域,拖动背景图一角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。增加字幕,点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。至此,数字人视频完成,点击右上角“导出”按钮导出视频备用。若希望数字人换成自己希望的面孔,则需用另一个工具进行换脸。
2025-03-22
数字人
数字人是运用数字技术创造出来的人,目前业界还没有一个关于数字人的准确定义,但一般可根据技术栈的不同分为两类,一类是由真人驱动的数字人,另一类是由算法驱动的数字人。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业以及现下很火热的直播带货,其表现质量与手动建模的精细程度及动捕设备的精密程度直接相关,不过随着视觉算法的不断进步,现在在没有昂贵动捕设备的情况下也可以通过摄像头捕捉到人体骨骼和人脸的关键点信息,从而做到不错的效果。 制作数字人的工具主要有: 1. HeyGen:是一个 AI 驱动的平台,可以创建逼真的数字人脸和角色。使用深度学习算法生成高质量的肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:是一个 AI 视频制作平台,允许用户创建虚拟角色并进行语音和口型同步。支持多种语言,并可用于教育视频、营销内容和虚拟助手等场景。 3. DID:是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后就能合成一段非常逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会随着时间和技术的发展而变化。在使用这些工具时,请确保遵守相关的使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角,将图片放大到适合的尺寸,比如覆盖视频窗口。并将数字人拖动到合适的位置。 增加字幕:点击文本 智能字幕 识别字幕,点击开始识别。软件会自动将文字智能分段并形成字幕。 至此,数字人视频就完成了。点击右上角的“导出”按钮,导出视频以作备用。如果希望数字人换成自己希望的面孔,就需要用另一个工具来进行换脸了。
2025-03-21
什么工具可以帮我做数字人
以下是一些可以帮助您制作数字人的工具: 1. HeyGen:这是一个 AI 驱动的平台,能创建逼真的数字人脸和角色。它运用深度学习算法生成高质量的肖像和角色模型,适用于游戏、电影和虚拟现实等领域。 2. Synthesia:这是一个 AI 视频制作平台,允许用户创建虚拟角色并实现语音和口型同步。它支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:这是一家提供 AI 拟真人视频产品服务和开发的公司,只需上传人像照片和输入要说的内容,平台提供的 AI 语音机器人将自动转换成语音,然后合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。 请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用时,请确保遵守相关使用条款和隐私政策,并注意对生成内容的版权和伦理责任。 以下是使用剪映制作数字人的步骤: 1. 生成数字人:在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”,软件会根据提供的内容生成对应音视频并添加到当前视频中。左下角会提示渲染完成时间,之后可点击预览按钮查看效果。 2. 增加背景图片:删除先前导入的文本内容,为视频增加背景图片。点击左上角“媒体”菜单并点击“导入”按钮,选择本地图片上传。将图片添加到视频轨道上(会覆盖数字人),可通过拖拽轨道右侧竖线使图片在整个视频播放时都显示。
2025-03-21
3D模型做数字人
以下是一些关于用 3D 模型做数字人的相关信息: 工具汇总: 1. MakeACharacter:一键生成 3D 数字人,可自定义面部特征,生成逼真 3D 角色。基于真实人类扫描数据,使用 Unreal Engine 渲染。支持中英文提示,兼容多个行业应用。链接:https://x.com/xiaohuggg/status/1743986486780076279?s=20 2. Rodin Gen1:3D 原生生成模型,拥有 1.5B 参数,可实现 3Dto3D 生成。生成 3D 模型及物理基础渲染材质。支持 3D LoRA 技术,类似于 Stable Diffusion。链接:https://x.com/xiaohuggg/status/1743638052097184102?s=20 3. Skybox AI 0.9 版本更新:可以从文本提示或草图生成 360 度 3D 世界。使用 NeRF 技术,增强图像的空间深度和真实感。提供不同分辨率的 3D 网格下载。链接:https://x.com/xiaohuggg/status/1739926702158225859?s=20 4. 扫描物体生成 3D 模型:使用 APP 扫描物体,完成 3D 全貌捕获。创建 AR QR 码,展示物体于任何地点。苹果新品官网展示中应用此技术。链接:https://x.com/xiaohuggg/status/1739259052448944139?s=20 构建高质量的 AI 数字人的躯壳方式: 1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢。代表是 Live2D Cubism。 2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高。代表是 UE、Unity,虚幻引擎 MetaHuman 等。个人学习在电脑配置和学习难度上有一定门槛。 3. AIGC:虽然省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持 ID 一致性,帧与帧的连贯性上会让人有虚假的感觉。典型的项目有 wav2lip等。AIGC 还有一个方向是直接生成 2d/3d 引擎的模型,但该方向还在探索中。 摊位信息: 1. AI 3D 打印纹身印章:通过 AI 将图片转绘成简约线条插画风格,然后现场 3D 打印出来,最终交付定制化的纹身印章产品。具体流程:适用 comfyui 工作流生成+输出线稿素材;将线稿生成模型文件;输入 3D 打印机,输出定制图案模型(预计打印时间 35 分钟)。印章图案为软性材料,印章颜料为可水洗安全材料,可另选半永久植物染料。摊位区域:E,摊位编号:69,摊位类型:3D 印章。 2. AI 未病预测细胞仪:通过发送脉冲信号跟神经中枢互动,获取身体各器官的细胞信号,和背后 1500 万人的健康细胞库进行比对,结合医学算法,输出人体营养和各器官的健康度。摊位区域:D,摊位编号:7,摊位类型:产品宣传。 3. AI 研学及 AI 家长课程:摊位区域:E,摊位编号:70,摊位类型:剧本游体验。 4. AI 手办定制+AI 写真照片:摊位区域:E,摊位编号:71,摊位类型:手办。 5. 工作流 MetaGPT,游戏:摊位区域:E,摊位编号:72,摊位类型:游戏体验。 6. 数字人与 AI 硬件(情趣玩具)结合,可与 AI 谈恋爱、玩耍。摊位区域:E,摊位编号:73,摊位类型:AI 相框+成人陪伴产品宣传。
2025-03-21
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息,达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是数字人视频的制作方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。至此,数字人视频完成,点击右上角“导出”按钮导出视频备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-03-20
ai数字人哪些工具比较好
以下是一些比较好的 AI 数字人工具: 1. aigcpanel: 特点:开源且适合小白用户,具有一键安装包,无需配置环境,简单易用。 功能:能生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。 系统兼容:支持 Windows、Linux、macOS。 模型支持:MuseTalk(文本到语音)、CosyVoice(语音克隆)。 使用步骤:下载 8G+3G 语音模型包,启动模型即可。 GitHub 链接: 官网: 2. HEYGEN: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法:点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片;上传后效果在 My Avatar 处显示上传的照片;点开大图后,点击 Create with AI Studio 进入数字人制作;写上视频文案并选择配音音色,也可以自行上传音频;最后点击 Submit 得到数字人视频。 3. DID: 优点:制作简单,人物灵活。 缺点:为防止侵权,免费版下载后有水印。 使用方法:点击网址,点击右上角的 Create vedio;选择人物形象,可以点击 ADD 添加照片或使用给出的人物形象;配音时,可以选择提供文字选择音色或直接上传音频;最后点击 Generate vedio 生成视频;打开生成的视频,可以下载或直接分享给朋友。 4. KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色较 AI。 使用方法:点击网址注册后获得 120 免费 k 币,选择“照片数字人口播”的功能;点击开始创作,选择自定义照片;配音时,可以选择提供文字选择音色或直接上传音频;打开绿幕按钮,点击背景,可以添加背景图;最后点击生成视频。
2025-03-20
降本增效的情况下建筑设计院自己开发AI和应用好现有的AI哪个选择更好
在降本增效的情况下,建筑设计院是自己开发 AI 还是应用现有的 AI,需要综合多方面因素来考虑。 现有的 AI 工具已经在很多领域带来了显著的优势,例如: 1. 提高效率:能够快速产生创意效果和设计方案。 2. 丰富设计效果:极大地丰富了设计自由度,实现各种创意。 3. 拓展工作流程:促使设计工作流程重新组合再造,拓展设计师的思维边界。 同时,也有一些专门针对建筑设计的现有 AI 工具,比如: 1. HDAidMaster:云端工具,在建筑、室内和景观设计领域表现出色,搭载自主训练的建筑大模型,软件 UI 和设计成果颜值在线。 2. Maket.ai:面向住宅行业,在户型和室内软装设计方面有 AI 技术探索,能根据输入需求自动生成户型图。 3. ARCHITEChTURES:AI 驱动的三维建筑设计软件,在住宅设计早期阶段可引入标准和规范约束设计结果。 4. Fast AI 人工智能审图平台:形成全自动智能审图流程,能实现建筑全寿命周期内信息的集成与管理。 然而,自己开发 AI 也有其潜在的好处,比如可以更精准地满足设计院的特定需求和业务特点。但开发 AI 需要投入大量的资源和时间,包括技术人才、资金、研发周期等。 综上所述,建筑设计院应根据自身的技术实力、资源状况、业务需求的独特性等因素来权衡选择。如果资源有限且现有工具能满足大部分需求,应用现有的 AI 可能是更好的选择;如果对特定功能有极高的要求且有足够的能力和资源支持,自己开发 AI 也未尝不可。
2025-03-23
我现在是学了一段时间的comfyui+flux,接下来准备学Python开发comfyui节点、对接模型,这样学下去方向有没有问题呢
您学习 ComfyUI 和 Flux 一段时间后准备学习 Python 开发 ComfyUI 节点并对接模型,这个方向是可行的。以下是一些相关的知识和要点供您参考: 工作流方面: 工作流节点可直接拖动单个节点到任意位置,也可按住 Control 键并用鼠标左键滑框选中多个节点,再按 Shift 键一起拖动。 选中节点后右键新建组,可修改组名、颜色等,组被覆盖时可直接拖动组。 选中节点后右键选择对齐方式,如顶部对齐、左边对齐等。 第三方节点的安装方式包括在 customer NODE manager 中安装、在 GitHub 上复制链接安装、通过终端输入指令安装、在秋叶启动器的版本管理中安装。 可通过 group by Parser 节点控制组,也可通过按住节点按 control b 跳过或按 control m 终止执行。 模型方面: 噪声强度由种子调节,种子固定噪声分布方式,噪声与 CLIP 无关,增大噪声设置值会增强模型对图片重绘的程度。 模型版本的提示词差异:1.5 以 tag 为主,XL 论文称以自然语言为主,但实际使用中因模型微调情况可能仍需用 tag。 Flux 模型有时生成黑图,可能有修复方案,需自行查询。图像生成结果为空,可能是 VAE 编码器与大模型未连接,调整连接后问题解决。 安装方面: 自动打标 joy_caption 副本的节点安装地址为 D:\\ComfyUI\\ComfyUI_windows_portable\\ComfyUI\\custom_nodes。 安装步骤包括:(Comfyui evn python.exe)python m pip install rrequirements.txt 或点击 install_req.bat,注意 transformers 版本不能太低。 下载模型或者运行 ComfyUI 自动下载模型到合适文件夹,如从 https://huggingface.co/unsloth/MetaLlama3.18Bbnb4bit 下载并放到 Models/LLM/MetaLlama3.18Bbnb4bit 文件夹内。 新版的 PuLID 解决了模型污染的问题,使用新版的节点需要禁用或者删除之前的 PuLID 节点,不然可能会有冲突问题。模型放在 ComfyUI\\models\\pulid 文件夹里面,注意用新版的。 如果使用 PuLID,还需要安装 EVA CLIP 等模型。
2025-03-21
RAG 开发实战
以下是关于 RAG 开发实战的详细内容: RAG 是一种结合了检索和生成的技术,能让大模型在生成文本时利用额外的数据源,提高生成质量和准确性。其基本流程为:首先,用户给出输入,如问题或话题,RAG 从数据源中检索相关文本片段(称为上下文);然后,将用户输入和检索到的上下文拼接成完整输入传递给大模型(如 GPT),此输入通常包含提示,指导模型生成期望输出(如答案或摘要);最后,从大模型输出中提取或格式化所需信息返回给用户。 以餐饮生活助手为例进行 RAG 的 Langchain 代码实战,需完成以下步骤: 1. 定义餐饮数据源:将餐饮数据集转化为 Langchain 可识别和操作的数据源(如数据库、文件、API 等),注册到 Langchain 中,并提供统一接口和方法,方便 LLM 代理访问和查询。 2. 定义 LLM 的代理:通过 Langchain 的代理(Agent)实现,代理管理器可让开发者定义不同 LLM 代理及其功能逻辑,并提供统一接口和方法,方便用户与 LLM 代理交互。
2025-03-20
目前国内不需要翻墙的AI编程开发工具有哪些
目前国内不需要翻墙的 AI 编程开发工具主要有以下几种: 1. Trae 国内版:这是字节跳动旗下的国内首个 AI IDE,自带豆包 1.5pro 和满血版 DeepSeek R1、V3 模型,具有国内用户友好、使用完全免费、内置预览插件等特性,网址为 Trae.com.cn。 2. 通义灵码:阿里巴巴团队推出的一款基于通义大模型的智能编程辅助工具,提供多种编程辅助能力。 3. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供智能研发服务的免费 AI 代码助手,基于蚂蚁集团自研的基础大模型进行微调。 此外,还有一些其他的相关工具,如 GitHub Copilot(需注意可能存在使用限制)、CodeWhisperer、CodeGeeX、Cody、Codeium 等,但这些工具的使用情况可能因地区和具体场景有所不同。您可以根据自身需求选择最适合的工具。更多辅助编程 AI 产品,还可以查看 https://www.waytoagi.com/category/65 。
2025-03-20
有没有软件开发过程中辅助标准开发的AI
以下是一些在软件开发过程中辅助标准开发的 AI 工具: 1. GitHub Copilot:由 GitHub 联合 OpenAI 和微软 Azure 团队推出,支持多种语言和 IDE,能为程序员快速提供代码建议,帮助提高编写代码的效率。 2. 通义灵码:阿里巴巴团队推出,基于通义大模型,提供多种编程辅助能力。 3. CodeWhisperer:亚马逊 AWS 团队推出,由机器学习技术驱动,可实时提供代码建议。 4. CodeGeeX:智谱 AI 推出的开源免费 AI 编程助手,基于 130 亿参数的预训练大模型,能快速生成代码。 5. Cody:代码搜索平台 Sourcegraph 推出,借助强大的代码语义索引和分析能力,了解开发者的整个代码库。 6. CodeFuse:蚂蚁集团支付宝团队推出的免费 AI 代码助手,基于自研的基础大模型进行微调。 7. Codeium:一个由 AI 驱动的编程助手工具,通过提供代码建议等帮助提高编程效率和准确性。 更多辅助编程 AI 产品,还可以查看这里:https://www.waytoagi.com/category/65 。每个工具的功能和适用场景可能不同,您可以根据自身需求选择最适合的工具。 在面试时,可以通过以下 AI 相关问题快速判断候选人是否真正懂 AI: 1. “你遇到过 AI 给出明显错误答案的情况吗?你是怎么处理的?” 2. “最近有没有新出的 AI 工具或功能是你学习并实际应用的?能举个例子吗?” 3. “如果 AI 生成的内容和你的预期不符,你会怎么优化它?” 4. “你觉得 AI 目前有哪些无法解决的业务难题?遇到这些问题你会怎么做?” 未来软件开发人员的角色可能会发生变化,需要掌握跨学科的技能,不仅要知道构建什么,也要评估 AI 生成的代码,从主要的代码编写者转变为主要的任务委托者和代码审查者。同时,模型和模型基础设施需要更好地从代码库和代码审查中学习,以生成更符合公司代码规范的代码。
2025-03-20
如何用trae开发一个微信小程序
以下是使用 Trae 开发微信小程序的步骤: 1. 开发微信小程序的准备工作: 注册一个微信小程序账号:访问 https://mp.weixin.qq.com/cgibin/wx ,点击“前往注册”,进入小程序注册页面。填写邮箱、确认密码,接收激活邮件并点击激活链接,进入具体注册页面。选择“主体类型”并填写相关信息登记,核心是获取 AppID。 下载微信开发者工具:访问 https://developers.weixin.qq.com/miniprogram/dev/devtools/download.html ,选择稳定版进行下载。下载完毕后打开微信开发者工具,扫码登录。创建项目名称和目录,选择项目名称和目录,点击 AppID 下拉框选择关联的微信小程序,若不需要微信云开发,后端服务选择“不使用云服务”,然后点击“创建”按钮进入开发界面。 2. 打开 Trae 开始开发: 继续使用 Chat 模式明确需求,生成 prd.md 后可进行修改。 切换到 Builder 模式进行开发。Trae 会在本地文件夹内生成代码,微信开发者工具从同一本地文件夹读取代码且有实时预览功能,可在左侧预览窗口进行交互,还可点击右上角真机调试进行预览。 开发过程中若有报错就修改错误,直到在微信开发者工具内调试正常。 点击微信开发者工具右上角“上传”,在弹出的弹窗里选择“确定”。 接着在弹出的选项里填写版本号和项目备注,上传完毕后会显示上传成功。 随后,可在微信小程序后台的版本管理里看到开发版本的信息,可以点击体验版进行线上体验,也可以提交审核。 另外有两个额外要点需要了解: Trae+微信开发者工具协同开发。 微信认证和 ICP 备案。
2025-03-19