直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

AI数字人的最新消息

回答

以下是关于 AI 数字人的最新消息:

  • 4 月 25 日,Synthesia 推出新型虚拟数字人 Expressive-1,能通过脚本预测表情,可自动解析和理解文本情绪,实现表情和声音同步。链接:https://x.com/imxiaohu/status/1783505405488054433
  • 11 月 7 日,百度虚拟数字人“度晓晓”携文心一言入驻淘宝。链接:https://x.com/xiaohuggg/status/1721876724798136544?s=20
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

XiaoHu.AI日报

🔔Xiaohu.AI日报「4月25日」 ✨✨✨✨✨✨✨✨1⃣️🎭 Synthesia新技术展示:推出新型虚拟数字人Expressive-1,能通过脚本预测表情。数字人可自动解析和理解文本情绪,实现表情和声音同步。🔗 https://x.com/imxiaohu/status/17835054054880544332⃣️🌐 360 AI浏览器新功能:新版AI浏览器增加了视频总结、提问、转录和翻译功能。支持本地和网络视频的内容分析,但无法提取无对白视频摘要。🔗 http://browser.360.cn/ai🔗 https://x.com/imxiaohu/status/17834954374226497193⃣️📚全球最大AI知识库一周年:通往AGI之路网站访问量突破1000万。网站内容丰富,旨在推动AI知识的普及。🔗 http://WaytoAGI.com 🔗 https://x.com/imxiaohu/status/17834750028154716694⃣️🤖日本横须賀市AI市长:使用AI技术克隆市长,用于发布英语信息。技术应用广泛,包括灾难信息传播和旅游信息发布。

XiaoHu.AI日报

🔔Xiaohu.AI日报「4月25日」 ✨✨✨✨✨✨✨✨1⃣️🎭 Synthesia新技术展示:推出新型虚拟数字人Expressive-1,能通过脚本预测表情。数字人可自动解析和理解文本情绪,实现表情和声音同步。🔗 https://x.com/imxiaohu/status/17835054054880544332⃣️🌐 360 AI浏览器新功能:新版AI浏览器增加了视频总结、提问、转录和翻译功能。支持本地和网络视频的内容分析,但无法提取无对白视频摘要。🔗 http://browser.360.cn/ai🔗 https://x.com/imxiaohu/status/17834954374226497193⃣️📚全球最大AI知识库一周年:通往AGI之路网站访问量突破1000万。网站内容丰富,旨在推动AI知识的普及。🔗 http://WaytoAGI.com 🔗 https://x.com/imxiaohu/status/17834750028154716694⃣️🤖日本横须賀市AI市长:使用AI技术克隆市长,用于发布英语信息。技术应用广泛,包括灾难信息传播和旅游信息发布。

XiaoHu.AI日报

🔔小互的推特11月7日更新番外✨✨✨✨✨✨✨✨9️⃣今天被OpenAI刷屏了帮你们总结下今天别的AI新闻🚀马斯克xAI公司宣布推出PromptIDE开发工具🛑阿里云A100服务器业务暂停出租算力价格飞涨🎙️微软发布7款针对对话优化的AI语音,更加逼真自然🔍谷歌正测试2项AI功能,以改善YouTube观看体验🎮微软将AI引入Xbox,可生成AI角色、故事剧情等🏫英国一学校启用人工智能担任校长,帮助教师解学生🤖百度虚拟数字人「度晓晓」携文心一言入驻淘宝👥美团推出AI产品Wow定位AI朋友社区🔗https://x.com/xiaohuggg/status/1721876724798136544?s=20

其他人在问
有哪些ai课程值得学习?
以下是一些值得学习的 AI 课程: 【野菩萨】的预习周课程,包括 AI 绘画电脑配置要求、高效 AIGC 创意者的数字人工具包、SD 插件安装方法、画静为动的 AIGC 视频制作讲解等。 基础操作课,涵盖 AI 绘画通识课、AI 摄影虚拟的真实、AI 电影穿越的大门等内容。 核心范式课程,涉及词汇的纸牌屋、核心范式应用、控制随机性等方面。 SD WebUi 体系课程,包括 SD 基础部署、SD 文生图、图生图、局部重绘等。 ChatGPT 体系课程,有 ChatGPT 基础、核心文风、格式、思维模型等内容。 ComfyUI 与 AI 动画课程,包含部署和基本概念、基础工作流搭建、动画工作流搭建等。 应对 SORA 的视听语言课程,涉及通识欢迎参加电影的葬礼、影像赏析、基础戏剧影视文学等。
2024-09-19
ai 软件测试
以下是关于 AI 软件测试的相关内容: 实践中的应用示例: 1. Web 应用测试:使用 Testim 分析用户行为和日志数据,自动生成高覆盖率的测试用例,检测不同浏览器和设备上的兼容性问题。 2. 移动应用测试:利用 Test.ai 从需求文档中提取测试用例,确保覆盖关键功能和用户路径,提高测试效率和质量。 3. 复杂系统测试:采用 GraphWalker 基于系统状态模型生成测试用例,确保覆盖所有可能的状态和操作场景,检测系统的边界情况和异常处理能力。 工具和平台: 1. Testim:AI 驱动的自动化测试平台,生成和管理测试用例。 2. Test.ai:基于 NLP 技术的测试用例生成工具,适用于移动应用和 Web 应用。 3. DeepTest:利用深度学习生成自动驾驶系统测试用例。 4. GraphWalker:基于状态模型生成测试用例,适用于复杂系统的行为测试。 5. Pex:微软开发的智能测试生成工具,自动生成高覆盖率的单元测试。 另外,在 Coze 官方教程中,搭建好第一个 AI Bot 后,配置好 Bot 就可以在预览与调试区域中测试 Bot 是否符合预期,可单击清除图标清除对话记录。
2024-09-19
AI在法律领域的最新应用
以下是 AI 在法律领域的一些最新应用: 1. 专利审查方面:AI 技术通过自动化和智能化手段,帮助专利审查员更高效地处理大量专利申请、检索相关文献、评估专利性和创新性等任务。 2. 法律文书:这是目前 AI 在 2B 行业基本成熟的应用,其格式固定,核心技术是法条/判例的引用,是“搜索”能力和大模型能力的搭配。 3. 虽然目前其他 2B 应用如“AI 客服”等雷声大、雨点小,未达到大量取代人工的预期,但生成式人工智能技术已逐步涵盖艺术创作产业、医疗保健、虚拟现实、数据合成与数据增强等多个领域,为各行业带来创新、效率与价值。
2024-09-19
如何利用AI帮助自己成为一名知识产权律师?我已经获得了法律职业资格证,但还没有实习成为一名律师。
成为一名知识产权律师可以借助 AI 从以下几个方面入手: 1. 知识学习与案例研究:利用 AI 驱动的法律数据库和学习平台,深入了解知识产权领域的法律法规、典型案例和最新动态。 2. 法律文书撰写辅助:借助 AI 工具提高法律文书如起诉书、答辩状等的撰写效率和质量,确保语言准确、逻辑清晰。 3. 模拟案例分析:通过 AI 模拟各种知识产权相关的案例场景,进行分析和应对策略的制定,提升解决实际问题的能力。 4. 客户需求分析:利用 AI 对潜在客户的需求和问题进行分析,以便更好地提供针对性的法律服务。 5. 法律研究与创新:借助 AI 探索知识产权领域的前沿研究和创新趋势,为自己的业务发展提供新思路。 需要注意的是,AI 只是辅助工具,不能替代您自身的专业判断和实践经验。在使用 AI 工具时,要对其结果进行审慎评估和验证。
2024-09-19
网页翻译AI
以下为一些网页翻译 AI 产品及相关信息: 1. DeepL(网站): ,点击页面「翻译文件」按钮,上传 PDF、Word 或 PowerPoint 文件即可。 2. 沉浸式翻译(浏览器插件): ,安装插件后,点击插件底部「更多」按钮,选择「制作双语 BPUB 电子书」、「翻译本地 PDF 文件」、「翻译 THML / TXT 文件」、「翻译本地字幕文件」。 3. Calibre(电子书管理应用): ,下载并安装 calibre,并安装翻译插件「Ebook Translator」。 4. 谷歌翻译(网页): ,使用工具把 PDF 转成 Word,再点击谷歌翻译「Document」按钮,上传 Word 文档。 5. 百度翻译(网页): ,点击导航栏「文件翻译」,上传 PDF、Word、Excel、PPT、TXT 等格式的文件,支持选择领域和导出格式(不过进阶功能基本都需要付费了)。 此外,XiaoHu.AI 也具有高质量多语言翻译的特点,能提供沉浸式阅读和写作体验,支持多种语言的高质量翻译。它能够智能识别网页上的内容,如 Twitter、Discord 等,提供鼠标悬停翻译。支持 Chrome、Edge 等主流浏览器,下载插件即可使用。具有简单易用的用户界面,操作方便,还内置了 GPT 的聊天功能,可以随时提问。相关链接:
2024-09-19
用AI搭建网站
以下为您介绍一些用 AI 搭建网站的工具及选择合适工具的方法: AI 搭建网站的工具: 1. Zyro 网址: 特点:使用 AI 生成网站内容,包括文本、图像和布局建议;提供 AI 驱动的品牌和标志生成器,帮助创建独特的品牌形象;包含 SEO 和营销工具,帮助提升网站可见性和流量。 2. Site123 网址: 特点:简单易用的 AI 网站构建工具,适合初学者;提供多种设计模板和布局,用户可以快速创建专业网站;包括内置的 SEO 和分析工具,帮助优化网站表现。 选择合适的 AI 网站制作工具的方法: 1. 明确目标和需求:确定您的网站目标,如个人博客、商业网站、在线商店等,并明确功能需求。 2. 考虑预算:有些工具提供免费计划或试用版,但高级功能可能需要付费订阅。 3. 易用性:选择符合您技术水平的工具,确保能够轻松使用和管理网站。 4. 自定义选项:检查工具是否提供足够的自定义选项,以满足设计和功能需求。 5. 支持和资源:查看是否有足够的客户支持和学习资源,如教程、社区论坛等,帮助解决问题。 通过这些 AI 驱动的工具,您可以更轻松地创建和管理一个功能丰富、外观专业的网站。请注意,以上内容由 AI 大模型生成,请仔细甄别。
2024-09-19
24小时内中国AI医美最新消息
以下是为您找到的关于中国 AI 医美的相关消息: 有一个将 AI 和中医结合的项目,其先是用摄像头观察患者的口腔和舌苔,再用指尖传感器号脉,然后根据观测的数据生成选择题让患者作答,最后 AI 会生成药方。该项目目前应用在辅助看诊,能够提高诊疗效率,创始人的愿景是在未来实现 24 小时独立问诊开药。 但目前没有关于 24 小时内中国 AI 医美最新消息的准确和详尽内容。要获取最新的信息,您可以查阅相关的科技新闻网站、学术论坛或关注人工智能领域的社交媒体平台。
2024-09-17
24小时内中国AI前沿科技最新消息
以下是 24 小时内中国 AI 前沿科技的最新消息: 阿里 CEO 吴泳铭表示将开源国内最大 720 亿参数模型。 京东 CEO 称正在测试 AI 自动生成营销内容。 此外,还有一些国际上的 AI 相关消息: 苹果新专利:CGR 技术生成虚拟形象,展示穿戴效果。 微软 AI 专利:充当治疗师,疏导心理问题。 苹果改造 Siri:明年或用大语言模型。 谷歌 Open Se Cura:为 Pixel 带来低功耗 AI。 微软计划:AI 助手 Copilot 将进入 Windows 10。 亚马逊成立 AI 训练团队,投资数百万美金。 ChatGPT 持续宕机,CEO 道歉。 GitHub Universe 2023 新功能:新的 Copilot 聊天功能,Copilot 支持手机应用,GitHub Copilot Workspace,产问题查询 GitHub Copilot 企业版:每月 39 美元的高级服务。GitHub Copilot 合作伙伴计划,GitHub 高级安全功能。
2024-09-17
AI 数字人最新消息
以下是关于 AI 数字人的最新消息: 目前业界对于数字人的定义尚未统一,一般可根据技术栈分为真人驱动和算法驱动两类。算法驱动数字人的相关开源代码有很多,如 ASR 语音识别方面的 openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition,这是一个语音识别的接口集合,包含不同实现的语音识别接口)。AI Agent 大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等,Agent 部分可使用 LangChain 的模块进行自定义(https://www.langchain.com/)。TTS 方面,有微软的 edgetts(https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费)、VITS(https://github.com/jaywalnut310/vits)以及专注于唱歌的 sovitssvc(https://github.com/svcdevelopteam/sovitssvc,前段时间很火的 AI 孙燕姿就与其相关)。 4 月 25 日的消息: Synthesia 推出新型虚拟数字人 Expressive1,能通过脚本预测表情,数字人可自动解析和理解文本情绪,实现表情和声音同步。链接:https://x.com/imxiaohu/status/1783505405488054433 360 AI 浏览器新版增加了视频总结、提问、转录和翻译功能,支持本地和网络视频的内容分析,但无法提取无对白视频摘要。链接:http://browser.360.cn/ai https://x.com/imxiaohu/status/1783495437422649719 全球最大 AI 知识库“通往 AGI 之路”网站访问量突破 1000 万,网站内容丰富,旨在推动 AI 知识的普及。链接:http://WaytoAGI.com https://x.com/imxiaohu/status/1783475002815471669 日本横须贺市使用 AI 技术克隆市长,用于发布英语信息,技术应用广泛,包括灾难信息传播和旅游信息发布。
2024-09-12
ai最新消息
以下是 11 月 7 日的 AI 最新消息: 马斯克 xAI 公司宣布推出 PromptIDE 开发工具。 阿里云 A100 服务器业务暂停出租,算力价格飞涨。 微软发布 7 款针对对话优化的 AI 语音,更加逼真自然。 谷歌正测试 2 项 AI 功能,以改善 YouTube 观看体验。 微软将 AI 引入 Xbox,可生成 AI 角色、故事剧情等。 英国一学校启用人工智能担任校长,帮助教师了解学生。 百度虚拟数字人「度晓晓」携文心一言入驻淘宝。 美团推出 AI 产品 Wow 定位 AI 朋友社区。链接:https://x.com/xiaohuggg/status/1721876724798136544?s=20 当前 AI 前沿技术点包括: 1. 大模型(Large Language Models):如 GPT、PaLM 等。 2. 多模态 AI:视觉语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习:自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习:元学习、一次学习、提示学习等。 5. 可解释 AI:模型可解释性、因果推理、符号推理等。 6. 机器人学:强化学习、运动规划、人机交互等。 7. 量子 AI:量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。
2024-08-07
免费制作数字人程序
以下是免费制作数字人的方法: 1. 打开剪映,添加文本到文字轨道,修改好需要朗读的文字。 2. 点击朗读进行声音克隆,剪映的声音克隆现在只用念一句话就可完成。 3. 克隆完成后,选择喜欢的数字人形象,并把自己的克隆音色换上去。 4. 一键智能生成字幕,自行调整文字样式并校准。 在剪映中生成数字人的具体步骤: 1. 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”,将其添加到当前视频中,软件会根据提供的内容生成对应音视频并添加到轨道中,左下角会提示渲染完成时间,可点击预览查看效果。 2. 增加背景图片:删除先前导入的文本内容,为视频增加背景图片。点击左上角“媒体”菜单,点击“导入”按钮选择本地图片上传,点击图片右下角的加号将其添加到视频轨道上(会覆盖数字人)。 数字人“私有化”的方法: 1. 尽管剪映已有很多公模数字人,但私模数字人更受欢迎。可使用 AI 换脸软件完成最后一步。 2. 注意需要谷歌账号(淘宝或者在账号解决平台“”可直接购买)。 3. 第一步:打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进到程序主要运行界面,在右上角点击“代码执行程序”选择“全部运行”就行,无需安装,无需付费。点击红框对应的 URL 就会打开操作界面。 4. 第二步:点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”就能生成。 5. 第三步:等待自己专属的数字人视频出炉。
2024-09-17
数字媒体艺术专业,毕设建筑浏览动画,灵感推荐
很抱歉,目前知识库中没有关于数字媒体艺术专业毕设建筑浏览动画灵感推荐的相关内容。但您可以从以下几个方面获取灵感: 1. 研究著名建筑大师的作品及其设计理念,从中汲取创意。 2. 观察不同文化和地域的特色建筑,将其独特元素融入动画。 3. 参考科幻电影或游戏中对未来建筑的想象和呈现方式。 4. 关注当下的建筑趋势,如绿色建筑、智能建筑等,从中获得启发。 5. 从自然景观中获取灵感,例如山脉、河流等的形态和韵律,运用到建筑的造型和布局中。
2024-09-14
数字媒体艺术专业,毕设做三维建筑浏览动画,灵感推荐
很抱歉,目前知识库中没有关于数字媒体艺术专业毕设做三维建筑浏览动画的灵感推荐相关内容。但您可以从以下几个方面获取灵感: 1. 研究不同风格的建筑,如现代主义、古典主义、后现代主义等,从中汲取设计元素和特点。 2. 观察自然景观,如山峦、水流、森林等,将自然元素融入建筑设计中。 3. 参考著名建筑师的作品,分析其创意和表现手法。 4. 从科幻电影、游戏中的虚拟建筑获取灵感,想象未来建筑的可能性。 5. 关注当下的城市发展和社会需求,思考如何通过建筑解决实际问题并展现创新理念。
2024-09-14
开源的数字人方案
以下是开源的数字人方案: 1. 第一步:先剪出音频,使用 https://elevenlabs.io/speechsynthesis 或使用 GPTsovits克隆声音,做出文案的音频。 2. 第二步:使用 wav2lip 整合包,导入视频和音频,对口型得到视频。基础 wav2lip+高清修复整合包下载地址为 https://github.com/Rudrabha/Wav2Lip 。这就是目前的本地跑数字人的方案,效果都差不多,都是用的 wav2lip 。产品为 https://synclabs.so/ 。 3. 构建数字人躯壳:笔者的开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。
2024-09-14
ai数字人app
以下是关于 AI 数字人 app 的相关内容: 如何构建高质量的 AI 数字人: 数字人的灵魂如同大脑,需具备一定智能水平,能理解交互对象信息并给予有效回应。构建数字人灵魂时,要让其具备各种智能,如记住个人信息、充当个人助手、拥有专业知识、处理复杂任务等。实现这些能力有几个工程关键点: 1. AI Agent:要让数字人像人一样思考,需编写类似人的 Agent,工程实现所需的记忆模块、工作流模块、各种工具调用模块的构建存在挑战。 2. 驱动躯壳的实现:灵魂部分通过定义接口,躯壳部分通过 API 调用,调用方式视躯壳实现而定,如 HTTP、webSocket 等。但包含情绪的语音表达以及保证躯壳的口型、表情、动作和语音的同步及匹配存在困难,目前主流方案只能预设一些表情动作,再做逻辑判断来播放预设,语音驱动口型相对成熟但闭源,效果可参考 Nvidia 的 Audio2Face 或 Live Link Face + Face AR Sample。 生成数字人: 在剪映右侧窗口顶部打开“数字人”选项,选取免费且适合的数字人形象,如“婉婉青春”。选择数字人形象时会播放其声音,可判断是否需要,点击右下角“添加数字人”将其添加到当前视频中,软件会生成对应音视频并添加到轨道中,左下角提示渲染完成时间,可点击预览查看效果。之后可删除先前导入的文本内容,为视频增加背景图片,如通过点击左上角“媒体”菜单并导入本地图片,将其添加到视频轨道上。 数字人“私有化”: 尽管剪映有很多公模数字人,但私模数字人更受欢迎。可使用 AI 换脸软件完成,需谷歌账号(可在淘宝或“”购买)。具体步骤: 1. 第一步打开谷歌浏览器,点击链接 https://github.com/facefusion/facefusioncolab 并点击 open colab 进入运行界面,在右上角点击“代码执行程序”选择“全部运行”,点击红框对应的 URL 打开操作界面。 2. 第二步,点击“source”上传自己的照片和“target”上传之前的剪映数字人视频,保持默认参数,点击“START”生成。 3. 第三步:等待专属数字人视频出炉。
2024-09-12
用文本生成视频加数字人
以下是用文本生成视频加数字人的方法: 一、创建视频内容 1. 准备内容 先准备一段视频中播放的内容文字,可以是产品介绍、课程讲解、游戏攻略等任何您希望推广让大家了解的文字。您也可以利用 AI 来生成这段文字。 2. 制作视频 使用剪映 App 对视频进行简单处理。电脑端打开剪映 App,点击“开始创作”,进入创作页面。 选择顶部工具栏中的“文本”,点击默认文本右下角的“+”号,为视频添加一个文字内容的轨道。 二、生成数字人 1. 生成数字人 在剪映右侧窗口顶部,打开“数字人”选项,选取一位免费且适合的数字人形象,如“婉婉青春”。 选择数字人形象时,软件会播放其声音,可判断是否需要,点击右下角“添加数字人”,软件会根据之前提供的内容生成对应音视频,并添加到当前视频中。 左下角会提示渲染完成时间,然后可点击预览按钮查看生成的数字人效果。 2. 增加背景图片 直接删除先前导入的文本内容,因为视频中的音频已包含文字内容。 点击左上角“媒体”菜单,点击“导入”按钮,选择本地一张图片上传。 选择的图片会添加到视频轨道下方的新轨道,将轨道最右侧竖线向右拖拽至视频最后,使其在整个视频播放时都显示。 选中背景图片所在轨道,在显示区域拖动图片角将其放大到适合尺寸,覆盖视频窗口,并将数字人拖动到合适位置。 3. 增加字幕 点击“文本 智能字幕 识别字幕,点击开始识别”,软件会自动将文字智能分段并形成字幕。 至此,数字人视频就完成了。点击右上角“导出”按钮,导出视频以作备用。如果希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2024-09-12