Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

近期数字人比较成熟的应用有哪些

Answer

数字人目前有以下较为成熟的应用:

  1. 影视行业:真人驱动的数字人通过动捕设备或视觉算法还原真人动作表情,用于影视制作。
  2. 直播带货:真人驱动的数字人在直播带货领域发挥作用。
  3. 家庭:未来可能会有数字人管家,全面接管智能家居或其他设备。
  4. 学校:未来可能会有数字人老师,为学生答疑解惑。
  5. 商场:未来可能会有数字人导购,为顾客提供指路、托管个人物品等服务。

数字人的构建方式包括:

  1. 2D 引擎:风格偏向二次元,亲和力强,定制化成本低,代表如 Live2D Cubism。
  2. 3D 引擎:风格偏向超写实的人物建模,拟真程度高,定制化成本高,代表如 UE、Unity、虚幻引擎 MetaHuman 等。
  3. AIGC:虽然省去建模流程,但在数字人 ID 一致性和帧连贯性上存在弊端,不过算法发展迅速,未来可能会有改善。AIGC 还有直接生成 2D/3D 引擎模型的探索方向。
Content generated by AI large model, please carefully verify (powered by aily)

References

AI 数字人-定义数字世界中的你

这类数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业以及现下很火热的直播带货,其表现质量与手动建模的精细程度及动捕设备的精密程度直接相关,不过随着视觉算法的不断进步,现在在没有昂贵动捕设备的情况下也可以通过摄像头捕捉到人体骨骼和人脸的关键点信息,从而做到不错的效果。

AI 数字人-定义数字世界中的你

[title]AI数字人-定义数字世界中的你[heading2]二、如何构建高质量的AI数字人[heading4]2.1构建数字人躯壳数字人的躯壳就是建模过程,有多种构建方式:1.2D引擎风格偏向二次元,亲和力强,定制化成本低,在日本、东南亚等国家比较受欢迎,也深受年轻人喜欢,毕竟能将喜欢的动漫人物变成数字人的躯壳,是一件很棒的事情。2D引擎的代表就是Live2D Cubism(https://www.live2d.com/)。1.3D引擎风格偏向超写实的人物建模,拟真程度高,定制化成本高,目前有很多公司都在做这个方向的创业,已经可以实现用户通过手机摄像头快速创建一个自己的虚拟人身体(如下图,NextHuman(https://nexthuman.cn/))。3D引擎的代表是UE(Unreal Engine)、Unity,虚幻引擎MetaHuman等(个人学习在电脑配置和学习难度上有一定门槛。1.AIGC虽然AIGC的方式相比前两者省去了建模流程,直接生成数字人的展示图片,但弊端也明显,算法生成的数字人很难保持ID一致性,帧与帧的连贯性上会让人有虚假的感觉。如果项目对人物模型真实度要求没有那么高,可以使用这种方案(算法发展非常快,可能不久就会有连贯度很高的生成方式),典型的项目有wav2lip(https://github.com/Rudrabha/Wav2Lip)、video-retalking(https://github.com/OpenTalker/video-retalking)等。AIGC还有一个方向是直接生成2d/3d引擎的模型,而不是直接生成数字人的最终展示部分,但该方向还在探索中。得益于现有各类技术方案的成熟度,以往建模往往都是由专业的建模师完成工作,不久之后相信大家就可以通过一些生成算法快速生成自己的人物模型了。

AI 数字人-定义数字世界中的你

数字人在未来肯定会有很多的应用场景,比如家庭中有数字人管家,全面接管智能家居或其他设备;学校中有数字人老师,孜孜不倦的为学生答疑解惑;商场里有数字人导购,为顾客提供指路、托管个人物品等悉心服务...数字人在未来肯定还有很多的技术突破,比如可以将五感数据作为输入(例如声音、图像、气味、震动等等),将所有可以控制躯壳的参数也作为输入(例如躯壳骨骼节点,面部混合形状参数等);次世代的算法可以自我迭代升级,也可以拿到感官输入以及躯壳控制方法后,自行演化躯壳控制方式...笔者希望通过Dify搭建数字人的开源项目,给大家展现低门槛高度定制数字人的基本思路,但数字人的核心还是在于我们的Agent,也就是数字人的灵魂,怎样在Dify上面去编排专属自己的数字人灵魂是值得大家自己亲自体验的。真诚的希望看到,随着数字人的多模态能力接入、智能化水平升级、模型互动控制更精确,用户在需要使用AI的能力时,AI既可以给你提供高质量的信息,也能关注到你的情绪,给你一个大大的微笑,也许到了那时,数字世界也开始有了温度。

Others are asking
你好,我想用ai将一张图片形式的数字表格转换成excel,应该使用哪款模型?
很抱歉,上述提供的内容中没有直接提及将图片形式的数字表格转换成 Excel 可用的具体模型。但您可以尝试以下几种常见的方法和工具: 1. 一些 OCR(光学字符识别)软件,如 ABBYY FineReader、Adobe Acrobat Pro 等,它们通常具有将图片中的表格转换为可编辑文本的功能,然后您可以将其粘贴到 Excel 中进行整理。 2. 在线 OCR 服务,例如百度 OCR、腾讯 OCR 等,操作相对便捷。 3. 某些专门用于表格处理的 AI 工具,您可以通过在相关的技术论坛、社区或专业的软件评价网站上进一步搜索和了解。
2025-02-26
有什么免费开源的数字人AI工具
以下为您推荐一些免费开源的数字人 AI 工具: 1. Aigcpanel: 特点:开源且适合小白用户,具有一键安装包,无需配置环境,简单易用。 功能:能够生成数字人视频,支持语音合成和声音克隆,操作界面中英文可选。 系统兼容:支持 Windows、Linux、macOS。 模型支持:MuseTalk(文本到语音)、CosyVoice(语音克隆)。 使用步骤:下载 8G+3G 语音模型包,启动模型即可。 GitHub 链接: 官网: 2. Heygen: 优点:人物灵活,五官自然,视频生成很快。 缺点:中文的人声选择较少。 使用方法: 点击网址注册后,进入数字人制作,选择 Photo Avatar 上传自己的照片。 上传后效果如图所示,My Avatar 处显示上传的照片。 点开大图后,点击 Create with AI Studio,进入数字人制作。 写上视频文案并选择配音音色,也可以自行上传音频。 最后点击 Submit,就可以得到一段数字人视频。 3. DID: 优点:制作简单,人物灵活。 缺点:为了防止侵权,免费版下载后有水印。 使用方法: 点击上面的网址,点击右上角的 Create vedio。 选择人物形象,可以点击 ADD 添加自己的照片,或者使用 DID 给出的人物形象。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 最后,点击 Generate vedio 就可以生成一段视频。 打开自己生成的视频,可以下载或者直接分享给朋友。 4. KreadoAI: 优点:免费(对于普通娱乐玩家很重要),功能齐全。 缺点:音色很 AI。 使用方法: 点击上面的网址,注册后获得 120 免费 k 币,这里选择“照片数字人口播”的功能。 点击开始创作,选择自定义照片。 配音时,可以选择提供文字选择音色,或者直接上传一段音频。 打开绿幕按钮,点击背景,可以添加背景图。 最后,点击生成视频。
2025-02-24
数字人
数字人是运用数字技术创造出来的人,目前业界没有准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业和直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。使用这些工具时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,比如覆盖视频窗口,并将数字人拖动到合适位置。 点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 至此,数字人视频就完成了。点击右上角的“导出”按钮,导出视频以作备用。如果希望数字人换成自己希望的面孔,需要用另一个工具来进行换脸。
2025-02-24
数字人
数字人是运用数字技术创造出来的人,目前业界没有准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息达到不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化。使用时请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,比如覆盖视频窗口,并将数字人拖动到合适位置。 增加字幕,点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。 至此,数字人视频完成,点击右上角“导出”按钮,导出视频以作备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-02-24
数字人
数字人是运用数字技术创造出来的人,目前业界尚无准确定义,一般可根据技术栈分为真人驱动和算法驱动两类。 真人驱动的数字人重在通过动捕设备或视觉算法还原真人动作表情,主要应用于影视行业及直播带货,其表现质量与手动建模精细程度及动捕设备精密程度直接相关,不过视觉算法的进步使在无昂贵动捕设备时也能通过摄像头捕捉人体骨骼和人脸关键点信息以达不错效果。 制作数字人的工具主要有: 1. HeyGen:AI 驱动的平台,可创建逼真数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人自动转换成语音,合成逼真会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。请注意,这些工具的具体功能和可用性可能会变化。使用时请确保遵守相关使用条款和隐私政策,并注意对生成内容的版权和伦理责任。 以下是每个人都可以用 10 分钟轻松制作 AI 数字人视频的方法: 在显示区域,拖动背景图的一个角将图片放大到适合尺寸,比如覆盖视频窗口,并将数字人拖动到合适位置。增加字幕,点击文本智能字幕识别字幕,点击开始识别,软件会自动将文字智能分段并形成字幕。至此,数字人视频完成,点击右上角“导出”按钮导出视频以作备用。若希望数字人换成自己希望的面孔,则需要用另一个工具来进行换脸。
2025-02-21
AI音频与数字人
以下是关于 AI 音频与数字人的相关信息: 数字人口播配音: 操作指引:输入口播文案,选择期望生成的数字人形象及目标语言,选择输出类型,点击开始生成。 支持的数字人形象和语言多样,能让视频制作更高效。 图片换脸: 操作指引:上传原始图片和换脸图片,点击开始生成。 图片大小上限 5M,支持 JPG、PNG 格式。 视频换脸: 操作指引:上传原始视频和换脸图片,点击生成。 音频合成数字人: 操作指引:上传音频文件,选择数字人角色和输出类型,点击开始生成。 支持 MP3 和 WAV 格式的音频文件,文件大小上限 5M,工具支持使用 100+数字人模板,可解决无素材冷启问题。 AI 配音: 多语种(包含菲律宾语、印地语、马来语等小语种)智能配音,同时支持区分男声和女声。 操作指引:输入需配音文案,选择音色,点击立即生成。 注意输入的配音文案需和选择音色语种保持一致。 AI 字幕: 操作指引:点击上传视频,开始生成,字幕解析完成后下载 SRT 字幕。 支持 MP4 文件类型,大小上限为 50M。 在数字人语音合成方面,提到了声音克隆,有新的声音克隆且音质很不错。算法驱动的数字人相关开源代码仓库有: ASR 语音识别:openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition)。 大模型:ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分:可以使用 LangChain 的模块去做自定义(https://www.langchain.com/)。 TTS:微软的 edgetts(https://github.com/rany2/edgetts)、VITS(https://github.com/jaywalnut310/vits)、sovitssvc(https://github.com/svcdevelopteam/sovitssvc)。 构建简单数字人的方式包括通过手动建模(音频驱动)或者 AIGC 的方式生成人物的动态效果(例如 wav2lip 模型),但仍存在一些问题,如如何生成指定人物的声音、TTS 生成的音频如何精确驱动数字人口型以及做出相应的动作、数字人如何使用知识库做出某个领域的专业性回答等。
2025-02-21
目前ai发展成熟吗
目前 AI 仍处于不断发展的阶段,尚未完全成熟。 人类是工具的创造者,每一代都在前人的基础上创造出更强大的工具,如今 AGI 成为了人类进步的又一工具。长期以来,人类创新推动生活各方面繁荣改善,AI 也在持续快速发展。 例如,Transformer 架构早在 2017 年就已提出,但 AI 近几年才爆发,其中神经网络的规模是重要影响因素。以 GPT 模型为例,从 2018 年第一代的 1 亿左右参数量,到 2023 年第四代的万亿规模,规模越大智能程度越高,且在达到一定规模后出现“涌现”能力,智能程度飞速上升,但这种“涌现”出现的机理目前尚无统一解释。 在未来,AI 有望在多个领域取得进展,如 2024 年内,图片超短视频的精细操控、AI 音频能力、“全真 AI 颜值网红”、游戏 AI NPC、AI 男/女朋友聊天、实时生成的内容、AI Agent 等方面会有发展;2025 2027 年,AI 3D 技术、全真 AI 虚拟人、AR/VR 技术、具身智能等技术可能会有明显突破。 然而,AI 立法、伦理讨论仍大规模落后于技术进展,AI 造成的 DeepFake、诈骗、网络攻击等问题开始引发担忧,且可能导致结构性失业等社会问题。
2025-02-18
市场有哪些成熟的AI应用案例
以下是一些成熟的 AI 应用案例: 彩云天气 APP:这是一个 AI 天气预报预警系统,使用数据分析和机器学习技术,市场规模达数亿美元。它能提供准确的天气预报预警,保障生命财产安全,例如在暴雨来临前推送预警信息,提醒用户避免外出。 腾讯觅影:作为 AI 医疗影像分析平台,运用数据分析和机器学习,市场规模达数十亿美元。它可以分析医疗影像,辅助医生诊断,比如检测肺部结节、乳腺病变等,提高诊断效率和准确性。 钉钉会议管理功能:这是一个 AI 会议管理系统,采用自然语言处理和数据分析技术,市场规模达数亿美元。它能够管理会议流程,提高会议效率,比如自动记录会议内容,生成会议纪要,方便参会人员回顾。 微拍堂书法作品拍卖频道:此为 AI 书法作品销售平台,借助图像识别和数据分析技术,市场规模达数亿美元。它为书法爱好者提供作品销售渠道,比如用户可以在平台上拍卖自己的书法作品,也可以购买其他用户的作品。 宝宝树安全座椅推荐:AI 儿童安全座椅推荐系统,运用数据分析和机器学习,市场规模达数亿美元。它能根据儿童年龄、体重等信息为家长推荐合适的儿童安全座椅。 途虎养车保养推荐:AI 汽车保养套餐推荐系统,使用数据分析和机器学习,市场规模达数十亿美元。它会根据车辆情况推荐保养套餐,如更换机油、滤清器等。 丰巢快递柜管理系统:AI 物流快递柜管理系统,利用数据分析和物联网技术,市场规模达数十亿美元。它能优化快递柜使用效率,比如分配柜子、通知取件等。 智联招聘面试模拟功能:AI 招聘面试模拟平台,采用自然语言处理和机器学习技术,市场规模达数亿美元。它可以帮助求职者进行面试模拟。 酷家乐装修设计软件:AI 房地产装修设计平台,借助图像生成和机器学习技术,市场规模达数十亿美元。它能为用户提供装修设计方案,用户可根据自己的喜好进行选择和调整。 摄影 APP 参数调整功能:AI 摄影参数调整助手,运用图像识别和数据分析技术,市场规模达数亿美元。它能根据场景自动调整摄影参数,如曝光、对焦、感光度等。 音乐情感分析软件:AI 音乐情感分析平台,使用机器学习和音频处理技术,市场规模达数亿美元。它可以分析音乐的情感表达。 小米智能照明系统:AI 家居智能照明系统,利用物联网技术和机器学习,市场规模达数十亿美元。它能实现家居照明的智能化控制,根据用户的习惯和环境变化自动调整灯光亮度和颜色。 金融风险预警软件:AI 金融风险预警平台,运用数据分析和机器学习技术,市场规模达数十亿美元。它可以提前预警金融风险,比如股市下跌、汇率波动等。 马蜂窝路线优化功能:AI 旅游路线优化平台,采用数据分析和自然语言处理技术,市场规模达数亿美元。它能根据用户需求优化旅游路线,提高旅行体验。
2025-01-05
假设我建立一个针对中小企业的Ai落地赋能服务中心,结合目前中国市场比较成熟的Ai产品、技术、服务、培训等等内容,应该怎么设计这个中心
目前中国市场上成熟的 AI 产品、技术、服务和培训内容丰富多样。要设计针对中小企业的 AI 落地赋能服务中心,以下是一些建议: 产品方面: 引入适合中小企业业务流程的自动化软件,如智能客服系统、智能办公软件等。 提供基于 AI 的数据分析工具,帮助企业进行市场预测和客户洞察。 技术方面: 配备专业的技术团队,能够为企业提供 AI 技术的集成和定制化开发服务。 关注前沿的 AI 技术,如机器学习、深度学习、自然语言处理等,并将其转化为可应用的解决方案。 服务方面: 提供一站式的服务,包括需求评估、方案设计、实施部署和后续维护。 建立快速响应机制,及时解决企业在使用 AI 过程中遇到的问题。 培训方面: 设计针对不同层次员工的培训课程,涵盖基础知识普及、操作技能提升和高级应用开发等。 采用线上线下相结合的培训方式,满足企业员工的多样化学习需求。 同时,服务中心还需要建立良好的沟通渠道,与中小企业保持密切联系,了解他们的实际需求和反馈,不断优化和完善服务内容和方式。
2024-12-19
AI应用于测试领域 哪些有比较成熟的、稳定的应用
目前在测试领域,AI 有一些较为成熟和稳定的应用。例如,利用机器学习算法进行自动化测试用例生成,能够提高测试效率和覆盖度;基于深度学习的图像识别技术可用于界面测试,检测界面元素的准确性和一致性;还有自然语言处理技术在测试文档的自动分析和理解方面发挥作用,帮助快速提取关键信息。但整体而言,AI 在测试领域的应用仍在不断发展和完善中。
2024-12-13
私人助理领域,如今有没有成熟的产品
在私人助理领域,目前有一些相关产品,但成熟的产品相对较少。 AI Agent 应用大多集中在 2B 场景,面向个人消费者的产品少之又少。一方面是高度智能化的 Agent 能力需要打磨,概念落地还有较长一段距离;另一方面是 AI 和娱乐消费诉求的结合还几乎没有,其主要带来的是生产方式变革和效率变革。个人消费者方向,目前只看到“私人助理”场景。 Dots 是目前看到的最接近理想 AI Agent 形态的 C 端私人助理。它支持用户发送文本和图像、音频信息并理解内容,能够为用户制定计划、进行文件管理、推荐咖啡店,帮助用户访问互联网中的最新工具和服务。不过,该产品需要排队较久的 waitlist,官方也较少更新动态。其官方 twitter 为:https://twitter.com/newcomputer ,官网介绍:https://new.computer/about 。
2024-12-12
企业内部知识库和 AI 问答结合,有哪些成熟的解决方案,或者产品推荐?
以下是企业内部知识库和 AI 问答结合的一些成熟解决方案和产品推荐: Contextual Answers:这是一个端到端的 API 解决方案,其答案完全基于组织知识,能避免“幻觉”。全球信息服务提供商 Clarivate 与其合作,将其应用于图书馆解决方案套件,为学生、教师和研究人员提供基于策划和可信学术内容的问题答案。 职业规划类产品:结合用户个人情况和市场需求制定详细职业发展计划,包括短、中、长期目标,帮助用户在 AI 时代找到职业定位。其核心构思在于利用企业已有知识积累结合大模型能力,为用户提供准确简洁答案。具体通过创建企业私有知识库收录问答记录和资料,利用大模型处理用户咨询问题,确保回答准确一致,必要时提供原回答完整版,还能对接人工客服,在智能助手无法解决问题时快速转接,提升服务质量和客户满意度。
2024-09-14
我想时刻关注Deepseek目前在电商行业应用落地的场景的信息及对应的应用APP、小程序等,可以通过什么渠道第一时间获取
目前关于 Deepseek 在电商行业应用落地的场景信息以及对应的应用 APP、小程序等,您可以通过以下渠道第一时间获取: 1. 关注 Deepseek 官方网站的动态发布和通知。 2. 订阅 Deepseek 官方的社交媒体账号,如微信公众号、微博等,获取最新消息。 3. 加入相关的电商行业论坛或社区,与其他从业者交流,获取相关信息。 4. 关注电商行业的权威媒体和资讯平台,可能会有相关报道。
2025-02-26
Deepseek目前已在电商行业应用落地的场景有哪些?
DeepSeek 在电商行业已应用落地的场景包括: 电商商品策划:如“电商商品策划 DeepSeek 大师版|一键领取同款多维表格模板”。 商品链接分析:如“商品链接分析工具”。 电商产品上架规划:如“电商产品上架规划”。 您可以通过以下链接获取更详细的信息:
2025-02-26
我是一名AI工具使用小白,渴望快速掌握AI工具,在电子表格制作、ppt制作、公文写作、文案写作等方面提升应用能力,请问应该学习哪些入门课程。
以下是一些适合您入门学习的 AI 课程: 1. 工具入门篇(AI Tools): 数据工具多维表格小白之旅:适合 Excel 重度使用者、手动数据处理使用者、文件工作者。通过表格+AI 进行信息整理、提效、打标签,满足 80%数据处理需求。 文章链接: 视频链接: 2. 工具入门篇(AI Code): 编程工具Cursor 的小白试用反馈:适合 0 编程经验、觉得编程离我们很遥远的小白。通过 AI 工具对编程祛魅,降低技术壁垒。 文章链接: 3. 工具入门篇(AI Music): 音乐工具Suno 的小白探索笔记:适合 0 乐理知识、觉得作词作曲和我们毫不相关成本巨大的小白。AI 赋能音乐创作,无需乐理知识即可参与音乐制作。 文章链接: 此外,还有以下相关内容供您参考: 1. 关于 AI 视频制作的交流与答疑: 视频流表格制作:在知识库的 AI 视频专栏中有相关教程和模板。 Copy UI 社区:微推有专门研究 Copy UI 的社区,相关内容有趣但本次未展开讲。 SD 类图片作用:国内大厂很卷,一般需求吉梦等产品可完成,特殊精细要求才用 SD,不了解可在微推加 AI 会话中找。 图片视角转移:使用 P 模型,上传图片并告知镜头移动方向和相关内容。 PNG 与背景融合:Recraft 产品目前不太擅长 PNG 与背景的特别好的融合,可通过合并方式处理。 保证文字不崩:使用吉梦的 2.1 模型效果较好。 新手 AI 视频制作:纯小白参与项目时,项目组会做好部分准备工作,上手难度不高,专注出图和出视频,用好相关技术。 关于利用 AI 工具创作北京宣传片相关问题的探讨。 AI 工具使用思路:对于如何利用 AI 工具创作,建议直接上手尝试,通过试错和与 AI 交流获取反馈,遇到具体问题再向社区请教。 素材处理方法:若有故宫相关照片素材,可采用导入参考图生图、让实拍素材动起来等方式,还可通过抠图、融图等操作将素材与虚拟背景融合。 创作需先构思:创作时不能仅考虑如何连接已有素材,而应先构思剧本和想要表达的内容,再合理运用素材。 2. 入门工具推荐: Kimi 智能助手:Chatgpt 的国产平替,实际上手体验最好,推荐新手用 Kimi 入门学习和体验 AI。不用科学🕸️、不用付费、支持实时联网。是国内最早支持 20 万字无损上下文的 AI,也是目前对长文理解做的最好的 Ai 产品。能一次搜索几十个数据来源,无广告,能定向指定搜索源。 PC 端: 移动端 Android/ios: 您还可以通过「飞书」这款工具,浏览其社区的精选课程、先进客户实践。下载飞书:
2025-02-26
Deepseek目前已在电商行业应用落地的场景有哪些?
DeepSeek 目前已在电商行业应用落地的场景包括: 电商商品策划:如 。 商品链接分析:如 。 电商产品上架规划:如 。
2025-02-26
DeepSeek应用场景
DeepSeek 的应用场景包括: 1. 智能对话:能够进行自然流畅的对话交流。 2. 文本生成:生成各种类型的文本内容。 3. 语义理解:准确理解文本的语义。 4. 计算推理:进行相关的计算和推理。 5. 在实际场景中的应用,如工作、学习、生活和社交等方面,帮助解决各种问题。 在实际使用中,DeepSeek 在文字能力方面表现突出,尤其在中文场景中符合日常写作习惯,但在专业论文总结方面稍弱。数学能力经过优化表现不错,编程能力略逊于 GPT(据用户反馈)。
2025-02-26
我如何AI应用产品创业思路 目前有商业和项目概念没有IT基础
以下是为您提供的关于 AI 应用产品创业思路的相关内容: 从过去的经验来看,2014 年是移动互联网的红利时代,当时有很多创业者和投资人在深圳的咖啡馆交流项目。有人参与移动互联网创业,做了一款帮人养成好习惯的 APP,积累了百万用户并拿到投资,但因商业化思考较浅等原因项目折戟。 对于现在的 AI 应用创业,有观点认为这一波 AI 更利好大厂,因为创业公司缺乏数据和场景。但也有观点指出,任何技术进步,现有的大公司虽会获利,但创业公司能创造新的价值和场景。以移动互联网为例,最大的四个应用如移动端的 IM 工具、打车、外卖、短视频,除微信外都来自创业公司,且新的技术优势应是解决新问题,而非做更好的上一代产品。此外,AI 时代有利于创业者的一个好处是,利用大模型的能力,创业公司人员更精简,很多 AI 应用创业者仅几人就能完成产品开发上线测试。而且从应用层面看,2B 的应用公司在中国可能会迎来跨越式发展的机会。 如果您没有 IT 基础但有商业和项目概念,建议您: 1. 深入研究目标市场和用户需求,找准新的问题和价值点。 2. 关注创新的应用场景,避免与大厂在已有产品上竞争。 3. 充分利用大模型的能力,优化团队结构,提高效率。 4. 考虑与有 IT 技术能力的团队或个人合作。
2025-02-25
Way to AGI 的近期更新
WaytoAGI 的近期更新包括以下内容: 今日课程直播📹:,时间为 8 月 15 16 日。 未来之声2024“科技与艺术的交响”AI 音乐会作品征集启动:,时间为 2024 年 7 月 26 日 9 月下旬。由中国科学技术馆和网易新闻发起,WaytoAGI 作为特别支持社区,即日起向全球征集 AI 音乐歌曲作品,通过专业评审评选出 10 首歌曲,将在 9 月下旬进行线下汇演。 线上活动:,时间为 2024 年 7 月 24 日 8 月 8 日。Agent 共学活动新一期“谁是人类”全新开启!本次活动获得了阿里云☁️百炼和通义千问大模型的大力支持,为大家准备了丰厚的比赛奖品。 线下活动:,活动即将开始报名,举办时间为 7 月 28 日下午 1:00 6:00。 此外,还有观点相关的更新: 作者 Allen 发表了“热爱与行动是通往 AGI 之路”的观点。更新日志包括补充对共创模式的思考,删减部分内容。端午假期实践了三篇教程,个人感觉难度按从低到高排序: 1. (入门级网速好的话,一个小时能搞定) 2. 3. 写在前面:关于加强写作能力的训练,准备调整工作流,先把初稿发在飞书上(可能是原来 2 篇或 3 篇的集合,有一些不方便说的也先发在初稿,后续再删),获取大家反馈后再拆分细化。自我介绍:Allen,一个小镇青年,我们都是 WaytoAGI 共创者。
2025-02-23
Way to AGI 近期更新
WaytoAGI 近期更新如下: 今日课程直播📹:,时间为 8 月 15 16 日。 未来之声2024“科技与艺术的交响”AI 音乐会作品征集启动:,时间为 2024 年 7 月 26 日 9 月下旬。由中国科学技术馆和网易新闻发起,即日起向全球征集 AI 音乐歌曲作品,通过专业评审评选出 10 首歌曲,将在 9 月下旬进行线下汇演。 线上活动:,时间为 2024 年 7 月 24 日 8 月 8 日。Agent 共学活动新一期“谁是人类”全新开启,本次活动获得了阿里云☁️百炼和通义千问大模型的大力支持,为大家准备了丰厚的比赛奖品。 线下活动:,活动即将开始报名,举办时间为 7 月 28 日下午 1:00 6:00。 观点方面:作者 Allen 发表了“热爱与行动是通往 AGI 之路”的观点。更新日志补充了对共创模式的思考,删减了部分内容。端午假期实践了三篇教程,个人感觉难度按从低到高排序分别为: 1. (入门级网速好的话,一个小时能搞定) 2. 3. 写在前面:关于加强写作能力的训练,准备调整工作流,先把初稿发在飞书上(可能是原来 2 篇或 3 篇的集合,有一些不方便说的也先发在初稿,后续再删),获取大家反馈后再拆分细化。自我介绍:Allen,一个小镇青年,我们都是 WaytoAGI 共创者。
2025-02-23
请联网搜索近期有什么AIGC相关的比赛活动
以下是近期的 AIGC 相关比赛活动: 【线上⬆️】,时间为 9 月 1 日 9 月 24 日。利用 AI 复原《山海经》中的经典神兽,赢取 35 万元现金和实体大奖,获奖作品将获得全网流量曝光,由中央美术学院等权威高校支持。 ,时间为 9 月 3 日 11 月 3 日。一等奖 2 名,奖杯、荣誉证书及 10000 元奖励;二等奖 2 名,奖杯、荣誉证书及 8000 元奖励;三等奖 6 名,奖杯、荣誉证书及 3000 元奖励。 【线上⬆️】 。 【线上⬆️】,时间为 8 月 22 日 9 月 22 日。全球 AI 视觉创意大赛(瓦卡奖 VACAT Vision Arts Created by AI Technology),致力于构建 AI 视觉创意界的“奥斯卡”平台,推动 AI 视觉技术的应用与创新。 ,截止时间为 10 月 31 日。作品提交:sipsac.cn,主题为“潮起东方创益未来”,板块包括美丽世界、文化中国、科技生活,类型有平面、音视频、数字创新,金奖 3 万、银奖 1 万、铜奖 5 千,另外有全场大奖 10 万。 ,截止时间为 2024 年 11 月 10 日。让创意点亮传统,传承经典,一等奖 10000 元,二等奖 5000 元,三等奖 1000 元。 ,作品提交时间为 10.11 11.30,专家评审时间为 12.1 12.9,成果发布时间为 12.10 。 ,时间为 1 月 24 日 2 月 28 日。需用魔搭平台【AIGC 专区】麦橘超然模型作底模训练 LORA 模型,描绘心中理想世界,风格不限。提交 LoRA 及 6 张以上高质量作品,单张图片分辨率不低于 1024x1024 像素,每组作品展现一个世界观场景;避免鲜血、骷髅等敏感元素。一等奖 1 名,奖金 5000 元 + 证书;二等奖 3 名,奖金 3000 元 + 证书;三等奖 10 名,奖金 1000 元 + 证书。魔搭社区 AIGC 代言人奖:作品发小红书带一丹一世界话题并@魔搭 ModelScope 社区官方,浏览量满 800,前 20 名可得 300 元天猫超市卡。
2025-01-30
近期国内颁布了什么AI相关政策
近期国内颁布的 AI 相关政策包括: 1. 互联网信息服务算法推荐管理规定(算法推荐规定),于 2023 年 3 月 1 日生效。 2. 互联网信息服务深度合成管理规定(深度合成规定),于 2023 年 1 月 10 日生效。 3. 生成式人工智能服务管理暂行办法(生成式 AI 办法),于 2023 年 7 月 13 日公布并于 2023 年 8 月 15 日生效。 4. 生成式人工智能服务安全基本要求(征求意见稿),于 2023 年 10 月 11 日公开征求意见,意见反馈截止日期为 2023 年 10 月 25 日。 5. 科技伦理审查办法(试行)(征求意见稿)(伦理审查办法(草案)),于 2023 年 4 月 14 日公开征求意见,意见反馈截止时间为 2023 年 5 月 3 日。 6. 国家人工智能产业综合标准化体系建设指南(征求意见稿),于 2024 年 1 月 17 日公开征集意见,意见反馈截止时间为 2024 年 1 月 31 日。 这些政策的适用范围如下: 1. 算法推荐规定适用于任何使用算法推荐技术在中国境内提供互联网信息服务的行为。 2. 深度合成规定适用于任何使用深度合成技术在中国境内提供互联网信息服务的行为。 3. 生成式 AI 办法适用于使用生成式人工智能技术在中国境内向公众提供服务的行为,但并不包括尚未用于在中国境内向公众提供服务的生成式人工智能技术的研究和开发。 4. 伦理审查办法(草案)一旦实施,将适用于任何涉及人类、实验室动物或其他涉及伦理风险的科学技术活动。 在地域范围方面,人工智能法规并不限定其仅适用于中国个人及实体,外国个人或实体如涉及使用人工智能技术在中国境内提供服务或研发人工智能技术,也受到监管。
2025-01-25
近期AI界有什么重大事件吗
以下是 2024 年 AI 界的一些重大事件: 1. 1 月:斯坦福大学 Mobile Aloha、LumaAl Genie 文生 3D、GPT store 上线、MagnificAl 高清放大爆火、苹果 Vision Pro 宣布发售等。 2. 10 月:9 月 27 日 Reecho 睿声●三只羊录音事件涉及 AI 公司出面回应;9 月 28 日 TeleAI●正式开源 TeleChat2115B;10 月 1 日快手●可灵 AI 全面开放 API、OpenAI DevDay;10 月 2 日 Black Forest Labs●发布 FLUX1.1、苹果●推出多模态大模型 MM1.5;10 月 3 日 OpenAI●发布 ChatGPT Canvas;10 月 8 日 2024 年诺贝尔物理学奖;10 月 9 日 2024 年诺贝尔化学奖;10 月 10 日字节●发布首款 AI 智能体耳机 Ola Friend、Vivo●增加蓝心端侧大模型 3B、谷歌●图像生成模型 Imagen 3 开放使用、智源●BGE 登顶 Hugging Face 月榜、State of AI 2024 报告发布;10 月 11 日智谱●GLM4Flash 与「沉浸式翻译」合作、北大&北邮&快手●👑开源高清视频生成模型 Pyramid Flow;10 月 12 日 OpenAI●👑开源多智能体协作框架 Swarm、深势科技●完成数亿元人民币新一轮融资、苹果●质疑当前 LLM 缺乏真正的逻辑推理能力;10 月 14 日。 3. 关于 AI 在未来一年的 10 个预测:一个主权国家向美国大型人工智能实验室投资 100 亿美元以上,需要国家安全审查;没有任何编码能力的人独自创建的应用程序或网站将会迅速走红(例如 App Store Top100);案件开始审理后,前沿实验室对数据收集实践实施有意义的改变;由于立法者担心权力过度,欧盟人工智能法案的早期实施最终比预期更为缓慢;OpenAl o1 的开源替代品在一系列推理基准测试中超越了它;挑战者未能对 NVIDIA 的市场地位造成任何重大打击;由于公司难以实现产品与市场的契合,对人形机器人的投资水平将会下降;苹果设备上研究的强劲成果加速了个人设备上 AI 的发展势头;人工智能科学家撰写的研究论文被大型机器学习会议或研讨会接受;一款以与 GenAI 元素交互为基础的视频游戏将取得突破性进展。
2025-01-17
案例:借助人工智能技术的诈骗 一、案例材料 1.背景资料 (1)近期全国范围内出现了一种新型电信诈骗——AI换脸诈骗,该诈骗利用AI人工智能,通过“换脸”和“拟声”技术模仿受害人的朋友或亲戚的声音和外貌,以此骗取受害者的信任,进行网络诈骗,近日包头警方就根据一起典型案例,向大家发出了防范AI换脸诈骗的警示。 财联社5月22日讯,据平安包头微信公众号消息,包头警方发布了一起利用人工智能(AI)实施电信诈骗的典型案例,一家福州市科技公司的法人代表郭先生竟在短短10分钟内被骗走了430万元人民币。
以下是关于 AI 的相关内容: 律师如何写好提示词用好 AI: 对于不具备理工科背景的文科生,可将 AI 视为黑箱,只需知道其能模仿人类思维理解和输出自然语言。AI 就像似人而非人的存在,与传统道教的驱神役鬼拘灵遣将有相似之处。提示词应是相对完善的“谈话方案”,成果在与 AI 的对话中产生,要接受其存在的“不稳定性”,并在对话中限缩自己思维的模糊地带。 AI 的应用场景: 医疗保健:包括医学影像分析、药物研发、个性化医疗、机器人辅助手术等。 金融服务:涵盖风控和反欺诈、信用评估、投资分析、客户服务等。 零售和电子商务:有产品推荐、搜索和个性化、动态定价、聊天机器人等。 制造业:包含预测性维护、质量控制、供应链管理、机器人自动化等。 交通运输:(未具体阐述)
2024-12-25