直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

阿里开源的数字人

回答

阿里开源的数字人相关信息如下:

在构建高质量的 AI 数字人方面,建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI。笔者的开源数字人项目(项目地址:https://github.com/wan-h/awesome-digital-human-live2d)选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。

内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

1.7 AI 数字人+语音合成

互联网厂商腾讯:[智能数智人](https://cloud.tencent.com/product/ivh)阿里:[虚拟数字人](https://www.aliyun.com/product/ai/avatar?spm=5176.21213303.8115314850.1.72de53c9pdvu6T&scm=20140722.S_card@@%E4%BA%A7%E5%93%81@@1161322.S_card0.ID_card@@%E4%BA%A7%E5%93%81@@1161322-RL_%E6%95%B0%E5%AD%97%E4%BA%BA-OR_ser-V_2-P0_0)百度:[曦灵数字人](https://www.notion.so/158039ec85d84f7789bca030b614e8c0?pvs=21)华为:[MetaStudio](https://www.huaweicloud.com/product/mdh.html)网易:[瑶台](https://yaotai.163.com/)京东:[言犀](https://yanxi.jd.com/)字节:[虚拟形象生产平台](https://www.volcengine.com/product/virtualavatar)快手:[StreamLake虚拟人](https://www.streamlake.com/product/digital-human)科大讯飞:[讯飞智声](https://zhisheng.xunfei.cn/#/ai-anchor)

大厂AIGC实践

[阿里|电商设计师视角下的AI解读与应用10-22 10:45](https://www.yuque.com/wikidesign/vngzgk/hv2fp8u64g9mx4wp)[阿里| AI引领,畅想未来办公的无限可能10-22 10:45](https://www.yuque.com/wikidesign/vngzgk/evu4q82cxnrrfpg0)[阿里|当AI成为大众的新朋友10-22 10:45](https://www.yuque.com/wikidesign/vngzgk/cieygg04sx6knc9z)[阿里|AI新形态,数字人带你探索未来生活体验升级10-22 10:45](https://www.yuque.com/wikidesign/vngzgk/gg8zd0lka53drpqz)[阿里|让AI模型更加平易近人|ModelScope模型开源社区设计实践10-22 10:45](https://www.yuque.com/wikidesign/vngzgk/klzcf5g0xfu345oh)[阿里|S03E05:当设计遇见AI,智能设计的践行者——2022阿里云设计中心年鉴10-22 10:45](https://www.yuque.com/wikidesign/vngzgk/iq3fbxzkncwfynmf)[蚂蚁|一览无遗,让收银更快捷-支付宝智能AI秤10-22 10:45](https://www.yuque.com/wikidesign/vngzgk/xabu3ad5sx078nbk)[蚂蚁|玩转AI,探索绘图新世界10-22 10:45](https://www.yuque.com/wikidesign/vngzgk/dhyxlhhtirvv4db2)

AI 数字人-定义数字世界中的你

建好的模型可以使用web前端页面(Live2D就提供了web端的SDK)或者Native的可执行程序进行部署,最后呈现在用户面前的是一个GUI。笔者的开源数字人项目(项目地址:https://github.com/wan-h/awesome-digital-human-live2d)选择了live2d作为数字人躯壳,因为这类SDK的驱动方式相比现在的AI生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于live2d的SDK驱动方式可以参考官方示例:https://github.com/Live2D。

其他人在问
目前有哪些开源绘画模型
目前常见的开源绘画模型有: Stable Diffusion:生态最完整,能够加载的框架有 ComfyUI 框架、SD.Next 框架、Stable Diffusion WebUI 框架、diffusers 框架。 MidJourney:模型风格包罗万象,操作简洁,极富美感和艺术感。 Dall·E3(ChatGPT):具有惊人的语义理解能力,可像甲方一样连续修改。 Fooocus:优化程度高,操作简便,类似本地化 mj。 ComfyUI:门槛高,定制化强。 HunYuanDiT:国内第一个开源绘图模型。 SDXL:开源时间为 2023.7。 SD3:开源时间为 2024.6。 KOLORS:开源时间为 2024.7,目前生图质量最高,有相关的教学视频,如“Kolors 中文生图绘画模型开源,快手接连放出高质量开源项目,是否会成为中国的 StabilityAI”等。 Flux:开源时间为 2024.8。
2024-11-07
有哪些开源或者免费的数字人工具
以下是一些开源或者免费的数字人工具: 1. HeyGen:AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人能自动转换成语音并合成逼真的说话视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 此外,还有一些相关的开源代码仓库: ASR 语音识别: openai 的 whisper: https://github.com/openai/whisper wenet: https://github.com/wenete2e/wenet speech_recognition:https://github.com/Uberi/speech_recognition AI Agent: 大模型:ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分:可使用 LangChain 的模块自定义,https://www.langchain.com/ TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用预设人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多分支版本。 sovitssvc: https://github.com/svcdevelopteam/sovitssvc,专注于唱歌。 请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。
2024-11-07
有哪些开源免费的数字人工具
以下是一些开源免费的数字人工具: 1. HeyGen:这是一个 AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人将自动转换成语音并合成逼真的会开口说话的视频。 更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42 。 请注意,这些工具的具体功能和可用性可能会变化。使用时请遵守相关使用条款和隐私政策,并注意生成内容的版权和伦理责任。 此外,以下是一些与数字人相关的开源代码仓库: ASR 语音识别: openai 的 whisper: https://github.com/openai/whisper wenet: https://github.com/wenete2e/wenet speech_recognition:https://github.com/Uberi/speech_recognition AI Agent: 大模型部分包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。 Agent 部分可使用 LangChain 的模块自定义,包含了 Agent 实现的几个组件:https://www.langchain.com/ TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多分支版本。 sovitssvc: https://github.com/svcdevelopteam/sovitssvc,专注于唱歌。 人物建模模型可通过手动建模(音频驱动)或者 AIGC 的方式生成人物的动态效果(例如 wav2lip 模型)实现。 以下是部分摊位信息中与数字人相关的内容: |编号|摊位活动主题和内容|摊位区域|摊位编号| ||||| |54|AI 数字人的技术以及应用场景|D|D4| |59|百度数字人试拍|D|D3|
2024-11-07
开源数字人
以下是关于开源数字人的相关信息: 组合方案: 1. 先剪出音频,使用 https://elevenlabs.io/speechsynthesis 或使用 GPTsovits()克隆声音,做出文案的音频。 2. 使用 wav2lip 整合包,导入视频和音频,对口型得到视频。基础 wav2lip+高清修复整合包下载地址:https://github.com/Rudrabha/Wav2Lip 。这就是目前的本地跑数字人的方案,效果都差不多,都是用的 wav2lip 。产品:https://synclabs.so/ 构建高质量的 AI 数字人: 1. 构建数字人躯壳:建好的模型可以使用 web 前端页面(Live2D 就提供了 web 端的 SDK)或者 Native 的可执行程序进行部署,最后呈现在用户面前的是一个 GUI 。笔者的开源数字人项目(项目地址:https://github.com/wanh/awesomedigitalhumanlive2d)选择了 live2d 作为数字人躯壳,因为这类 SDK 的驱动方式相比现在的 AI 生成式的方式更加可控和自然,相比虚幻引擎这些驱动方式又更加轻量和简单;另外超写实的数字人风格在目前的技术能力下,处理不好一致性问题,容易带来虚假的感觉或者产生恐怖谷效应,而卡通二次元的形象给人的接受度更高。关于 live2d 的 SDK 驱动方式可以参考官方示例:https://github.com/Live2D 。 相关算法开源代码: 1. ASR 语音识别: openai 的 whisper: https://github.com/openai/whisper wenet: https://github.com/wenete2e/wenet speech_recognition(这是一个语音识别的接口集合,里面有不同实现的语音识别的接口): https://github.com/Uberi/speech_recognition 2. AI Agent: 大模型部分:包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等等。 Agent 部分:可以使用 LangChain 的模块去做自定义,里面基本包含了 Agent 实现的几个组件 3. TTS: 微软的 edgetts:https://github.com/rany2/edgetts,只能使用里面预设的人物声音,目前接口免费。 VITS:https://github.com/jaywalnut310/vits,还有很多的分支版本,可以去搜索一下,vits 系列可以自己训练出想要的人声。 sovitssvc: https://github.com/svcdevelopteam/sovitssvc,专注到唱歌上面,前段时间很火的 AI 孙燕姿。 除了算法,人物建模模型可以通过手动建模(音频驱动)或者 AIGC 的方式生成人物的动态效果(例如 wav2lip 模型)实现,这样就完成了一个最简单的数字人。当然这种简单的构建方式还存在很多的问题,例如: 1. 如何生成指定人物的声音? 2. TTS 生成的音频如何精确驱动数字人口型以及做出相应的动作? 3. 数字人如何使用知识库,做出某个领域的专业性回答?
2024-11-06
开源大模型ChatGLM 系列有哪些版本
ChatGLM 系列的开源版本包括: ChatGLM36B:第三代 ChatGLM 对话模型,采用全新设计的 Prompt 格式,原生支持工具调用、代码执行和 Agent 任务等复杂场景。 ChatGLM36Bbase:第三代 ChatGLM 基座模型,采用更多样的训练数据、更充分的训练步数和更合理的训练策略,在 10B 以下的基础模型中性能较强。 ChatGLM36B32k:第三代 ChatGLM 长上下文对话模型,在 ChatGLM36B 的基础上进一步强化了对长文本的理解能力,能处理最多 32K 长度的上下文。
2024-11-04
智谱清言的开源大模型哪些种类
智谱清言的开源大模型种类包括: 多模态模型: CogAgent18B:基于 CogVLM17B 改进的开源视觉语言模型,拥有 110 亿视觉参数和 70 亿语言参数,支持 11201120 分辨率的图像理解,具备 GUI 图像的 Agent 能力。代码链接:、始智社区。 CogVLM17B:强大的开源视觉语言模型(VLM),在多模态权威学术榜单上综合成绩优异。代码链接:。 Visualglm6B:开源的支持图像、中文和英文的多模态对话语言模型,语言模型基于 ChatGLM6B,具有 62 亿参数;图像部分通过训练 BLIP2Qformer 构建起视觉模型与语言模型的桥梁,整体模型共 78 亿参数。代码链接:。 RDM:Relay Diffusion Model,级联扩散模型,可以从任意给定分辨率的图像快速生成,而无需从白噪声生成。代码链接:。 此外,智谱清言是智谱 AI 和清华大学推出的大模型产品,基础模型为 ChatGLM 大模型。2023 年 10 月 27 日,智谱 AI 于 2023 中国计算机大会(CNCC)上,推出了全自研的第三代基座大模型 ChatGLM3 及相关系列产品。智谱清言在工具使用排名国内第一,在计算、逻辑推理、传统安全能力上排名国内前三。总体来看,智谱清言更擅长专业能力,但在代码能力上还有一定优化空间,知识百科与其他第一梯队模型相比稍显不足。综合来看,智谱清言是一个很有竞争力的大模型。可应用的场景相对广泛,根据 SuperCLUE 测评结果,优先推进在 AI 智能体方面相关的应用,包括任务规划、工具使用及一些长文本记忆相关的场景。另外在较复杂推理应用上的效果会比较不错,在广告文案、文学写作方面也是一个很好的选择。
2024-11-04
现在国内语言生成式AI有多少个在做的,比如说百度的文心一言和阿里的通义
目前国内在做语言生成式 AI 的有不少,例如百度的文心一言、阿里的通义千问、讯飞的讯飞星火、智谱华章的智谱清言、字节跳动的豆包、腾讯的元宝、昆仑万维的天工 AI 等。 此外,还有一些在特定时间上线的大模型,如 8 月正式上线的包括北京的百度(文心一言)、抖音(云雀大模型)、智谱 AI(GLM 大模型)、中科院(紫东太初大模型)、百川智能(百川大模型),上海的商汤(日日新大模型)、MiniMax(ABAB 大模型)、上海人工智能实验室(书生通用大模型)。 需要注意的是,不同的大模型具有各自的特点和功能,在使用和应用场景上可能存在差异。
2024-11-06
在一个设定中,使用阿里千问模型,设定角色为“美嘉”,知识库为《爱情公寓》全季剧情,实现问答。
在一个设定中,使用阿里千问模型,将角色设定为“美嘉”,知识库设定为《爱情公寓》全季剧情来实现问答。 大语言模型就像一个学习过无数本书、拥有无穷智慧的人,对公共知识、学识技能、日常聊天很擅长,但在工作场景中需要提示词来告诉它角色和专注技能,变成所需的“员工”。知识库则相当于给这个“聪明员工”发放的工作手册,比如知道老板娘吃饭要打三折等特定信息。 这里的设定为:AI 模型使用阿里千问模型,提示词设定的角色是“美嘉”,按照其人设、背景和对话风格设定,知识库是《爱情公寓》全季剧情,让“美嘉”拥有过往“记忆”。 例如,提问“你是谁?你和子乔在台球厅吵架那次是为了什么吵架?”,回复是“我是陈美嘉,那次在台球厅和吕子乔吵架是因为他约会被人撞见,我讽刺他脸大影响信号,他还反击我。后来谈到过去的事情,我指责他忘恩负义,他就说我平。最后,我伤心地说要分手,因为他之前甩过我。” 然而,有时回答会不准确,比如提问“一菲为美嘉找了一份助教工作”,AI 可能未根据正确的知识库内容回答,这是常见的错误场景,在严肃场景中不能接受。优化 AI 更准确回答问题的过程称为 RAG(RetrievalAugmented Generation),即检索增强生成,由检索器从外部知识中快速找到与问题相关的信息,生成器利用这些信息制作精确连贯的答案,适合处理需要广泛知识的任务,如问答系统,能提供详细准确的回答。
2024-10-29
阿里巴巴开发的AI有哪几个
阿里巴巴开发的 AI 包括以下几个: 1. 通义灵码:一款基于通义大模型的智能编程辅助工具,提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码注释生成、代码解释、研发智能问答、异常报错排查等能力。 2. CodeFuse:蚂蚁集团支付宝团队为国内开发者提供智能研发服务的免费 AI 代码助手,该产品是基于蚂蚁集团自研的基础大模型进行微调的代码大模型。 此外,在其他领域,阿里巴巴和蚂蚁集团也有相关的 AIGC 实践,例如: 电商设计师视角下的 AI 解读与应用 AI 引领,畅想未来办公的无限可能 当 AI 成为大众的新朋友 AI 新形态,数字人带你探索未来生活体验升级 让 AI 模型更加平易近人|ModelScope 模型开源社区设计实践 S03E05:当设计遇见 AI,智能设计的践行者——2022 阿里云设计中心年鉴 一览无遗,让收银更快捷支付宝智能 AI 秤 玩转 AI,探索绘图新世界 在编程辅助方面,还有其他一些常见的 AI 工具,如 GitHub Copilot(由 GitHub 联合 OpenAI 和微软 Azure 团队推出)、CodeWhisperer(亚马逊 AWS 团队推出)、CodeGeeX(智谱 AI 推出)、Cody(代码搜索平台 Sourcegraph 推出)、Codeium 等。每个工具的功能和适用场景可能会有所不同,您可以根据自己的需求来选择最适合您的工具。 如果您想使用 AI 完成阿里巴巴营销技巧和产品页面优化,可以采取以下步骤: 1. 市场分析:利用 AI 分析工具来研究市场趋势、消费者行为和竞争对手情况。 2. 关键词优化:AI 可以分析和推荐高流量、高转化的关键词,帮助卖家优化产品标题和描述,提高搜索排名和可见度。 3. 产品页面设计:AI 设计工具可以根据市场趋势和用户偏好自动生成吸引人的产品页面布局。 4. 内容生成:AI 文案工具可以撰写有说服力的产品描述和营销文案,提高转化率。 5. 图像识别和优化:AI 图像识别技术可以帮助选择或生成高质量的产品图片,这些图片能够更好地吸引顾客并展示产品特点。 6. 价格策略:AI 可以分析不同价格点对销量的影响,帮助卖家制定有竞争力的价格策略。 7. 客户反馈分析:AI 可以分析客户评价和反馈,帮助卖家了解客户需求,优化产品和服务。 8. 个性化推荐:AI 可以根据用户的购买历史和偏好提供个性化的产品推荐,增加销售额。 9. 聊天机器人:AI 驱动的聊天机器人可以提供 24/7 的客户服务,解答疑问,提高客户满意度。 10. 营销活动分析:AI 可以分析不同营销活动的效果,帮助卖家了解哪些活动更能吸引顾客并产生销售。 11. 库存管理:AI 可以帮助预测需求,优化库存管理,减少积压和缺货情况。 12. 支付和交易优化:AI 可以分析不同的支付方式对交易成功率的影响,优化支付流程。 13. 社交媒体营销:AI 可以帮助卖家在社交媒体上找到目标客户群体,通过精准营销提高品牌知名度。 14. 直播和视频营销:AI 可以分析观众行为,帮助卖家优化直播和视频内容,提高观众参与度和转化率。
2024-10-20
你了解哪儿些大模型在电商行业供应链物流领域的应用,如果能举例阿里、淘宝、抖音、京东等涉及到电商的公司进行说明就更好了
目前在电商行业供应链物流领域,一些大模型的应用还处于不断发展和探索的阶段。 阿里巴巴:可能利用其强大的技术能力和数据优势,通过大模型优化物流路径规划、库存管理和订单预测等方面,提高物流效率和降低成本。 淘宝:或许借助大模型来分析消费者的购买行为和偏好,从而更精准地进行商品推荐,并优化物流配送的调度。 抖音:可能运用大模型对用户的兴趣和行为进行深度挖掘,以实现更高效的商品匹配和物流配送安排。 京东:有可能利用大模型改进仓储管理、物流配送的智能调度,以及预测商品的需求和销售趋势。 但需要注意的是,具体的应用情况和效果会受到多种因素的影响,包括数据质量、算法优化、业务场景的复杂性等。
2024-09-25
知识库里有没有阿里云部署cow教程
以下是阿里云部署 cow 的完整教程: 一、注册云服务器和获取模型 key 1. 刚才在这里保存的“外网面板地址”,点击打开。 2. 输入账号密码,即上图中的 username、password。 3. 第一次进入会让您绑定一下,点击免费注册,注册完成后,返回此页,登录账号。 4. 首次会有个推荐安装,只安装第一个即可。其他的取消勾选。 5. 点击“终端”,会让您关联,点击关闭就好。 七、安装并接入 cow 1. 回到宝塔,打开【终端】 继续,一行一行依次粘贴,依次回车: cd /root git clone https://github.com/zhayujie/chatgptonwechat 这个注意一定要粘贴完整,这里容易粘贴不全。 出现下方的样子,就是成功了。如果失败,或者没反应,刷新一下,重新再试一次。 继续一行一行,依次输入: cd chatgptonwechat/ pip install r requirements.txt 等待执行完成,如上图后,继续粘贴: pip install r requirementsoptional.txt 上边的都执行完成后。 现在我们到“文件”菜单中去执行,点击文件找到 root,进入 root 文件夹,找到 chatgptonwechat 文件夹,并进入。 点击文件夹上方功能栏中的【终端】(注意,不是左侧一级菜单里的终端,是文件夹上方那一行的终端电脑) 粘贴进入,点击回车。点击后,关闭此弹窗。 cp configtemplate.json config.json 刷新页面。在当前目录下,找到 config.json 文件。 双击这个文件,找到第 4、5 行,把刚才 FastGPT 里拿到 API 和 key,根据要求粘贴到双引号里。这也是您唯一需要修改的地方。修改完之后,点击保存,关闭文件。 依然在当前文件,【终端】里进行,依次复制粘贴进入: cd plugins/godcmd cp config.json.template config.json 操作完成后,退出窗口,刷新一下。进入/root/chatgptonwechat/plugins/godcmd, 下边是依次进入窗口的路径, 双击 config.json,进入后,设置下您的 password 和 admin_users,可以设置为和我一样的,后边再改,点击保存后关闭。 重新回到/root/chatgptonwechat/这个文件路径下,点击终端,继续依次粘贴: touch nohup.out nohup python3 app.py & tail f nohup.out 使用微信扫码(建议使用小号)。完成
2024-07-19
如何用 AI 完成阿里巴巴营销技巧和产品页面优化
使用AI来完成阿里巴巴营销技巧和产品页面优化,可以采取以下几个步骤: 1. 市场分析:利用AI分析工具来研究市场趋势、消费者行为和竞争对手情况。AI可以处理大量数据,快速识别出哪些产品受欢迎、价格区间、销量等关键信息。 2. 关键词优化:AI可以分析和推荐高流量、高转化的关键词,帮助卖家优化产品标题和描述,提高搜索排名和可见度。 3. 产品页面设计:AI设计工具可以根据市场趋势和用户偏好自动生成吸引人的产品页面布局。 4. 内容生成:AI文案工具可以撰写有说服力的产品描述和营销文案,提高转化率。 5. 图像识别和优化:AI图像识别技术可以帮助选择或生成高质量的产品图片,这些图片能够更好地吸引顾客并展示产品特点。 6. 价格策略:AI可以分析不同价格点对销量的影响,帮助卖家制定有竞争力的价格策略。 7. 客户反馈分析:AI可以分析客户评价和反馈,帮助卖家了解客户需求,优化产品和服务。 8. 个性化推荐:AI可以根据用户的购买历史和偏好提供个性化的产品推荐,增加销售额。 9. 聊天机器人:AI驱动的聊天机器人可以提供24/7的客户服务,解答疑问,提高客户满意度。 10. 营销活动分析:AI可以分析不同营销活动的效果,帮助卖家了解哪些活动更能吸引顾客并产生销售。 11. 库存管理:AI可以帮助预测需求,优化库存管理,减少积压和缺货情况。 12. 支付和交易优化:AI可以分析不同的支付方式对交易成功率的影响,优化支付流程。 13. 社交媒体营销:AI可以帮助卖家在社交媒体上找到目标客户群体,通过精准营销提高品牌知名度。 14. 直播和视频营销:AI可以分析观众行为,帮助卖家优化直播和视频内容,提高观众参与度和转化率。 通过这些步骤,AI可以帮助卖家在阿里巴巴平台上提高营销效果和产品页面的吸引力,从而增加销量和客户满意度。
2024-04-18
数字营销是什么
数字营销是指借助数字技术和渠道来推广产品、服务或品牌的营销方式。以下为您介绍一些相关的数字营销工具和案例: Adsby:这是一个针对初创企业和小型企业的谷歌搜索广告转换工具。它利用人工智能创建、分析和扩展广告,为广告新手提供简化工具,也为专业人士提供强大功能,如通过智能 AI 驱动策略最大化广告支出回报(ROAS),提供每日优化、AI 生成的关键词建议、秒级的广告内容创作等服务,还有 14 天免费试用,以简单直观的平台指导用户设置广告活动。 【甲子光年】Web 3.0 之数字人营销白皮书(2022)33 页:提供了关于数字营销的相关研究和分析。 【国信证券】领先布局数字人营销,AIGC 赋予成长机遇:从证券角度探讨了数字人营销的布局和发展机遇。
2024-11-11
AI数字人工具,哪个好用?
以下是一些好用的 AI 数字人工具: 1. HeyGen:AI 驱动的平台,能创建逼真的数字人脸和角色,使用深度学习算法生成高质量肖像和角色模型,适用于游戏、电影和虚拟现实等应用。 2. Synthesia:AI 视频制作平台,允许创建虚拟角色并进行语音和口型同步,支持多种语言,可用于教育视频、营销内容和虚拟助手等场景。 3. DID:提供 AI 拟真人视频产品服务和开发,上传人像照片和输入内容,平台的 AI 语音机器人能自动转换成语音并合成逼真的会开口说话的视频。 此外,还有以下相关工具: 1. MakeACharacter:一键生成 3D 数字人,可自定义面部特征,生成逼真 3D 角色,基于真实人类扫描数据,使用 Unreal Engine 渲染,支持中英文提示,兼容多个行业应用。 2. Rodin Gen1:拥有 1.5B 参数,可实现 3Dto3D 生成,生成 3D 模型及物理基础渲染材质,支持 3D LoRA 技术。 在算法方面,开源代码仓库有: 1. ASR 语音识别:openai 的 whisper(https://github.com/openai/whisper)、wenet(https://github.com/wenete2e/wenet)、speech_recognition(https://github.com/Uberi/speech_recognition)。 2. AI Agent:大模型包括 ChatGPT、Claude、ChatGLM、文星一言、千帆大模型、通义千问等。Agent 部分可使用 LangChain 的模块自定义(https://www.langchain.com/)。 3. TTS:微软的 edgetts(https://github.com/rany2/edgetts),只能使用预设人物声音,目前接口免费;VITS(https://github.com/jaywalnut310/vits)及其分支版本;sovitssvc(https://github.com/svcdevelopteam/sovitssvc),专注于唱歌。 请注意,这些工具的具体功能和可用性可能会随时间和技术发展而变化。在使用时,请确保遵守相关使用条款和隐私政策,并注意保持对生成内容的版权和伦理责任。更多数字人工具请访问网站查看:https://www.waytoagi.com/category/42
2024-11-11
能够读取文本数字最多的大模型是哪一个
目前能够读取文本数字较多的大模型有以下几种: Claude2 模型的上下文上限是 100,000 个 token。 ChatGPT16k 模型的上下文上限是 16,000 个 token。 ChatGPT432k 模型的上下文上限是 32,000 个 token。 需要注意的是,token 限制会同时对一次性输入和一次对话的总体上下文长度生效。例如,一次性输入的文本长度以及一次对话中累计的上下文长度都受到相应的限制。当达到上限时,并非停止对话,而是会遗忘最前面的对话内容。
2024-11-08