Navigate to WaytoAGI Wiki →
Home/Question List/Question Detail

AI在电商直播带货有什么新进展吗

Answer

AI 在电商直播带货领域有以下新进展:

  1. “全真 AI 颜值网红”出现,可以稳定输出视频,并能够进行直播带货。
  2. 数字人工具软件方面,有实时驱动和非实时驱动两类,实时驱动在直播时能改音频话术,真人可接管,标准零售价一年 4 - 6 万往上;非实时驱动一个月 600 元,效果差,市场价格混乱。
  3. 数字人运营服务可按直播间成交额抽佣。
  4. 适用于不需要强展示的商品,如品牌食品饮料,以及虚拟商品如门票、优惠券等,店播效果较好,数据基本能保持跟真人一样。不适用于促销场景。
  5. 目前技术仍显稚嫩,如更真实的对口型、更低的响应延迟等方面有待提高。
  6. 不会一家独大,可能 4 - 5 家一线效果,大多二三线效果公司。
  7. 有资源、有业务的大平台下场可能会带来降维打击,例如剪映若全环节打通会绑定商家。
  8. 欧莱雅、YSL、兰蔻、李宁、北面等品牌会选择使用 AI 驱动的虚拟主播进行自播,但通常只在午夜时段排期。
  9. 阿里云提供的品牌智能直播间基础版售价为 99000 元/(年×路),提供多种功能。
  10. 虚拟形象有 3D 卡通风格和 2D 拟真人风格,预设动作库和真实语音表现,商品展示以图片为主,直播互动流程相对固定。但虚拟主播无法与产品接触,测评结果缺乏真实性,目前更像是花瓶,负责基础性介绍和互动问答。
Content generated by AI large model, please carefully verify (powered by aily)

References

AGI 万字长文(下)| 2024,分叉与洪流

2024年内图片-超短视频的精细操控:表情、细致动作、视频-文字匹配有一定操控能力的生成式短视频:风格化、动漫风最先成熟;真人稍晚AI音频能力长足进展:带感情的AI配音基本成熟“全真AI颜值网红”出现,可以稳定输出视频,可以直播带货游戏AI NPC有里程碑式进展,出现新的游戏生产方式AI男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈实时生成的内容开始在社交媒体内容、广告中出现AI Agent有明确进展,办公场景“AI助手”开始有良好使用体验2AI的商业模式开始有明确用例:数据合成、工程平台、模型安全等可穿戴-全天候AI硬件层出不穷,虽然大多数不会成功中国AI达到或超过GPT4水平;美国出现GPT5;世界上开始现“主权AI”华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)AI造成的DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧AI立法、伦理讨论仍然大规模落后于技术进展……2025-2027AI 3D技术、物理规则成熟:正常人无法区别AI生成还是实景拍摄全真AI虚拟人成熟:包含感情的AI NPC成熟,开放世界游戏成熟;游戏中几乎无法区别真人和NPCAR/VR技术大规模商用接近AGI的技术出现人与AI配合的工作方式成为常态,很多日常决策开始由AI来执行AI生产的数据量超过全人类生产数据量,“真实”成为稀缺资源具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破“人的模型”出现,出现“集中化AGI”与“个人AGI”的历史分叉AI引发的社会问题开始加重,结构性失业开始出现AGI对于地缘政治的影响开始显露……"Limit of Understanding"; Yifei Gong 2024,with Dall-E

7月2日 张晟、汗青讨论数字人

1.直接卖数字人工具软件。分实时驱动和非实时驱动两类,实时驱动在直播时能改音频话术,真人接管。市面价格在一年4-6万往上(标准零售价)。非实时一个月600元,效果很差,类似放视频的伪直播,市场价格混乱,靠发展代理割韭菜。2.提供数字人运营服务,按直播间成交额抽佣。[heading2]AI直播卖货适用品类和场景?[content]1.适用于不需要强展示的商品,如品牌食品饮料。如果服装就搞不了,过品快,衣服建模成本高。2.适用于虚拟商品,如门票、优惠券等。3.不适用于促销场景,这涉及主播话术、套路,调动直播间氛围能力等。4.电商直播分为达播跟店播,数字人直播跑下来效果最好的是店播,数据基本能保持跟真人一样(朋友公司数据)。[heading2]AI直播的壁垒和未来市场格局是什么?[content]1.时间拉长,技术上没壁垒。但目前看仍有技术门槛,单纯靠开源算法拼的东西,实时性、可用性不高。比如更真实的对口型,更低的响应延迟等。2.不会一家独大,可能4-5家一线效果,大多二三线效果公司。因为它只是工具,迁移成本低。3.真正把客户服务好,能规模化扩张的公司更有价值。疯狂扩代理割韭菜,不考虑客户效果的公司,售后问题很麻烦。4.有资源、有业务的大平台下场,可能会带来降维打击,例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等等,全环节打通会绑定商家,很难打。

虚拟主播,能在电商直播间站稳脚跟吗?

欧莱雅、YSL、兰蔻、李宁、北面等品牌会选择使用AI驱动的虚拟主播进行自播。但由于技术尚未达到真人直播的水平,所以通常只在午夜时段排期。阿里云提供的品牌智能直播间基础版售价为99000元/(年×路),其中每个店铺视为一路。该服务提供多种功能,包括直播剧本智能生成、多模态智能交互和营销平台智能整合等。我们来看一下几个淘宝智能直播间的案例。虚拟形象采用3D卡通风格,预设了丰富的动作库和真实的语音表现,呈现出鲜活、富有感染力的带货风格。品牌方可定制虚拟主播的服装,例如北面旗舰店的虚拟主播就着装本品牌衣物。商品展示以图片为主,背景墙上呈现出商品主图。当主播介绍卖点时,画面会出现文字特效。直播间的场景设定有三维空间感,营造出与观众互动的虚拟背景;而主播介绍产品时,则会使用蓝幕背景插入商品图片。直播互动流程相对固定,比如进场互动,当识别到新进入直播间的观众时,会插播“欢迎xx进入我的直播间”;引导关注、分享、下单的互动话术;问答互动,当识别到评论区中的问题,主播会插播相关的回答,比如红包优惠,某个商品链接等。欧莱雅京东自营官方旗舰店的直播间采用的是2D拟真人的虚拟形象。这类虚拟形象的定制只需要录制2分钟的视频,就可以训练生成。货品展示方式参考真人直播时的形式,将商品以图片的形式罗列在虚拟人面前。由于虚拟主播无法与产品有接触,纯粹只能动嘴皮,商品只能放在一旁,这样的测评结果缺乏真实性,容易引起用户反感。目前,AI驱动的虚拟主播更像是一个花瓶,能够吸引一些好奇的用户,再负责一些基础性的产品介绍和互动问答。

Others are asking
我想时刻关注Deepseek目前在电商行业应用落地的场景的信息及对应的应用APP、小程序等,可以通过什么渠道第一时间获取
目前关于 Deepseek 在电商行业应用落地的场景信息以及对应的应用 APP、小程序等,您可以通过以下渠道第一时间获取: 1. 关注 Deepseek 官方网站的动态发布和通知。 2. 订阅 Deepseek 官方的社交媒体账号,如微信公众号、微博等,获取最新消息。 3. 加入相关的电商行业论坛或社区,与其他从业者交流,获取相关信息。 4. 关注电商行业的权威媒体和资讯平台,可能会有相关报道。
2025-02-26
Deepseek目前已在电商行业应用落地的场景有哪些?
DeepSeek 在电商行业已应用落地的场景包括: 电商商品策划:如“电商商品策划 DeepSeek 大师版|一键领取同款多维表格模板”。 商品链接分析:如“商品链接分析工具”。 电商产品上架规划:如“电商产品上架规划”。 您可以通过以下链接获取更详细的信息:
2025-02-26
Deepseek目前已在电商行业应用落地的场景有哪些?
DeepSeek 目前已在电商行业应用落地的场景包括: 电商商品策划:如 。 商品链接分析:如 。 电商产品上架规划:如 。
2025-02-26
适合电商设计运用的AI工具
以下是一些适合电商设计运用的 AI 工具及相关应用: Midjourney 新编辑器: 产品海报设计:将产品图片导入编辑器,通过简单操作和提示词生成不同风格的海报。 家具材质变化:利用图像重纹理化模式,快速为家具图片换上各种材质。 艺术字体海报:通过白底字体图和图像重纹理化模式,变换成各种炫酷的字体海报风格,建议使用竖版白底文字图。 用于阿里巴巴营销技巧和产品页面优化的 AI 应用: 市场分析:利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况。 关键词优化:AI 推荐高流量、高转化的关键词,优化产品标题和描述。 产品页面设计:AI 设计工具生成吸引人的产品页面布局。 内容生成:AI 文案工具撰写有说服力的产品描述和营销文案。 图像识别和优化:选择或生成高质量的产品图片。 价格策略:分析不同价格点对销量的影响,制定有竞争力的价格策略。 客户反馈分析:了解客户需求,优化产品和服务。 个性化推荐:根据用户购买历史和偏好提供个性化产品推荐。 聊天机器人:提供 24/7 客户服务,解答疑问,提高满意度。 营销活动分析:了解活动效果,吸引顾客并产生销售。 库存管理:预测需求,优化库存管理。 支付和交易优化:分析支付方式对交易成功率的影响,优化支付流程。 社交媒体营销:在社交媒体上找到目标客户群体,精准营销提高知名度。 直播和视频营销:分析观众行为,优化直播和视频内容,提高参与度和转化率。 其他生成式 AI 工具: :帮助品牌创建引人注目的产品照片。 :制作用于电子邮件或社交媒体的营销材料。 :编写经过 SEO 优化的产品描述。未来有望仅通过描述期望的审美并点击按钮,创建完整的电商商店及营销材料。
2025-02-24
电商做图用哪个工具最好
以下是一些常用于电商做图的工具及相关介绍: Stable Diffusion:适合电商店主初步制作商品展示图。例如,对于女装商品,可通过真人穿衣服拍照,选好真人照片风格的底模,进行换头操作,并利用局部重绘选项卡涂抹替换部分。同时,还可借助美图秀秀或 PS 处理身材方面的问题。 Midjourney:其新推出的图像编辑器在电商设计领域有巨大潜力。 产品海报设计:将产品图片导入编辑器,通过简单操作和写提示词生成不同风格的海报。 家具材质变化:利用图像重纹理化模式快速为家具换上各种材质。 艺术字体海报:通过白底字体图变换成各种炫酷的字体海报风格。 此外,还有一些人员在电商应用中使用不同的工具,如薄荷用于电商应用出图辅助创意落地,龙飞用于海报生成,刘燕兰用于电商应用等。
2025-02-23
Ai在电商行业的应用
AI 在电商行业有以下应用: 1. 产品推荐:通过分析客户数据,为每个客户推荐可能感兴趣的产品。 2. 搜索和个性化:改善搜索结果,为客户提供个性化的购物体验。 3. 动态定价:根据市场需求动态调整产品价格。 4. 聊天机器人:提供服务,回答客户问题并解决他们的问题。 在这个领域,电子商务已成为生成式 AI 最富成效的垂直行业之一。相关工具能帮助品牌创建引人注目的产品照片,如将连衣裙的静态照片变成女人穿着裙子在花园行走的形象,预期用途将极度个性化,如展示沙发在用户公寓中的照片。品牌还能通过相关工具创作用于电子邮件或社交媒体的营销材料、编写经过 SEO 优化的产品描述,未来甚至能仅通过描述期望的审美并点击按钮创建完整的电商商店及营销材料。 同时,AIGC 应用在电商领域也存在法律风险。目前关于 AIGC 侵权的关注重点多集中于版权和专利侵权,实际上也可能产生商标侵权和不正当竞争的风险。例如,利用 AIGC 设计商标可能生成与在先注册商标近似的标志,导致商标侵权。在数据采集过程中,若直接抓取竞争者加工过的数据且未付出新的劳动创造就将其作为获取商业利益的工具,可能构成不正当竞争。
2025-02-23
微软认证AI工程师
以下是关于微软认证 AI 工程师的相关信息: MQ 老师是知乎的 AI 讲师,考过了国家工信部、微软、讯飞三个初级人工智能工程师证书,在教育行业工作 15 年以上,过去半年一直在探索教育场景中的 AI 实践。 胡凯翔是微软、讯飞认证提示词工程师,曾担任破局俱乐部企业培训和 AI+教育行动营教练,共创有约 10 万字 AI+教育手册。 韦恩是微软提示词工程师,智能体创业者,WayToAGI 共建者,多平台 Agent 开发者,企业级 AI Agent 定制专家,荣获多家 AI 开发平台的比赛奖项,有 12 年程序开发背景,是多家企业的 AI 落地顾问。
2025-03-02
安防行业如何应用好AI
在安防行业应用好 AI 可以从以下几个方面考虑: 1. 技术层面: 大模型时代,训练大模型涉及 GPU 调用、模型架构设计、数据处理、调优等多个环节,具有较高的资源门槛和技术复杂度。 2. 竞争态势: 当计算机视觉的商业化场景转向安防后,创业公司面临来自安防行业巨头的竞争。创业公司虽更懂 AI 视觉识别,但需从头学习研发硬件产品、搭建营销体系;而巨头有完善的供应链和销售体系,但需要引入 AI 技术。 大模型时代的创业公司对手从海康威视换成了资源更多、决心明确的 BAT 和字节等大公司。 3. 创新与生态: 新技术能否找到新生态至关重要,包括新的供应链、新的硬件载体、新的渠道和新的需求与用户来源。 创业公司和大公司间的竞赛结果取决于新技术能在多大程度上颠覆原有体验,新技术的进入门槛、赛道长度以及能否找到新生态。 此外,在管理方面,要善于为 AI 应用提供明确的沟通和上下文,明晰其能力边界,合理授权并监督检查,擅长任务拆解和整合以提升协作效率。同时,医保严禁 AI 自动开处方,而在其他领域如 Coinbase 全面推动 AI 应用,提高了效率并广泛应用于多个方面。
2025-03-02
AI能不能帮人写小说赚钱
AI 可以帮助人写小说赚钱。例如,南瓜博士上个月参加了一场 AI 创作微信小说的比赛,尽管在提交过程中出现了一些小失误,但仍凭借 AI 的帮助获奖。此外,使用 AI 可以草拟各种类型的初稿,如博客文章、论文、宣传材料、演讲、讲座、剧本、短篇小说等。通过与 AI 系统互动,提高提示质量,能让写作效果更好。还可以将自己的文本粘贴到 AI 中,要求其改进内容、提供针对特定受众的建议、创建不同风格的草稿等。AI 也能帮助完成一些任务,如写邮件、创建销售模板、提供商业计划的下一步等。总之,合理利用 AI 能在写作方面提供支持,从而有机会通过写小说获得收益。
2025-03-02
企业本地化部署AI
企业本地化部署 AI 主要包括以下方面: RPA 与财务税务问答机器人:RPA 与 AI 结合具有多种应用和优势。操作流程简单,无需代码,适合小白和无 IT 经验者。有众多应用案例,如奥康和方太在各部门的订单处理等操作中搭建了大量脚本。封装了众多组件,还可通过触发器设置机器人每天工作。数字化包括标准化、自动化、RPA 加 AI 使机器人更智能三个阶段,交付的是动态能力,让用户自己搭建机器人。产品可本地化私有部署,面向企业有费用,私有化部署能保障数据安全,企业大模型可封装调用。RPA 有容错处理方式,但受多种因素影响。 LangChain 与 NVIDIA:NVIDIA NIM 是一系列用户友好的微服务,旨在加速企业内部生成式 AI 的部署进程。支持广泛的 AI 模型,基于强大的推理引擎和技术构建,提供无缝的 AI 推理体验。其自托管特性可保障数据安全,提供预构建容器,具有可扩展性。开始使用 NIM 可在 NVIDIA API 目录中获取多种 AI 模型,它是 NVIDIA AI Enterprise 的一部分。 从 LLM 大语言模型、知识库到微信机器人:以 windows10 系统为例,安装环境时先在系统中输入“cmd”打开命令窗口,确认是否有 python 和 pip。若没有则需安装,如安装 python 可下载安装包。部署项目时下载 COW 机器人项目并解压缩。
2025-03-02
ai写作的内容
以下是关于 AI 写作的相关内容: 1. 陈财猫从自身经历出发,认为 AI+内容创作是现阶段最好的赛道,具有完美的产品模型匹配和产品市场匹配,且天花板高。其业务包含营销和小说、短剧创作,开发了智能营销矩阵平台,参与喜马拉雅短故事和短剧写作课程,捣鼓出小财鼠程序版 agent。好文字能引起人的生理共鸣与情绪,AI 因预训练数据量大能学会引发共鸣,从而写出好文字。用 AI 写出好文字的方法包括选好模型,评估模型的文风和语言能力等;克服平庸,平衡“控制”与“松绑”;显式归纳想要的文本特征,通过 prompt 中的描述与词语映射到预训练数据中的特定类型文本,往 prompt 里塞例子。同时,作者认为 AI 创作的内容有灵魂,期望 AI 能力进一步提升,改变每个人的生活。 2. 利用 AI 不到 30 分钟打造爆款公众号文章的关键在于提供清晰且具有指导性的提示词(prompt)。好的提示词能帮助 AI 更准确理解需求并生成符合预期的内容。若已有基本提示词,AI 可生成基础文章,若想提升质量,可提供更详细、具创意的提示词,让 AI 更好地捕捉文章的语气、风格和重点。例如,可给出“请根据我们收集的关于 OpenAI 回应马斯克言论的资讯,创作一篇既深入又易于理解的科技资讯文章。文章应该有一个吸引人的标题,开头部分要概述事件的背景和重要性,主体部分详细分析 OpenAI 的回应内容及其可能产生的影响,结尾处提出一些引人深思的问题或观点。”这样的提示词,它不仅为 AI 提供明确指导,还设定文章基本结构和内容要求,AI 会据此生成结构完整、内容丰富、观点鲜明的文章,但最终产出的内容可能需要微调以符合预期和公众号风格。
2025-03-02
利用AI打造个人知识库
利用 AI 打造个人知识库可以通过以下方式实现: 1. 使用 GPT 打造个人知识库: 将大文本拆分成若干小文本块(chunk),通过 embeddings API 将小文本块转换成与语义相关的 embeddings 向量,并在向量储存库中保存这些向量和文本块作为问答的知识库。 当用户提出问题时,将问题转换成向量,与向量储存库中的向量比对,提取距离最小的几个向量对应的文本块,与问题组合成新的 prompt 发送给 GPT API。 例如对于“此文作者是谁?”的问题,可直观或通过比较 embeddings 向量得出关联度最高的文本块,如“本文作者:越山。xxxx。”“《反脆弱》作者塔勒布xxxx。”,最后发送给 GPT API 的问题类似于“此文作者是谁?从以下信息中获取答案:本文作者:越山。xxxx。《反脆弱》作者塔勒布xxxx。” 2. 搭建基于 GPT API 的定制化知识库: 涉及给 GPT 输入定制化知识,但 GPT3.5 一次交互支持的 Token 有限,OpenAI 提供了 embedding API 解决方案。 Embeddings 是浮点数字的向量,两个向量之间的距离衡量关联性,小距离表示高关联度,大距离表示低关联度。 向量是用一串数字表示的量,在计算机科学中常用列表表示,向量间距离有多种计算方式,如欧几里得距离。 3. 小七姐提出的 AI 时代知识管理体系构建: 包括读书时看到有触动的文本作为书摘。 对书摘整理归纳、标记重点、打赏标签放入笔记系统,准备深度思考和实践。 基于笔记提到的 AI 对人的赋能模式展开深度实践,如通过 AI 信息杠杆迅速掌握相关知识。 基于实践生成自己的观点和决策,并打造成体系化的内容产品实现价值。 最终把碎片化知识在知识库中流转,从书摘变成体系化内容,把“别人说的话”变成“自己的智慧”。 希望以上内容能帮助您打造个人知识库。
2025-03-01
RAG最新进展
RAG(检索增强生成)是由 Lewis 等人于 2020 年中期提出的一种大语言模型领域的范式。 其发展经历了以下阶段: 1. 2017 年创始阶段,重点是通过预训练模型吸收额外知识以增强语言模型,主要集中在优化预训练方法。 2. 大型语言模型如 GPT 系列在自然语言处理方面取得显著成功,但在处理特定领域或高度专业化查询时存在局限性,易产生错误信息或“幻觉”,特别是在查询超出训练数据或需要最新信息时。 3. RAG 包括初始的检索步骤,查询外部数据源获取相关信息后再回答问题或生成文本,此过程为后续生成提供信息,确保回答基于检索证据,提高输出准确性和相关性。 4. 在推断阶段动态检索知识库信息能解决生成事实错误内容的问题,被迅速采用,成为完善聊天机器人能力和使大语言模型更适用于实际应用的关键技术。 RAG 在多个基准测试中表现出色,如在 Natural Questions、WebQuestions 和 CuratedTrec 等中表现抢眼。用 MSMARCO 和 Jeopardy 问题进行测试时,生成的答案更符合事实、具体和多样,FEVER 事实验证使用后也有更好结果。基于检索器的方法越来越流行,常与 ChatGPT 等流行大语言模型结合使用提高能力和事实一致性,在 LangChain 文档中有相关使用例子。 同时,对增强生成检索的兴趣增长促使了嵌入模型质量的提高,传统 RAG 解决方案中的问题也得到解决。
2025-02-20
deepseek最近有什么新进展
DeepSeek 近期有以下新进展: 深夜发布大一统模型 JanusPro,将图像理解和生成统一在一个模型中。 模型(7B):https://huggingface.co/deepseekai/JanusPro7B 模型(1B):https://huggingface.co/deepseekai/JanusPro1B JanusPro 是一种新型的自回归框架,通过将视觉编码解耦为独立的路径解决先前方法的局限性,同时利用单一的统一变压器架构进行处理。解耦缓解了视觉编码器在理解和生成中的角色冲突,增强了框架的灵活性,超越了之前的统一模型,并匹配或超过了特定任务模型的性能,成为下一代统一多模态模型的有力候选者。 在编码任务中已成为社区的最爱,其组合了速度、轻便性和准确性而推出的 deepseekcoderv2。
2025-02-19
国产AI大模型的最新进展
以下是国产 AI 大模型的最新进展: 通义千问的 Qwen 系列表现出色:Qwen 是国内唯一出现在 OpenAI 视野里、能参与国际竞争的国产大模型。Qwen 多次冲进相关榜单,得分不断提高,其开源模型累计下载量突破 1600 万,国内外有大量开发者基于 Qwen 开发模型和应用,尤其在企业级领域。通义大模型证明了开源开放的力量。 国内大模型落地情况:2024 年被称为国内大模型落地元年,1 至 11 月,大模型中标项目共 728 个,是 2023 年全年的 3.6 倍;中标金额 17.1 亿元,是 2023 年全年的 2.6 倍。中标项目数前五的行业分别是运营商、能源、教育、政务、金融。厂商方面,百度以 40 个中标项目数、2.74 亿元的中标金额排名所有厂商之首,科大讯飞居第二。 其他进展:智谱一年间推出了 4 代 GLM,一直是国内能力较好的模型之一。MiniMax 推出了 MoE 架构的新模型和“星野”这个目前国内较成功的 AI 陪聊 APP。月之暗面专注长 Token 能力,在记忆力和长 Token 能力上有一定优势。但硬件层上的卡脖子问题仍未缓解,国内目前仍无胜任大模型训练的芯片,在推理上虽有 Nvidia 的替代产品逐渐出现,但华为昇腾在单卡指标上距离不远,因稳定性不足和缺乏 Cuda 生态,仍需时间打磨。
2025-01-09
AI方面有什么最新进展
以下是 AI 方面的一些最新进展: 1. 2024 人工智能现状报告:由剑桥大学和 AI 风险投资公司 Air Street Capital 的相关人员共同发表,围绕人工智能领域的最新进展、政治动态、安全挑战及未来预测几大方面进行说明。 2. AI 绘画:从生成艺术作品到辅助艺术创作,逐渐改变传统艺术面貌。技术进步使创作质量和速度取得突破,为艺术家提供新工具和可能性,但也引发了关于艺术本质、创造性、版权和伦理的讨论,带来对从业者职业安全的焦虑和“侵权”嫌疑的反对之声。 3. 技术历史和发展方向: 发展历程:包括早期阶段的专家系统、博弈论、机器学习初步理论;知识驱动时期的专家系统、知识表示、自动推理;统计学习时期的机器学习算法;深度学习时期的深度神经网络等。 前沿技术点:大模型(如 GPT、PaLM 等)、多模态 AI(视觉语言模型、多模态融合)、自监督学习、小样本学习、可解释 AI、机器人学、量子 AI、AI 芯片和硬件加速。
2024-12-05
人工智能与AI诈骗最新进展
以下是关于人工智能与 AI 诈骗的最新进展: 在 2024 年,AI 领域有诸多进展。在图像和视频方面,超短视频的精细操控,如表情、细致动作、视频文字匹配等有所发展,有一定操控能力的生成式短视频中,风格化、动漫风最先成熟,真人稍晚。AI 音频能力长足进展,带感情的 AI 配音基本成熟。“全真 AI 颜值网红”出现,可稳定输出视频并直播带货。游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式。AI 男/女朋友聊天基本成熟,在记忆上有明显突破,能较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈。实时生成的内容开始在社交媒体内容、广告中出现。AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验。AI 的商业模式开始有明确用例,如数据合成、工程平台、模型安全等。可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功。中国 AI 有望达到或超过 GPT4 水平,美国可能出现 GPT5,世界上开始出现“主权 AI”。华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代稍晚)。然而,AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧,AI 立法、伦理讨论仍大规模落后于技术进展。 在 3 月底的 23 个最新 AI 产品中,有室内装修自动渲染的 HomeByte,生成效果超赞的新视觉模型 Playground v1,“图生文”反向工具 Clip Interrogator 以及致力于解决电话诈骗的 GPTCHA 等。 在技术应用方面,LLMs 能自动化写代码等流程,交通应用如 Google Maps 和 CityMapper 也使用了 AI。AI 在银行业的欺诈检测、信用管理和文件处理等方面发挥作用。同时,AI 还在药物研发、解决气候危机等领域有重要应用。 总之,AI 技术在不断发展的同时,也带来了如诈骗等问题,需要关注和解决。
2024-12-02
AI加教育的最新进展
以下是 AI 加教育的最新进展: 案例方面: “AI 赋能教师全场景”,来自 MQ 老师的投稿贡献。 “未来教育的裂缝:如果教育跟不上 AI”,揭示了人工智能在教育领域从理论走向实际应用带来的颠覆性改变。 “化学:使用大型语言模型进行自主化学研究”。 “翻译:怎么把一份英文 PDF 完整地翻译成中文?”,介绍了 8 种方法。 对未来的预判: 个性化学习时代已到来,AI 将作为教育生态系统的一部分与人类教师协作,为孩子提供不同的学习体验,如混合式教学、定制学习路径等。 教育工作者将成为学习的引导者和伙伴,更多关注孩子的全人发展,如创造力和社交智慧。 未来 3 年,提升人机协作效率的领域,如 AI 作业批改、备课、定制教育规划、学前启蒙等,对教育从业者蕴藏着巨大机遇。 探索实践: 过去半年多,梳理教学和育儿工作流,每个环节与 AI 协作可大幅提升效率,但也加剧了知识获取的不平等。从家长的“育”、老师的“教”和学生的“学”进行了落地实践的拆解。
2024-11-05