直达「 通往AGI之路 」飞书知识库 →
首页/问答列表/问答详情

AI在电商直播带货有什么新进展吗

回答

AI 在电商直播带货领域有以下新进展:

  1. “全真 AI 颜值网红”出现,可以稳定输出视频,并能够进行直播带货。
  2. 数字人工具软件方面,有实时驱动和非实时驱动两类,实时驱动在直播时能改音频话术,真人可接管,标准零售价一年 4 - 6 万往上;非实时驱动一个月 600 元,效果差,市场价格混乱。
  3. 数字人运营服务可按直播间成交额抽佣。
  4. 适用于不需要强展示的商品,如品牌食品饮料,以及虚拟商品如门票、优惠券等,店播效果较好,数据基本能保持跟真人一样。不适用于促销场景。
  5. 目前技术仍显稚嫩,如更真实的对口型、更低的响应延迟等方面有待提高。
  6. 不会一家独大,可能 4 - 5 家一线效果,大多二三线效果公司。
  7. 有资源、有业务的大平台下场可能会带来降维打击,例如剪映若全环节打通会绑定商家。
  8. 欧莱雅、YSL、兰蔻、李宁、北面等品牌会选择使用 AI 驱动的虚拟主播进行自播,但通常只在午夜时段排期。
  9. 阿里云提供的品牌智能直播间基础版售价为 99000 元/(年×路),提供多种功能。
  10. 虚拟形象有 3D 卡通风格和 2D 拟真人风格,预设动作库和真实语音表现,商品展示以图片为主,直播互动流程相对固定。但虚拟主播无法与产品接触,测评结果缺乏真实性,目前更像是花瓶,负责基础性介绍和互动问答。
内容由 AI 大模型生成,请仔细甄别(powered by aily)

参考资料

AGI 万字长文(下)| 2024,分叉与洪流

2024年内图片-超短视频的精细操控:表情、细致动作、视频-文字匹配有一定操控能力的生成式短视频:风格化、动漫风最先成熟;真人稍晚AI音频能力长足进展:带感情的AI配音基本成熟“全真AI颜值网红”出现,可以稳定输出视频,可以直播带货游戏AI NPC有里程碑式进展,出现新的游戏生产方式AI男/女朋友聊天基本成熟:记忆上有明显突破,可以较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈实时生成的内容开始在社交媒体内容、广告中出现AI Agent有明确进展,办公场景“AI助手”开始有良好使用体验2AI的商业模式开始有明确用例:数据合成、工程平台、模型安全等可穿戴-全天候AI硬件层出不穷,虽然大多数不会成功中国AI达到或超过GPT4水平;美国出现GPT5;世界上开始现“主权AI”华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代要稍晚)AI造成的DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧AI立法、伦理讨论仍然大规模落后于技术进展……2025-2027AI 3D技术、物理规则成熟:正常人无法区别AI生成还是实景拍摄全真AI虚拟人成熟:包含感情的AI NPC成熟,开放世界游戏成熟;游戏中几乎无法区别真人和NPCAR/VR技术大规模商用接近AGI的技术出现人与AI配合的工作方式成为常态,很多日常决策开始由AI来执行AI生产的数据量超过全人类生产数据量,“真实”成为稀缺资源具身智能、核聚变、芯片、超导、机器人等技术有明显进展突破“人的模型”出现,出现“集中化AGI”与“个人AGI”的历史分叉AI引发的社会问题开始加重,结构性失业开始出现AGI对于地缘政治的影响开始显露……"Limit of Understanding"; Yifei Gong 2024,with Dall-E

7月2日 张晟、汗青讨论数字人

1.直接卖数字人工具软件。分实时驱动和非实时驱动两类,实时驱动在直播时能改音频话术,真人接管。市面价格在一年4-6万往上(标准零售价)。非实时一个月600元,效果很差,类似放视频的伪直播,市场价格混乱,靠发展代理割韭菜。2.提供数字人运营服务,按直播间成交额抽佣。[heading2]AI直播卖货适用品类和场景?[content]1.适用于不需要强展示的商品,如品牌食品饮料。如果服装就搞不了,过品快,衣服建模成本高。2.适用于虚拟商品,如门票、优惠券等。3.不适用于促销场景,这涉及主播话术、套路,调动直播间氛围能力等。4.电商直播分为达播跟店播,数字人直播跑下来效果最好的是店播,数据基本能保持跟真人一样(朋友公司数据)。[heading2]AI直播的壁垒和未来市场格局是什么?[content]1.时间拉长,技术上没壁垒。但目前看仍有技术门槛,单纯靠开源算法拼的东西,实时性、可用性不高。比如更真实的对口型,更低的响应延迟等。2.不会一家独大,可能4-5家一线效果,大多二三线效果公司。因为它只是工具,迁移成本低。3.真正把客户服务好,能规模化扩张的公司更有价值。疯狂扩代理割韭菜,不考虑客户效果的公司,售后问题很麻烦。4.有资源、有业务的大平台下场,可能会带来降维打击,例如剪映马上要做,如果不仅提供数字人,还提供货品供应链、数据复盘分析等等,全环节打通会绑定商家,很难打。

虚拟主播,能在电商直播间站稳脚跟吗?

欧莱雅、YSL、兰蔻、李宁、北面等品牌会选择使用AI驱动的虚拟主播进行自播。但由于技术尚未达到真人直播的水平,所以通常只在午夜时段排期。阿里云提供的品牌智能直播间基础版售价为99000元/(年×路),其中每个店铺视为一路。该服务提供多种功能,包括直播剧本智能生成、多模态智能交互和营销平台智能整合等。我们来看一下几个淘宝智能直播间的案例。虚拟形象采用3D卡通风格,预设了丰富的动作库和真实的语音表现,呈现出鲜活、富有感染力的带货风格。品牌方可定制虚拟主播的服装,例如北面旗舰店的虚拟主播就着装本品牌衣物。商品展示以图片为主,背景墙上呈现出商品主图。当主播介绍卖点时,画面会出现文字特效。直播间的场景设定有三维空间感,营造出与观众互动的虚拟背景;而主播介绍产品时,则会使用蓝幕背景插入商品图片。直播互动流程相对固定,比如进场互动,当识别到新进入直播间的观众时,会插播“欢迎xx进入我的直播间”;引导关注、分享、下单的互动话术;问答互动,当识别到评论区中的问题,主播会插播相关的回答,比如红包优惠,某个商品链接等。欧莱雅京东自营官方旗舰店的直播间采用的是2D拟真人的虚拟形象。这类虚拟形象的定制只需要录制2分钟的视频,就可以训练生成。货品展示方式参考真人直播时的形式,将商品以图片的形式罗列在虚拟人面前。由于虚拟主播无法与产品有接触,纯粹只能动嘴皮,商品只能放在一旁,这样的测评结果缺乏真实性,容易引起用户反感。目前,AI驱动的虚拟主播更像是一个花瓶,能够吸引一些好奇的用户,再负责一些基础性的产品介绍和互动问答。

其他人在问
智能体在电商领域的应用
智能体在电商领域有以下应用: 1. 电商导购:以“什么值得买”智能体为例,当用户输入“我想买个笔记本电脑”,智能体会先提取关键词“笔记本电脑”,通过相关 API 检索商品信息,与内置提示词组装成上下文,请求大模型回答,提供更好的商品推荐效果。 2. 工作流协作:工作流也可理解为多智能体协作,通过多个智能体的组装解决复杂场景的搜索问题。例如给新产品取名,涉及多个步骤和检测,人工操作费时,而 AI 搜索与 Workflow 模式可有效解决,通过定义多个智能体完成各项功能,并由调度中枢协调工作和决策。 在品牌卖点提炼方面: 1. 构建中对结构的理解和控制最为重要,旨在提供结构化思路,单点可通过不断迭代完善。品牌卖点提炼助手本质是办公助手,能为有营销思维的团队提供思路,提高团队效率。 2. 实际搭建需根据公司业态调整,给智能体更多提示词提升分析合理性。不同行业的线上、线下和人员触点不同,遵循营销管理流程保证输出,调整提示词提升准确度。营销管理结构化提示词中避免依赖举例,决策和洞察力仍依赖人员,智能体作为灵感助手辅助决策。 3. 最终提炼的品牌卖点应用于与用户交互的所有场景,即触点,包括线上(如微信、抖音等平台)、线下(产品到达消费者手上的场景或线下实体门店场景)和人员(线上直播间、人工客服或线下销售人员等)触点。在最终步骤,需找到所有传达品牌卖点的场景,结合需求制作落地页或沟通话术,建立品牌价值。
2024-12-20
当前电商领域有哪些智能体可以用
在电商领域,以下是一些常见的智能体类型及应用示例: 1. 简单反应型智能体:如温控器,根据当前的感知输入直接采取行动,不维护内部状态和考虑历史信息。 2. 基于模型的智能体:像自动驾驶汽车,维护内部状态,对当前和历史感知输入进行建模,能推理未来状态变化并据此行动。 3. 目标导向型智能体:例如机器人导航系统,具有明确目标,能评估行动方案并选择最优行动。 4. 效用型智能体:如金融交易智能体,能量化不同状态的效用值,选择效用最大化的行动。 5. 学习型智能体:例如强化学习智能体,通过与环境交互不断学习最优策略。 以“什么值得买”智能体为例,当用户输入“我想买个笔记本电脑”,智能体会先提取关键词,再通过相关 API 检索商品信息,与内置提示词组装后请求大模型回答,成为电商导购类的垂直搜索应用,在商品推荐方面效果较好。 此外,工作流(Workflow)也可理解为多智能体协作(MultiAgents),通过多个智能体的组装解决复杂场景的搜索问题。例如给新产品取名,可定义多个智能体分别负责不同功能,还需要有调度中枢协调工作和做决策。 还有“买买买!💥产品买点提炼神器强化版🚀”智能体,专注于市场营销领域,能帮助用户从产品出发挖掘卖点并转化为买点,生成小红书文案和抖音短视频脚本等,并保存至飞书文档。
2024-12-20
AI智能体在电商领域可落地的应用
AI 智能体在电商领域有以下可落地的应用: 1. 电商导购:以“什么值得买”智能体为例,当用户输入“我想买个笔记本电脑”,智能体会先提取关键词“笔记本电脑”,通过相关 API 检索商品信息,与内置提示词组装成上下文,请求大模型回答,从而提供更好的商品推荐效果。 2. 工作流优化:工作流也可理解为多智能体协作,通过多个智能体的组装解决复杂场景的搜索问题。例如给新产品取名,涉及多个步骤和检测,人工操作费时,而 AI 搜索与 Workflow 模式可有效解决,通过定义多个完成不同功能的智能体,并由调度中枢协调工作和决策。 3. 品牌卖点提炼:AI 在逻辑推理、数据分析、内容理解和输出上有独特优势,可搭建品牌卖点提炼助手。但在搭建前需明确 AI 的能力边界,如对公司产品、独特之处、核心渠道等了解有限。AI 更适合做引导型助手,在寻找卖点陷入停滞时提供更多思考维度。实际搭建时,除遵循营销管理流程保证输出合理,还需根据公司业态调整智能体提示词以提升信息准确度。对于电商产品,需考虑线上线下不同触点和人员等因素。
2024-12-19
AI智能体在电商领域营销助手应用
AI 智能体在电商领域营销助手方面有以下应用: 1. 品牌卖点提炼: 智能体的构建中,理解和控制结构最为重要,其本质是办公助手,能为有营销思维的团队提供思路,提高效率。 实际搭建要根据公司业态调整,给智能体更多提示词提升分析合理性。例如电商产品,线上触点有淘系、京东系等电商平台和抖音、小红书等兴趣电商内容平台,线下触点包括产品包装、包裹等,人员触点有销售人员等;线下实体服务行业,线上触点有大众点评/美团等,线下触点有门店展示等。 遵循营销管理流程构建智能体可保证输出准确,调整提示词能提升某部分助手信息准确度,但注意营销管理结构化提示词中不要依赖举例,以免限制 AI 创造性思维。 2. 电商导购: 以“什么值得买”智能体为例,用户输入“我想买个笔记本电脑”,智能体会提取关键词,通过 API 检索商品信息,与提示词组装后请求大模型回答,成为电商导购类垂直搜索应用,提升商品推荐效果。 工作流 Workflow 可理解为多智能体协作,通过多个智能体组装解决复杂场景搜索问题,如新产品取名,涉及多个步骤和智能体,还需调度中枢协调工作和决策。 3. 搭建智能体提炼品牌卖点: AI 在逻辑推理、数据分析等方面有强项,可用于品牌卖点提炼,搭建品牌卖点提炼助手。 搭建前要明确 AI 能力边界,如 AI 不了解公司产品、独特之处等。 AI 真正的能力是逻辑推理、处理分析数据等,确定的智能体更适合做引导型助手,在寻找卖点陷入停滞时提供思考维度。
2024-12-19
AI智能体在电商领域到底能做什么
AI 智能体在电商领域主要有以下应用: 1. 电商导购:以“什么值得买”智能体为例,当用户输入购买需求,如“我想买个笔记本电脑”,智能体会提取关键词,通过相关 API 检索商品信息,与内置提示词组装成上下文,请求大模型回答,提供更精准的商品推荐。 2. 工作流协作:通过多个智能体的组装,解决复杂场景的搜索问题。例如给新产品取名,定义多个智能体分别负责不同功能,如给出建议名字、检索是否同名等,同时需要调度中枢协调工作,决定是继续下一步还是回溯。 3. 决策支持:如在理赔提交审核中,将付款方规则转换为有向无环图,智能体遍历决策树,利用语言模型评估相关文件是否符合规则,并在复杂任务中选择最佳方法。 4. 品牌卖点提炼:实际搭建中,遵循营销管理流程保证输出合理性,根据电商业态调整单独智能体的提示词提升信息准确度,为营销团队提供更广阔思路和灵感。
2024-12-19
有那些AI工具能运用到抖音电商中
以下是一些能运用到抖音电商中的 AI 工具: 1. 像这样的工具,可帮助品牌创建引人注目的产品照片。 2. 能够制作用于电子邮件或社交媒体的营销材料。 3. 可以编写经过 SEO 优化的产品描述。 此外,使用 AI 来完成电商相关的优化还可以采取以下步骤: 1. 市场分析:利用 AI 分析工具研究市场趋势、消费者行为和竞争对手情况,快速识别关键信息。 2. 关键词优化:AI 分析和推荐高流量、高转化的关键词,优化产品标题和描述。 3. 产品页面设计:AI 设计工具根据市场趋势和用户偏好生成吸引人的页面布局。 4. 内容生成:AI 文案工具撰写有说服力的产品描述和营销文案。 5. 图像识别和优化:AI 图像识别技术选择或生成高质量的产品图片。 6. 价格策略:AI 分析不同价格点对销量的影响,制定有竞争力的价格策略。 7. 客户反馈分析:AI 分析客户评价和反馈,优化产品和服务。 8. 个性化推荐:AI 根据用户购买历史和偏好提供个性化产品推荐。 9. 聊天机器人:AI 驱动的聊天机器人提供 24/7 客户服务。 10. 营销活动分析:AI 分析不同营销活动效果。 11. 库存管理:AI 预测需求,优化库存管理。 12. 支付和交易优化:AI 分析支付方式对交易成功率的影响,优化支付流程。 13. 社交媒体营销:AI 帮助在社交媒体上找到目标客户群体,精准营销提高品牌知名度。 14. 直播和视频营销:AI 分析观众行为,优化直播和视频内容。 还有,它收集了十几款电商领域能用得上的 AI 工具,按照电商的角色进行区分,有产品形态和具体的使用描述,无论您是买家、卖家、渠道还是生产者,都能找到合适的 AI 工具。
2024-12-19
如何学习AI
以下是新手学习 AI 的方法和建议: 1. 了解 AI 基本概念: 阅读「」部分,熟悉 AI 的术语和基础概念,包括其主要分支(如机器学习、深度学习、自然语言处理等)以及它们之间的联系。 浏览入门文章,了解 AI 的历史、当前的应用和未来的发展趋势。 2. 开始 AI 学习之旅: 在「」中,找到为初学者设计的课程,特别推荐李宏毅老师的课程。 通过在线教育平台(如 Coursera、edX、Udacity)上的课程,按照自己的节奏学习,并有机会获得证书。 3. 选择感兴趣的模块深入学习: AI 领域广泛,如图像、音乐、视频等,可根据兴趣选择特定模块深入学习。 掌握提示词的技巧,它上手容易且很有用。 4. 实践和尝试: 理论学习后,实践是巩固知识的关键,尝试使用各种产品做出作品。 在知识库提供了很多大家实践后的作品、文章分享,欢迎实践后的分享。 5. 体验 AI 产品: 与现有的 AI 产品进行互动,如 ChatGPT、Kimi Chat、智谱、文心一言等 AI 聊天机器人,了解其工作原理和交互方式,获得对 AI 在实际应用中表现的第一手体验,并激发对 AI 潜力的认识。 对于中学生学习 AI,建议如下: 1. 从编程语言入手学习: 可以从 Python、JavaScript 等编程语言开始,学习编程语法、数据结构、算法等基础知识,为后续的 AI 学习打下基础。 2. 尝试使用 AI 工具和平台: 可以使用 ChatGPT、Midjourney 等 AI 生成工具,体验 AI 的应用场景。 探索一些面向中学生的 AI 教育平台,如百度的“文心智能体平台”、Coze 智能体平台等。 3. 学习 AI 基础知识: 了解 AI 的基本概念、发展历程、主要技术如机器学习、深度学习等。 学习 AI 在教育、医疗、金融等领域的应用案例。 4. 参与 AI 相关的实践项目: 参加学校或社区组织的 AI 编程竞赛、创意设计大赛等活动。 尝试利用 AI 技术解决生活中的实际问题,培养动手能力。 5. 关注 AI 发展的前沿动态: 关注 AI 领域的权威媒体和学者,了解 AI 技术的最新进展。 思考 AI 技术对未来社会的影响,培养对 AI 的思考和判断能力。 记住,学习 AI 是一个长期的过程,需要耐心和持续的努力。不要害怕犯错,每个挑战都是成长的机会。随着时间的推移,您将逐渐建立起自己的 AI 知识体系,并能够在这一领域取得成就。完整的学习路径建议参考「通往 AGI 之路」的布鲁姆分类法,设计自己的学习路径。
2024-12-22
AI英文全称
AI 的英文全称是 Artificial Intelligence,意思是人工智能。它是指让计算机或机器能像人类一样思考和学习的技术。在不同的应用场景中,AI 有着丰富的表现形式,比如聊天机器人、推理者、智能体、创新者和组织等。同时,在 AI 领域还有众多的术语,如 BlackBox Attack(黑盒攻击)、Bonding Environments(成键环境)、Bonferroni Correction(邦弗朗尼校正)等。
2024-12-22
ai音乐创作管线
AI 音乐创作管线包括以下几个方面: 1. ByteComposer:由字节跳动人工智能实验室开发,利用大型语言模型(LLM),通过概念分析、草稿创作、自我评估与修改、审美选择四个关键步骤生成旋律。其核心模块包括专家模块、生成器模块、投票器模块以及记忆模块,通过精心设计的提示激发 LLM 的音乐理论知识,并通过交叉验证优化提示设计。在实验中证明了其在音乐创作方面的有效性,达到了初级作曲家的水平,为用户提供了直观、可控且富有创造性的音乐创作平台。 2. 《We Are The One》的融合工作流:呼应了 AI 技术在音乐创作中不可或缺的愿景,核心是介绍使用 AI 音乐平台 UDIO.com 进行音乐创作的技术分享,以歌曲《We Are the One》的制作过程为例,展示如何结合 AI 与传统音频处理手段,打造以 AI 为主导的音乐制作工作流。 3. 自定义前奏的工作流:Suno 和 Udio 推出上传音频文件生成音乐的功能,可精确控制速度、旋律、配器、合成等。节省的点数可用于多 Roll 与流派、心情、场景相关的曲子并存好旋律素材,也可用于 roll 更多细节调整部分以提升作品品质。通过简单例子演示工作流。
2024-12-22
AI客服用哪个智能体
智能体(Agent)在人工智能和计算机科学领域是一个重要概念,指能够感知环境并采取行动以实现特定目标的实体,可以是软件程序或硬件设备。 在 LLM 支持的自主 Agent 系统中,LLM 充当 Agents 的大脑,并具有以下关键组成部分: 1. 规划:将大型任务分解为更小、可管理的子目标,以有效处理复杂任务。 2. 反思和完善:对过去的行为进行自我批评和反思,从错误中吸取教训,完善未来步骤,提高最终结果质量。 3. 记忆:包括短期记忆(所有的上下文学习利用模型的短期记忆来学习)和长期记忆(通过外部向量存储和快速检索实现长时间保留和回忆无限信息的能力)。 4. 工具使用:学习调用外部 API 来获取模型权重中缺失的额外信息,包括当前信息、代码执行能力、对专有信息源的访问等。 AI Agent 有效使用工具的前提是全面了解工具的应用场景和调用方法。利用 LLM 强大的 zeroshot learning 和 fewshot learning 能力,AI Agent 可以通过描述工具功能和参数的 zeroshot demonstration 或提供特定工具使用场景和相应方法演示的少量提示来获取工具知识。 AI Agent 学习使用工具的方法主要包括从 demonstration 中学习和从 reward 中学习。环境反馈包括行动是否成功完成任务的结果反馈和捕捉行动引起的环境状态变化的中间反馈;人类反馈包括显性评价和隐性行为,如点击链接。 在追求人工通用智能(AGI)的征途中,具身 Agent(Embodied Agent)正成为核心的研究范式,强调将智能系统与物理世界紧密结合。与传统的深度学习模型相比,LLMbased Agent 不再局限于处理纯文本信息或调用特定工具执行任务,而是能够主动地感知和理解其所在的物理环境,进而与其互动,并利用内部丰富的知识库进行决策和产生具体行动来改变环境。 然而,关于 AI 客服适合使用哪个智能体,需要根据具体的需求和场景来确定。例如,如果需要处理大量复杂的任务分解和协调,可能需要具备强大规划和推理能力的智能体;如果需要与用户进行频繁的互动和反馈,可能需要对环境感知和理解能力较强的智能体。
2024-12-22
ai怎样精准搜索
AI 精准搜索可以通过以下几个关键步骤来实现: 1. 意图识别:对用户提问进行分类,如导航类、信息查询类、交易类、本地信息类等,还包括多级子分类。通过分类匹配更准的信息源和更好的回复提示词,很大程度提升检索召回率。目前主流的实现方案主要是通过提示词请求大模型完成,但准确度不够高,大模型的 Function Calling 能力也可理解为一种意图识别。 2. 问题改写(Query Rewrite):在完成意图识别并确认需要联网检索后,对用户的 query 进行改写,目的是得到更高的检索召回率。主要包括三个维度的改写,即让提问有更精准/更专业的表达、补全上下文做指代消解、名词提取。改写可以通过设置提示词请求大模型完成。 3. 多信息源聚合(Multi Source):提升 AI 搜索准确度的另一个关键措施是做多信息源整合。结合意图识别和问题改写,假设用户搜索特定问题,可根据意图判断是否联网及搜索类型,提取概念名词,除常见检索外,还可检索其他信息源获取更多内容。多信息源的整合可能涉及海量数据处理和自建信息源索引等技术,传统搜索厂商和依靠 UGC 建立数据飞轮的超级 App 在这方面有优势。 4. 搜索结果重排(Reranking):AI 搜索做多信息源整合时,需要对检索结果重排。重排目的主要是过滤不相关参考信息和对相关性进行排序,便于截取权重最高的 top_k 条记录作为引用参考。重排方案有使用 zilliz 向量数据库+llamaindex 框架做相似度匹配和使用 FlashRank 开源框架,但前者效率低,后者准确度不够高。 5. 搜索内容读取(Read Content)
2024-12-22
可灵ai官网教学
以下是关于可灵 AI 的相关信息: 可灵是一款由快手团队开发的 AI 应用,主要用于生成高质量的图像和视频。 其特点包括: 1. 生成的图像质量非常高。 2. 最初采用内测邀请制,现在已向所有用户开放使用。 费用方面: 1. 价格相对较高,重度用户的最高档年费可能达到几千元人民币,平均每月使用成本在 400 到 600 元人民币之间。 2. 对于临时使用或轻度使用的用户,有每日免费点数和 60 多元单月的最便宜包月选项。 您可以通过以下方式获取更多关于可灵 AI 的教学内容: 1. 可灵的官网帮助中心。 2. 相关的视频教程,如“【90 分钟视频教程】全网最详细的 Coze AI 应用教学”。
2024-12-21
AI方面有什么最新进展
以下是 AI 方面的一些最新进展: 1. 2024 人工智能现状报告:由剑桥大学和 AI 风险投资公司 Air Street Capital 的相关人员共同发表,围绕人工智能领域的最新进展、政治动态、安全挑战及未来预测几大方面进行说明。 2. AI 绘画:从生成艺术作品到辅助艺术创作,逐渐改变传统艺术面貌。技术进步使创作质量和速度取得突破,为艺术家提供新工具和可能性,但也引发了关于艺术本质、创造性、版权和伦理的讨论,带来对从业者职业安全的焦虑和“侵权”嫌疑的反对之声。 3. 技术历史和发展方向: 发展历程:包括早期阶段的专家系统、博弈论、机器学习初步理论;知识驱动时期的专家系统、知识表示、自动推理;统计学习时期的机器学习算法;深度学习时期的深度神经网络等。 前沿技术点:大模型(如 GPT、PaLM 等)、多模态 AI(视觉语言模型、多模态融合)、自监督学习、小样本学习、可解释 AI、机器人学、量子 AI、AI 芯片和硬件加速。
2024-12-05
人工智能与AI诈骗最新进展
以下是关于人工智能与 AI 诈骗的最新进展: 在 2024 年,AI 领域有诸多进展。在图像和视频方面,超短视频的精细操控,如表情、细致动作、视频文字匹配等有所发展,有一定操控能力的生成式短视频中,风格化、动漫风最先成熟,真人稍晚。AI 音频能力长足进展,带感情的 AI 配音基本成熟。“全真 AI 颜值网红”出现,可稳定输出视频并直播带货。游戏 AI NPC 有里程碑式进展,出现新的游戏生产方式。AI 男/女朋友聊天基本成熟,在记忆上有明显突破,能较好模拟人的感情,产品加入视频音频,粘性提升并开始出圈。实时生成的内容开始在社交媒体内容、广告中出现。AI Agent 有明确进展,办公场景“AI 助手”开始有良好使用体验。AI 的商业模式开始有明确用例,如数据合成、工程平台、模型安全等。可穿戴全天候 AI 硬件层出不穷,虽然大多数不会成功。中国 AI 有望达到或超过 GPT4 水平,美国可能出现 GPT5,世界上开始出现“主权 AI”。华为昇腾生态开始形成,国内推理芯片开始国产替代(训练替代稍晚)。然而,AI 造成的 DeepFake、诈骗、网络攻击等开始进入公众视野,并引发担忧,AI 立法、伦理讨论仍大规模落后于技术进展。 在 3 月底的 23 个最新 AI 产品中,有室内装修自动渲染的 HomeByte,生成效果超赞的新视觉模型 Playground v1,“图生文”反向工具 Clip Interrogator 以及致力于解决电话诈骗的 GPTCHA 等。 在技术应用方面,LLMs 能自动化写代码等流程,交通应用如 Google Maps 和 CityMapper 也使用了 AI。AI 在银行业的欺诈检测、信用管理和文件处理等方面发挥作用。同时,AI 还在药物研发、解决气候危机等领域有重要应用。 总之,AI 技术在不断发展的同时,也带来了如诈骗等问题,需要关注和解决。
2024-12-02
AI加教育的最新进展
以下是 AI 加教育的最新进展: 案例方面: “AI 赋能教师全场景”,来自 MQ 老师的投稿贡献。 “未来教育的裂缝:如果教育跟不上 AI”,揭示了人工智能在教育领域从理论走向实际应用带来的颠覆性改变。 “化学:使用大型语言模型进行自主化学研究”。 “翻译:怎么把一份英文 PDF 完整地翻译成中文?”,介绍了 8 种方法。 对未来的预判: 个性化学习时代已到来,AI 将作为教育生态系统的一部分与人类教师协作,为孩子提供不同的学习体验,如混合式教学、定制学习路径等。 教育工作者将成为学习的引导者和伙伴,更多关注孩子的全人发展,如创造力和社交智慧。 未来 3 年,提升人机协作效率的领域,如 AI 作业批改、备课、定制教育规划、学前启蒙等,对教育从业者蕴藏着巨大机遇。 探索实践: 过去半年多,梳理教学和育儿工作流,每个环节与 AI 协作可大幅提升效率,但也加剧了知识获取的不平等。从家长的“育”、老师的“教”和学生的“学”进行了落地实践的拆解。
2024-11-05
Ai最新进展
AI 技术的发展历程如下: 1. 早期阶段(1950s 1960s):包括专家系统、博弈论、机器学习初步理论。 2. 知识驱动时期(1970s 1980s):有专家系统、知识表示、自动推理。 3. 统计学习时期(1990s 2000s):出现了机器学习算法,如决策树、支持向量机、贝叶斯方法等。 4. 深度学习时期(2010s 至今):深度神经网络、卷积神经网络、循环神经网络等得到广泛应用。 当前 AI 的前沿技术点包括: 1. 大模型,如 GPT、PaLM 等。 2. 多模态 AI,例如视觉 语言模型(CLIP、Stable Diffusion)、多模态融合。 3. 自监督学习,包含自监督预训练、对比学习、掩码语言模型等。 4. 小样本学习,如元学习、一次学习、提示学习等。 5. 可解释 AI,涉及模型可解释性、因果推理、符号推理等。 6. 机器人学,包括强化学习、运动规划、人机交互等。 7. 量子 AI,有量子机器学习、量子神经网络等。 8. AI 芯片和硬件加速。 此外,绿洲资本张津剑认为 AI 技术正在加速发展,并且没有看到任何减缓的迹象。尽管媒体报道可能有所减少,但 AI 的实际进展非常迅速。
2024-09-03
LLM写ABAP代码的最新进展
大型语言模型(LLM)在编写ABAP代码方面的能力正在不断提升。ABAP(高级业务应用编程)是SAP系统的编程语言,专门用于开发企业资源规划(ERP)软件。以下是一些LLM编写ABAP代码的最新进展: 1. 代码生成:LLM可以基于自然语言描述生成ABAP代码片段,帮助开发者快速实现特定功能。 2. 代码补全:通过机器学习技术,LLM能够预测并补全ABAP代码,提高开发效率。 3. 代码审查:LLM可以分析ABAP代码,识别潜在的错误和不规范的编程实践。 4. 文档生成:LLM能够根据ABAP代码自动生成文档,包括函数描述、参数说明等。 5. 模式识别:LLM可以识别ABAP编程中的常见模式和最佳实践,并在代码生成时应用这些模式。 6. 交互式学习:一些LLM提供交互式学习环境,帮助开发者通过实例学习ABAP编程。 7. 集成开发环境(IDE)插件:LLM技术被集成到ABAP开发工具中,提供智能代码提示和错误检测。 8. 自动化测试:LLM可以生成测试用例,帮助自动化ABAP代码的测试过程。 9. 性能优化:LLM可以分析ABAP代码的性能瓶颈,并提出优化建议。 10. 跨语言能力:一些LLM能够理解多种编程语言的概念,并将其应用于ABAP代码的编写。 然而,尽管LLM在编写ABAP代码方面取得了进展,但它们仍然面临一些挑战,例如: 领域特定知识:ABAP是一种领域特定的语言,需要对SAP系统有深入的理解。 复杂逻辑处理:企业级应用的逻辑可能非常复杂,LLM需要能够处理这些复杂性。 代码维护性:自动生成的代码需要易于理解和维护。 随着技术的发展,LLM在ABAP编程领域的应用将越来越广泛,但它们可能仍然需要与人类开发者合作,以确保生成的代码既高效又可靠。
2024-08-05
GPT4最新进展
GPT4是OpenAI开发的大型多模态语言模型,它能够接受图像和文本输入,并产生文本输出。以下是GPT4的一些最新进展: 1. GPT4 Turbo的发布:OpenAI推出了GPT4 Turbo的预览版,这是一个更强大的模型,它了解截至2023年4月的世界事件。GPT4 Turbo具有128K的上下文窗口,可以处理相当于300多页文本的输入。相比于GPT4,GPT4 Turbo在性能上进行了优化,提供了更低的价格,输入token价格降低了3倍,输出token价格降低了2倍。 2. 功能和性能提升:GPT4 Turbo支持多模态API调用,包括视觉功能和DALL·E 3 API。它还在指令跟随和JSON模式方面进行了改进,提供了更高的准确性和更有效的JSON格式输出。 3. 可重复输出和对数概率:GPT4 Turbo引入了新的seed参数,允许模型返回大部分时间一致的完成,这对于调试请求和编写单元测试非常有用。OpenAI还计划推出一个功能,返回最可能输出的令牌的对数概率,这将对构建搜索体验中的自动完成等功能非常有用。 4. GPT3.5 Turbo更新:除了GPT4 Turbo之外,OpenAI还发布了GPT3.5 Turbo的新版本,支持16K的上下文窗口,并改进了指令跟随、JSON模式和并行函数调用。 5. 助手API和新模态:OpenAI发布了助手API,允许开发者在自己的应用程序中构建Agent类体验。GPT4 Turbo可以通过Chat Completions API接受图像输入,实现生成标题、详细分析现实世界的图像以及阅读带有图表的文档等功能。 6. 技术报告:OpenAI发布了GPT4的技术报告,详细介绍了模型的开发、性能、能力和局限性。GPT4在多项专业和学术基准测试中展现出人类水平的表现,包括通过模拟律师资格考试并在SAT考试中取得高分。 7. 安全性和可靠性:尽管GPT4在性能上取得了显著进步,但它仍然存在一些局限性,例如可能产生不准确的信息(俗称“幻觉”)和有限的上下文窗口。OpenAI在模型开发过程中注重安全性,以减少潜在的风险。 8. 企业级服务:Azure OpenAI服务发布了企业级可用的GPT4国际预览版,允许企业构建自己的应用程序,并利用生成式AI技术提高效率。 9. 价格降低和速率限制提高:OpenAI降低了API价格,以将节省的费用传递给开发者,并提高了每分钟的令牌限制,以帮助开发者扩展应用程序。 10. 版权保护:OpenAI推出了版权保护措施,如果客户面临版权侵权的法律索赔,OpenAI将介入保护客户并支付相关费用。 这些进展显示了GPT4在多模态能力、性能优化、安全性和企业级应用方面的持续发展和创新。随着GPT4的不断改进和新功能的推出,它在自然语言处理领域的应用潜力将进一步扩大。
2024-04-22