以下是关于智能座舱的相关信息:
火山引擎 AI 创造者大赛设置了“AI 座舱”赛道。该大赛由火山引擎携手领克汽车与英特尔联合主办,鼓励开发者及技术爱好者利用豆包大模型和扣子专业版,针对领克汽车的真实业务场景开发具有实际应用价值的智能体解决方案。
在“AI 座舱”赛道中,赛题说明为利用豆包大模型、扣子专业版以及吉利原子化能力,探索 AI 在智能座舱中的多样化应用,通过智能座舱内的智能体开发,满足车主定制化的需求。核心目标是通过扣子专业版的插件调用吉利座舱原子化能力自建车载智能体,利用豆包大模型提升智能体的交互能力和智能水平,开发的解决方案应具备实际应用价值,并能够显著提升用户体验。
2023 年度中文大模型基准测评报告显示,在智能座舱与交互这一维度上,仅有一个中文模型达到了良好表现,说明中文大模型在智能座舱与交互还有不少的进步空间。在汽车场景中,部分中小模型在满足用户需求方面具备良好能力,端侧模型有非常大的潜力。
大赛介绍火山引擎AI创造者大赛是火山引擎首次举办的AI智能体商业赛事,本次大赛由火山引擎携手领克汽车与英特尔联合主办,鼓励开发者及技术爱好者利用豆包大模型和扣子专业版,针对领克汽车的真实业务场景,开发出具有实际应用价值的智能体解决方案,本次大赛共设置3大赛道:「AI座舱」、「AI营销」和「AI售后」。领克汽车介绍领克是由吉利控股集团、吉利汽车集团与沃尔沃汽车合资成立的中国品牌,定位为“全球新能源高端品牌”。“领”寓意领先、引领;“克”寓意改变、突破。领克秉持着“挑战惯例”的精神持续推动品牌发展。依托SPA大型车电气化模块架构、SEA原生智能纯电架构、CMA中型车电气化模块架构、CMA Evo原生新能源架构、BMA Evo架构,打造了多款“高颜值、高性能、高科技、高安全、高价值”的产品,实现SUV+轿车,覆盖燃油及新能源赛道的超强产品矩阵。英特尔介绍英特尔创始于1968年,是半导体行业和计算创新领域的全球领先厂商,创造改变世界的科技,推动全球进步并让生活丰富多彩。英特尔®至强®可扩展平台,全面服务数据计算,存储和传输,持续加速人工智能,大数据分析,高性能计算等应用,第五代英特尔®至强®处理器专为AI设计,每个内核均配备AI加速功能,为扣子平台提供底层技术支持。可以随时处理要求严苛的AI工作负载,为AI、数据库、网络、存储和高性能计算(HPC)带来非凡的性能并降低总拥有成本(TCO)。赛道说明
赛道说明|汽车品牌_赛题类别|领克汽车_AI座舱赛道|领克汽车_AI营销赛道|领克汽车_AI售后赛道||-|-|-|-||赛题说明|利用豆包大模型、扣子专业版以及吉利原子化能力,探索AI在智能座舱中的多样化应用,通过智能座舱内的智能体开发,满足车主定制化的需求。|利用豆包大模型和扣子专业版,开发出能高效投放广告、精准用户画像、提升销售能力、优化线索转化智能体方案,助力汽车行业实现高效营销。|利用豆包大模型和扣子专业版,提供创新且实际可行的智能体应用,提升汽车售后服务效率与用户体验,优化汽车售后服务体系,助力汽车行业智能化升级。||核心目标|通过扣子专业版的插件调用吉利座舱原子化能力自建车载智能体。<br>利用豆包大模型提升智能体的交互能力和智能水平。<br>开发的解决方案应具备实际应用价值,并能够显著提升用户体验。|智能体应能够在广告投放、用户画像、销售转化等方面提供创新解决方案。<br>通过创新营销玩法提高用户参与度,增强用户对品牌的认知和忠诚度,并有效收集意向人群线索。<br>需考虑公域和私域(如KOC、官方)的营销渠道,以及智能创作工具的应用。|智能体应能够在维修技术、门店服务、备件供应链等方面提供解决方案。<br>需考虑如何标准化维修技术方案,提升技师的工作效率。|AI座舱赛道-吉利模拟座舱原子化能力
部分大模型在技术和应用不同维度表现稍显不一致。车辆使用指南这一维度上,多个模型达到了80分以上的优异表现,说明在一些对用户有用的任务上(如操作指南、车辆故障诊断、维修保养)已经具备较高的交互成熟度。在智能座舱与交互这一维度上,仅有一个中文模型达到了良好表现,说明中文大模型在智能座舱与交互还有不少的进步空间。在汽车场景中,有一些13-14B中小模型也超过了云端的闭源模型,说明可满足用户需求具备良好能力的端侧模型有非常大的潜力。专项基准:SuperCLUE-Agent中文智能体测评基准基准说明AI Agent智能体正在最大程度释放了LLM潜能,逐渐成为了通向AGI的技术共识。AI Agent是一个能够自主理解、规划决策和执行复杂任务的智能体。现有关于Agent能力的测评,主要是在英文场景或任务的测评。目前还没有一个在中文任务和场景上针对中文大模型的全面测评。国内外代表性模型SuperCLUE-Agent十大能力上的表现SuperCLUE-Agent是一个聚焦于Agent能力的多维度基准测试,包括3大核心能力、10大基础任务,可以用于评估大语言模型在核心Agent能力上的表现,包括工具使用、任务规划和长短期记忆能力。测评结果我们选取了国内外有代表性的16个闭源/开源的模型进行测评。通过测评结果发现,在Agent核心基础能力上,国内模型已经较为接近或部分超过GPT3.5水平。