AI 或者智能体是可以部署在个人 NAS 上的。端侧大模型能部署在手机端等设备,参数量小,可利用自带芯片或处理器运算,主要通过压缩来解决存储和性能问题,如减少模型参数量和计算复杂度。此外,像 coach 等 AI 工程平台新版本有很多模板,可创建智能体,还能通过工作流节点调用和 prompt 构建提示词,调用插件、图像流、知识库等。OpenAI 会陆续更新 ChatGPT 应用,让其具备 Assistant Agent 能力,Google 也计划推出类似功能。智能体除了端到端的多模态和实时性特点外,还能让终端参与分担一部分模型的计算量。在这种趋势下,能设计新硬件产品或重新设计现有产品,如让 Google Glass 复活,改变手机的设计和交互方式等。
[heading2]总结AI技术的发展与应用流式训练方式提升训练速度和质量:将孔明灯换成泡泡,通过流式训练方式提高了整体训练的过程速度和质量,基于Transformer模型进行流匹配,这种方式优于扩大模型。多种AI生成工具:如输入简单提示词就能创作音乐的so no音频生成工具,能创建个人AI智能体的豆包,输入文本可生成播客的Notebook LN。端侧大模型的特点:端侧大模型能部署在手机端等设备,参数量小,可利用手机自带芯片或处理器运算,主要通过压缩来解决存储和性能问题,如减少模型参数量和计算复杂度,知识蒸馏模型有教师模型和学生模型。AI工程平台:AI工程平台对模型和应用有要求,像define是典型的工程平台,涉及数据清洗管道、数据存储和检索、编辑生成平台、构建prompt技巧、智能体概念、插件调用、运维平台、模型层和缓存机制等,还能接入多家大模型。AI工程平台coach的应用:coach平台新版本有很多模板,如名画照相馆,有众多插件工具,包括必应搜索、链接读取、代码执行器等,还有工作流,可创建应用APP。AI相关工具与平台的介绍及应用coach平台的使用:介绍了coach平台的新手教程和文档,可创建智能体,通过工作流节点调用和prompt构建提示词,还能调用插件、图像流、知识库等,商城中有各种智能体和插件模板,知识库可添加多种格式内容。模型社区介绍:提到魔搭社区等几个为大模型提供数据、企业模型和算力服务的平台,有按任务划分的模型库、数据集和在线应用供体验。AI建站预告:为后续AI建站做预告,需要在今明两天安装vs code等基础软件,以简单步骤帮助文科生和无基础人员完成建站,获得正反馈。
很明显OpenAI是有计划的抢先发布,因为Google在第二天的I/O 2024大会上准备宣布他们最新的研究项目Project Astra,一个类似GPT-4o全模态模型,结果研究团队拿手机精心录制的与环境实时交互的视频,让OpenAI给提前一天全部展示了,而且功能更强大,完成度更高。OpenAI会在几个月内陆续更新ChatGPT应用,通过GPT-4o让其具备Assistant Agent能力,一个能够像人类一样互动的“数字形态”全能助理;Google也计划在今年内推出Gemini Live支持类似功能,我们可以把这种能沟通还能感知环境的AI称之为智能体(Intelligent Agent)。除了端到端的多模态之外,另一个重要的特点就是实时性,之前所有的交互都是回合对话式,包括API的调用;现在我们要从文字语音聊天升级到视频直播了,智能体保持一直在线。可以想像,用流媒体的形式来消耗Token,这对算力的开销得有多大,所以大家必须保持模型能力不变的情况下缩小参数规模,升级架构来提升性能;最好让终端也参与进来分担一部分模型的计算量。让科技变简单,是技术民主化最重要的一个趋势,没有人能抵挡住这种毫无机械感、完全类人化的交互方式。用这样的思路,可以设计从未有过的硬件产品,也能重新设计现有的产品,例如多年以前的Google Glass就可以因此而复活了;因为语音交互的流畅,智能体还能用手机之外的设备来实现视觉感知,那么手机的设计也会因此而进化,触摸交互更简单,在很多情况下,都只需要放在口袋里,给你的智能体提供本地算力。