在多智能体(Multi-Agent)系统中,常见的调度模式主要有以下几种:
在惊人算力成本背后,对于 AI 混战下基础设施的选择,需要注意以下方面:AI 任务的调度可能造成巨大的性能瓶颈或改进。以一种最小化权重交换的方式将模型分配给 GPU,如果有多个 GPU 可用,选择最适合任务的 GPU,以及通过提前批量处理工作负载来最小化停机时间,都是常用的技术。总之,模型优化仍然有点像黑魔法,大多数创业公司都与第三方合作来处理一些软件方面的问题。通常,这些不是传统的 MLops 供应商,而是专门针对特定生成模型进行优化的公司(例如 OctoML 或 SegMind)。
在多智能体(Multi-Agent)系统中,常见的调度模式主要有以下几种:1.集中式调度(Centralized Scheduling)在这种模式下,有一个中央控制器负责收集所有智能体的信息,并做出整体最优的决策和资源分配。常见于需要全局协调的场景,如机器人协作、交通管制等。1.分布式调度(Distributed Scheduling)每个智能体根据本地信息和与其他智能体的交互来做出决策,无需中央控制器。常用于大规模、动态、开放的系统,如传感器网络、P2P网络等。1.市场驱动调度(Market-Driven Scheduling)智能体通过竞价机制获取资源和任务分配。类似于现实市场的供需规律,常用于电力负载调度、计算资源分配等领域。1.约束优化调度(Constraint Optimization Scheduling)将多智能体协作问题建模为分布式约束优化问题,通过启发式或完全算法求解近似最优解。适用于任务分配、资源规划等约束严格的场景。1.组织结构调度(Organizational Structuring)根据特定的组织拓扑结构(层级、同辈、联盟等)对智能体角色和协作模式进行规范,实现有序调度。常见于多机器人协作、组织自动化系统中。1.基于规范协议的调度(Norm-based Scheduling)
最后,也是最重要的,AI任务的调度可以造成巨大的性能瓶颈或改进。以一种最小化权重交换的方式将模型分配给GPU,如果有多个GPU可用,选择最适合任务的GPU,以及通过提前批量处理工作负载来最小化停机时间,都是常用的技术。总之,模型优化仍然有点像黑魔法,我们交流过的大多数创业公司都与第三方合作来处理一些软件方面的问题。通常,这些不是传统的MLops供应商,而是专门针对特定生成模型进行优化的公司(例如OctoML或SegMind)。