volcano 社区正式发布全新子项目 agentcube——一个基于 volcano 构建的高性能 ai agent 编排平台。它通过深度扩展 kubernetes api,将 agent 实例与各类工具(如代码解释器、浏览器操作模块等)抽象为集群中的一等资源。“这不仅是一组 crd,更是一个专为 agent 设计的 serverless 操作系统。”
AgentCube 定义了两类关键 CRD,用于描述不同场景下的 Agent 工作负载:
1. AgentRuntime: 专为长周期、多轮交互式对话 Agent 设计。
- 支持配置会话生命周期策略、资源限制(CPU / 内存配额)以及状态持久化机制。
2. CodeInterpreter: 面向短时、高频、单次执行类任务的代码运行环境。
- 倡导“即用即弃”理念,具备强安全隔离能力,原生兼容 MicroVM 运行时(如 Kuasar、Kata Containers、Firecracker)。
未来,AgentCube 还将持续拓展对 BrowserUse、ComputerUse、MobileUse 等多样化工作负载的抽象支持。
AgentCube 核心技术特性
1. 超低延迟启动
为彻底规避冷启动瓶颈,AgentCube 引入 Warm Pool(预热池)机制。系统预先拉起并挂起一批已加载基础运行环境的 MicroVM 沙箱。当新 Agent 请求抵达时,AgentCube 采用 “Claim-and-Go” 模式,在毫秒级内完成沙箱分配与唤醒,提供接近零感知的启动体验。
2. 高效智能调度
依托 Volcano 自研的 Agent Scheduler,AgentCube 在调度吞吐量与时延方面实现显著突破。
- 高并发低延迟:针对 Agent 流量突发性强的特点,采用乐观并发控制与轻量化调度逻辑,大幅拉升每秒调度事务数(TPS)。
- 多负载协同调度:Volcano Agent Scheduler 可与现有 Batch Scheduler 无缝共存,在统一调度框架下兼顾 Agent 类任务与传统批处理作业,兼顾资源利用率与核心业务 SLA。
3. 内置会话感知路由与管理
AgentCube 以 Session ID 为核心标识,构建端到端的会话上下文保障体系。
- 智能请求分发:AgentCube Router 自动解析请求头中的
x-agentcube-session-id字段,并精准路由至对应活跃沙箱。 - 沙箱按需唤醒:若目标会话所绑定的沙箱当前处于休眠状态,Router 将自动触发其恢复运行。
- 会话级资源隔离:每个 Session 独占一个沙箱实例,在计算、内存及文件系统层面实现硬隔离,杜绝跨租户数据泄露风险。
4. Serverless 式弹性扩缩容
AgentCube 动态感知会话活跃度,自主调控沙箱生命周期。闲置沙箱将被自动回收或转入休眠状态,释放底层物理资源,交由更高优先级任务使用,真正达成资源按需供给与极致复用。
AgentCube 整体架构示意
AgentCube 采用标准的控制面与数据面分离架构,兼顾系统稳定性、可维护性与横向扩展能力:

- 数据面:由 AgentCube Router 承担。作为统一入口网关,负责身份校验、流量限速及基于 Session ID 的动态路由。对于新建会话,它向控制面发起资源申请;对于已有会话,则直接转发请求至对应 Sandbox(MicroVM)。
- 控制面:核心组件 Workload Manager 全权管理沙箱全生命周期。它持续监控 Warm Pool 容量水位,按需扩容 MicroVM 实例,并依据 TTL 等策略执行沙箱回收与清理。
- 调度层:集成 Volcano Agent Scheduler,借助异步并行调度与乐观锁机制,在高并发场景下实现毫秒级资源分配。
源码地址:点击下载











