清华大学自然语言处理实验室、中国人民大学、面壁智能与 openbmb 社区联合发布业内首个 4b 参数规模的端侧智能体模型——agentcpm-explore。该模型在 gaia、hle、browsercomp 等 8 项主流长程智能体基准测试中实现全面领先,不仅刷新同参数量级模型的性能纪录(sota),更展现出超越 8b 模型的推理能力,部分指标甚至接近某些 30b+ 大模型表现。模型支持超 100 轮连贯、稳定、有逻辑的多步交互,具备质疑精神、实证意识、灵活应变与目标导向等类人探索特质。

AgentCPM-Explore 核心优势概览
- 突破参数限制:业界首个在 GAIA、Xbench、BrowserComp 等 8 个高难度长程智能体任务上均达成优异表现的 4B 端侧模型,重塑轻量化智能体的能力边界;
- 持久深度探索:可稳定执行逾 100 轮无重复、高一致性环境交互,持续推进复杂任务直至精准闭环;
- 全栈开源支持:除模型本身外,同步开放工具调度平台 AgentDock、全异步强化学习训练框架 AgentRL、以及一体化智能体评测系统 AgentToLeaP,实现从训练、部署到评估的完整链路开源,助力社区高效复现与自主迭代。

本次开源涵盖模型权重、强化学习训练代码、标准化评测套件及工具集成平台。
Github:https://www.php.cn/link/bff5992111ba4c548364f2a68998634b
HuggingFace:https://www.php.cn/link/232f983bd0b0c382d0844f118072f725
ModelScope:https://www.php.cn/link/21b1a8129e987682b9ee28f6eaf36a0f
魔乐社区:https://www.php.cn/link/5a628fa66251ccace84659b5a1128f97
源码地址:点击下载









