阿里巴巴未来生活实验室联合智能引擎与数据技术团队,正式推出智能体模型rome-v0.1(rome is obviously an agentic model)。

在多个主流Agent基准评测中,IFLow-CLI 集成 ROME-V0.1 后,在同等规模开源模型中表现卓越,部分指标已逼近参数量超 100B 的大模型——例如,在 Terminal-Bench 2.0 上达成 24.72% 的任务成功率,在 SWE-bench Verified 上实现 57.40% 的任务完成率。

ROME-V0.1 是一款面向真实执行场景深度打磨的智能体模型,不以单一评测为目标进行针对性调优,而是依托大规模真实环境交互数据、端到端执行闭环训练机制,以及专为长程复杂任务设计的强化学习范式构建而成。依托自研的智能体学习基础设施——ALE(Agentic Learning Ecosystem),ROME-V0.1 已在超百万条可验证、高质量交互轨迹上完成充分训练。
详情请参阅:https://www.php.cn/link/a2a561ffc61849e2ba1ad94624ad4e0b
源码获取地址:点击下载










