阿里巴巴未来生活实验室与智能引擎及数据技术团队携手,正式推出智能体模型ROME-V0.1(ROME is Obviously an Agentic ModEl)。

在多项主流Agent基准评测中,IFLow-CLI集成ROME-V0.1后,于同规模开源模型范畴内表现出色,部分指标已逼近参数量超过100B的大模型——例如,在Terminal-Bench 2.0上达成了24.72%的任务成功率,并在SWE-bench Verified上实现了57.40%的任务完成率。

ROME-V0.1是一款面向真实执行场景深度打磨的智能体模型,它并非针对单一评测目标进行针对性调优,而是依托于大规模真实环境交互数据、端到端执行闭环训练机制,以及专为长程复杂任务设计的强化学习范式构建而成。依托自研的智能体学习基础设施——ALE(Agentic Learning Ecosystem),ROME-V0.1已在超百万条可验证、高质量交互轨迹上完成了充分训练。
详情请参阅:官方网站及技术报告
源码获取地址:模型仓库页面
