游乐游手机版
首页/科技数码/文章详情

阶跃星辰开源GELab-Zero:4B模型一键部署,性能领先34%

时间:2025-11-30 22:33
人工智能领域迎来重要突破,阶跃星辰团队正式开源其最新研发的GELab-Zero项目,为移动端智能体开发提供全新解决方案。该项目包含4B参数的GUI Agent模型、完整的本地化推理基础设施以及面向真

人工智能领域迎来重大突破,阶跃星辰团队正式开源其最新研发的GELab-Zero项目,为移动端智能体开发提供全新解决方案。该项目集成包含40亿参数的GUI智能体模型、完整的本地化推理基础设施以及面向真实场景的评测标准,旨在降低消费级智能体的开发门槛,推动AI技术在终端设备上的规模化应用。

核心模型GELab-Zero-4B-preview在多项基准测试中表现优异:不仅在ScreenSpot、OSWorld等传统GUI评测中刷新同尺寸模型纪录,更在基于真实业务场景构建的AndroidDaily评估体系中取得73.4%的准确率。该模型突破性地实现在消费级硬件上流畅运行,其轻量化设计使40亿参数模型即可达到320亿参数模型的性能水平,同时保持更低的部署成本和更快的响应速度。

在技术架构层面,项目团队构建了完整的智能体开发工具链。开发者可通过统一部署流水线自动处理设备连接、权限配置等底层操作,系统支持多设备任务分发与交互轨迹记录。平台提供ReAct闭环保税推理、多智能体协作等四种工作模式,并配备可视化调试界面,让开发者能够专注于交互策略创新而非基础设施搭建。这种"开箱即用"的设计理念,使单个开发者即可在数小时内完成从模型部署到复杂任务验证的全流程。

针对移动生态碎片化难题,研究团队提出创新解决方案。通过动态环境适配技术,模型可自动识别不同品牌设备的界面布局差异,在华为、小米、OPPO等主流机型上实现跨平台兼容。在复杂任务处理方面,模型展现出强大的泛化能力:既能准确执行"购买300g红颜草莓和125g蓝莓"等精确指令,也能理解"找部成龙经典动作片"等模糊需求,通过自主拆解任务步骤、评估选项优先级完成操作。

AndroidDaily评测体系的建立标志着行业评估标准的重大革新。该体系覆盖饮食、出行、购物等六大生活场景,选取外卖、打车、社交等高频应用构建测试任务库。每个任务均包含真实用户交互流程,如支付环节需要模拟输入密码、高危操作要求人工确认等。这种设计使评测结果更贴近实际应用环境,为模型优化提供可靠依据。静态评测与端到端测试的双轨机制,既保证评估效率又兼顾执行稳定性,其中端到端测试任务成功率直接反映模型在真实场景中的综合能力。

开源项目包含完整的代码库、预训练模型和详细文档,支持通过GitHub和Hugging Face平台获取。技术文档详细说明模型训练方法、推理优化技巧和跨平台部署指南,并提供外卖采购、福利领取等典型场景的完整代码示例。这种开放共享模式将加速智能体技术在移动端的普及,预计将催生更多创新应用场景。

项目团队透露,后续开发将聚焦三个方向:提升模型在低算力设备上的运行效率,扩展车载系统、IoT设备等新平台支持,以及构建开发者生态社区。通过持续优化模型架构和工具链,团队致力于打造面向消费级市场的通用智能体解决方案,使AI技术真正融入日常生活服务。

来源:https://www.itbear.com.cn/html/2025-11/1034557.html
上一篇霸王茶姬2025年Q3营收32亿净利5亿,海外扩张与派息1.77亿驱动增长 下一篇三星T7 Shield新品预售:多容量可选,京东入手价999元起
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5