12月1日,字节跳动豆包团队正式发布了手机助手技术预览版。
据介绍,这款手机助手在豆包APP基础上,与手机厂商在操作系统层面深度整合的AI助手软件。它依托豆包大模型的技术实力,并结合手机厂商的系统授权,旨在为用户创造更便捷的交互方式和更丰富的使用体验。
豆包大模型能力全面,在推理、视觉理解、图像创作、视频生成和语音等多个维度已达到国际一流水平。尤其在图形界面操作方面,其表现已在多项权威测评中获得业内最佳成绩,能够像人类一样灵活操控手机,轻松完成各类复杂任务。
在手机助手的落地路径上,豆包团队明确表示目前没有自研手机的计划,正积极与多家手机厂商洽谈合作,计划以“生态合作”模式,将豆包手机助手整合至不同品牌机型中。具体进展将在后续适时公布。
当前阶段,开发者和科技爱好者可在豆包与中兴合作的工程样机 nubia M153 上,抢先体验手机助手技术预览版。目前该版本已面向开发者和科技爱好者限量发售,售价为3499元。

从豆包手机助手技术预览版的演示视频中可以看到,AI助手通过与手机厂商的深度系统整合,实现了灵活的操控能力与大模型功能的便捷调用,成为一大亮点。
视频显示,用户可通过语音、侧边键或豆包 Ola Friend 耳机直接唤醒豆包,实现更顺畅的语音交互。在使用手机任何界面时,用户都能直接针对屏幕内容向助手提问,获取更多相关信息。同时,助手也将语音通话、视频通话和屏幕共享等豆包常用功能深度整合其中,用户双击侧边AI键即可快速调用。
在多模态交互方面,豆包手机助手打通了系统原生相册,用户可直接在相册内通过语音对图片下达修图指令,例如轻松移除不想要的人物、清除画面中的杂物等。

尤其值得注意的是豆包手机助手的AI操控手机功能。据介绍,该功能可根据用户指令,在多个应用间自动跳转,帮助用户完成查票订票、商品下单、批量下载文件、多软件物流进度一键查询等任务。
以演示视频中的跨平台比价下单场景为例,当用户在社交媒体上看到心仪的商品,只需说出“帮我在全平台比价下单”,豆包手机助手即可自动在多个电商平台搜索同款商品,对比价格和规格后,在领券后自动选择最低价的商品完成下单。不过,在涉及支付等高敏感环节时,助手会提示用户手动完成,以降低误操作和安全风险。在AI操作过程中,用户仍可正常使用手机。
为提升个性化体验,豆包手机助手提供了记忆功能,支持用户按需开启,并严格保护用户数据隐私与安全。
基于记忆功能,豆包手机助手上线了操作手机Pro模式。该模式除了调用GUI Agent(模拟点击)外,还可直接调用系统工具,结合记忆数据与更强大的推理能力,更高效地帮助用户完成复杂任务。最新视频举例称,在操作手机Pro模式下,当用户说“帮我给女儿推荐几个礼物放进购物车”时,若记忆中已储存女儿的年龄、兴趣等信息,助手可直接查询符合女儿年龄和偏好的方案,无需用户逐一交代细节。

不过,豆包手机助手也在最新视频的结尾特别提示,尽管演示内容均为真实录制,但受限于大模型技术的不确定性,相关场景无法保证百分百复现。当前产品实际可用性与团队预期仍有差距,未来将持续迭代优化。
有行业分析指出,大模型行业近年来发展迅速,当前手机AI助手领域正呈现“手机厂商+大模型厂商”深度融合的清晰趋势。例如谷歌Gemini与三星的合作探索,已为行业提供了跨界协同的参考样本。
