港科团队破解AI助手记忆难题:手机应用获突破

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
当你拿起手机,想让AI助手帮你完成一项复杂的任务时,比如先在淘宝和京东上比较AirPods Pro 2的价格,然后把便宜的那款加入购物车,最后把链接分享给微信好友,你会发现现在的AI助手往往力不从心。它们可能在前几步表现不错,但随着任务步骤的增加,就开始"健忘"了——明明刚才查到了两个平台的价格,转眼就忘记了哪个更便宜。
这种现象引起了一个由香港科技大学(广州)、香港科技大学、西安交通大学、香港城市大学、悉尼科技大学等多所知名院校组成的国际研究团队的关注。他们在2026年3月发表的最新研究中,深入分析了这个问题的根本原因,并提出了一种名为"锚定状态记忆"(Anchored State Memory,简称ASM)的解决方案。这项研究成果发表在计算机视觉领域的顶级会议上,论文编号为arXiv:2603.18429v1。
想象一下人类是如何完成复杂任务的。当我们要完成上述比价购物任务时,大脑会自动记住几个关键节点:淘宝上的价格是多少,京东上的价格是多少,哪个更便宜。这些"关键信息点"就像锚一样,稳定地固定在我们的记忆中,帮助我们在后续步骤中做出正确决策。然而,现有的AI系统在处理长任务时,要么试图记住所有细节(就像把整个图书馆都搬进大脑),要么只保留粗略的总结(就像只记住"我去过图书馆"),都无法准确保存和使用这些关键信息。
为了彻底研究这个问题,研究团队首先构建了一个名为"AndroTMem-Bench"的测试平台。这个平台就像一个专门设计的"考场",包含了1069个需要多步骤完成的手机操作任务,平均每个任务需要32.1步操作,最多的甚至达到65步。这些任务都有一个共同特点:后面的步骤必须依赖前面步骤获得的信息才能正确完成。比如,只有先在两个购物平台都查到价格,才能决定把哪个商品加入购物车。
通过在这个测试平台上评估12个不同的AI系统,研究团队发现了一个令人惊讶的规律:无论是开源还是闭源的AI模型,无论是谷歌的Gemini还是OpenAI的GPT系列,它们的表现都随着任务长度的增加而急剧下降。更重要的是,这种下降主要不是因为AI看不懂屏幕内容或不知道该点击哪个按钮,而是因为它们无法有效地记住和使用之前获得的重要信息。
这就好比一个人患了特殊的健忘症:他能清楚地看到眼前的景象,也知道下一步该做什么,但就是记不住几分钟前发生的关键事情。研究团队通过详细分析发现,现有AI系统在长任务中主要面临四种"记忆障碍":一是重要信息丢失,比如忘记了之前查到的价格;二是信息混乱,比如把淘宝的价格错误地关联到了京东的商品上;三是上下文漂移,比如忘记了当前正在进行什么任务;四是进度验证失败,比如不确定某个步骤是否已经成功完成。
基于这些发现,研究团队提出了"锚定状态记忆"这一创新解决方案。这种方法的核心思想是让AI系统像人类一样,只记住任务中的关键节点信息,而不是试图记住每一个细节。这些"锚点"包括六种类型:子目标完成(比如"已在淘宝查到价格"),状态转换(比如"进入了支付页面"),依赖关系(比如"这个价格将用于后续比较"),异常处理(比如"关闭了弹出广告"),上下文信息(比如"用户选择的联系人是Alice"),以及任务完成(比如"商品链接已发送")。
更巧妙的是,这套系统还会建立这些锚点之间的因果关系。就像在大脑中用看不见的线把相关记忆连接起来一样,当AI需要做决策时,它可以快速找到相关的历史信息,而不必翻遍整个"记忆库"。
实验结果令人鼓舞。在各种测试场景中,使用锚定状态记忆的AI系统比传统方法的成功率提高了5%到30%不等。特别是在那些需要跨应用协作的复杂任务中,改进效果更加明显。这就像给一个健忘的助手配备了一个智能笔记本,不仅记录关键信息,还能在需要时快速翻到正确的页面。
这项研究的意义远不止于技术改进。随着我们越来越依赖AI助手来处理日常事务,从简单的查询到复杂的多步骤操作,这种"记忆力"的提升将直接影响用户体验。试想,未来你可以对手机说:"帮我订一张下周末去上海的高铁票,选择下午2点后的班次,如果没有座位就改订飞机票,然后把行程分享给我的家人。"而AI助手真的能一步步完成,而不是在中途"断片"。
当然,这项技术目前还处于研究阶段,距离大规模应用还有一段距离。研究团队也坦诚地指出了当前方法的局限性:比如它主要针对单次任务设计,还无法处理跨越数天的长期任务,也没有充分考虑应用界面变化或内容更新对任务执行的影响。但是,这项工作为AI系统的"记忆机制"研究开辟了新的方向,为我们提供了一个理解和改进AI长期任务执行能力的新视角。
从更广阔的角度来看,这项研究触及了人工智能发展的一个核心问题:如何让机器具备类似人类的认知能力。记忆不仅仅是信息存储,更是智能行为的基础。当AI系统能够像人类一样选择性地记住关键信息,并在需要时灵活调用,它们就向真正的智能助手又迈进了一大步。正如研究团队所说,他们希望这项工作能够为构建可靠、可扩展的长期AI助手奠定基础,让人工智能真正成为我们日常生活中不可或缺的智能伙伴。
Q&A
Q1:什么是锚定状态记忆技术?
A:锚定状态记忆是香港科技大学团队提出的一种AI记忆机制,它让AI系统像人类一样只记住任务中的关键节点信息,比如查到的价格、完成的步骤等重要状态,而不是试图记住所有细节。这些关键信息像锚一样固定在记忆中,并建立相互关联,帮助AI在长任务中做出正确决策。
Q2:现在的AI手机助手为什么完成不了复杂任务?
A:主要问题是记忆障碍。当任务步骤超过20-30步时,AI会出现四种典型问题:重要信息丢失、信息关联错误、忘记当前任务目标、无法确认步骤是否完成。这就像患了健忘症,能看懂当前屏幕但记不住之前的关键信息,导致后续决策出错。
Q3:锚定状态记忆技术什么时候能用到我们的手机上?
A:目前这项技术还处于研究阶段,距离商用还需要时间。研究团队目前主要验证了技术可行性,提升了AI长任务成功率5%-30%,但要真正应用到日常手机助手中,还需要解决跨天任务、应用界面变化等实际问题。预计未来几年内会有相关应用出现。
相关攻略
广州市发布人工智能产业工作要点,明确将聚焦药物研发、工业机器人等高价值场景,推动专用模型开发与应用。同时,计划培育包括AI眼镜、智能手表在内的千款智能硬件产品,以“软硬兼施”策略促进产业深度与消费端创新双向发展。
软银集团首席执行官表示正研究进入AI服务器生产领域,这标志着其战略可能从投资转向制造。当前AI服务器市场竞争激烈,软银旗下ARM架构的低功耗优势或有助于打造差异化解决方案,切入市场。此举反映AI算力竞争已延伸至硬件设施层,但实现量产与市场认可仍需克服制造领域的挑战。
广州市印发人工智能产业发展工作要点,强化智能算力布局。核心是构建“城市数据中心+园区算力中心”的分层格局,通过规范规划与优化标准,系统性配置算力资源。城市中心提供基础通用算力,园区中心贴近场景提供专业高效服务,旨在提升资源利用效率,为本地AI产业创新提供坚实支撑。
人工智能技术正深度赋能医疗健康产业,为传统诊疗模式带来革新。在成瘾治疗这一长期面临高复发率与资源不均挑战的领域,AI驱动的解决方案展现出独特价值,其中“机器人治疗助手”作为新兴干预工具,正逐步改变康复支持体系。 从酒精依赖戒断到药物成瘾康复,临床干预手段持续迭代。未来,基于人工智能的机器人治疗助手有
广州市将开展人工智能百模培育行动,聚焦汽车制造、智能家电等优势产业,研发“小而美”的行业专用模型,推动AI技术深度融入实体经济流程。行动计划发布不少于70个“AI+智能制造”应用场景,为模型提供试验田,加速技术从实验室走向生产线,以产业需求驱动研发,提升产业效率。
热门专题
热门推荐
当在OKX欧易平台提币遇到“审核中”状态时,通常意味着交易触发了平台的安全风控流程。常见原因包括账户安全验证、大额提现、新设备登录或涉及高风险资产。等待期间,用户应保持耐心,检查账户信息是否完整,并可通过官方渠道查询进度。理解这一机制有助于更顺畅地进行资产管理。
小米澎湃OS3系统已全量上线母亲节限定水印,采用手绘康乃馨花束设计,用户需将相册编辑应用升级至2 3 0以上版本方可在5月13日前使用。同时,小米汽车于5月9日至10日推出门店活动,到店扫码可领取鲜花,每家门店至少备有30支。
《刺客信条:黑旗重置版》扩展了探索区域,新增岛屿与城市。玩家可招募三名拥有特殊能力的新船员,并体验更丰富的角色剧情。游戏以罗盘系统取代小地图,优化探索沉浸感,支持按键自定义,并计划加入经典操作模式。将于7月10日登陆PS5、XSX S及PC平台。
面对海量的欧易平台教程,新手常感无从下手。本文提供一份清晰的入门顺序指南,建议用户首先熟悉官网结构与安全公告,随后完成账户注册与基础安全设置。接着下载官方App并掌握基本操作,最后从现货交易开始实践,逐步学习更复杂的交易类型。遵循此路径可系统性地建立认知,安全高效地开启数字资产交易之旅。
比亚迪“闪充”技术实测充电速度领先,引发安全性与实用性讨论。行业数据显示日常仍以慢充为主,快充多用于应急。虽大功率快充可能影响电池寿命,但适度放宽充电时间或更利于技术落地。其核心价值在于提供灵活补能选择,服务于更自由从容的用车体验。





