首页
AI
复旦团队突破:机器人学会主动提问,推动人机交互升级
复旦团队突破:机器人学会主动提问,推动人机交互升级
复旦大学计算机科学与人工智能学院的研究团队近日在机器人交互领域实现重大技术飞跃。该团队成功研发出世界上首个具有自主探究能力的机器人系统平台"Ask-to-Clarify",这一突破性成果彻底改变了机器人单向响应的工作模式,相关研究论文已在国际顶级预印本平台arXiv正式发布。
传统机器人系统面临着模糊指令处理的致命瓶颈。研究团队在分析数以千计的家庭场景后发现,89%的日常指令都存在语义模糊问题。面对诸如"给我些水果"的普通请求,现有机器人往往只能在猜错物品或原地待命之间二选一。究其根源,静态执行架构使得机器人丧失了最基本的交互确认能力。
全新开发的"Ask-to-Clarify"框架创新性地采用了三层模块化设计。该系统核心包含:1)基于ViT-L/14视觉语言模型的对话理解组件,专司语义解析与问题生成;2)采用扩散策略网络的末端执行器控制组件,负责精准动作规划;3)革命性的动态注意力连接机制,通过实时调节视觉权重实现任务-场景精准匹配。这三个子系统形成闭环处理流程,完美模拟人类"确认-执行"的认知机制。
在实际操作中,系统展现出媲美人脑的模糊问题处理能力。接收"把饮料放桌上"指令后,系统能智能生成递进式确认:"您要的是红色易拉罐吗?"、"需要打开拉环吗?"。待所有模糊点澄清后,高速运动规划模块能在300ms内生成包含12个关键帧的抓取轨迹,实现毫米级操作精度。
训练阶段首创"认知+运动"双轨分离策略。前六个月专注培养系统理解7大类168小类家庭场景的能力,包括材质识别、空间关系判断等23项核心技能;后三个月锁定运动控制网络训练,在保持原有认知水平基础上,将抓取成功率提升了47个百分点。这种训练隔离策略有效规避了传统端到端学习中的性能耗散问题。
验证实验设计了涵盖厨房、客厅、卧室三大场景的测评矩阵。在1230次随机测试中,新系统在模糊指令条件下的平均任务完成率达93.2%,比获得精确指令的基准系统还高出14.7%。更具突破性的是,在同时包含7个相似物品的高干扰场景下,系统仍保持82.4%的成功率,远超传统系统35.6%的水平。
环境适应性测试结果同样令人振奋。在照度低于50lux的昏暗环境中,系统任务完成率仅下降8个百分点;面对5dB背景噪音时,语音交互准确率维持在91%以上。这种卓越的鲁棒性源于特征解耦训练策略,使得各功能模块具备独立的补偿容错能力。
核心技术突破体现在智能状态机设计上。系统采用12层LSTM网络构建的决策引擎,能实时监测37维特征向量的变化模式。当检测到置信度低于0.7时自动触发澄清流程,确保每次动作执行都建立在充分确认的基础上。这种设计使系统在2024年RoboChallenge大赛中斩获"最佳人机协作奖"。
研究团队通过对比实验揭示了传统系统的根本缺陷。即使在最理想的实验室条件下,使用扩散模型的基线系统对不同水果的辨识率差异不足3%,导致"放橙子"和"拿苹果"的指令几乎产生相同的电机控制信号。而新系统通过动态特征调制,使同类指令的编码相似度控制在安全阈值内。
场景理解测试中,系统展现出令人惊讶的常识推理能力。当用户说"把药给奶奶"而目标对象不在场时,系统会主动询问:"需要我去卧室找奶奶吗?"。这种上下文保持能力源自对话历史的图网络建模,确保了长期记忆的一致性。
这项创新代表了机器人技术发展的范式转变。系统从单纯的命令执行者进化为具备元认知能力的协作伙伴,标志着人机交互正式迈入"双向对话时代"。研究团队特别强调,这项技术将重塑服务机器人的评价体系,交互自然度、意图领会度等新指标将与执行精度同等重要。
技术突破点在于首次实现了对话理解与运动控制的有机统一。当前版本的连接模块采用基于梯度的特征融合方法,未来计划引入脉冲神经网络提升响应速度。这种持续创新的理念,为服务机器人从实验室走向千家万户铺平了道路。
产业化应用前景广阔。拥有主动确认能力的机器人将彻底改变智能家居的人机交互方式,预计到2026年可带动全球服务机器人市场规模增长23个百分点。在医疗陪护领域,能理解模糊需求的护理机器人可有效缓解护理人员短缺问题,具有重大的社会价值。
来源:https://www.itbear.com.cn/html/2025-10/981653.html
免责声明:
游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。
热门推荐
Lemonaid-AI音乐生成工具
Lemonaid是什么 如果你正为音乐创作寻找得力助手,那么Lemonaid很可能就是答案。它是一款专门面向专业音乐人打造的AI音乐生成工具,核心能力在于自主生成包含完整旋律、和声与节奏的乐曲。无论是想要一段氛围感十足的背景音乐,还是为具体场景定制配乐,它都能提供高度逼真且质量上乘的作品。工具提供了
苹果折叠屏iPhone Ultra关键点汇总:这4个问题你肯定想知道
苹果也要出折叠屏,传闻已经有几年了,从目前供应链、分析师与知名爆料者释放的信息来看,这款与市面大折都不一样的阔折叠似乎已经蓄势待发,大概率今年下半年就要正式面市。今天我们就来为大家汇总一波,没准儿就有你想知道的消息。 关于苹果折叠屏手机的传闻,已经流传了好几年。如今,综合供应链、分析师以及各路知名爆
《刺客信条4:黑旗 重制版》对手来了!被称为4A级海盗大作
《刺客信条:黑旗重制版》官宣之际,这款新海盗游戏为何能抢先赢得玩家口碑? 当游戏界的焦点都集中在《刺客信条:黑旗重制版》的正式公布时,一款名为《风启之旅》(Windrose)的开放世界海盗生存建造游戏,却凭借其过硬的品质与独特的玩法融合,悄然在玩家社区中掀起热议。这款由乌兹别克斯坦团队Kraken
腾讯智影-智能视频创作与发布一体化平台
产品介绍 提到云端智能视频创作,腾讯智影是一个绕不开的名字。这款由腾讯推出的平台,本质上是一个一站式的在线视频工厂,集成了从素材挖掘、剪辑、渲染到最终发布的全链路功能,旨在为用户提供全方位的视频创作解决方案。更吸引人的是,它不仅免费开放,还深度整合了多项前沿AI技术,目标很明确:让视频化表达这件事,
比心被拒小哥回应:不尴尬 尊重Coser 大家当个乐子
《王者荣耀世界》线下活动风波:合影互动引争议,职业素养与网络舆论深度探讨 近日,《王者荣耀世界》的一场线下玩家见面会,因台上一次短暂的合影互动,意外成为全网热议的焦点。活动中,一位男粉丝上台与角色扮演者(Coser)合影时,主动做出比心手势以示友好,却未得到身旁Coser的任何回应。男生举着手势在原