中科院研发Reflection-V模型，突破AI视觉推理能力

首页

AI资讯

热心网友

转载

2025-09-29

视觉推理领域的重大突破正重塑AI理解图像的范式。中国科学院自动化研究所的最新研究表明，现有视觉智能系统存在明显的即时判断局限——它们往往在对图像完成初始扫描后就立即做出结论，而不会像人类那样反复核查关键视觉信息。这种认知短板显著制约了AI在多步骤验证型视觉任务中的表现，使其落后于人类水平。

研究团队通过精心设计的对比实验揭示了这一问题的本质。他们构建了双通道评估方案：实时监测模型生成每个词汇时对图像区域的关注程度，同时在推理过程中移除视觉输入以分析信息依赖性。令人惊讶的是，主流模型在输出300个词汇后，对源图像的记忆强度会急剧衰减至初始状态的20%-30%。采用强化学习优化的高级模型反而表现出更严重的"视觉失焦"现象，部分系统的信息保持率甚至不及基础版本。

为弥补这一缺陷，研究人员开创性地提出了"视觉反思"训练新范式。该系统仿照人类解题思维设置了多角色协作机制："视觉提问官"负责提出针对性问题（例如"请确认两点间距离的具体数值"），"图像观察员"给出精确测量数据，最终由"推理分析者"串联形成完整解答。这种对话式训练生成了大量包含视觉回溯的样本，逐步培养AI自我核查的认知习惯。

这套方案配备的创新性激励系统同样关键。它不仅评估结论准确性，还特别关注模型在推理后期阶段的视觉关注强度。实战测试中，70亿参数的"轻量级"模型在MathVision数学推理测试中斩获33.9%的准确率，以明显优势超越350亿参数的GPT-4o。更令人振奋的是，在MMMU-Pro跨学科综合评测中取得42.7%的高分，证明该方法可切实提升AI处理现实复杂问题的能力。

深层分析揭示了模型认知方式的转变。当遇到模糊信息时，经过训练的AI会主动表达"我需要重新查看图像左上角的坐标"，同时其视觉注意力权重出现明显回升。这种自查机制还产生了意外增益——在视觉幻觉检测任务中，改进模型的误判率下降了4.4%，证实持续的信息核查能有效避免错误认知固化。

在技术架构上，研究团队采用专业化分工设计：720亿参数的视觉编码器确保像素级解析精度，320亿参数的语言模型专注逻辑推演。训练过程实施两阶段策略：先用3个训练周期掌握基础反思模式，再通过12个强化周期优化行为稳定性。注意力权重的计算特别选用最终层注意力头的动态加权值，以实现对视觉关注度的精准刻画。

扩展实验验证了该方法的普适价值。140亿参数的中等规模模型在数学推理任务中性能提升3.9%，跨学科测试达到68.7%的优异成绩。跨语言测试更证实其迁移能力——仅通过英语训练的模型在中文视觉推理任务中依然表现抢眼。研究团队正着力简化30%-50%的数据构建流程，以降低技术落地门槛。

这项创新已展现出多元应用潜力。医疗场景下，系统能够通过多次图像比对发现早期肿瘤的细微征象；教育领域可逐步拆解物理实验装置的组装逻辑；工业设计中能精确定位工程图纸的尺寸公差异常。随着视觉反思机制的持续优化，AI系统正逐步接近人类专家级的认知可靠性。

来源:https://www.itbear.com.cn/html/2025-09/971849.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：OpenAI报告：AI专家任务速度提升100倍，成本降至1% 下一篇：苹果自研AI模型Manzano亮相，多模态能力媲美GPT-4o

热门推荐

游戏攻略

菩提苦海万事知任务全流程攻略

在《燕云十六声》中领悟“菩提苦海”，需沉浸探索游戏世界。主线剧情构建认知框架，战斗观察、场景细节与NPC对话皆暗藏线索。通过多元视角拼凑因果，方能深入理解游戏蕴含的宏大叙事与深邃魅力。

热心网友

05.23

业界动态

海信618电视销量夺冠 Mini LED技术加速普及

2026年618大促的序幕刚刚拉开，初期战报已经透露出一些耐人寻味的信号。截至5月21日，海信电视在京东平板电视累计销售竞速榜上拔得头筹，其RGB-Mini LED爆款王——海信小墨E5S Pro，更是同时拿下了天猫平板电视和抖音大家电的5 20单品销冠。这并非偶然。奥维云网的全渠道监测数据给出了

热心网友

05.23

业界动态

极氪800kW液冷超充桩上线峰值电流800A充电更快

充电桩领域的“军备竞赛”再次迎来重磅升级。5月22日，极氪汽车正式发布了其全新一代液冷超级充电桩，将单枪峰值功率一举提升至行业领先的800kW，标志着超充技术迈入新阶段。根据官方披露的核心信息，这款超充桩主要具备四大优势：极速补能、高效节能、广泛适配与多重安全。具体而言，其单枪峰值电流高达800A

热心网友

05.23

游戏攻略

红色沙漠电弧机剑获取攻略与详细步骤解析

获取电弧机剑主要有五种途径：推进主线任务以解锁线索；探索遗迹、工厂等特定区域；挑战特定副本与Boss；完成提及传说武器或遗物的支线任务；参与限时活动并达成要求。玩家可根据偏好选择或组合多种方式获取该武器。

热心网友

05.23

业界动态

小米汽车试驾活动重启预约即送1比64合金车模

小米汽车再次为潜在车主带来惊喜福利！即日起至5月31日，用户只需提前完成预约，并到店参与任意车型的试驾体验，即可免费获赠一款1:64精致合金车模。车模款式与颜色随机发放，为试驾过程增添一份专属的收藏乐趣，诚意十足。参与本次活动需注意以下细则：试驾必须通过官方渠道提前预约；各授权门店的车模备货数量不

热心网友

05.23

中科院研发Reflection-V模型，突破AI视觉推理能力

热门专题

最新APP

热门推荐