游乐游手机版
首页/科技数码/文章详情

新训练方法提高AI模型准确率和透明度

时间:2026-04-22 19:17
来源:科技日报 科技日报记者 张梦然 当“黑盒”AI开始用人类的语言说话 在医疗诊断、自动驾驶这些容错率极低的领域,人们最担心的往往不是人工智能出错,而是不知道它为何出错。模型的决策像个黑盒子,信任自然无从谈起。提升AI的可解释性,因而成为贯穿整个行业的核心命题。 概念瓶颈模型:给AI决策加上“翻译

来源:科技日报

科技日报记者 张梦然


当“黑盒”AI开始用人类的语言说话

在医疗诊断、自动驾驶这些容错率极低的领域,人们最担心的往往不是人工智能出错,而是不知道它为何出错。模型的决策像个黑盒子,信任自然无从谈起。提升AI的可解释性,因而成为贯穿整个行业的核心命题。

概念瓶颈模型:给AI决策加上“翻译”环节

为了打开这个黑盒,研究者们开发了一种名为“概念瓶颈模型”的技术。它的思路很直观:在AI的决策链中,强行插入一个“翻译”步骤。模型不能直接从图像跳到结论,而是必须先用人类能理解的概念描述它看到了什么,再基于这些概念做出最终判断。

举个例子,在皮肤癌筛查中,模型不会直接输出“恶性黑色素瘤”,而是先指出图像中存在“不规则的棕色斑块”或“边缘模糊的色素沉淀”等特征,再推导出诊断结果。这就像一位医生在出具报告前,先向患者解释他看到了哪些可疑的迹象。

传统方法的瓶颈:谁来定义“概念”?

理想很丰满,但传统的概念瓶颈模型在实际应用中遇到了坎儿。最大的问题在于,那些用于解释的“概念”本身,往往需要由人类专家或大型语言模型预先定义和提供。这就带来了两个麻烦:一是预设的概念可能与当前具体任务的关联性不强,显得隔靴搔痒;二是模型在实际思考时,很可能偷偷依赖了一些定义之外的特征,导致最终的“解释”与真实的决策过程脱节,成了应付检查的漂亮话。

新思路:从模型内部“榨取”知识,再翻译乘人话

那么,有没有可能让模型自己告诉我们,它在用什么“语言”思考?麻省理工学院的团队这次另辟蹊径,他们提出了一个颇具巧思的方案:不从外部灌输概念,而是从一个已经训练好的强大视觉模型内部,直接提取它已经掌握的知识,再将其转化为人类语言。

整个过程分为两个精妙的阶段。第一步是“知识萃取”。研究人员使用一种叫做稀疏自编码器的工具,深入模型的内部,将其庞大的特征网络压缩、提炼成一小撮最核心、最活跃的特征单元。你可以把这些特征单元看作模型思考时最倚重的“原始概念”。

紧接着是“语言翻译”阶段。这些抽象的特征单元被送入一个多模态大语言模型,由后者将其转化成“羽毛呈亮蓝色”、“病灶边缘有弥散”这类简洁的自然语言描述。更重要的是,这个大模型能自动为海量图片标注这些描述是否准确,从而生成了训练后续模块所需的大规模标注数据。

最后,利用这些数据训练一个“概念瓶颈”模块,并将其严丝合缝地集成到原始模型中。至此,模型被强制要求:每次预测,都必须使用这套从自身“血液”里提炼出的、并用人类语言表述的概念来推演。为了确保解释的精炼和直指核心,研究团队还加了一道硬性约束——每次决策,最多只能动用五个核心概念。

效果如何?不仅说得更明白,也做得更准确

在鸟类物种鉴别和皮肤病变诊断等任务上的测试结果,验证了这条路径的可行性。新方法生成的概念解释,不仅更精确、与图像内容贴合更紧,其最终的预测准确率甚至超过了以往的概念瓶颈模型。

这个结果意义重大。它意味着,强迫AI进行自我解释,并不一定是以牺牲性能为代价的“赎罪券”。恰恰相反,通过引导模型使用一套简洁、核心的概念体系进行思考,反而可能帮助它剔除噪声、聚焦关键,从而实现解释性与准确性的双赢。

前路与挑战

当然,这项工作只是起点。研究团队指出,未来还需要解决模型在训练过程中可能存在的信息泄露等更隐蔽的问题。同时,随着多模态大模型能力的持续进化,利用它们来标注更大规模、更高质量的数据,将是进一步提升该方法效能的关键方向。

归根结底,这项研究的价值在于它提供了一种新思路:与其费力地从外部教AI人类的逻辑,不如设计一套机制,让AI学会用人类的语言,翻译它自己的逻辑。当AI的思考过程变得透明可循,人与机器之间的信任桥梁,才算真正开始搭建。

来源:https://www.163.com/dy/article/KPVVMMG30514R9OJ.html
上一篇“三明治”忆阻器能在700℃高温下稳定运行 下一篇智谱(02513)GLM-5.1发布:逆势提价10%,开源模型超闭源,编程能力对齐Claude Opus 4.6
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。