人工智能模型从实验室走向真实场景,一直面临一个关键挑战——域偏移。在自动驾驶、遥感识别、医学分析甚至地震检测等任务中,训练数据与实际应用数据往往来自不同设备、环境或采样条件,数据分布差异会直接影响模型的泛化能力和部署可靠性。简单说,一个有标签的源域上表现优秀的模型,迁移到无标签的目标域时,性能往往会明显下降。那么,在缺少目标域标注的情况下,如何提升模型的跨域泛化能力?这始终是领域自适应基础研究中的核心问题。
近日,马坚伟教授团队在人工智能基础研究领域取得创新突破,围绕无监督领域自适应的理论建模、可解释性与计算效率,提出了Feature-Space Planes Searcher(FPS)特征空间决策平面搜索框架。相关成果以长篇论文形式(共18页)发表于人工智能领域国际顶刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》。

哈工大数学学院为论文第一完成单位。数学学院博士生成知同和副研究员蒋一然为共同一作,马坚伟教授为通讯作者,博士生葛煜龙、李宇峰,硕士生覃仲恒,副教授林荣智为合作者。论文链接:https://arxiv.org/abs/2508.18693

上图直观展示了不同领域样本分布偏移与决策面错位的情况。以往的做法,大多是通过调整深层特征表示,努力缩小源域与目标域之间的差异。但这个过程需要更新大量参数,尤其在大规模预训练模型中,计算开销相当可观,而且模型迁移的过程也变得更难解释、更难控制。
FPS提供了一种全新的基础研究视角:当预训练模型已经形成稳定的特征空间结构时,领域自适应完全可以转化为固定特征空间中的决策边界优化问题。换句话说,不再让模型重新改变特征空间,而是识别目标域数据中已经存在但尚未被标签显式揭示的结构性先验与几何模式——比如同类样本在特征空间中更紧凑,不同类别保持分离,决策边界避开样本密集区域。这些来自数据结构本身的先验,共同构成了FPS进行边界搜索的基础。
该框架下的实验表明,领域自适应不一定非得依赖复杂而昂贵的特征对齐,仅调整决策边界也能实现高效、稳定、可解释的跨域迁移。这一工作为领域自适应基础研究提供了新的理论视角和方法框架。

从实际应用角度看,FPS既适用于自然图像分析,也适用于蛋白质二级结构预测、遥感影像分类、地震检测等任务,为大模型在真实复杂场景中的低成本部署和可靠应用提供了新的研究路径。

