近日,香港中文大学(深圳)人工智能学院荆炳义教授、尹峰教授,以及数据科学学院与人工智能学院双聘助理教授贺品嘉教授团队的6篇论文,成功被机器学习领域顶级会议ICML 2026接收。ICML(国际机器学习大会)与NeurIPS、ICLR并称为“三大顶会”,属于CCF A类会议,学术含金量极高。ICML 2026将于2026年7月6日至11日在韩国首尔举行,届时深度学习、计算机视觉、自然语言处理等前沿方向的最新成果,将由全球AI学术精英集中呈现。
论文简介
01 RACER: Risk-Aware Calibrated Efficient Routing for Large Language Models
论文链接:https://arxiv.org/abs/2603.06616
论文作者:Sai HAO, Hao ZENG, Hongxin WEI, Bingyi JING(共同通讯作者)
研究背景与动机
在多模型系统中,不同大语言模型由于训练数据、模型架构的差异,往往在不同领域展现出互补的能力。那么问题来了:如何为每个具体问题挑选最合适的模型,从而在性能与推理成本之间达成最佳平衡?现有的路由方法通常只选择单一模型,但预测排名与真实性能之间常常存在偏差,容易导致误路由错误。更关键的是,现有方法对误路由的风险缺乏严格的统计控制,在安全关键场景中难以直接应用。因此,一个能够在控制风险的同时将推理成本降至最低的路由框架,成为亟待解决的重要问题。

核心方法与贡献
(根据原文信息,此处应有具体的方法与贡献描述,但用户提供的文本在此处截断。下同。)
