10月14日,苹果公司正式宣布将参与2025年10月19日至23日在檀香山举办的国际计算机视觉大会(ICCV)。

苹果表示,ICCV作为计算机视觉领域的顶级会议,每年与欧洲计算机视觉会议(ECCV)轮流举办,始终聚焦该领域的前沿议题。
本次大会期间,苹果不仅将展示八篇入选论文的海报和口头报告,还将参与主旨演讲环节。苹果机器学习应用研究部负责人C. Thomas博士将受邀出席第三届基于视觉的工业检测研讨会(VISION)并发表主题演讲。Thomas博士的具体演讲内容将在近日公布,活动时间定于10月19日。
以下是苹果将在ICCV 2025上呈现的八篇论文清单:
- ETVA:通过精细化问题生成与应答实现文本-视频对齐评估
- MM-Spatial:探索多模态大语言模型的三维空间认知能力
- 原生多模态模型的扩展规律探究
- 稳定扩散模型在视觉上下文学习中的潜在优势
- STIV:可扩展的文本与图像条件化视频生成框架
- UINavBench:交互式数字智能体的综合评测体系
- 基于多模态提示的统一开放世界分割方案
- UniVG:面向统一图像生成与编辑的通用扩散模型
此外,苹果还将支持“计算机视觉领域女性研讨会”。苹果研究院的Patricia Vitoria Carrera与Tanya Glozman两位研究员将在会后晚宴中担任导师角色。
