苹果2025 CVPR展示多模态模型与视频生成新突破
10月14日,苹果公司正式宣布将参与2025年10月19日至23日在檀香山举办的国际计算机视觉大会(ICCV)。
苹果表示,ICCV作为计算机视觉领域的顶级会议,每年与欧洲计算机视觉会议(ECCV)轮流举办,始终聚焦该领域的前沿议题。
本次大会期间,苹果不仅将展示八篇入选论文的海报和口头报告,还将参与主旨演讲环节。苹果机器学习应用研究部负责人C. Thomas博士将受邀出席第三届基于视觉的工业检测研讨会(VISION)并发表主题演讲。Thomas博士的具体演讲内容将在近日公布,活动时间定于10月19日。
以下是苹果将在ICCV 2025上呈现的八篇论文清单:
- ETVA:通过精细化问题生成与应答实现文本-视频对齐评估
- MM-Spatial:探索多模态大语言模型的三维空间认知能力
- 原生多模态模型的扩展规律探究
- 稳定扩散模型在视觉上下文学习中的潜在优势
- STIV:可扩展的文本与图像条件化视频生成框架
- UINavBench:交互式数字智能体的综合评测体系
- 基于多模态提示的统一开放世界分割方案
- UniVG:面向统一图像生成与编辑的通用扩散模型
此外,苹果还将支持“计算机视觉领域女性研讨会”。苹果研究院的Patricia Vitoria Carrera与Tanya Glozman两位研究员将在会后晚宴中担任导师角色。
热门专题


热门推荐

由十英工作室代理发行的横版战术射击游戏《破门而入:行动小队》正式版手游,将于10月17日上午10:00在安卓与iOS平台同步上线。该作在Steam平台享有“好评如潮”的美誉。为庆祝

芝麻开门 (Gate io) 官方入口及平台概览 对于数字资产爱好者来说,选择一个安全、可靠的交易平台至关重要。 芝麻开门 (Gate io) 作为

近日,由中国电信人工智能研究院(TeleAI)与中电信人工智能科技有限公司联合主办的“TeleStudio全模态视频创作挑战赛”正式拉开帷幕。本次大赛依托本月10日全网上线、限时免费开放的“Tele

10月15日消息,长光卫星日前发布了哈密“为人民服务” 标语的破坏与重生的图片记录。其介绍,2024年,哈密戈壁滩“为人民服务”大字逐渐遭人开车漂移破坏。越野爱好者在标语上肆意漂移,留下了一个个刺眼

科大讯飞近日在上海世界会客厅举办“对话世界,沟通无限——AI同传技术升级暨翻译耳机新品发布会”,同时通过迪拜Gitex Global科技盛会向全球展示中国AI翻译技术的最新突破。此次活动标志着科大讯